A cosa serve MurText?
MurText converte i file audio e video presenti sul tuo computer in testo.
Quali sono le caratteristiche che distinguono MurText dagli altri programmi?
• È completamente gratuito. “Gratuito” non è uno slogan pubblicitario.
• Offre trascrizione illimitata.
• Non è necessario caricare i file online.
• Non richiede connessione internet per la trascrizione.
• È orientato ai risultati.
• Design semplice e intuitivo, accessibile a tutti.
• Riconosce e trascrive oltre 100 lingue.
• Sei tu a scegliere il modello da usare.
• Il menu con clic destro è pratico ed efficiente.
• Supporta più lingue.
Come ottenere una chiave di accesso Hugging Face?
Per utilizzare la funzione di riconoscimento dei parlanti e di allineamento, è necessario disporre di una chiave di accesso. Le chiavi di accesso fornite gratuitamente da Hugging Face devono essere autorizzate su 2 modelli. Puoi creare una chiave di accesso Hugging Face seguendo i passaggi indicati di seguito.
1. Apri https://huggingface.co/login. Se sei già registrato, accedi direttamente oppure crea un account.
2. Apri il menu "Profilo". Clicca sul link "Settings". Clicca sul titolo "Access Tokens" nella pagina.
Nota: Dopo aver cliccato sul link, le opzioni si aprono più in basso nella stessa pagina. Se stai utilizzando uno screen reader, puoi navigare con la scorciatoia per i titoli di livello 3.
3. Clicca sul link "Create new token".
3.1. Compila il campo "Token name".
3.2. Seleziona le checkbox nella pagina e clicca sul pulsante "Create token".
3.3. Copia la chiave di accesso che ti viene fornita. Per far funzionare la chiave devi concedere l'accesso a 2 modelli.
4. Vai su https://huggingface.co/pyannote/speaker-diarization-community-1.
4.1. Trova il pulsante "Agree and access repository" nella pagina.
4.2. Appena sotto il pulsante si trovano due campi del modulo a scopo statistico. Compila i campi "Company/university" e "Use case".
4.3. Dopo aver compilato i moduli, clicca sul pulsante "Agree and access repository" in fondo.
5. Vai su https://huggingface.co/pyannote/segmentation-3.0.
5.1. Trova il pulsante "Agree and access repository" nella pagina.
5.2. Appena sotto il pulsante si trovano due campi del modulo a scopo statistico. Compila i moduli e clicca sul pulsante "Agree and access repository" in fondo.
MurText può creare file di sottotitoli?
Sì. MurText può creare file di sottotitoli con estensione .srt e .vtt. È sufficiente inviare il file all'applicazione ed effettuare le selezioni necessarie.
È disponibile una funzione di riconoscimento dei parlanti?
Sì. Puoi attivare questa funzione utilizzando la tua chiave di accesso gratuita fornita da Hugging Face. Durante il processo di trascrizione, i parlanti verranno identificati con nomi diversi. In seguito, puoi rinominare i parlanti se lo desideri.
Quali sono i vantaggi della trascrizione locale?
• La tua privacy è garantita al 100%.
• I tuoi file non vengono utilizzati per l’addestramento dei modelli.
• Nessuna dipendenza da internet.
• Nessuna perdita di tempo nel caricamento su server cloud.
• Non condividi i tuoi testi trascritti.
• Nessuna necessità di ripulire testi sensibili o cronologia.
• Risultati rapidi.
• Salva i file trascritti dove e come vuoi.
• Ottieni le prestazioni che hai pagato acquistando il tuo processore! ☺
Come posso correggere gli errori ortografici nel file di sottotitoli?
Gli errori ortografici derivano da una trascrizione errata dei suoni. Puoi usare il modello large-v3 per ridurre al minimo gli errori ortografici durante la trascrizione. Dopo la trascrizione, puoi correggere questi errori con l'aiuto dell'intelligenza artificiale. Claude mostra le migliori prestazioni per questo tipo di modifica. Quando fornisci il file .srt a un'IA, non dimenticare di dare le seguenti istruzioni precise:
• Non toccare mai i timestamp.
• Tratta i timestamp come valori numerici (interi). Non trattarli mai come stringhe.
• Non usare caratteri che causano problemi in CMD, come ':', '\', '%' se compaiono nel testo. Non cercare di gestirli con caratteri di escape.
• Correggi i nomi di origine straniera e i termini tecnici presenti nel testo.
• Al termine del processo, verifica se ci sono sovrapposizioni temporali tra i segmenti.
Ricevo un avviso di "Protezione delle app" e di Windows Defender, cosa devo fare?
MurText non è un software a scopo commerciale. Utilizziamo le nostre limitate risorse finanziarie per i servizi server e altri progetti. Per questo motivo il software non è firmato con un certificato SSL. Körüz.biz è un'organizzazione non governativa attiva dal 2014. Puoi scansionare il software con qualsiasi applicazione antivirus tu preferisca. Non contengono alcun contenuto dannoso. Windows mostra questi avvisi per tutti i software non firmati digitalmente, poiché questo è il suo approccio standard.
Quale file di sottotitoli devo usare?
MurText genera file di sottotitoli in due posizioni diverse durante il processo di trascrizione.
I file situati nella directory del progetto vengono configurati in base alle impostazioni del software.
I file sotto Directory del progetto\fallback sono file grezzi generati direttamente durante la trascrizione e non sono stati elaborati.
Se prevedi di modificare il file .srt generato in un editor SRT in seguito, puoi usare i file .srt e .vtt che si trovano sotto fallback\. Questo perché questi file non subiscono elaborazioni come la definizione del numero di caratteri per riga o la suddivisione delle righe.
Se vuoi controllare l'ortografia del file .srt e usarlo direttamente, puoi preferire i file nella directory del progetto.
Come si installa?
• Scarica il file di installazione dal menu del sito e segui le istruzioni.
• Scegli la lingua dell’app e quella dei file che trascriverai più spesso.
• Scarica il pacchetto del modello desiderato.
• Quando necessario, apri MurText o fai clic destro sul file e seleziona “MurText Speech-To-Text”.
• La trascrizione inizierà in base alle tue preferenze.
Quale motore di trascrizione devo usare?
Se il tuo obiettivo è generare file di sottotitoli, ti consigliamo di usare il motore WhisperX. In questo motore, vengono calcolati i tempi di inizio e fine a livello di parola, producendo timestamp molto più realistici. Nel motore Fast-Whisper, i segmenti di sottotitoli vengono generati utilizzando i timestamp restituiti dal modello. WhisperX mostra prestazioni migliori negli intervalli di tempo con lunghi silenzi, rumori di sottofondo o musica.
Qual è il tasso di precisione dei sottotitoli generati?
Questo varia in base al motore di trascrizione scelto e alla qualità del file. Con il motore WhisperX e un file di qualità audio nella media, il tasso di successo si situa tra il 91 e il 96% (esclusi errori ortografici minori e deviazioni temporali impercettibili).
Uso una scheda grafica NVIDIA ma l'elaborazione viene eseguita con la CPU, perché?
Ci sono due possibili motivi per questo: 1. Le specifiche tecniche della tua scheda grafica sono insufficienti, oppure stai usando un modello di scheda grafica obsoleto.
2. La tua scheda grafica è nuova ma i modelli di IA utilizzati da MurText non sono ancora stati configurati per queste schede. (Esempio: Il modello NVIDIA 5060 può essere usato attivamente nel modello di trascrizione. Tuttavia, il modello di allineamento delle parole non supporta ancora l'architettura sm_150. Se viene rilevato un processo non supportato, la trascrizione continua con la CPU.)
Ci sono limiti di tempo?
No, puoi trascrivere quanti file vuoi con MurText.
Si possono trascrivere solo file brevi o di piccole dimensioni?
No, non ci sono limiti di durata. Tuttavia, consigliamo di prestare attenzione ad alcuni aspetti. (Vedi: Cosa considerare durante la trascrizione)
Cosa considerare durante la trascrizione?
• Seleziona la lingua corretta del file. Una selezione errata può rallentare o distorcere la trascrizione.
• Se non conosci la lingua del file, usa l’opzione “Rilevamento automatico lingua”.
• Per file superiori a un’ora, dividerli in parti accelera il processo.
• La scelta del modello influisce direttamente su qualità e velocità. Se gli errori minori non sono critici, scegli il modello più efficiente.
Cos’è il modello Whisper?
Whisper è un modello di riconoscimento vocale sviluppato da OpenAI. Riconosce molte lingue parlate e trascrive file audio in tali lingue.
Come funziona il modello Whisper?
Whisper è composto da pacchetti di riconoscimento in formato .pt. Il file audio viene inviato al modello selezionato, che lo suddivide in segmenti e inizia la decodifica. Poiché più segmenti vengono elaborati contemporaneamente, il tempo di trascrizione è inferiore alla durata del file. Una volta trascritti tutti i segmenti, vengono uniti e restituiti.
I miei file vengono condivisi da qualche parte?
No, i tuoi file vengono trascritti senza lasciare il dispositivo. Il processo utilizza solo il processore e l’hardware del tuo computer.
L'utilizzo di MurText richiede una connessione Internet?
No. MurText richiede una connessione Internet solo durante il download dei modelli e il controllo delle nuove versioni.
Qualche file del mio dispositivo viene condiviso?
No. Nemmeno i log di errore vengono inviati dal tuo dispositivo.
Quanto tempo richiede la trascrizione?
Il tempo di trascrizione varia in base alle dimensioni e alla qualità del file e alle specifiche hardware del dispositivo. Se disponi di una scheda grafica NVIDIA con supporto CUDA, la trascrizione viene eseguita più velocemente con il supporto GPU. Se non disponi di una scheda grafica NVIDIA o possiedi un modello GPU non supportato, l'elaborazione viene eseguita con la CPU.
Posso usare il computer durante la trascrizione?
Sì, puoi continuare a usare il computer. Normalmente, il sistema operativo gestisce automaticamente la distribuzione della potenza. Tuttavia, se stai trascrivendo un file lungo con un modello pesante, giocare a videogiochi ad alte prestazioni può rallentare il processo.
Quali sistemi operativi supporta MurText?
MurText funziona su Microsoft Windows 7 e versioni successive. I test di accessibilità e prestazioni sono stati effettuati su Windows 11.
È disponibile una versione per Mac?
Una versione per macOS è prevista per i futuri aggiornamenti.
Quali tipi di file sono supportati?
.aac .avi .dat .flac .flv .m4a .m4v .mkv .mov .mp3 .mp4 .mpeg .mpg .ogg .opus .ts .wav .waptt
Ricevo un messaggio di errore, cosa devo fare?
Assicurati di utilizzare la versione più recente dell'applicazione. Reinstalla la versione più recente e deseleziona l'opzione "Mantieni le impostazioni dell'applicazione" indicata durante l'installazione. Se il problema persiste, rimuovi il modello Whisper che stai utilizzando e scaricalo di nuovo. Se il risultato non cambia nonostante tutto ciò, contattaci utilizzando il pulsante "Segnala errore".
Come posso scaricare nuovamente il pacchetto del modello?
Vai alla pagina "Modelli" nelle impostazioni dell'applicazione. Clicca sul pulsante "Rimuovi" accanto al modello con cui vuoi lavorare. Una volta che il pulsante passa alla posizione "Scarica", scarica nuovamente il modello.
Ricevo un errore di aggiornamento. Cosa devo fare?
• Assicurati di avere una connessione internet attiva prima di aggiornare.
• Se hai modificato il file di configurazione, potresti ricevere errori. Elimina il contenuto e riavvia l’app.
• Se hai spento il dispositivo durante l’aggiornamento, reinstallare l’app è la soluzione più semplice.
Come posso cambiare la lingua dell’interfaccia dell’app?
Vai su Impostazioni > Scegli la lingua dell’app e salva. Se desideri l’interfaccia nella tua lingua madre, traduci il file “default.po” nella cartella dell’app e inviacelo.