MacWhisper è il software di trascrizione gratuito che stavo aspettando

Stai cercando un software Mac per trascrivere file audio in file di testo scritti? Ci sono molti strumenti a pagamento, come Otter.ai e Trint, che possono costare soldi veri quando inizi a usarli troppo. Ma Mac Whisper è la soluzione gratuita che Internet stava aspettando. O, almeno, quello che stavo aspettando.

OpenAI ha rilasciato un programma gratuito incredibilmente potente nel settembre 2022 che ha consentito alle persone con un po 'di esperienza tecnologica di convertire i propri file audio e video in trascrizioni incredibilmente accurate. Il problema era che non era molto accessibile all'utente medio, poiché era necessario avere familiarità con l'utilizzo dei comandi nell'app Terminal.

Ma con MacWhisper, che è stato individuato per la prima volta da 9to5Mac, qualcuno ha finalmente sviluppato una GUI, o interfaccia utente grafica, che si basa su Whisper di OpenAI e lascia tutte le cose tecnologiche confuse sotto il cofano, permettendoti semplicemente di trascinare e rilasciare il tuo file audio e ottenere una trascrizione molto rapidamente. E MacWhisper è estremamente preciso perché su Whisper di OpenAI è stato addestrato 680,000 ore di dati audio sul web.

Una delle cose belle di MacWhisper è che non stai caricando il file audio o video che desideri trascrivere su Internet. Questo è importante per i giornalisti che potrebbero lavorare su una storia delicata o per chiunque sia generalmente diffidente nel caricare i propri file personali nel cloud. Il file rimane sul desktop, il che significa che non c'è alcuna possibilità che qualcuno possa intercettare il tuo audio.

Ancora una volta, MacWhisper è solo una nuova interfaccia utente per un programma gratuito che è stato introdotto da OpenAI alla fine dell'anno scorso, ma renderà davvero la trascrizione audio facile per quasi tutti. Perché uso Whisper e l'ho trovato estremamente utile da quando è stato rilasciato. E anche ora userò MacWhsiper, perché sicuramente accelererà il mio flusso di lavoro.

Tanto per fare un esempio, dopo la notizia del crollo della società di criptovalute FTX, ho utilizzato Whisper per trascrivere dozzine di ore di vecchie interviste su YouTube con il fondatore dell'azienda Sam Bankman-Fried. Da lì, sono stato in grado di cercare le trascrizioni e trovare idee strane e interessanti per articoli da scrivere, come quando SBF ha detto nel giugno 2021 che blockchain avrebbe riparato Enron. Il paragone di SBF con Enron è stata una strana coincidenza, dato tutto ciò che ora sappiamo su come è crollato FTX. Ma non avrei mai trovato quel momento in una vecchia e oscura intervista senza avere dozzine di trascrizioni da cercare. E quel processo, sebbene più semplice dell'ascolto di ore e ore di nastri, era ancora goffo e poco automatizzato.

Dopo aver installato Whisper sulla mia macchina, digitavo "whisper audiofilename.mp3 —model tiny.en" nell'app Terminal di Mac ogni volta che volevo trascrivere un file. Con WhisperMac, posso semplicemente trascinare e rilasciare il mio file audio e fa la sua magia senza alcuna digitazione aggiuntiva.

Ho testato MacWhisper con un episodio di NBC Nightly News che ho scaricato da YouTube. E a parte alcuni errori, come interpretare la parola "windchills" come "windshills" e sentire Lester Holt come "Lester Hold", la trascrizione era molto accurata. MacWhisper è gratuito, ma esiste un livello a pagamento del software che potrebbe essere leggermente più accurato perché utilizza i modelli di formazione più intensivi di OpenAI, ma la versione gratuita funzionerà perfettamente per la maggior parte delle persone.

MacWhisper ti consente di esportare la parola trascritta in alcuni formati diversi, tra cui testo normale, CSV o persino un formato di file di sottotitoli come SRT e VTT.

E MacWhisper non è solo per l'inglese. Puoi trascrivere l'audio in 100 lingue diverse, il che è incredibilmente utile. L'unica caratteristica che MacWhisper non ha, con cui mi sono divertito a giocare su Whisper nell'app Terminal, è la traduzione linguistica. Ho tradotto video virali in russo e cinese e mi è stato detto da persone che parlano le lingue su Twitter che le traduzioni sono preciso.

L'altra caratteristica che MacWhisper non ha, sebbene non sia disponibile anche da Whisper di OpenAI, è la capacità di differenziare gli altoparlanti. Ad esempio, se stai trascrivendo un'intervista con due oratori, non ci sono segni chiari che mostrano quando un oratore si è fermato e un altro è iniziato. Ma sospetto che alla fine qualcuno svilupperà quella capacità. I servizi a pagamento come Trint lo fanno automaticamente e alla fine sarebbe fantastico averlo gratuitamente, ma ottieni quello per cui paghi.

C'è anche una funzione con MacWhisper in cui puoi convertire il parlato dal microfono del tuo computer in testo, che potrebbe essere utile se vuoi trascrivere qualcosa al volo.

Ho passato mesi a chiedermi quando qualcuno avrebbe finalmente sviluppato una GUI per Whisper, poiché alcune persone ci hanno provato ma non hanno creato nulla di molto intuitivo. Ma MacWhisper, sviluppato da Jordi Bruin, è il software che stavo aspettando. Bruin ha anche sviluppato software come Mac GPT, che consente agli utenti di accedere a ChatGPT dalla barra dei menu.

Puoi scaricare MacWhisper gratuito, con registrazione via email, al sito web di Bruin.

Fonte: https://www.forbes.com/sites/mattnovak/2023/02/04/macwhisper-is-the-free-transcription-software-ive-been-waiting-for/