ElevenLabs lancia GenFM: la nuova frontiera dei podcast con AI multi-speaker | Llm machine learning | Modelli llm | Llm generative ai | Turtles AI

ElevenLabs lancia GenFM: la nuova frontiera dei podcast con AI multi-speaker
La funzionalità GenFM di ElevenLabs consente la creazione di podcast personalizzati in 32 lingue, arricchiti da elementi naturali come pause e “ehm”, per un’esperienza più autentica e coinvolgente
Isabella V

 

 
ElevenLabs ha lanciato una nuova funzionalità, GenFM, per creare podcast con voci sintetiche multi-speaker, a partire da contenuti testuali o video. La tecnologia, che può generare conversazioni naturali in 32 lingue, si posiziona come alternativa a soluzioni simili come NotebookLM di Google. Con GenFM, l’azienda mira a migliorare l’interazione vocale, arricchendo i podcast con elementi di linguaggio umano come pause e "ehm".  

Punti chiave:

  •  ElevenLabs introduce GenFM, una nuova funzione per creare podcast AI con voci multiple  
  •  Supporto di 32 lingue, inclusi inglese, spagnolo, francese e giapponese  
  •  La funzionalità si distingue per l’inserimento di suoni naturali come pause ed "ehm"  
  •  L’azienda sta investendo nell’espansione internazionale, con piani di crescita in Polonia e India  

La startup ElevenLabs, nota per le sue innovazioni nell’AI vocale, ha recentemente introdotto una funzione chiamata GenFM, destinata a trasformare la creazione di contenuti audio, in particolare podcast, utilizzando voci generate dall’AI. Questa nuova tecnologia si propone come un valido concorrente di soluzioni simili come NotebookLM di Google, portando un’evoluzione nell’interazione vocale basata sull’AI. GenFM consente agli utenti di caricare una varietà di contenuti, tra cui video, documenti o trascrizioni da YouTube, e di trasformarli in podcast coinvolgenti con più voci sintetiche. La caratteristica distintiva di questa funzionalità risiede nel fatto che l’app seleziona automaticamente due voci, scelte tra una vasta gamma di opzioni disponibili, per garantire una narrazione fluida e naturale. Il supporto multilingue, che copre 32 lingue diverse tra cui inglese, spagnolo, portoghese, cinese, francese, tedesco, giapponese e hindi, permette di accedere a un ampio pubblico globale, ampliando le possibilità di utilizzo del prodotto.

Un aspetto particolarmente interessante di GenFM è la possibilità di aggiungere elementi di linguaggio umano come "ehm", pause e altri suoni che arricchiscono l’esperienza audio, cercando di avvicinarsi al più possibile alla fluidità e spontaneità tipiche delle conversazioni reali. In un mondo in cui molte tecnologie di generazione vocale tendono a rimuovere ogni traccia di incertezze e "imperfezioni", ElevenLabs sceglie di integrare questi dettagli, puntando a un equilibrio tra una narrazione autentica e una comunicazione utile. Secondo quanto dichiarato da Jack McDermott, responsabile della crescita mobile presso ElevenLabs, l’intento è di trovare il giusto mix tra un suono naturale e un contenuto utile e informativo, ispirandosi ai podcast di lunga durata che mostrano una conversazione fluida e senza troppe interruzioni.

Nel lungo termine, ElevenLabs prevede di migliorare ulteriormente la funzionalità di GenFM, consentendo agli utenti di personalizzare maggiormente i contenuti generati, con l’introduzione di più fonti e una maggiore libertà nella creazione di contenuti audio generativi. Questi sviluppi si inseriscono in un panorama in continua evoluzione, dove l’uso dell’AI nel settore audio sta diventando sempre più sofisticato, rispondendo alle esigenze di un pubblico sempre più esigente in termini di qualità e personalizzazione. Oltre a queste novità tecnologiche, l’azienda ha recentemente annunciato un investimento di 11 milioni di dollari nell’ecosistema delle startup in Polonia, dove aprirà anche un centro di ricerca e sviluppo. Inoltre, la startup sta espandendo la sua presenza in India, con l’obiettivo di attrarre nuovi talenti locali e sviluppare ulteriori applicazioni nel campo dell’AI conversazionale.  

GenFM di ElevenLabs non solo rappresenta un significativo passo avanti nella creazione di contenuti audio generati dall’AI, ma apre anche nuove possibilità per una narrazione più interattiva e autentica, ponendo nuove sfide e opportunità nell’ambito della produzione di contenuti digitali.

Video