Questa IA può falsificare la tua voce dopo soli tre secondi

L'intelligenza artificiale (AI) lo è avendo un momento proprio adesso, e il vento continua a soffiare in poppa con la notizia che Microsoft sta lavorando su un'intelligenza artificiale in grado di imitare la voce di chiunque dopo aver ricevuto un breve campione di tre secondi.

Il nuovo strumento, denominato VALL-E, è stato addestrato su circa 60.000 ore di dati vocali in lingua inglese, che secondo Microsoft è “centinaia di volte più grande dei sistemi esistenti”. Usando questa conoscenza, i suoi creatori affermano che è necessaria solo una piccola infarinatura di input vocale per capire come replicare la voce di un utente.

uomo che parla al telefono
Fizkes/Shutterstock

Ancora più impressionante, VALL-E può riprodurre le emozioni, i toni vocali e l'ambiente acustico presenti in ciascun campione, qualcosa con cui altri programmi di intelligenza artificiale vocale hanno lottato. Ciò gli conferisce un’aura più realistica e avvicina i suoi risultati a qualcosa che potrebbe passare per un autentico linguaggio umano.

Imparentato

  • GPT-4: come utilizzare il chatbot AI che fa vergognare ChatGPT
  • Google Bard ora può parlare, ma può soffocare ChatGPT?
  • La nuova società di intelligenza artificiale di Elon Musk mira a “comprendere l’universo”

Rispetto ad altri concorrenti di sintesi vocale (TTS), Microsoft afferma che VALL-E “supera significativamente il sistema TTS all'avanguardia in termini di sintesi vocale naturalezza e somiglianza dei parlanti.” In altre parole, VALL-E assomiglia molto di più ai veri esseri umani rispetto alle IA rivali che incontrano input audio che non sono stati addestrati SU.

Video consigliati

Su GitHub, Microsoft ha creato un file piccola libreria di campioni creato utilizzando VALL-E. I risultati sono per lo più molto impressionanti, con molti campioni che riproducono la cadenza e l’accento delle voci degli oratori. Alcuni esempi sono meno convincenti, indicando che probabilmente VALL-E non è un prodotto finito, ma nel complesso il risultato è convincente.

Potenziale enorme e rischi

Una persona che effettua una videochiamata su un dispositivo Microsoft Surface con Windows 11.
Microsoft/Unsplash

In un articolo che introduce VALL-E, Microsoft spiega che VALL-E “potrebbe comportare rischi potenziali nell'uso improprio del modello, come lo spoofing vocale identificazione o impersonificazione di un parlante specifico”. Uno strumento così capace per generare rilanci vocali dal suono realistico lo spettro di deepfake sempre più convincenti, che potrebbe essere utilizzato per imitare qualsiasi cosa, da un ex partner romantico a una personalità internazionale di spicco.

Per mitigare questa minaccia, Microsoft afferma che “è possibile creare un modello di rilevamento per discriminare se una clip audio è stata sintetizzata da VALL-E”. L'azienda afferma che utilizzerà anche il proprio Principi dell'intelligenza artificiale quando sviluppa il suo lavoro. Tali principi coprono aree quali l’equità, la sicurezza, la privacy e la responsabilità.

VALL-E è solo l’ultimo esempio della sperimentazione di Microsoft con l’intelligenza artificiale. Recentemente, l'azienda ha lavorato su integrazione di ChatGPT in Bing, utilizzando l'intelligenza artificiale per ricapitolare le riunioni di Teamse l'inserimento di strumenti avanzati in app come Outlook, Word e PowerPoint. E secondo Semafor, Microsoft sta cercando di farlo investire 10 miliardi di dollari nel produttore di ChatGPT OpenAI, una società in cui ha già investito ingenti fondi.

Nonostante i rischi apparenti, strumenti come VALL-E potrebbero essere particolarmente utili in medicina, ad esempio, per aiutare le persone a ritrovare la voce dopo un incidente. Essere in grado di replicare il parlato con un set di input così piccolo potrebbe essere immensamente promettente in queste situazioni, a condizione che sia fatto bene. Ma con tutti i soldi spesi per l’intelligenza artificiale, sia da Microsoft che da altri, è chiaro che non scomparirà presto.

Raccomandazioni degli editori

  • Gli autori più importanti richiedono un pagamento alle aziende di intelligenza artificiale per l’utilizzo del loro lavoro
  • I migliori strumenti di editing video AI
  • OpenAI, produttore di ChatGPT, affronta l'indagine della FTC sulle leggi sulla protezione dei consumatori
  • Le scoperte dell’intelligenza artificiale potrebbero arrivare attraverso il cervello delle api, dicono gli scienziati
  • OpenAI sta costruendo un nuovo team per impedire che l'IA superintelligente diventi un disonesto

Migliora il tuo stile di vitaDigital Trends aiuta i lettori a tenere d'occhio il frenetico mondo della tecnologia con tutte le ultime notizie, divertenti recensioni di prodotti, editoriali approfonditi e anteprime uniche nel loro genere.