L'intelligenza artificiale di Facebook Potrebbe risolvere fastidiosi problemi nelle app di chat video

click fraud protection

La comunicazione su Facebook potrebbe avvenire prevalentemente tramite testo, ma il colosso dei social media potrebbe comunque aiutare a risolvere alcune delle sfide più grandi legate alla comunicazione audio. Annunciato venerdì 10 luglio, in vista del Conferenza internazionale sull'apprendimento automatico, Facebook ha sviluppato un nuovo, intelligenza artificiale all’avanguardia che è in grado di distinguere fino a cinque voci che parlano simultaneamente.

Ciò potrebbe essere trasformativo per qualsiasi cosa, dagli apparecchi acustici di nuova generazione agli altoparlanti intelligenti che si collegano e amplificano determinati dispositivi voci per le future videoconferenze in stile Zoom, imparando a dare meglio la priorità agli oratori per impedire a tutti di parlare uno sopra l'altro altro.

Video consigliati

"Questo è un approccio di apprendimento supervisionato per la separazione del parlato", Elia Nachmani, assistente di ricerca presso FAIR (Facebook A.I. Research) Tel Aviv, ha detto a Digital Trends. “Per la prima volta stiamo dimostrando che è possibile separare cinque altoparlanti separati da un’unica registrazione microfonica. Mostriamo anche come il modello può rilevare il numero degli altoparlanti nella registrazione e preformarlo di conseguenza. Il modello è senza maschera, il che significa che non stimiamo un mascheramento che rimuova altre voci. Invece, il nostro modello impara a filtrare le altre voci o il rumore di fondo”.

2 Animazione di separazione vocale dell'oratore FINALE

Questo elemento “senza maschera” è significativo. I modelli precedenti che hanno raggiunto parametri di riferimento impressionanti utilizzano una maschera per rimuovere altre voci. Il problema con questo approccio è che i modelli peggiorano man mano che il numero di parlanti aumenta o è sconosciuto. Sebbene il modello di Facebook richieda ancora che venga specificato il numero di parlanti, utilizza una tecnologia intelligente per farlo capire automaticamente il numero di persone che stanno parlando e quindi selezionare il modello più appropriato con cui lavorare quel numero.

Nachmani ha sottolineato che questa tecnologia di separazione vocale potrebbe avere anche altre applicazioni. Oltre a separare le voci, potrebbe anche separare altri suoni dal rumore di fondo. Ad esempio, ciò potrebbe consentirlo isolare diversi strumenti musicali da un singolo file audio.

Qualcuno di questi tecnologie troverà presto spazio in un prodotto Facebook? Questo non è chiaro. Questa è l'A.I. fondamentale ricerca che non sarà necessariamente inserita in un futuro Facebook app. Ma è certamente facile capire come uno strumento del genere potrebbe essere utile. Dato che Facebook offre già varie funzionalità di chat video e vocale, non è escluso che questo possa entrare in un prodotto futuro in futuro.

Questa I.A. La dimostrazione è solo uno degli oltre 30 documenti che Facebook sta discutendo alla Conferenza internazionale sull'apprendimento automatico, che inizierà questo fine settimana.

Raccomandazioni degli editori

  • Twitter ha appena risolto uno dei suoi problemi più fastidiosi
  • Come Nintendo potrebbe usare l'A.I. per portare i giochi 4K su Switch Pro
  • Nuova IA intelligente il sistema promette di addestrare il tuo cane mentre sei lontano da casa
  • Questa abilità umana di base è la prossima pietra miliare per l’A.I.
  • Riepilogo GTC 2020: il mondo virtuale di Nvidia per robot, A.I. videochiamate

Migliora il tuo stile di vitaDigital Trends aiuta i lettori a tenere d'occhio il frenetico mondo della tecnologia con tutte le ultime notizie, divertenti recensioni di prodotti, editoriali approfonditi e anteprime uniche nel loro genere.