Facebook A.I. Kan fikse irriterende problem i videochat-apper

Kommunikasjon på Facebook skjer kanskje hovedsakelig via tekst, men sosiale medier-giganten kan likevel bidra til å løse noen av de største utfordringene med lydkommunikasjon. Kunngjort fredag ​​10. juli i forkant av Internasjonal konferanse om maskinlæring, Facebook har utviklet en ny, banebrytende kunstig intelligens som er i stand til å skille opptil fem stemmer som snakker samtidig.

Det kan være transformerende for alt fra neste generasjons høreapparater eller smarthøyttalere som ringer inn og forsterker visse stemmer til fremtidig Zoom-stil videokonferanse læring for bedre å prioritere høyttalere for å stoppe alle fra å snakke om hver annen.

Anbefalte videoer

"Dette er en overvåket læringstilnærming for taleseparasjon," Eliya Nachmani, en forskningsassistent ved FAIR (Facebook A.I. Research) Tel Aviv, fortalte Digital Trends. "For første gang viser vi at det er mulig å skille fem separate høyttalere fra et enkelt mikrofonopptak. Vi viser også hvordan modellen kan oppdage antallet høyttalere i opptaket og forhåndsforme deretter. Modellen er maskefri, noe som betyr at vi ikke anslår maskering som fjerner andre stemmer. I stedet lærer modellen vår å filtrere bort de andre stemmene eller bakgrunnsstøyen."

2 Speaker Voice Separation Animation FINAL

Dette "maskefrie" elementet er betydelig. Tidligere modeller som oppnådde imponerende målestokker bruker en maske for å fjerne andre stemmer. Problemet med denne tilnærmingen er at modellene blir dårligere ettersom antall høyttalere øker eller er ukjent. Mens Facebooks modell fortsatt krever at antall høyttalere spesifiseres, bruker den noe smart teknologi for å automatisk finne ut hvor mange personer som snakker og deretter velge den mest passende modellen å jobbe med det tallet.

Nachmani påpekte at denne taleseparasjonsteknologien også kunne ha andre applikasjoner. I tillegg til å skille stemmer, kan den også sortere andre lyder fra bakgrunnsstøy. Det kan for eksempel tillate det isolere forskjellige musikkinstrumenter fra en enkelt lydfil.

Vil noe av denne teknologien finne veien til et Facebook-produkt snart? Så mye er ikke klart. Dette er grunnleggende A.I. forskning som ikke nødvendigvis vil bli bakt inn i en fremtid Facebook app. Men det er absolutt lett å se hvordan et slikt verktøy kan være nyttig. Gitt at Facebook allerede tilbyr forskjellige video- og talechatfunksjoner, det er ikke ute av muligheten for at dette kan komme inn i et fremtidig produkt en gang i fremtiden.

Denne A.I. demonstrasjon er bare en av mer enn 30 artikler Facebook diskuterer på den internasjonale konferansen om maskinlæring, som starter denne helgen.

Redaktørenes anbefalinger

  • Twitter fikset nettopp et av de mest irriterende problemene
  • Hvordan Nintendo kunne bruke A.I. for å bringe 4K-spill til Switch Pro
  • Smart ny A.I. systemet lover å trene hunden din mens du er borte fra hjemmet
  • Denne grunnleggende menneskelige ferdigheten er den neste store milepælen for A.I.
  • GTC 2020 roundup: Nvidias virtuelle verden for roboter, A.I. videosamtaler

Oppgrader livsstilen dinDigitale trender hjelper leserne å følge med på den fartsfylte teknologiverdenen med alle de siste nyhetene, morsomme produktanmeldelser, innsiktsfulle redaksjoner og unike sniktitter.