Facebook AI Kan een vervelend probleem in videochat-apps oplossen

Communicatie op Facebook vindt misschien voornamelijk via tekst plaats, maar de socialemediagigant kan niettemin helpen bij het oplossen van enkele van de grootste uitdagingen op het gebied van audiocommunicatie. Aangekondigd op vrijdag 10 juli, voorafgaand aan de Internationale conferentie over machinaal leren, Facebook heeft een nieuwe, geavanceerde kunstmatige intelligentie dat in staat is om maximaal vijf stemmen te onderscheiden die tegelijkertijd spreken.

Dat zou voor alles een transformatie kunnen betekenen, van hoortoestellen van de volgende generatie tot slimme luidsprekers die inbellen en bepaalde geluiden versterken stemmen voor toekomstige videoconferenties in Zoom-stijl, waarbij wordt geleerd om sprekers beter te prioriteren om te voorkomen dat iedereen over elkaar heen praat ander.

Aanbevolen video's

“Dit is een begeleide leeraanpak voor spraakscheiding,” Eliya Nachmani, een onderzoeksassistent bij FAIR (Facebook AI Onderzoek) Tel Aviv, vertelde Digital Trends. “Voor het eerst laten we zien dat het mogelijk is om vijf afzonderlijke luidsprekers te scheiden van één microfoonopname. We laten ook zien hoe het model het aantal sprekers in de opname kan detecteren en dienovereenkomstig kan voorvormen. Het model is maskervrij, wat betekent dat we geen maskers schatten die andere stemmen verwijderen. In plaats daarvan leert ons model de andere stemmen of achtergrondgeluiden eruit te filteren.”

2 Luidspreker Stemscheiding Animatie FINAL

Dit “maskervrije” element is significant. Eerdere modellen die indrukwekkende benchmarks behaalden, gebruiken een masker om andere stemmen te verwijderen. Het probleem met deze aanpak is dat de modellen slechter worden naarmate het aantal sprekers toeneemt of onbekend is. Hoewel het Facebook-model nog steeds vereist dat het aantal luidsprekers wordt gespecificeerd, maakt het gebruik van slimme technologie Bereken automatisch het aantal mensen dat aan het woord is en selecteer vervolgens het meest geschikte model om mee te werken dat nummer.

Nachmani wees erop dat deze spraakscheidingstechnologie ook andere toepassingen zou kunnen hebben. Naast het scheiden van stemmen, kan het ook andere geluiden uit achtergrondgeluiden sorteren. Dat zou het bijvoorbeeld mogelijk kunnen maken isoleer verschillende muziekinstrumenten uit één enkel audiobestand.

Zal iets van deze technologie binnenkort zijn weg vinden naar een Facebook-product? Zoveel is niet duidelijk. Dit is fundamentele AI. onderzoek dat niet noodzakelijkerwijs in de toekomst zal worden ingebakken Facebook app. Maar het is zeker gemakkelijk in te zien hoe een dergelijk hulpmiddel nuttig kan zijn. Gezien dat Facebook biedt al verschillende video- en voicechatfuncties, het is niet uitgesloten dat dit ergens in de toekomst zijn weg zou kunnen vinden naar een toekomstig product.

Deze A.I. demonstratie is slechts een van de meer dan dertig papers die Facebook bespreekt tijdens de Internationale Conferentie over Machine Learning, die dit weekend van start gaat.

Aanbevelingen van de redactie

Twitter heeft zojuist een van de meest vervelende problemen opgelost
Hoe Nintendo AI zou kunnen gebruiken om 4K-gaming naar de Switch Pro te brengen
Slimme nieuwe A.I. systeem belooft uw hond te trainen terwijl u niet thuis bent
Deze fundamentele menselijke vaardigheid is de volgende grote mijlpaal voor A.I.
GTC 2020 roundup: Nvidia’s virtuele wereld voor robots, A.I. videogesprekken

Upgrade uw levensstijlMet Digital Trends kunnen lezers de snelle technische wereld in de gaten houden met het laatste nieuws, leuke productrecensies, inzichtelijke redactionele artikelen en unieke sneak peeks.

Facebook AI Kan een vervelend probleem in videochat-apps oplossen

Aanbevelingen van de redactie

Categorieën

Recente

Bungie schetst zijn plan voor 'Destiny 2'-content tot en met mei

De boog is een in de ruimte geteste LED-lamp, nu op Kickstarter

De Navatics Mito is een onderwaterdrone met stabilisatie