Communicatie op Facebook vindt misschien voornamelijk via tekst plaats, maar de socialemediagigant kan niettemin helpen bij het oplossen van enkele van de grootste uitdagingen op het gebied van audiocommunicatie. Aangekondigd op vrijdag 10 juli, voorafgaand aan de Internationale conferentie over machinaal leren, Facebook heeft een nieuwe, geavanceerde kunstmatige intelligentie dat in staat is om maximaal vijf stemmen te onderscheiden die tegelijkertijd spreken.
Dat zou voor alles een transformatie kunnen betekenen, van hoortoestellen van de volgende generatie tot slimme luidsprekers die inbellen en bepaalde geluiden versterken stemmen voor toekomstige videoconferenties in Zoom-stijl, waarbij wordt geleerd om sprekers beter te prioriteren om te voorkomen dat iedereen over elkaar heen praat ander.
Aanbevolen video's
“Dit is een begeleide leeraanpak voor spraakscheiding,” Eliya Nachmani, een onderzoeksassistent bij FAIR (Facebook AI Onderzoek) Tel Aviv, vertelde Digital Trends. “Voor het eerst laten we zien dat het mogelijk is om vijf afzonderlijke luidsprekers te scheiden van één microfoonopname. We laten ook zien hoe het model het aantal sprekers in de opname kan detecteren en dienovereenkomstig kan voorvormen. Het model is maskervrij, wat betekent dat we geen maskers schatten die andere stemmen verwijderen. In plaats daarvan leert ons model de andere stemmen of achtergrondgeluiden eruit te filteren.”
2 Luidspreker Stemscheiding Animatie FINAL
Dit “maskervrije” element is significant. Eerdere modellen die indrukwekkende benchmarks behaalden, gebruiken een masker om andere stemmen te verwijderen. Het probleem met deze aanpak is dat de modellen slechter worden naarmate het aantal sprekers toeneemt of onbekend is. Hoewel het Facebook-model nog steeds vereist dat het aantal luidsprekers wordt gespecificeerd, maakt het gebruik van slimme technologie Bereken automatisch het aantal mensen dat aan het woord is en selecteer vervolgens het meest geschikte model om mee te werken dat nummer.
Nachmani wees erop dat deze spraakscheidingstechnologie ook andere toepassingen zou kunnen hebben. Naast het scheiden van stemmen, kan het ook andere geluiden uit achtergrondgeluiden sorteren. Dat zou het bijvoorbeeld mogelijk kunnen maken isoleer verschillende muziekinstrumenten uit één enkel audiobestand.
Zal iets van deze technologie binnenkort zijn weg vinden naar een Facebook-product? Zoveel is niet duidelijk. Dit is fundamentele AI. onderzoek dat niet noodzakelijkerwijs in de toekomst zal worden ingebakken
Deze A.I. demonstratie is slechts een van de meer dan dertig papers die Facebook bespreekt tijdens de Internationale Conferentie over Machine Learning, die dit weekend van start gaat.
Aanbevelingen van de redactie
- Twitter heeft zojuist een van de meest vervelende problemen opgelost
- Hoe Nintendo AI zou kunnen gebruiken om 4K-gaming naar de Switch Pro te brengen
- Slimme nieuwe A.I. systeem belooft uw hond te trainen terwijl u niet thuis bent
- Deze fundamentele menselijke vaardigheid is de volgende grote mijlpaal voor A.I.
- GTC 2020 roundup: Nvidia’s virtuele wereld voor robots, A.I. videogesprekken
Upgrade uw levensstijlMet Digital Trends kunnen lezers de snelle technische wereld in de gaten houden met het laatste nieuws, leuke productrecensies, inzichtelijke redactionele artikelen en unieke sneak peeks.