Facebook A.I. Kunde fixa irriterande problem i videochattappar

Kommunikation på Facebook kanske till övervägande del sker via text, men sociala mediejätten kan ändå hjälpa till att lösa några av de största utmaningarna med ljudkommunikation. Tillkännagav fredagen den 10 juli före Internationell konferens om maskininlärning, Facebook har utvecklat en ny, banbrytande artificiell intelligens som kan särskilja upp till fem röster som talar samtidigt.

Det kan vara transformerande för allt från nästa generations hörapparater eller smarta högtalare som ringer in och förstärker vissa röster till framtida Zoom-liknande videokonferensinlärning för att bättre prioritera högtalare för att stoppa alla att prata om varje Övrig.

Rekommenderade videor

"Detta är en övervakad inlärningsmetod för talseparation," Eliya Nachmani, en forskningsassistent på FAIR (Facebook A.I. Research) Tel Aviv, berättade för Digital Trends. "För första gången visar vi att det är möjligt att separera fem separata högtalare från en enda mikrofoninspelning. Vi visar också hur modellen kan detektera antalet högtalare i inspelningen och förforma därefter. Modellen är maskfri, vilket innebär att vi inte uppskattar maskering som tar bort andra röster. Istället lär sig vår modell att filtrera bort de andra rösterna eller bakgrundsljudet.”

2 Speaker Voice Separation Animation FINAL

Detta "maskfria" element är betydande. Tidigare modeller som uppnått imponerande riktmärken använder en mask för att ta bort andra röster. Problemet med detta tillvägagångssätt är att modellerna blir sämre när antalet högtalare ökar eller är okända. Även om Facebooks modell fortfarande kräver att antalet högtalare anges, använder den en del smart teknik för att räkna automatiskt ut antalet personer som pratar och välj sedan den mest lämpliga modellen att arbeta med det numret.

Nachmani påpekade att denna talseparationsteknologi också kan ha andra tillämpningar. Förutom att separera röster kan den också sortera andra ljud från bakgrundsljud. Det kan till exempel tillåta det isolera olika musikinstrument från en enda ljudfil.

Kommer någon av denna teknik att hitta sin väg in i en Facebook-produkt snart? Så mycket är inte klart. Detta är grundläggande A.I. forskning som inte nödvändigtvis kommer att bakas in i en framtid Facebook app. Men det är verkligen lätt att se hur ett sådant verktyg kan vara användbart. Givet att Facebook redan erbjuder olika video- och röstchattfunktioner, det är inte uteslutet att detta kan ta sig in i en framtida produkt någon gång i framtiden.

Denna A.I. demonstration är bara ett av mer än 30 papper som Facebook diskuterar vid den internationella konferensen om maskininlärning, som startar i helgen.

Redaktörens rekommendationer

  • Twitter fixade precis ett av sina mest irriterande problem
  • Hur Nintendo kunde använda A.I. för att få 4K-spel till Switch Pro
  • Smart ny A.I. systemet lovar att träna din hund när du är borta från hemmet
  • Denna grundläggande mänskliga färdighet är nästa stora milstolpe för A.I.
  • GTC 2020 roundup: Nvidias virtuella värld för robotar, A.I. videosamtal

Uppgradera din livsstilDigitala trender hjälper läsare att hålla koll på den snabba teknikvärlden med alla de senaste nyheterna, roliga produktrecensioner, insiktsfulla redaktioner och unika smygtittar.