Facebook-KI Könnte ein lästiges Problem in Video-Chat-Apps beheben

Die Kommunikation auf Facebook erfolgt zwar vorwiegend über Text, der Social-Media-Riese könnte jedoch dennoch dabei helfen, einige der größten Herausforderungen der Audiokommunikation zu lösen. Angekündigt am Freitag, 10. Juli, im Vorfeld Internationale Konferenz zum maschinellen Lernen, Facebook hat ein neues, modernste künstliche Intelligenz Das ist in der Lage, bis zu fünf gleichzeitig sprechende Stimmen zu unterscheiden.

Das könnte für alles von entscheidender Bedeutung sein, von Hörgeräten der nächsten Generation bis hin zu intelligenten Lautsprechern, die sich einwählen und bestimmte Dinge verstärken Stimmen zu zukünftigen Videokonferenzen im Zoom-Stil Lernen, die Redner besser zu priorisieren, um zu verhindern, dass alle übereinander reden andere.

Empfohlene Videos

„Dies ist ein überwachter Lernansatz zur Sprachtrennung.“ Eliya Nachmani, wissenschaftlicher Mitarbeiter bei FAIR (Facebook K.I. Research) Tel Aviv, sagte Digital Trends. „Zum ersten Mal zeigen wir, dass es möglich ist, fünf separate Sprecher aus einer einzigen Mikrofonaufnahme zu trennen. Wir zeigen auch, wie das Modell die Anzahl der Sprecher in der Aufnahme erkennen und entsprechend vorformulieren kann. Das Modell ist maskenfrei, was bedeutet, dass wir keine Maskierung schätzen, die andere Stimmen entfernt. Stattdessen lernt unser Modell, die anderen Stimmen oder Hintergrundgeräusche herauszufiltern.“

2-Lautsprecher-Sprachtrennungsanimation FINAL

Dieses „maskenfreie“ Element ist von Bedeutung. Frühere Modelle, die beeindruckende Benchmarks erzielten, verwenden eine Maske, um andere Stimmen zu entfernen. Das Problem bei diesem Ansatz besteht darin, dass die Modelle schlechter werden, wenn die Anzahl der Sprecher zunimmt oder unbekannt ist. Während das Modell von Facebook immer noch die Angabe der Anzahl der Lautsprecher erfordert, nutzt es dafür intelligente Technologie Ermitteln Sie automatisch die Anzahl der sprechenden Personen und wählen Sie dann das am besten geeignete Modell für die Arbeit aus diese Nummer.

Nachmani wies darauf hin, dass diese Sprachtrennungstechnologie auch andere Anwendungen haben könnte. Neben der Trennung von Stimmen könnte es auch andere Geräusche von Hintergrundgeräuschen trennen. Das könnte es zum Beispiel ermöglichen Isolieren Sie verschiedene Musikinstrumente aus einer einzigen Audiodatei.

Wird irgendeine dieser Technologie bald Eingang in ein Facebook-Produkt finden? So viel ist nicht klar. Das ist grundlegende KI. Forschung, die nicht unbedingt in die Zukunft eingebettet sein wird Facebook App. Aber es ist sicherlich leicht zu erkennen, wie nützlich ein solches Tool sein könnte. Angesichts dessen Facebook Da das Unternehmen bereits verschiedene Video- und Voice-Chat-Funktionen bietet, ist es nicht ausgeschlossen, dass diese irgendwann in einem zukünftigen Produkt Einzug halten.

Diese K.I. Demonstration ist nur einer von mehr als 30 Artikeln, die Facebook auf der International Conference on Machine Learning diskutiert, die an diesem Wochenende beginnt.

Empfehlungen der Redaktion

  • Twitter hat gerade eines seiner nervigsten Probleme behoben
  • Wie Nintendo K.I. nutzen könnte um 4K-Gaming auf die Switch Pro zu bringen
  • Clevere neue K.I. Das System verspricht, Ihren Hund zu trainieren, während Sie nicht zu Hause sind
  • Diese grundlegende menschliche Fähigkeit ist der nächste große Meilenstein für die KI.
  • Zusammenfassung der GTC 2020: Nvidias virtuelle Welt für Roboter, K.I. Videoanrufe

Werten Sie Ihren Lebensstil aufDigital Trends hilft Lesern mit den neuesten Nachrichten, unterhaltsamen Produktrezensionen, aufschlussreichen Leitartikeln und einzigartigen Einblicken, den Überblick über die schnelllebige Welt der Technik zu behalten.