Sztuczna inteligencja Facebooka Może naprawić irytujący problem w aplikacjach do czatowania wideo

Komunikacja na Facebooku może odbywać się głównie za pomocą wiadomości tekstowych, ale gigant mediów społecznościowych może mimo to pomóc w rozwiązaniu niektórych z największych wyzwań związanych z komunikacją audio. Ogłoszono w piątek, 10 lipca, przed Międzynarodowa konferencja na temat uczenia maszynowego, Facebook opracował nowy, najnowocześniejszą sztuczną inteligencję który jest w stanie rozróżnić do pięciu głosów mówiących jednocześnie.

Może to mieć wpływ na wszystko, od aparatów słuchowych nowej generacji po inteligentne głośniki włączające się i wzmacniające głosy do przyszłych wideokonferencji w stylu Zoom, ucząc się, jak lepiej ustalać priorytety mówców, aby nikt nie mówił o sobie Inny.

Polecane filmy

„Jest to metoda nadzorowanego uczenia się służąca do separacji mowy” Elija Nachmani, asystent naukowy w FAIR (Facebook sztuczna inteligencja Research) Tel Awiw, powiedział Digital Trends. „Po raz pierwszy pokazujemy, że możliwe jest oddzielenie pięciu oddzielnych głośników z jednego nagrania mikrofonowego. Pokazujemy również, jak model może wykryć liczbę głośników w nagraniu i odpowiednio wstępnie uformować. Model nie zawiera maski, co oznacza, że nie szacujemy maskowania usuwającego inne głosy. Zamiast tego nasz model uczy się odfiltrowywać inne głosy lub hałas w tle”.

Animacja separacji głosu 2 głośników FINAL

Ten element „bezmaskowy” jest istotny. W poprzednich modelach, które osiągnęły imponujące wyniki, maska usuwała inne głosy. Problem z tym podejściem polega na tym, że modele stają się coraz gorsze wraz ze wzrostem liczby głośników lub gdy liczba głośników jest nieznana. Chociaż model Facebooka nadal wymaga określenia liczby głośników, wykorzystuje do tego inteligentną technologię automatycznie oblicza liczbę rozmawiających osób, a następnie wybiera najbardziej odpowiedni model do pracy ten numer.

Nachmani zwrócił uwagę, że ta technologia separacji mowy może mieć również inne zastosowania. Oprócz oddzielania głosów może także sortować inne dźwięki od szumu tła. Na przykład to mogłoby na to pozwolić izolować różne instrumenty muzyczne z jednego pliku audio.

Czy którakolwiek z tych technologii znajdzie wkrótce zastosowanie w produktach Facebooka? Tyle nie jest jasne. To jest podstawowa sztuczna inteligencja. badań, które niekoniecznie zostaną zapisane w przyszłości Facebook aplikacja. Ale z pewnością łatwo jest zobaczyć, jak takie narzędzie może być przydatne. Jeśli się uwzględni Facebook oferuje już różne funkcje czatu wideo i głosowego, nie jest wykluczone, że kiedyś w przyszłości może to znaleźć się w przyszłym produkcie.

Ta sztuczna inteligencja demonstracja to tylko jeden z ponad 30 artykułów omawianych przez Facebooka podczas Międzynarodowej Konferencji na temat uczenia maszynowego, która rozpoczyna się w ten weekend.

Zalecenia redaktorów

Twitter właśnie naprawił jeden z najbardziej irytujących problemów
Jak Nintendo mogłoby wykorzystać sztuczną inteligencję aby przenieść gry 4K na Switch Pro
Inteligentna nowa sztuczna inteligencja system obiecuje wyszkolić Twojego psa, gdy będziesz poza domem
Ta podstawowa ludzka umiejętność jest kolejnym kamieniem milowym w rozwoju sztucznej inteligencji.
Podsumowanie GTC 2020: wirtualny świat robotów Nvidii, A.I. rozmowy wideo

Ulepsz swój styl życiaDigital Trends pomaga czytelnikom śledzić szybko rozwijający się świat technologii dzięki najnowszym wiadomościom, zabawnym recenzjom produktów, wnikliwym artykułom redakcyjnym i jedynym w swoim rodzaju zajawkom.

Sztuczna inteligencja Facebooka Może naprawić irytujący problem w aplikacjach do czatowania wideo

Zalecenia redaktorów

Kategorie

Niedawny

Publiczna wersja beta systemu MacOS Monterey jest już dostępna, ale brakuje w niej funkcji

W dniu śmierci Windows 7 jest nadal drugim najpopularniejszym systemem operacyjnym

Dlaczego system Windows 11 prawdopodobnie będzie bezpłatną aktualizacją z systemu Windows 10