Komunikacja na Facebooku może odbywać się głównie za pomocą wiadomości tekstowych, ale gigant mediów społecznościowych może mimo to pomóc w rozwiązaniu niektórych z największych wyzwań związanych z komunikacją audio. Ogłoszono w piątek, 10 lipca, przed Międzynarodowa konferencja na temat uczenia maszynowego, Facebook opracował nowy, najnowocześniejszą sztuczną inteligencję który jest w stanie rozróżnić do pięciu głosów mówiących jednocześnie.
Może to mieć wpływ na wszystko, od aparatów słuchowych nowej generacji po inteligentne głośniki włączające się i wzmacniające głosy do przyszłych wideokonferencji w stylu Zoom, ucząc się, jak lepiej ustalać priorytety mówców, aby nikt nie mówił o sobie Inny.
Polecane filmy
„Jest to metoda nadzorowanego uczenia się służąca do separacji mowy” Elija Nachmani, asystent naukowy w FAIR (Facebook sztuczna inteligencja Research) Tel Awiw, powiedział Digital Trends. „Po raz pierwszy pokazujemy, że możliwe jest oddzielenie pięciu oddzielnych głośników z jednego nagrania mikrofonowego. Pokazujemy również, jak model może wykryć liczbę głośników w nagraniu i odpowiednio wstępnie uformować. Model nie zawiera maski, co oznacza, że nie szacujemy maskowania usuwającego inne głosy. Zamiast tego nasz model uczy się odfiltrowywać inne głosy lub hałas w tle”.
Animacja separacji głosu 2 głośników FINAL
Ten element „bezmaskowy” jest istotny. W poprzednich modelach, które osiągnęły imponujące wyniki, maska usuwała inne głosy. Problem z tym podejściem polega na tym, że modele stają się coraz gorsze wraz ze wzrostem liczby głośników lub gdy liczba głośników jest nieznana. Chociaż model Facebooka nadal wymaga określenia liczby głośników, wykorzystuje do tego inteligentną technologię automatycznie oblicza liczbę rozmawiających osób, a następnie wybiera najbardziej odpowiedni model do pracy ten numer.
Nachmani zwrócił uwagę, że ta technologia separacji mowy może mieć również inne zastosowania. Oprócz oddzielania głosów może także sortować inne dźwięki od szumu tła. Na przykład to mogłoby na to pozwolić izolować różne instrumenty muzyczne z jednego pliku audio.
Czy którakolwiek z tych technologii znajdzie wkrótce zastosowanie w produktach Facebooka? Tyle nie jest jasne. To jest podstawowa sztuczna inteligencja. badań, które niekoniecznie zostaną zapisane w przyszłości
Ta sztuczna inteligencja demonstracja to tylko jeden z ponad 30 artykułów omawianych przez Facebooka podczas Międzynarodowej Konferencji na temat uczenia maszynowego, która rozpoczyna się w ten weekend.
Zalecenia redaktorów
- Twitter właśnie naprawił jeden z najbardziej irytujących problemów
- Jak Nintendo mogłoby wykorzystać sztuczną inteligencję aby przenieść gry 4K na Switch Pro
- Inteligentna nowa sztuczna inteligencja system obiecuje wyszkolić Twojego psa, gdy będziesz poza domem
- Ta podstawowa ludzka umiejętność jest kolejnym kamieniem milowym w rozwoju sztucznej inteligencji.
- Podsumowanie GTC 2020: wirtualny świat robotów Nvidii, A.I. rozmowy wideo
Ulepsz swój styl życiaDigital Trends pomaga czytelnikom śledzić szybko rozwijający się świat technologii dzięki najnowszym wiadomościom, zabawnym recenzjom produktów, wnikliwym artykułom redakcyjnym i jedynym w swoim rodzaju zajawkom.