Umelá inteligencia na odčítanie z pier ničí ľudí pri interpretácii tichých viet

LipNet: Čo si myslíte, aké ľahké je čítanie z pier?

Jedna z najpamätnejších častí sci-fi majstrovského diela Stanleyho Kubricka 2001: Vesmírna odysea je dejová línia, v ktorej sú dvaja členovia Discovery One Posádka vesmírnej lode je čoraz podozrievavejšia voči správaniu lodného asistenta AI, HAL 9000.

S vedomím, že HAL neustále počúva, čo hovoria, ustúpia niekam, o ktorom vedia, že HAL nemôže počúvať a súhlasia s tým, že ho odpojí. HAL pokazí svoj plán po tom, čo dvaja astronauti nezohľadnia Vynikajúce schopnosti AI odčítať z pier.

Futuristické veci, však? Podľa výskumu, ktorý vykonali vyšetrovatelia na Oxfordskej univerzite, nie. Vyvinuli program umelej inteligencie s názvom LipNet, ktorý dokáže presne interpretovať, čo ľudia hovoria, čisto na základe spôsobu, akým pri rozprávaní pohybujú ústami.

Súvisiace

  • Photoshop AI si myslí, že „šťastie“ je úsmev s pokazenými zubami
  • Predložil som svoj smiešny nápad na spustenie robotovi VC
  • Ako budeme vedieť, kedy sa AI skutočne stane vnímavou?

„LipNet vykonáva odčítanie z pier na úrovni viet pomocou strojového učenia,“

Brendan Shillingford, jeden z výskumníkov na papier, povedal Digital Trends. „Neurónová sieť podobná najmodernejším modelom rozpoznávania reči spracováva sekvenciu video snímok a mapuje ich na vetu. Predchádzajúce prístupy fungovali skôr na základe predpovedaných jednotlivých slov než viet.“

Odporúčané videá

Výkon LipNetu je neuveriteľne priaznivý v porovnaní s odborníkmi na odčítanie z pier na korpuse GRID, najväčšom verejne dostupnom súbore údajov o čítaniach na úrovni viet. V skutočnosti, kde ľudskí experti získali len 52 percent, LipNet dosiahol 93 percent. Jeho prístup k čítaniu z pier založený na vetách tiež prelomil najlepší predchádzajúci pokus stroja, ktorý dosiahol presnosť 79,6 percent na rovnakom súbore údajov.

Avšak zatiaľ čo fiktívny HAL 9000 využíva svoje schopnosti odzerania z pier na nič, tím stojaci za LipNet má na ich vytvorenie iné ciele. Približne 360 ​​miliónov ľudí na celom svete má invalidizujúcu stratu sluchu. Nástroje ako LipNet môžu byť pre týchto jednotlivcov veľmi dôležité, pretože pomáhajú presne interpretovať reč spôsobom, ktorý im uľahčí život.

„Ďalšie aplikácie, ktoré nás zaujímajú, zahŕňajú tiché diktovanie vo verejných priestoroch, skryté rozhovory, rozpoznávanie reči v hlučnom prostredí, biometrická identifikácia a spracovanie tichého filmu,“ Shillingford pokračoval.

Zatiaľ čo sledovanie bude problémom s akoukoľvek technológiou, ako je táto, Nando de Freitas, ktorý na projekte tiež pracoval, povedal, že to nie je aplikácia, na ktorú sa zamerali. Povedal však, že by „neprekvapilo“, keby sa iné laboratóriá v budúcnosti pokúsili na tento účel stavať.

„Verejnosť si to musí uvedomiť a spoliehať sa na naše zákonné demokratické inštitúcie, že zavedú vhodné zákony, ktoré budú chrániť naše súkromie a dôstojnosť,“ pokračoval de Freitas. "Dúfame, že zverejnením tejto práce pomôžeme zvýšiť povedomie a zároveň budeme stále zdôrazňovať užitočnosť tejto technológie na pomoc ľuďom v núdzi."

Odporúčania redaktorov

  • Konkurent spoločnosti Apple ChatGPT môže automaticky napísať kód za vás
  • Meta vytvorila DALL-E pre video a je to strašidelné aj úžasné
  • Optické ilúzie by nám mohli pomôcť vybudovať ďalšiu generáciu AI
  • Lambda's laptop machine learning je maskovaný Razer
  • Prečítajte si strašidelne krásne „syntetické písmo“ od A.I. ktorý si myslí, že je to Boh

Zlepšite svoj životný štýlDigitálne trendy pomáhajú čitateľom mať prehľad o rýchlo sa rozvíjajúcom svete technológií so všetkými najnovšími správami, zábavnými recenziami produktov, užitočnými úvodníkmi a jedinečnými ukážkami.