Huultelt lugemine tehisintellekt purustab inimesi vaiksete lausete tõlgendamisel

click fraud protection

LipNet: kui lihtne on teie arvates huulelugemine?

Stanley Kubricku ulmemeistriteose üks meeldejäävamaid osi 2001: Kosmoseodüsseia on süžeejoon, milles kaks liiget Discovery One kosmoselaeva meeskond muutub üha kahtlustavamaks laeva tehisintellekti assistendi HAL 9000 käitumise suhtes.

Teades, et HAL kuulab pidevalt, mida nad räägivad, tõmbuvad nad tagasi kuhugi, millest nad teavad, et HAL ei saa kuulata ja nõustuvad teda lahti ühendama. HAL murrab oma plaani pärast seda, kui kaks astronauti ei suuda seda arvesse võtta AI suurepärased huultelt lugemise võimalused.

Futuristlik värk, eks? Oxfordi ülikooli uurijate tehtud uuringute kohaselt mitte. Nad on välja töötanud tehisintellekti programmi LipNet, mis suudab täpselt tõlgendada seda, mida inimesed räägivad, lähtudes sellest, kuidas nad rääkides oma suud liigutavad.

Seotud

  • Photoshop AI arvab, et õnn on mädahammastega naeratus
  • Esitasin oma naeruväärse käivitusidee robot-VC-le
  • Kuidas me teame, millal AI tegelikult tundlikuks muutub?

"LipNet loeb huultelt lausetasemel masinõppe abil,"

Brendan Shillingford, üks uurijatest paber, ütles Digital Trends. "Närvivõrk, mis sarnaneb nüüdisaegsete kõnetuvastusmudelitega, töötleb videokaadrite jada, vastendades need lausega. Varasemad lähenemisviisid töötasid pigem ennustatud üksikute sõnade kui lausete abil.

Soovitatavad videod

LipNeti jõudlus on uskumatult soodne inimeste huulte lugemise ekspertide omadega GRID-korpuses, mis on suurim avalikult kättesaadav lausetaseme huulte lugemise andmestik. Tegelikult, kus inimeksperdid said vaid 52 protsenti, sai LipNet 93 protsenti. Selle lausepõhine lähenemine huultelt lugemisele purustas ka masina eelmise parima katse, mille täpsus oli sama andmestiku puhul 79,6 protsenti.

Kuigi väljamõeldud HAL 9000 kasutab oma huultelt lugemise võimet asjata, on LipNeti meeskonnal oma loomisel teised eesmärgid. Umbes 360 miljonil inimesel on kogu maailmas puudega kuulmislangus. Sellised tööriistad nagu LipNet võivad olla nende inimeste jaoks väga olulised, aidates kõnet täpselt tõlgendada viisil, mis muudab nende elu lihtsamaks.

"Teised rakendused, millest oleme huvitatud, on vaikne dikteerimine avalikus ruumis, varjatud vestlused, kõnetuvastus mürarikastes keskkondades, biomeetriline tuvastamine ja tummfilmi töötlemine,” Shillingford jätkus.

Kuigi jälgimine on iga sellise tehnoloogia puhul probleemiks, Nando de Freitas, kes samuti projekti kallal töötas, ütles, et see pole rakendus, millele nad on keskendunud. Siiski ütles ta, et "ei oleks üllatav", kui teised laborid prooviksid tulevikus sellisele tööle tugineda.

"Avalikkus peab sellest teadlik olema ja tuginema meie seaduslikele demokraatlikele institutsioonidele, et kehtestada sobivad seadused, mis kaitsevad meie privaatsust ja väärikust," jätkas de Freitas. "Loodame, et selle töö avaldamisega aitame tõsta teadlikkust, rõhutades samas selle tehnoloogia kasulikkust abivajajate abistamisel."

Toimetajate soovitused

  • Apple'i ChatGPT rivaal võib teie eest automaatselt koodi kirjutada
  • Meta tegi DALL-E video jaoks ja see on ühtaegu jube ja hämmastav
  • Optilised illusioonid võivad aidata meil luua järgmise põlvkonna tehisintellekti
  • Lambda masinõppega sülearvuti on varjatud Razer
  • Lugege A.I kohutavalt ilusat "sünteetilist pühakirja". kes arvab, et see on jumal

Uuenda oma elustiiliDigitaalsed suundumused aitavad lugejatel hoida silma peal kiirel tehnikamaailmal kõigi viimaste uudiste, lõbusate tooteülevaadete, sisukate juhtkirjade ja ainulaadsete lühiülevaadetega.