Huulilta lukeva tekoäly murskaa ihmiset tulkitseessaan hiljaisia ​​lauseita

LipNet: Kuinka helppoa luulet huulten lukemisen olevan?

Yksi Stanley Kubrickin sci-fi-mestariteoksen ikimuistoisimmista osista 2001: Avaruusodysseia on juoni, jossa kaksi jäsentä Discovery One avaruusaluksen miehistö epäilee yhä enemmän aluksen tekoälyavustajan, HAL 9000:n käyttäytymistä.

Tietäen, että HAL kuuntelee jatkuvasti, mitä he sanovat, he vetäytyvät jonnekin, jonka he tietävät, että HAL ei voi kuunnella ja suostuvat katkaisemaan hänet. HAL jyrisee suunnitelmaansa sen jälkeen, kun kaksi astronauttia eivät ole ottaneet huomioon Tekoälyn ylivertaiset huultenlukuominaisuudet.

Futuristista tavaraa, vai mitä? Ei Oxfordin yliopiston tutkijoiden tekemän tutkimuksen mukaan. He ovat kehittäneet tekoälyohjelman nimeltä LipNet, joka pystyy tulkitsemaan tarkasti, mitä ihmiset sanovat, puhtaasti sen perusteella, miten he liikkuvat suutaan puhuessaan.

Liittyvät

  • Photoshop AI ajattelee, että "onnellisuus" on hymy mätäneillä hampailla
  • Esitin naurettavan startup-ideani robotti-VC: lle
  • Mistä tiedämme, milloin tekoäly todella tulee tuntevaksi?

"LipNet suorittaa huulten lukemisen lausetasolla koneoppimisen avulla" Brendan Shillingford, yksi tutkijoista paperi, kertoi Digital Trendsille. "Hurmotekniikan huippuluokan puheentunnistusmallien kaltainen hermoverkko käsittelee videokehysten sarjan ja kuvaa ne lauseeksi. Aiemmat lähestymistavat toimivat ennustetuilla yksittäisillä sanoilla eikä lauseilla."

Suositellut videot

LipNetin suorituskyky on uskomattoman parempi verrattuna ihmisten huultenlukuasiantuntijoihin GRID-korpukseen, joka on suurin julkisesti saatavilla oleva lausetason huultenlukutietoaineisto. Itse asiassa, missä ihmisasiantuntijat saivat vain 52 prosenttia, LipNet sai 93 prosenttia. Sen lausepohjainen lähestymistapa huulilta lukemiseen murskasi myös koneen parhaan aiemman yrityksen, joka onnistui 79,6 prosentin tarkkuudella samassa tietojoukossa.

Vaikka kuvitteellinen HAL 9000 käyttää huultenlukukykyään turhaan, LipNetin takana olevalla tiimillä on kuitenkin muita tavoitteita niiden luomisessa. Noin 360 miljoonalla ihmisellä maailmanlaajuisesti on vammainen kuulovaurio. LipNetin kaltaiset työkalut voivat olla erittäin tärkeitä näille henkilöille, koska ne auttavat tulkitsemaan puhetta tarkasti tavalla, joka helpottaa heidän elämäänsä.

”Muita kiinnostavia sovelluksia ovat hiljainen sanelu julkisissa tiloissa, salaiset keskustelut, puheentunnistus meluisissa ympäristöissä, biometrinen tunnistus ja mykkäelokuvan käsittely", Shillingford jatkui.

Vaikka valvonta tulee olemaan ongelma minkä tahansa tällaisen tekniikan kanssa, Nando de Freitas, joka myös työskenteli projektin parissa, sanoi, että se ei ole sovellus, johon he ovat keskittyneet. Hän sanoi kuitenkin, että "ei olisi yllättävää", jos muut laboratoriot yrittäisivät jatkossa rakentaa tällaista työtä tähän tarkoitukseen.

"Yleisön on oltava tietoinen tästä ja luotettava laillisiin demokraattisiin instituutioihimme laatimaan asianmukaiset lait, jotka suojaavat yksityisyyttämme ja ihmisarvoamme", de Freitas jatkoi. "Toivomme, että julkaisemalla tämän teoksen autamme lisäämään tietoisuutta ja samalla korostamme tämän tekniikan hyödyllisyyttä hädässä olevien ihmisten auttamiseksi."

Toimittajien suositukset

  • Applen ChatGPT-kilpailija voi kirjoittaa koodin automaattisesti puolestasi
  • Meta teki DALL-E: n videoita varten, ja se on sekä kammottavaa että hämmästyttävää
  • Optiset illuusiot voivat auttaa meitä rakentamaan seuraavan sukupolven tekoälyä
  • Lambdan koneoppiva kannettava on naamioitu Razer
  • Lue aavemaisen kaunista A.I: n synteettistä kirjoitusta. joka luulee olevansa Jumala

Päivitä elämäntapasiDigital Trends auttaa lukijoita pysymään tekniikan nopeatempoisessa maailmassa uusimpien uutisten, hauskojen tuotearvostelujen, oivaltavien toimitusten ja ainutlaatuisten kurkistusten avulla.