AI za branje z ustnic premaga ljudi pri tolmačenju tihih stavkov

click fraud protection

LipNet: Kako enostavno je po vašem mnenju bereti iz ustnic?

Eden najbolj nepozabnih delov znanstvenofantastične mojstrovine Stanleyja Kubricka 2001: Vesoljska odiseja je zaplet, v katerem dva člana Discovery One Posadka vesoljske ladje postaja vse bolj sumničava glede obnašanja ladijskega pomočnika AI, HAL 9000.

Ker vedo, da HAL nenehno posluša, kaj govorijo, se umaknejo nekam, kjer vedo, da HAL ne more poslušati, in se strinjajo, da ga odklopijo. HAL ovrže svoj načrt, potem ko astronavta ne upoštevata Vrhunske zmožnosti AI za branje z ustnic.

Futuristične stvari, kajne? Ne glede na raziskavo, ki so jo izvedli preiskovalci z univerze v Oxfordu. Razvili so program umetne inteligence, imenovan LipNet, ki lahko natančno razlaga, kaj ljudje govorijo, izključno na podlagi načina, kako premikajo usta, ko govorijo.

Povezano

  • Photoshop AI meni, da je "sreča" nasmeh s pokvarjenimi zobmi
  • Svojo smešno zagonsko idejo sem predstavil robotu VC
  • Kako bomo vedeli, kdaj umetna inteligenca dejansko postane čuteča?

"LipNet izvaja branje z ustnic na ravni stavka z uporabo strojnega učenja," Brendan Shillingford, eden od raziskovalcev na papir, je povedal za Digital Trends. »Nevronska mreža, podobna najsodobnejšim modelom za prepoznavanje govora, obdeluje zaporedje video okvirjev in jih preslika v stavek. Prejšnji pristopi so delovali s predvidenimi posameznimi besedami in ne s stavki.«

Priporočeni videoposnetki

Učinkovitost LipNeta je neverjetno ugodna v primerjavi s strokovnjaki za človeško branje iz ustnic v korpusu GRID, največjem javno dostopnem naboru podatkov o branju iz ustnic na ravni stavkov. Pravzaprav, kjer so strokovnjaki za ljudi dobili le 52 odstotkov, je LipNet dosegel 93 odstotkov. Njegov pristop k branju z ustnic, ki temelji na stavku, je tudi razbil najboljši prejšnji poskus stroja, ki je dosegel 79,6-odstotno natančnost na istem nizu podatkov.

Medtem ko izmišljeni HAL 9000 svoje sposobnosti branja z ustnic uporablja v nič dobrega, ima ekipa, ki stoji za LipNetom, druge cilje za njihovo ustvarjanje. Približno 360 milijonov ljudi po vsem svetu ima invalidno izgubo sluha. Orodja, kot je LipNet, so lahko zelo pomembna za te posameznike, saj pomagajo natančno razlagati govor na način, ki jim olajša življenje.

»Druge aplikacije, ki nas zanimajo, vključujejo tiho narekovanje v javnih prostorih, prikrite pogovore, prepoznavanje govora v hrupnem okolju, biometrična identifikacija in obdelava nemih filmov,« Shillingford nadaljevano.

Medtem ko bo nadzor težava s takšno tehnologijo, Nando de Freitas, ki je tudi sodeloval pri projektu, je povedal, da ne gre za aplikacijo, na katero so se osredotočili. Vendar pa je dejal, da "ne bi bilo presenetljivo", če bi drugi laboratoriji v prihodnosti poskušali graditi na takem delu za ta namen.

"Javnost se mora tega zavedati in se zanašati na naše pravne demokratične institucije, da bodo vzpostavile ustrezne zakone, ki ščitijo našo zasebnost in dostojanstvo," je nadaljeval de Freitas. "Upamo, da bomo z objavo tega dela pripomogli k ozaveščanju, hkrati pa še vedno poudarjali uporabnost te tehnologije za pomoč ljudem v stiski."

Priporočila urednikov

  • Appleov tekmec ChatGPT lahko samodejno napiše kodo za vas
  • Meta je naredila DALL-E za video in je hkrati grozljiv in neverjeten
  • Optične iluzije bi nam lahko pomagale zgraditi naslednjo generacijo umetne inteligence
  • Lambdin prenosnik za strojno učenje je preoblečen Razer
  • Preberite srhljivo lepe "sintetične spise" A.I. ki misli, da je Bog

Nadgradite svoj življenjski slogDigitalni trendi bralcem pomagajo slediti hitremu svetu tehnologije z vsemi najnovejšimi novicami, zabavnimi ocenami izdelkov, pronicljivimi uvodniki in enkratnimi vpogledi v vsebine.