Leppelesende AI knuser mennesker ved å tolke stille setninger

LipNet: Hvor enkelt tror du lipreading er?

En av de mest minneverdige delene av Stanley Kubricks sci-fi-mesterverk 2001: A Space Odyssey er en plotline der to medlemmer av Discovery One romskipsbesetningen blir stadig mer mistenksom overfor oppførselen til skipets AI-assistent, HAL 9000.

Når de vet at HAL hele tiden lytter til det de sier, trekker de seg tilbake et sted de vet at HAL ikke kan lytte og godtar å koble fra ham. HAL buldrer planen deres etter at de to astronautene ikke klarer å ta hensyn til AIs overlegne leppeavlesningsevner.

Futuristiske greier, ikke sant? Ikke ifølge forskning utført av etterforskere ved Oxford University. De har utviklet et kunstig intelligensprogram kalt LipNet, som er i stand til å tolke nøyaktig hva folk sier, utelukkende basert på måten de beveger munnen på når de snakker.

I slekt

Photoshop AI mener «lykke» er et smil med råtne tenner
Jeg presenterte min latterlige oppstartside til en robot-VC
Hvordan vil vi vite når en AI faktisk blir sansende?

"LipNet utfører leppeavlesning på setningsnivå ved hjelp av maskinlæring,"

Brendan Shillingford, en av forskerne på papir, fortalte Digital Trends. "Et nevralt nettverk som ligner på state-of-the-art talegjenkjenningsmodeller behandler en sekvens av videorammer, og kartlegger disse til en setning. Tidligere tilnærminger fungerte med forutsagte individuelle ord i stedet for setninger."

Anbefalte videoer

Ytelsen til LipNet er utrolig gunstig sammenlignet med menneskelige leppeavlesningseksperter på GRID-korpus, det største offentlig tilgjengelige leppeavlesningsdatasettet på setningsnivå. Faktisk, hvor menneskelige eksperter fikk bare 52 prosent, scoret LipNet 93 prosent. Den setningsbaserte tilnærmingen til leppelesing knuste også det beste forrige forsøket fra en maskin, som klarte 79,6 prosent nøyaktighet på samme datasett.

Men mens den fiktive HAL 9000 bruker sine leppelesende krefter til ingen nytte, har teamet bak LipNet andre mål for opprettelsen. Rundt 360 millioner mennesker over hele verden har nedsatt hørselstap. Verktøy som LipNet kan være svært viktige for disse personene, ved å hjelpe til med å tolke tale nøyaktig på en måte som gjør livet deres enklere.

"Andre applikasjoner som vi er interessert i inkluderer stille diktering i offentlige rom, skjulte samtaler, talegjenkjenning i støyende omgivelser, biometrisk identifikasjon og lydløs filmbehandling," Shillingford fortsatte.

Selv om overvåking kommer til å være et problem med all teknologi som dette, Nando de Freitas, som også jobbet med prosjektet, sa at det ikke er en applikasjon de har fokusert på. Imidlertid sa han at det "ikke ville være overraskende" hvis andre laboratorier forsøkte å bygge på slikt arbeid for det formålet i fremtiden.

"Offentligheten må være klar over dette, og stole på at våre juridiske demokratiske institusjoner etablerer passende lover som beskytter vårt privatliv og verdighet," fortsatte de Freitas. "Det er vårt håp at vi ved å publisere dette arbeidet bidrar til å øke bevisstheten, samtidig som vi understreker nytten av denne teknologien for å hjelpe mennesker i nød."

Redaktørenes anbefalinger

Apples ChatGPT-rival kan automatisk skrive kode for deg
Meta laget DALL-E for video, og det er både skummelt og fantastisk
Optiske illusjoner kan hjelpe oss med å bygge neste generasjon AI
Lambdas maskinlæringslaptop er en Razer i forkledning
Les den uhyggelig vakre 'syntetiske skriften' til en A.I. som tror det er Gud

Oppgrader livsstilen dinDigitale trender hjelper leserne å følge med på den fartsfylte teknologiverdenen med alle de siste nyhetene, morsomme produktanmeldelser, innsiktsfulle redaksjoner og unike sniktitter.

Leppelesende AI knuser mennesker ved å tolke stille setninger

Redaktørenes anbefalinger

Kategorier

Nylig

Samsung svarer tilbake med sin egen 105-tommers buede 4K-TV

Call of Duty: Modern Warfare 3 drops lanseringstrailer

Ryan Gosling ventet å spille i Blade Runner-oppfølgeren