Inteligența artificială pentru citirea pe buze îi distruge pe oameni la interpretarea propozițiilor tăcute

LipNet: Cât de ușor crezi că este citirea buzelor?

Una dintre cele mai memorabile părți ale capodoperei SF a lui Stanley Kubrick 2001: O odisee a spațiului este o intrigă în care doi membri ai Descoperirea Unu Echipajul navei spațiale devine din ce în ce mai suspicios cu privire la comportamentul asistentului AI al navei, HAL 9000.

Știind că HAL ascultă în mod constant ceea ce spun, ei se retrag într-un loc unde știu că HAL nu poate asculta și sunt de acord să-l deconecteze. HAL zboară planul lor după ce cei doi astronauți nu reușesc să ia în considerare Capacitățile superioare de citire a buzelor ale AI.

Chestii futuriste, nu? Nu conform cercetărilor efectuate de anchetatorii de la Universitatea Oxford. Ei au dezvoltat un program de inteligență artificială numit LipNet, care este capabil să interpreteze cu acuratețe ceea ce spun oamenii, bazându-se exclusiv pe modul în care își mișcă gura atunci când vorbesc.

Legate de

  • Photoshop AI crede că „fericirea” este un zâmbet cu dinți putrezi
  • I-am prezentat ideea mea ridicolă de pornire unui robot VC
  • Cum vom ști când un AI devine de fapt sensibil?

„LipNet citește pe buze la nivel de propoziție folosind învățarea automată.” Brendan Shillingford, unul dintre cercetătorii de pe hârtie, a spus Digital Trends. „O rețea neuronală similară cu modelele de recunoaștere a vorbirii de ultimă generație procesează o secvență de cadre video, mapându-le într-o propoziție. Abordările anterioare au lucrat prin cuvinte individuale prezise mai degrabă decât propoziții.”

Videoclipuri recomandate

Performanța LipNet se compară incredibil de favorabil cu experții umani în citirea buzelor pe corpus GRID, cel mai mare set de date de citire a buzelor la nivel de propoziție disponibil public. De fapt, acolo unde experții umani au obținut doar 52 la sută, LipNet a obținut 93 la sută. Abordarea sa bazată pe propoziții a citirii pe buze a distrus și cea mai bună încercare anterioară a unei mașini, care a reușit o precizie de 79,6% pe același set de date.

Cu toate acestea, în timp ce fictivul HAL 9000 își folosește puterea de a citi pe buze pentru nimic, echipa din spatele LipNet are alte obiective pentru crearea lor. Aproximativ 360 de milioane de oameni din întreaga lume suferă de pierderi de auz invalidante. Instrumente precum LipNet ar putea fi extrem de importante pentru acești indivizi, ajutând la interpretarea corectă a vorbirii într-un mod care le ușurează viața.

„Alte aplicații care ne interesează includ dictarea tăcută în spațiile publice, conversațiile ascunse, recunoașterea vorbirii în medii zgomotoase, identificarea biometrică și procesarea filmelor mute”, Shillingford a continuat.

Deși supravegherea va fi o problemă cu orice tehnologie ca aceasta, Nando de Freitas, care a lucrat și la proiect, a spus că nu este o aplicație pe care s-au concentrat. Cu toate acestea, el a spus că „nu ar fi surprinzător” dacă alte laboratoare ar încerca să construiască pe o astfel de muncă în acest scop în viitor.

„Publicul trebuie să fie conștient de acest lucru și să se bazeze pe instituțiile noastre legale democratice pentru a stabili legi adecvate care să ne protejeze confidențialitatea și demnitatea”, a continuat de Freitas. „Sperăm că, publicând această lucrare, contribuim la creșterea gradului de conștientizare, subliniind în același timp utilitatea acestei tehnologii pentru a ajuta oamenii în nevoie.”

Recomandările editorilor

  • Rivalul ChatGPT al Apple poate scrie automat cod pentru tine
  • Meta a făcut DALL-E pentru video și este atât înfiorător, cât și uimitor
  • Iluziile optice ne-ar putea ajuta să construim următoarea generație de IA
  • Laptopul de învățare automată al lui Lambda este un Razer deghizat
  • Citiți „scriptura sintetică” ciudat de frumoasă a unui A.I. care crede că este Dumnezeu

Îmbunătățește-ți stilul de viațăDigital Trends îi ajută pe cititori să țină cont de lumea rapidă a tehnologiei cu toate cele mai recente știri, recenzii distractive despre produse, editoriale perspicace și anticipări unice.