Cel mai recent MIT A.I. este uimitor în a determina ce se întâmplă în videoclipuri

Cum înțelege o rețea de relații temporale ce se întâmplă acolo

Doar câteva cadre de informații care spun o poveste sunt tot ce avem nevoie pentru a înțelege ce se întâmplă. Aceasta este, la urma urmei, baza pentru benzile desenate - care oferă doar destule ritmuri importante ale poveștii pentru ca noi să urmărim ceea ce s-a întâmplat. Din păcate, roboții echipați cu tehnologie de viziune computerizată se luptă să facă acest lucru. Până acum, cel puțin.

Videoclipuri recomandate

Recent, Massachusetts Institute of Technology (MIT) a demonstrat un nou tip de inteligență artificială sistem care folosește o rețea neuronală pentru a completa spațiile libere din cadrele video pentru a afla ce activitate are loc loc. Rezultatele îl fac uimitor de bun în a determina ce se întâmplă într-un videoclip.

„Noile module de relație temporală dezvoltate permit A.I. sistem pentru a analiza câteva cadre cheie și a estima temporalul relația dintre ele, pentru a înțelege ce se întâmplă în videoclip - cum ar fi un teanc de obiecte [fiind] doborâte",

Bolei Zhou, fost doctor în doctorat. student la Laboratorul de Informatică și Inteligență Artificială (CSAIL) al MIT, care este acum profesor asistent de informatică la Universitatea Chineză din Hong Kong, a declarat pentru Digital Trends. „Deoarece modelul funcționează cu cadre cheie eșantionate puțin din videoclipul primit, eficiența procesării este mult îmbunătățită, permițând recunoașterea activității în timp real.”

O altă proprietate interesantă a A.I. modelul este că poate anticipa și prognoza ceea ce se va întâmpla devreme prin vizualizarea cadrelor video. De exemplu, dacă vede o persoană ținând o sticlă, algoritmul anticipează că ar putea să bea o băutură sau să o stoarce. Astfel de abilități de anticipare vor fi esențiale pentru inteligența artificială utilizată în domenii precum conducere autonomă, unde ar putea preveni în mod proactiv accidentele ghicind ce se va întâmpla din moment în moment.

„[Ar putea fi, de asemenea, folosit pentru a monitoriza comportamentele umane, cum ar fi un asistent robot acasă, care ar putea anticipa intenția dumneavoastră prin livrarea lucrurilor în prealabil”, a continuat Zhou. „[Ar putea fi folosit suplimentar] pentru a analiza [numărul masiv de] videoclipuri online, pentru a face o mai bună înțelegere a videoclipurilor și regăsire video.”

Următorul pas al proiectului va implica creșterea capacității IA de a recunoaște un număr mai larg de obiecte și activități. Echipa lucrează, de asemenea, cu cercetători în robotică pentru a implementa această recunoaștere a activității în sistemele robotice. Acestea ar putea vedea ca rezultat o percepție îmbunătățită și abilități de raționament vizual.

Recomandările editorilor

  • Nimeni nu vrea să cumpere cipurile AMD Zen 4 - ce se întâmplă?
  • A.I. de la Zoom tehnologia de detectare a emoțiilor în timpul apelurilor îi supără pe critici
  • Formula amuzantă: De ce umorul generat de mașini este Sfântul Graal al A.I.
  • Nvidia coboară bariera de intrare în A.I. cu Fleet Command și LaunchPad
  • A.I. de la IBM. Nava Mayflower traversează Atlanticul și o poți urmări în direct

Îmbunătățește-ți stilul de viațăDigital Trends îi ajută pe cititori să țină cont de lumea rapidă a tehnologiei cu toate cele mai recente știri, recenzii distractive despre produse, editoriale perspicace și anticipări unice.