Meta a făcut DALL-E pentru video și este atât înfiorător, cât și uimitor

Meta a dezvăluit un model nebun de inteligență artificială care permite utilizatorilor să-și transforme descrierile tastate în video. Sistemul este numit Faceți un videoclip și este cea mai recentă tendință de conținut generat de AI pe web.

Sistemul acceptă descrieri scurte precum „un robot care surfează un val în ocean” sau „peștele-clov înotând prin reciful de corali” și generează dinamic un GIF scurt al descrierii. Există chiar și trei stiluri diferite de videoclipuri din care puteți alege: suprarealist, realist și stilizat.

Pictură cu pensula unui artist pe o pânză de aproape

Potrivit unui postare pe Facebook de Meta CEO, Mark Zuckerberg, traducerea textului scris în video este mult mai dificilă din cauza modului în care videoclipul necesită mișcare:

Videoclipuri recomandate

„Este mult mai greu să generezi videoclipuri decât fotografii, deoarece, dincolo de generarea corectă a fiecărui pixel, sistemul trebuie, de asemenea, să prezică cum se vor schimba acestea în timp. Make-A-Video rezolvă acest lucru adăugând un strat de învățare nesupravegheată care permite sistemului să înțeleagă mișcarea din lumea fizică și să o aplice la generarea tradițională de text la imagine.”

Un cuplu tânăr care merge pe o ploaie puternică

Echipa de cercetare AI a lui Meta a scris a hârtie descriind modul în care sistemul funcționează și cum diferă de metodele actuale text-to-image (T2I). Spre deosebire de alte modele de limbaj de mașină, metoda Text-to-Video (T2V) de la Meta nu utilizează perechi text-video predefinite. De exemplu, nu se asociază „om care merge” cu un videoclip cu un bărbat real care merge.

Dacă asta seamănă mult cu DALL-E, populara aplicație T2I, nu ai fi departe. Alte aplicații T2I au fost lansate de când DALL-E a câștigat popularitate. TikTok a lansat un filtru în august numit AI Greenscreen care generează imagini de stil de pictură pe baza cuvintelor pe care le tastezi.

Un pui de leneș pufos, cu o pălărie portocalie tricotată, încearcă să-și dea seama de aproape un laptop, un ecran de iluminat de studio foarte detaliat care se reflectă în ochi

Conținutul generat de AI a devenit destul de popular în ultimii câțiva ani. Tehnologia deepfake, tehnici de învățare automată pentru a înlocui fața unei persoane cu alta, este folosită chiar și de studiourile de efecte vizuale pentru emisiuni cu buget mare, cum ar fi Mandalorianul.

În iulie, The Times a raportat în mod eronat despre o femeie ucraineană în mijlocul războiului Rusia-Ucraina. Problema este că ea nu era reală.

Amenințarea AI probabil nu este o amenințare reală, dar proiecte precum DALL-E și Make-A-Video sunt explorări distractive în unele dintre posibilitățile interesante.

Recomandările editorilor

  • Rivalul ChatGPT al Apple poate scrie automat cod pentru tine
  • Bing Image Creator aduce imagini generate de DALL-E AI în browser
  • Am văzut viitorul (depărtat) al căutării AI pe web – iată unde este uimitor și unde se luptă
  • AI Dall-E care generează imagini este acum gratuit pentru oricine să se joace
  • I-am prezentat ideea mea ridicolă de pornire unui robot VC

Îmbunătățește-ți stilul de viațăDigital Trends îi ajută pe cititori să țină cont de lumea rapidă a tehnologiei cu toate cele mai recente știri, recenzii distractive despre produse, editoriale perspicace și anticipări unice.