Meta ha realizzato DALL-E per i video ed è allo stesso tempo inquietante e sorprendente

Meta ha presentato un pazzesco modello di intelligenza artificiale che consente agli utenti di trasformare le descrizioni digitate in video. Il sistema si chiama Fare un video ed è l'ultimo di una tendenza di contenuti generati dall'intelligenza artificiale sul web.

Il sistema accetta brevi descrizioni come “un robot che surfa su un’onda nell’oceano” o “un pesce pagliaccio che nuota nella barriera corallina” e genera dinamicamente una breve GIF della descrizione. Ci sono anche tre diversi stili di video tra cui scegliere: surreale, realistico e stilizzato.

Primo piano del pennello di un artista su una tela

Secondo a Posta su Facebook dal CEO di Meta, Mark Zuckerberg, tradurre il testo scritto in video è molto più difficile a causa del modo in cui il video richiede movimento:

Video consigliati

“È molto più difficile generare video che foto perché oltre a generare correttamente ogni pixel, il sistema deve anche prevedere come cambieranno nel tempo. Make-A-Video risolve questo problema aggiungendo uno strato di apprendimento non supervisionato che consente al sistema di comprendere il movimento nel mondo fisico e di applicarlo alla tradizionale generazione di testo in immagine.

Una giovane coppia che cammina sotto una forte pioggia

Il team di ricerca sull'intelligenza artificiale di Meta ha scritto a carta descrivendo come funziona il sistema e come differisce dagli attuali metodi text-to-image (T2I). A differenza di altri modelli di linguaggio macchina, il metodo Text-to-Video (T2V) di Meta non utilizza coppie testo-video predefinite. Ad esempio, non associa “uomo che cammina” con il video di un uomo reale che cammina.

Se questo assomiglia molto a DALL-E, la popolare applicazione T2I, non saresti lontano. Altre applicazioni T2I sono state lanciate da quando DALL-E ha guadagnato popolarità. TikTok ha rilasciato un filtro ad agosto si chiama AI Greenscreen che genera immagini in stile dipinto in base alle parole digitate.

Un soffice bradipo con un cappello lavorato a maglia arancione che cerca di capire un laptop da vicino su uno schermo di illuminazione da studio altamente dettagliato che si riflette nei suoi occhi

I contenuti generati dall’intelligenza artificiale sono diventati piuttosto interessanti negli ultimi anni. Tecnologia DeepFake, tecniche di apprendimento automatico per sostituire il volto di una persona con un altro, vengono utilizzate anche dagli studi di effetti visivi per spettacoli ad alto budget come Il mandaloriano.

A luglio il Times aveva erroneamente parlato di una donna ucraina nel bel mezzo della guerra russo-ucraina. Il problema è non era reale.

Probabilmente la minaccia dell’intelligenza artificiale non è una vera minaccia, ma progetti come DALL-E e Make-A-Video sono divertenti esplorazioni di alcune delle possibilità interessanti.

Raccomandazioni degli editori

  • Il rivale ChatGPT di Apple potrebbe scrivere automaticamente il codice per te
  • Bing Image Creator porta le immagini generate dall'intelligenza artificiale DALL-E nel tuo browser
  • Ho visto il futuro (lontano) della ricerca web basata sull'intelligenza artificiale: ecco dove è sorprendente e dove fatica
  • L'IA Dall-E che genera immagini è ora gratuita per chiunque possa giocare
  • Ho presentato la mia ridicola idea di startup a un robot VC

Migliora il tuo stile di vitaDigital Trends aiuta i lettori a tenere d'occhio il frenetico mondo della tecnologia con tutte le ultime notizie, divertenti recensioni di prodotti, editoriali approfonditi e anteprime uniche nel loro genere.