Meta laget DALL-E for video, og det er både skummelt og fantastisk

Meta avduket en gal kunstig intelligens-modell som lar brukere gjøre om de skrevne beskrivelsene sine til video. Systemet kalles Lag en video og er det siste innen en trend med AI-generert innhold på nettet.

Systemet godtar korte beskrivelser som "en robot som surfer på en bølge i havet" eller "klovnefisk som svømmer gjennom korallrevet" og genererer dynamisk en kort GIF av beskrivelsen. Det er til og med tre forskjellige videostiler å velge mellom: surrealistisk, realistisk og stilisert.

En kunstners penselmaleri på et lerret nærbilde

I følge a Facebook-innlegg av Meta CEO, Mark Zuckerberg, er det mye vanskeligere å oversette skrevet tekst til video på grunn av hvordan video krever bevegelse:

Anbefalte videoer

"Det er mye vanskeligere å generere video enn bilder fordi utover å generere hver piksel riktig, må systemet også forutsi hvordan de vil endre seg over tid. Make-A-Video løser dette ved å legge til et lag med uovervåket læring som gjør det mulig for systemet å forstå bevegelse i den fysiske verden og bruke den til tradisjonell tekst-til-bilde-generering."

Et ungt par går i kraftig regn

Metas AI Research-team skrev en papir som beskriver hvordan systemet fungerer og hvordan det skiller seg fra gjeldende tekst-til-bilde (T2I) metoder. I motsetning til andre maskinspråkmodeller, bruker ikke Metas tekst-til-video (T2V)-metode forhåndsdefinerte tekst-video-par. Den kobler for eksempel ikke «mann som går» med en video av en ekte mann som går.

Hvis dette høres mye ut som DALL-E, den populære T2I-applikasjonen, ville du ikke vært langt unna. Andre T2I-applikasjoner har rullet ut siden DALL-E ble populær. TikTok har gitt ut et filter i august kalt AI Greenscreen som genererer malestilbilder basert på ordene du skriver.

En fluffy babydovendyr med en oransje strikket lue prøver å finne ut en bærbar PC på nært hold med svært detaljert studiobelysningsskjerm som reflekterer i øyet.

AI-generert innhold har blitt ganske buzzworthy i løpet av de siste årene. Deepfake-teknologi, maskinlæringsteknikker for å erstatte en persons ansikt med et annet, brukes til og med av visuelle effektstudioer for store budsjettprogrammer som Mandalorianeren.

I juli rapporterte The Times feilaktig om en ukrainsk kvinne midt i krigen mellom Russland og Ukraina. Problemet er hun var ikke ekte.

Trusselen fra AI sannsynligvis er ikke en reell trussel, men prosjekter som DALL-E og Make-A-Video er morsomme utforskninger av noen av de interessante mulighetene.

Redaktørenes anbefalinger

  • Apples ChatGPT-rival kan automatisk skrive kode for deg
  • Bing Image Creator bringer DALL-E AI-genererte bilder til nettleseren din
  • Jeg har sett den (fjerne) fremtiden til AI-nettsøk – her er det fantastisk, og hvor det sliter
  • Bildegenererende AI Dall-E er nå gratis for alle å leke med
  • Jeg presenterte min latterlige oppstartside til en robot-VC

Oppgrader livsstilen dinDigitale trender hjelper leserne å følge med på den fartsfylte teknologiverdenen med alle de siste nyhetene, morsomme produktanmeldelser, innsiktsfulle redaksjoner og unike sniktitter.