Meta membuat DALL-E untuk video, dan itu menyeramkan sekaligus menakjubkan

Meta meluncurkan model kecerdasan buatan gila yang memungkinkan pengguna mengubah deskripsi yang mereka ketik menjadi video. Sistem itu disebut Membuat video dan merupakan tren terbaru konten yang dihasilkan AI di web.

Sistem menerima deskripsi singkat seperti “robot berselancar di ombak di lautan” atau “ikan badut berenang di terumbu karang” dan secara dinamis menghasilkan GIF singkat dari deskripsi tersebut. Bahkan ada tiga gaya video berbeda yang dapat dipilih: nyata, realistis, dan bergaya.

Lukisan kuas seorang seniman di atas kanvas dari dekat

Menurut a kiriman Facebook oleh CEO Meta, Mark Zuckerberg, menerjemahkan teks tertulis menjadi video jauh lebih sulit karena video memerlukan gerakan:

Video yang Direkomendasikan

“Jauh lebih sulit menghasilkan video dibandingkan foto karena selain menghasilkan setiap piksel dengan benar, sistem juga harus memprediksi bagaimana piksel akan berubah seiring waktu. Make-A-Video memecahkan masalah ini dengan menambahkan lapisan pembelajaran tanpa pengawasan yang memungkinkan sistem memahami gerakan di dunia fisik dan menerapkannya pada pembuatan teks-ke-gambar tradisional.”

Sepasang suami istri muda berjalan di tengah hujan lebat

Tim Riset AI Meta menulis a kertas menjelaskan cara kerja sistem dan perbedaannya dengan metode text-to-image (T2I) saat ini. Tidak seperti model bahasa mesin lainnya, metode Text-to-Video (T2V) Meta tidak menggunakan pasangan teks-video yang telah ditentukan sebelumnya. Misalnya, video tersebut tidak memasangkan “pria berjalan” dengan video pria berjalan sebenarnya.

Jika ini terdengar sangat mirip dengan DALL-E, aplikasi T2I yang populer, Anda tidak akan salah lagi. Aplikasi T2I lainnya telah diluncurkan sejak DALL-E mendapatkan popularitas. TikTok merilis filter pada bulan Agustus disebut AI Greenscreen yang menghasilkan gambar gaya melukis berdasarkan kata-kata yang Anda ketik.

Seekor bayi kungkang berbulu halus dengan topi rajutan oranye mencoba membayangkan laptop dari jarak dekat dengan layar pencahayaan studio yang sangat detail terpantul di matanya

Konten yang dihasilkan AI menjadi sangat menarik dalam beberapa tahun terakhir. Teknologi pemalsuan dalam, teknik pembelajaran mesin untuk mengganti wajah seseorang dengan wajah lain, bahkan digunakan oleh studio efek visual untuk pertunjukan beranggaran besar seperti Mandalorian.

Pada bulan Juli, The Times secara keliru melaporkan seorang wanita Ukraina di tengah perang Rusia-Ukraina. Masalahnya adalah dia tidak nyata.

Ancaman AI mungkin bukanlah ancaman nyata, namun proyek seperti DALL-E dan Make-A-Video merupakan eksplorasi menyenangkan ke dalam beberapa kemungkinan menarik.

Rekomendasi Editor

  • Saingan Apple ChatGPT mungkin secara otomatis menulis kode untuk Anda
  • Bing Image Creator menghadirkan gambar yang dihasilkan DALL-E AI ke browser Anda
  • Saya telah melihat masa depan pencarian web AI (yang masih jauh) – di sinilah keunggulannya dan tantangannya
  • AI Dall-E yang menghasilkan gambar kini gratis untuk dimainkan oleh siapa saja
  • Saya menyampaikan ide startup konyol saya kepada robot VC

Tingkatkan gaya hidup AndaTren Digital membantu pembaca mengawasi dunia teknologi yang bergerak cepat dengan semua berita terbaru, ulasan produk yang menyenangkan, editorial yang berwawasan luas, dan cuplikan unik.