Meta สร้าง DALL-E สำหรับวิดีโอ ซึ่งทั้งน่าขนลุกและน่าทึ่ง

Meta เปิดตัวโมเดลปัญญาประดิษฐ์ที่ช่วยให้ผู้ใช้สามารถเปลี่ยนคำอธิบายที่พิมพ์ลงในวิดีโอได้ ระบบนี้มีชื่อว่า ทำ-A-Video และเป็นเทรนด์ล่าสุดของเนื้อหาที่สร้างโดย AI บนเว็บ

ระบบยอมรับคำอธิบายสั้นๆ เช่น “หุ่นยนต์โต้คลื่นในมหาสมุทร” หรือ “ปลาการ์ตูนว่ายในแนวปะการัง” และสร้าง GIF สั้นๆ ของคำอธิบายแบบไดนามิก มีวิดีโอให้เลือกสามสไตล์: เหนือจริง สมจริง และมีสไตล์

พู่กันของศิลปินวาดภาพบนผืนผ้าใบอย่างใกล้ชิด

ตามก โพสต์บนเฟซบุ๊ก โดย Mark Zuckerberg ซีอีโอ Meta การแปลข้อความที่เขียนเป็นวิดีโอนั้นยากกว่ามากเนื่องจากวิดีโอต้องมีการเคลื่อนไหว:

วิดีโอแนะนำ

“การสร้างวิดีโอนั้นยากกว่าภาพถ่ายมาก เนื่องจากนอกเหนือจากการสร้างแต่ละพิกเซลอย่างถูกต้องแล้ว ระบบยังต้องคาดการณ์ว่าพิกเซลจะเปลี่ยนแปลงไปอย่างไรเมื่อเวลาผ่านไป Make-A-Video แก้ปัญหานี้ด้วยการเพิ่มชั้นของการเรียนรู้แบบไม่มีผู้ดูแลซึ่งช่วยให้ระบบเข้าใจการเคลื่อนไหวในโลกทางกายภาพ และนำไปใช้กับการสร้างข้อความเป็นรูปภาพแบบดั้งเดิม”

คู่รักหนุ่มสาวกำลังเดินท่ามกลางสายฝนที่ตกหนัก

ทีมวิจัย AI ของ Meta เขียน กระดาษ อธิบายวิธีการทำงานของระบบและความแตกต่างจากวิธีแปลงข้อความเป็นรูปภาพ (T2I) ในปัจจุบัน ต่างจากรุ่นภาษาเครื่องอื่นๆ วิธี Text-to-Video (T2V) ของ Meta ไม่ได้ใช้คู่ข้อความ-วิดีโอที่กำหนดไว้ล่วงหน้า เช่น จะไม่จับคู่ "ผู้ชายกำลังเดิน" กับวิดีโอผู้ชายกำลังเดินจริงๆ

หากฟังดูคล้ายกับ DALL-E ซึ่งเป็นแอปพลิเคชัน T2I ยอดนิยม คุณก็คงอยู่ไม่ไกล แอปพลิเคชัน T2I อื่นๆ เปิดตัวตั้งแต่ DALL-E ได้รับความนิยม TikTok เปิดตัวตัวกรอง ในเดือนสิงหาคมเรียกว่า AI Greenscreen ที่สร้างภาพสไตล์การวาดภาพตามคำที่คุณพิมพ์

เจ้าสลอธขนปุกปุยกับหมวกถักสีส้มพยายามหาแล็ปท็อปใกล้ๆ หน้าจอไฟสตูดิโอที่มีรายละเอียดสูงสะท้อนอยู่ในดวงตาของมัน

เนื้อหาที่สร้างโดย AI กลายเป็นเนื้อหาที่ได้รับความนิยมอย่างมากในช่วงไม่กี่ปีที่ผ่านมา เทคโนโลยีดีพเฟคซึ่งเป็นเทคนิคการเรียนรู้ของเครื่องเพื่อแทนที่ใบหน้าของบุคคลด้วยใบหน้าอื่น แม้กระทั่งสตูดิโอวิชวลเอฟเฟกต์ก็ใช้สำหรับการแสดงที่มีงบประมาณมหาศาลเช่น แมนดาโลเรียน.

ในเดือนกรกฎาคม The Times รายงานอย่างผิดพลาดเกี่ยวกับผู้หญิงชาวยูเครนท่ามกลางสงครามรัสเซีย-ยูเครน ปัญหาคือ เธอไม่มีจริง.

ภัยคุกคามจาก AI อาจจะ ไม่ใช่ภัยคุกคามที่แท้จริงแต่โปรเจ็กต์อย่าง DALL-E และ Make-A-Video เป็นการสำรวจความเป็นไปได้ที่น่าสนใจบางอย่างอย่างสนุกสนาน

คำแนะนำของบรรณาธิการ

  • คู่แข่ง ChatGPT ของ Apple อาจเขียนโค้ดให้คุณโดยอัตโนมัติ
  • Bing Image Creator นำรูปภาพที่สร้างโดย DALL-E AI มาสู่เบราว์เซอร์ของคุณ
  • ฉันได้เห็นอนาคต (อันไกลโพ้น) ของการค้นหาเว็บด้วย AI – นี่คือจุดที่น่าทึ่ง และจุดที่ต้องดิ้นรน
  • AI ที่สร้างภาพ Dall-E เปิดให้ทุกคนเล่นฟรีแล้ว
  • ฉันนำเสนอแนวคิดการเริ่มต้นที่ไร้สาระของฉันให้กับ Robot VC

อัพเกรดไลฟ์สไตล์ของคุณDigital Trends ช่วยให้ผู้อ่านติดตามโลกแห่งเทคโนโลยีที่เปลี่ยนแปลงไปอย่างรวดเร็วด้วยข่าวสารล่าสุด รีวิวผลิตภัณฑ์สนุกๆ บทบรรณาธิการที่เจาะลึก และการแอบดูที่ไม่ซ้ำใคร

หมวดหมู่

ล่าสุด

เผยชื่อตัวละคร Star Wars: The Force Awakens

เผยชื่อตัวละคร Star Wars: The Force Awakens

เราได้รับรูปลักษณ์ใหม่ของตัวละครใหม่บางตัวที่ได...

จะไม่สร้างล้อขึ้นมาใหม่ได้อย่างไร: เทคโนโลยียานยนต์ห้าล้มเหลว

จะไม่สร้างล้อขึ้นมาใหม่ได้อย่างไร: เทคโนโลยียานยนต์ห้าล้มเหลว

เทคโนโลยีเป็นสิ่งมหัศจรรย์ โดยเฉพาะอย่างยิ่งเมื...