كشفت Meta عن نموذج ذكاء اصطناعي مجنون يسمح للمستخدمين بتحويل الأوصاف المكتوبة إلى فيديو. يسمى النظام اصنع مقطع فيديو وهو الأحدث في اتجاه المحتوى الذي تم إنشاؤه بواسطة الذكاء الاصطناعي على الويب.
يقبل النظام أوصافًا قصيرة مثل "روبوت يركب موجة في المحيط" أو "سمكة مهرج تسبح عبر الشعاب المرجانية" وينشئ ديناميكيًا صورة GIF قصيرة للوصف. هناك أيضًا ثلاثة أنماط مختلفة من مقاطع الفيديو للاختيار من بينها: سريالية وواقعية ومنمقة.
وفقا ل مشاركة الفيسبوك بقلم الرئيس التنفيذي لشركة Meta، مارك زوكربيرج، تعد ترجمة النص المكتوب إلى فيديو أصعب بكثير نظرًا لأن الفيديو يتطلب الحركة:
مقاطع الفيديو الموصى بها
"إن إنشاء الفيديو أصعب بكثير من إنشاء الصور، لأنه بالإضافة إلى إنشاء كل بكسل بشكل صحيح، يتعين على النظام أيضًا التنبؤ بكيفية تغيرها بمرور الوقت. يحل برنامج Make-A-Video هذه المشكلة عن طريق إضافة طبقة من التعلم غير الخاضع للإشراف الذي يمكّن النظام من فهم الحركة في العالم المادي وتطبيقها على توليد النص التقليدي إلى صورة.
كتب فريق أبحاث الذكاء الاصطناعي في Meta أ
ورق وصف كيفية عمل النظام وكيف يختلف عن طرق تحويل النص إلى صورة (T2I) الحالية. على عكس نماذج لغة الآلة الأخرى، لا تستخدم طريقة تحويل النص إلى فيديو (T2V) الخاصة بـ Meta أزواج نص-فيديو محددة مسبقًا. على سبيل المثال، لا يتم ربط "رجل يمشي" بمقطع فيديو لرجل حقيقي يمشي.إذا كان هذا يشبه إلى حد كبير DALL-E، تطبيق T2I الشهير، فلن تكون بعيدًا. تم طرح تطبيقات T2I الأخرى منذ أن اكتسب DALL-E شعبية. أصدر TikTok مرشحًا في أغسطس يسمى AI Greenscreen الذي ينشئ صورًا بنمط الرسم بناءً على الكلمات التي تكتبها.
أصبح المحتوى الذي تم إنشاؤه بواسطة الذكاء الاصطناعي مثيرًا للاهتمام خلال السنوات القليلة الماضية. تقنية التزييف العميق، تقنيات التعلم الآلي لاستبدال وجه الشخص بآخر، يتم استخدامها حتى من قبل استوديوهات المؤثرات البصرية للعروض ذات الميزانية الكبيرة مثل الماندالوريان.
في يوليو/تموز، نشرت صحيفة التايمز بالخطأ تقريرا عن امرأة أوكرانية في خضم الحرب الروسية الأوكرانية. المشكلة هي لم تكن حقيقية.
التهديد من الذكاء الاصطناعي على الأرجح لا يشكل تهديدا حقيقيا، لكن المشاريع مثل DALL-E وMake-A-Video هي استكشافات ممتعة لبعض الاحتمالات المثيرة للاهتمام.
توصيات المحررين
- قد يقوم منافس ChatGPT من Apple بكتابة التعليمات البرمجية لك تلقائيًا
- يقوم Bing Image Creator بإحضار الصور التي تم إنشاؤها بواسطة الذكاء الاصطناعي DALL-E إلى متصفحك
- لقد رأيت المستقبل (البعيد) لبحث الويب باستخدام الذكاء الاصطناعي - وهنا حيث يكون مذهلًا، وأين يواجه صعوبات
- أصبح الآن AI Dall-E المولد للصور مجانيًا ليلعب به أي شخص
- لقد عرضت فكرتي السخيفة لبدء التشغيل على روبوت VC
ترقية نمط حياتكتساعد الاتجاهات الرقمية القراء على متابعة عالم التكنولوجيا سريع الخطى من خلال أحدث الأخبار ومراجعات المنتجات الممتعة والمقالات الافتتاحية الثاقبة ونظرات خاطفة فريدة من نوعها.