في حال كنت تتساءل، فإن الصورة أعلاه هي "رسم معقد للخلود". لكنه ليس عمل فنان بشري؛ إنه إنشاء BigSleep، أحدث مثال رائع على الإبداع الذكاء الاصطناعي (منظمة العفو الدولية) في العمل.
محتويات
- كيف يعمل BigSleep
- الذكاء الاصطناعي المولد للصور
يشبه إلى حد ما النسخة المرئية من إنشاء نص موديل جي بي تي-3، BigSleep قادر على أخذ أي مطالبة نصية وتصور صورة لتناسب الكلمات. قد يكون ذلك شيئًا مقصورًا على فئة معينة مثل الأبدية، أو قد يكون وعاءً من الكرز، أو منزلًا جميلاً (الأخير من والتي يمكن رؤيتها أدناه.) فكر في الأمر مثل بحث صور Google - فقط للصور التي لم يسبق لها مثيل من قبل موجود.
مقاطع الفيديو الموصى بها
كيف يعمل BigSleep
"على مستوى عالٍ، يعمل BigSleep من خلال الجمع بين شبكتين عصبيتين: BigGAN وCLIP". ريان موردوك، قال مبتكر BigSleep البالغ من العمر 23 عامًا، وهو طالب يدرس علم الأعصاب الإدراكي في جامعة يوتا، لموقع Digital Trends.
أول هذه، بيججان، هو نظام أنشأته Google يلتقط ضوضاء عشوائية ويخرج الصور. BigGAN هي شبكة عدائية توليدية: زوج من الشبكات العصبية المتبارزة التي تنفذ ماذا يطلق موردوك على "لعبة شد الحبل العدائية" بين شبكة توليد الصور وأداة التمييز شبكة. بمرور الوقت، يؤدي التفاعل بين المولد والمميز إلى إجراء تحسينات على كلتا الشبكتين العصبيتين.
مقطعوفي الوقت نفسه، عبارة عن شبكة عصبية صنعتها شركة OpenAI وتم تدريسها لمطابقة الصور والأوصاف. قم بإعطاء نصوص وصور CLIP، وسيحاول معرفة مدى تطابقها ومنحها النتيجة وفقًا لذلك.
من خلال الجمع بين الاثنين، أوضح موردوك أن BigSleep يبحث من خلال مخرجات BigGAN عن الصور التي تزيد من نقاط CLIP إلى الحد الأقصى. ثم يقوم بعد ذلك بتعديل مدخلات الضوضاء في مولد BigGAN ببطء حتى يقول CLIP أن الصور التي يتم إنتاجها تتطابق مع الوصف. يستغرق إنشاء صورة لمطابقة المطالبة حوالي ثلاث دقائق إجمالاً.
وقال موردوك: "إن BigSleep مهم لأنه يمكنه توليد مجموعة واسعة من المفاهيم والأشياء بشكل جيد إلى حد ما بدقة 512 × 512 بكسل". "لقد أسفرت الأعمال السابقة عن نتائج مبهرة، ولكن حسب علمي، اقتصر الكثير منها على صور منخفضة الدقة والمزيد من الأشياء اليومية."
الذكاء الاصطناعي المولد للصور
BigSleep ليست المرة الأولى التي يقوم فيها الذكاء الاصطناعي تم استخدامه لإنشاء الصور. اسمها يذكرنا حلم عميق، الذكاء الاصطناعي. تم إنشاؤها بواسطة مهندس Google Alex Mordvintsev والذي يقوم بإنشاء صور مخدرة باستخدام نماذج التصنيف. تم أيضًا استخدام نظام قائم على GAN لإنشاء ملف منظمة العفو الدولية. لوحة بيعت في مزاد في عام 2018 بمبلغ ضخم قدره 432.500 دولار. ومع ذلك، فهي بالتأكيد خطوة رائعة إلى الأمام.
لتجربة BigSleep بنفسك، اقترح مردوك التحقق من تطبيقه دفتر جوجل كولاب فيما يتعلق بالمشروع. هناك القليل من منحنى التعلم الذي يتضمن استخدام واجهة المستخدم الرسومية Colab وبعض الخطوات الأخرى، ولكن يمكنك تجربتها مجانًا. سيتم أيضًا فتح طرق أخرى لاختباره في الأسابيع القادمة. إذا كنت مهتما، يمكنك أيضا زيارة r/MediaSynthesis، حيث ينشر المستخدمون بعضًا من أفضل الصور التي أنشأوها باستخدام النظام حتى الآن.
توصيات المحررين
- هل يستطيع أ. هل تتفوق على المهندسين البشريين في تصميم الرقائق الدقيقة؟ جوجل تعتقد ذلك
- الذكاء الاصطناعي الجديد الذكي. يعدك النظام بتدريب كلبك أثناء تواجدك بعيدًا عن المنزل
- التحدي الكبير القادم للذكاء الاصطناعي؟ تشغيل نسخة كمومية من Go
- الأطراف الاصطناعية التي لا تتطلب ممارسة: داخل أحدث اختراق في مجال الإلكترونيات الإلكترونية
- منظمة العفو الدولية. أداة الترجمة تلقي الضوء على اللغة السرية للفئران
ترقية نمط حياتكتساعد الاتجاهات الرقمية القراء على متابعة عالم التكنولوجيا سريع الخطى من خلال أحدث الأخبار ومراجعات المنتجات الممتعة والمقالات الافتتاحية الثاقبة ونظرات خاطفة فريدة من نوعها.