التعلم الآلي والفنون - Google I/O 2016
فكر في أجهزة الكمبيوتر كما لو كانوا أطفالًا ومن السهل أن نفهم كيف يمكن للمبرمجين تعليمهم كيفية التعلم. الذكاء الاصطناعي، في البداية، أساسي وبسيط للغاية. يقوم المشرفون البشريون بتوجيه أجهزة الكمبيوتر، موضحين لهم كيفية التفكير وبالتالي تعليم أنفسهم. وبمجرد أن يمنحهم المبرمجون الأساسيات، يمكنهم توسيع تلك المعرفة بسرعة.
"ماذا يمكنك أن تفعل بـ 7 ملايين قطعة أثرية رقمية؟"
في ال معهد جوجل الثقافي في باريس، فرنسا، تقوم شركة البحث العملاقة بتعليم الآلات كيفية تصنيف 7 ملايين صورة للإنجازات الفنية البشرية على مر القرون. لدى المعهد أيضًا موقع ويب، بالإضافة إلى تطبيقات لـ دائرة الرقابة الداخلية و ذكري المظهر حيث يمكنك البحث في الأعمال الفنية من متاحف مختلفة حول العالم. لإنشاء كتالوج الفن الخاص به، كان على فناني البرمجة المقيمين في المعهد تعليم أجهزة الكمبيوتر عرض الصور بالطريقة التي يقوم بها البشر لإنشاء أرشيف رقمي دقيق للفن عبر تاريخ البشرية.
إن فهرسة التاريخ أمر جيد وجيد، ولكن بعض المهارات التي تتعلمها أجهزة الكمبيوتر من الفرز وحفظ الملفات تجعلها في الواقع أكثر إبداعًا. يقوم الفنانون المقيمون الآن بتجربة أجهزة الكمبيوتر لإنشاء أعمال فنية جديدة باستخدام الذكاء الآلي وكتالوج يضم 7 ملايين صورة قاموا بتجميعها معًا. خلال مؤتمر Google I/O 2016، سيريل دياجني و ماريو كلينجمان وأوضحوا كيف قاموا بتعليم الآلات رؤية الفن مثل البشر، وكيف قاموا بتدريب الآلات على الإبداع.
تعليم أجهزة الكمبيوتر أبجدياتها
من أول الأشياء التي تعلمها للطفل هي اللغة. في الثقافة الغربية، هذا يعني تعلم الحروف الأبجدية الخاصة بك. بدأ ماريو كلينجمان، وهو فنان أكواد من ألمانيا، يصف نفسه بنفسه، بتعليم الآلات كيفية القيام بذلك التعرف على الحروف المنمقة من النصوص القديمة لمعرفة ما إذا كان بإمكانه تعليم الكمبيوتر كيفية التعرف على الآلاف من الحروف المختلفة المظهر مثل A وB وC وما إلى ذلك على. لقد كانت دورة مكثفة لتعليم الآلات كيفية تصنيف الصور بالطريقة التي يفعلها البشر.
في حين أن الكمبيوتر قد ينظر إلى حرف B منمق مغطى بالكروم والزهور ويرى نباتًا من نوع ما، فإنه حتى الطفل البالغ من العمر 5 سنوات يمكنه التعرف على الصورة على الفور على أنها حرف B - وليس نباتًا. لتعليم جهاز الكمبيوتر الخاص به كيفية التعرف على الحروف الأبجدية الخاصة به، قام كلينجمان بتزويده بآلاف الصور من الحروف المنمقة. لقد أنشأ واجهة تشبه Tinder تقوم بالتمرير إلى اليمين أو اليسار لإخبار أجهزته إذا خمنت الحرف بشكل صحيح أو خاطئ.
اتضح أن الآلات تتعلم أبجدياتها بسرعة كبيرة؛ بدأوا يرون الحروف في كل شيء. وكما يرى البشر الوجوه في السحب والصور في الأعمال الفنية التجريدية، فإن أجهزة الكمبيوتر الخاصة به ترى الحروف في صور غير مرتبطة تمامًا. أظهر كلينجمان لجهاز الكمبيوتر الخاص به رسمًا أو نقشًا لمبنى مدمر، ورأوا حرف B بدلاً من ذلك.
وأوضح كلينجمان أنه عندما تدرب جهاز كمبيوتر بمجموعة واحدة فقط من الصور، فإنه يبدأ في رؤية هذا النوع من الصور فقط في كل شيء. ولهذا السبب رأت أجهزته رسالة في حالة خراب.
تعليم الكمبيوتر تصنيف 7 مليون صورة
عندما انضم فنان التفاعل الرقمي سيريل دياني إلى المعهد الثقافي، طرحت عليه Google سؤالاً صعبًا إلى حد ما، "ماذا يمكنك أن تفعل بـ 7 ملايين قطعة أثرية رقمية؟"
كان دياني غارقًا في السؤال، لذا رسم كل صورة في صورة ضخمة موجة جيبية, والتي يمكنك رؤيتها أدناه. أصبحت هذه الموجة لاحقًا تمثيلًا جميلاً لكل ما يأمل المشروع في تحقيقه من خلال التعلم الآلي. في الواقع، يمكن البحث في موجة Diagne الجيبية، لذا يمكنك تصفح بحر من جميع الصور الموجودة في الأرشيف الرقمي الذي أنشأه معهد Google الثقافي. يتم تجميع الصور في فئات، ومن منظور عين الطير، ترى فقط بحرًا من النقاط. أثناء انتقالك، يمكنك رؤية صور محددة، كلها ذات موضوع مشترك، سواء كانت كلابًا أو مزارع أو أشخاصًا.
1 ل 3
ويمكنك البحث فيه أيضًا والعثور على الصور التي تريدها. إذا نظرت بجدية كافية، فقد تصادف ما يسميه دياني "شاطئ الصور الشخصية". هذا هو المكان الذي تتجمع فيه جميع صور وجوه الأشخاص.
لإنشاء خريطة قابلة للبحث لكل صورة في الأرشيف، كان على Diagne وفريقه إنشاء فئة لكل شيء لتعليم الآلة ما هي.
إن تصنيف 7 ملايين قطعة أثرية، والتي قد يحتوي الكثير منها على فئات متعددة، ليس بالمهمة السهلة. كان على الفريق أن يفكر في بعض الأشياء التي كانت خارج منطقة الجزاء. لا يكفي تصنيف الأشياء على أساس ما هي عليه. وكان عليهم أيضًا إنشاء فئات للمشاعر التي تثيرها الصور.
يعد تعليم الآلات المشاعر الإنسانية خطوة مهمة نحو جعلها أكثر إبداعًا.
وبهذه الطريقة، يمكنك البحث عن صورة "الهدوء"، وسيعرض لك الكمبيوتر صورًا تثير إحساسًا بالهدوء، مثل غروب الشمس والبحيرات الهادئة وما إلى ذلك. ومن المثير للدهشة أن الآلات تعلمت كيفية التعرف على المشاعر البشرية بمهارة كبيرة بحيث يمكنها أن تضع نفسها في مكاننا لتفكر في كيفية تأثير صورة معينة على الإنسان.
يعد تعليم الآلات المشاعر الإنسانية خطوة مهمة نحو جعلها أكثر إبداعًا. وفي نهاية المطاف، فإن الكثير من الفن الحديث عبارة عن تمثيلات مرئية للمشاعر الإنسانية.
ولكن هل يمكن للآلة أن تكون مبدعة؟
الإبداع والفن هما شيئان نحب نحن البشر أن نفكر فيهما على أنهما ملكنا وحدنا. الحيوانات لا تصنع الفن ولا الآلات... حتى الآن. مشروع جوجل للحلم العميق حاول قلب فكرة أن الآلات لا تستطيع خلق الفن رأسًا على عقب. قامت شركة البحث العملاقة بتدريب أجهزة الكمبيوتر على معالجة الصور لإنشاء أعمال فنية غريبة ومخدرة. الصور التي أنشأتها جوجل محرك الحلم العميق قد لا تكون جميلة، لكنها بالتأكيد فريدة ومبدعة إلى حد كبير. تحتوي إبداعات الآلة على ألوان مخدرة، وبزاقات، وعيون غريبة، وحيوانات بلا جسد تحوم في مساحات غير محددة.
قد يجادل البعض بأنه ليس فنًا حقًا إذا كانت الآلات تقوم فقط بدمج الصور الموجودة، ولفها، وغمسها بألوان متطرفة؛ قد يختلف جوجل، وكذلك الحال بالنسبة لفنان البرمجة كلينجمان.
وأوضح أن "البشر غير قادرين على الأفكار الأصلية".
1 ل 8
وأشار إلى أنه حتى اللوحات الشهيرة تحتوي على عناصر من أعمال فنية سابقة. تحفة بيكاسو 1907 آنسات أفينيون, على سبيل المثال، له تأثيرات من الفن الأفريقي والسلائف إلى التكعيبيين مثل بول سيزان. وفي هذا الصدد، يعد الفن التصويري، الذي يجمع بين الصور الموجودة بطريقة فنية، شكلاً فنيًا راسخًا آخر. يشتهر بيكاسو، وآندي وارهول، ومان راي، وغيرهم بمجموعاتهم الغريبة، فلماذا لا يمكن للمجموعات التي تصنعها الآلات أن تكون أيضًا فنًا؟
أراد كلينجمان تجاوز حدود الفن الرقمي ورؤية كيف يمكن للآلات الإبداعية أن تمضي وقتًا طويلاً قبل أن يبدأ إقامته في معهد Google الثقافي. وباستخدام أجهزته الأقل قوة، بدأ كلينجمان بالتلاعب بأرشيفات الإنترنت وجوجل TensorFlow برامج التعلم الآلي لإنشاء صور مجمعة رقمية.
ابتكر أداة للتعلم الآلي تسمى إرنست، سُميت على اسم الفنان السريالي وفنان الكولاج ماكس ارنست. حدد كلينجمان سلسلة من الأشياء من أعمال إرنست وطلب من جهاز الكمبيوتر الخاص به أن يصنع صورًا مجمعة مختلفة بنفس العناصر. وكانت النتائج في كثير من الأحيان سريالية، ومضحكة في بعض الأحيان، وفي أحيان أخرى فظيعة للغاية.
"البشر غير قادرين على الأفكار الأصلية."
أراد كلينجمان مزيدًا من التحكم في الصور الفوضوية التي تنتجها أجهزته، لذلك بدأ بتعليمهم أشياء جديدة. سأل نفسه: ما الذي يثير اهتمام البشر؟ عرف كلينجمان أن عليه أن يدرب النظام على ما يبحث عنه، ليعلمه كيفية رؤية كل هذه العناصر مثلما يفعل الفنان البشري.
العمل الفني الناتج رائع وفريد من نوعه تمامًا. على الرغم من أن كلينجمان استخدم بوضوح صورًا قديمة لإنشاء أعماله، إلا أنه يتم عرضها في سياق جديد، وهذا ما يحدث فرقًا كبيرًا.
في الوقت الحالي، يقتصر الإبداع الحاسوبي على الصور المجمعة المثيرة للاهتمام وفهم الصور التي تتناسب بشكل جيد معًا. لم تصنع الآلات أعمالها الفنية الخاصة بعد، لكن فناني الأكواد الذين يديرونها أصبحوا أكثر تنظيمًا من كونهم مبدعين خلال هذه العملية.
ويبقى أن نرى إلى أي مدى يستطيع الإنسان توسيع العقول الإبداعية للآلات، ولكن من المؤكد أن مشاهدته أمر رائع.
توصيات المحررين
- بإمكان Google Bard الآن التحدث، لكن هل يمكنه إخفاء ChatGPT؟
- يمكنك الآن تجربة Google’s Bard، المنافس لـ ChatGPT
- قد يكون نظام Bard AI الجديد من Google قويًا بما يكفي لإثارة قلق ChatGPT، وهو موجود بالفعل
- جوجل ميت أو زووم؟ قريبا، لن يهم
- يمكن أيضًا للوحة المفاتيح الجديدة الغريبة من Google Japan اكتشاف الأخطاء (الحرفية).