Google के सांस्कृतिक संस्थान में कोडर आर्ट के अंदर

मशीन लर्निंग और कला - Google I/O 2016

क्या कोई मशीन रचनात्मक हो सकती है? Google ऐसा सोचता है, और उसके पास मशीनों को यह सिखाने के लिए समर्पित एक पूरी टीम है कि दुनिया को हम भावनात्मक इंसानों की तरह कैसे देखा जाए।

कंप्यूटर के बारे में ऐसे सोचें जैसे कि वे बच्चे हों और यह समझना आसान है कि कोडर उन्हें कैसे सीखना सिखा सकते हैं। कृत्रिम बुद्धिमत्ता, शुरुआत में, बहुत बुनियादी और सरल है। मानव मॉडरेटर कंप्यूटर को निर्देश देते हैं, उन्हें दिखाते हैं कि कैसे सोचना है और इस प्रकार वे स्वयं को सिखाते हैं। हालाँकि, एक बार जब कोडर उन्हें बुनियादी बातें बता देते हैं, तो वे उस ज्ञान का तेज़ी से विस्तार कर सकते हैं।

"आप 7 मिलियन डिजिटल कलाकृतियों के साथ क्या कर सकते हैं?"

पर गूगल सांस्कृतिक संस्थान पेरिस, फ़्रांस में, खोज दिग्गज मशीनों को सिखा रहा है कि सदियों से मानव कलात्मक उपलब्धि की 7 मिलियन छवियों को कैसे वर्गीकृत किया जाए। संस्थान के पास एक वेबसाइट और ऐप्स भी हैं आईओएस और एंड्रॉयड जहां आप दुनिया भर के विभिन्न संग्रहालयों से कला के कार्यों को खोज सकते हैं। कला की अपनी सूची बनाने के लिए, संस्थान में निवास करने वाले कोड कलाकारों को कंप्यूटर सिखाना था मानव इतिहास में कला का एक सटीक डिजिटल संग्रह बनाने के लिए छवियों को उसी तरह देखें जैसे मनुष्य देखते थे।

कैटलॉगिंग का इतिहास बहुत अच्छा है, लेकिन कंप्यूटर सॉर्टिंग और फाइलिंग से जो कुछ कौशल सीख रहे हैं, वे वास्तव में उन्हें और अधिक रचनात्मक बना रहे हैं। निवास में कलाकार अब मशीन इंटेलिजेंस और उनके द्वारा एकत्रित की गई 7 मिलियन छवियों की सूची का उपयोग करके कला के नए कार्यों को बनाने के लिए कंप्यूटर के साथ प्रयोग कर रहे हैं। Google I/O 2016 के दौरान, सिरिल डायग्नि और मारियो क्लिंगमैन बताया कि कैसे उन्होंने मशीनों को इंसानों की तरह कला देखना सिखाया है, और कैसे उन्होंने मशीनों को रचनात्मक होने के लिए प्रशिक्षित किया है।

कंप्यूटर को उनकी एबीसी सिखाना

सबसे पहली चीज़ जो आप एक बच्चे को सिखाते हैं वह है भाषा। पश्चिमी संस्कृति में, इसका अर्थ है अपनी एबीसी सीखना। जर्मनी के एक स्व-वर्णित कोड कलाकार मारियो क्लिंगमैन ने मशीनें सिखाना शुरू किया यह पता लगाने के लिए कि क्या वह कंप्यूटर को हजारों अलग-अलग दिखने वाले As, Bs, Cs इत्यादि को पहचानना सिखा सकता है, पुराने पाठों से शैलीबद्ध अक्षरों की पहचान करें पर। यह मशीनों को मनुष्यों की तरह छवियों को वर्गीकृत करने का प्रशिक्षण देने वाला एक क्रैश कोर्स था।

जबकि एक कंप्यूटर लताओं और फूलों से ढके एक स्टाइलिश अक्षर बी को देख सकता है और किसी प्रकार का पौधा देख सकता है, यहां तक ​​कि एक 5 साल का बच्चा भी तुरंत छवि को अक्षर बी के रूप में पहचान सकता है - पौधे के रूप में नहीं। अपने कंप्यूटर को उसकी एबीसी पहचानना सिखाने के लिए, क्लिंगमैन ने उसे शैलीबद्ध अक्षरों की हजारों छवियां दीं। उन्होंने अपनी मशीनों को यह बताने के लिए दाएं या बाएं स्वाइप करने का टिंडर जैसा इंटरफ़ेस बनाया कि उन्होंने अक्षर का सही या गलत अनुमान लगाया है।

पत्र मशीन

यह पता चला है, मशीनें अपनी एबीसी बहुत जल्दी सीख लेती हैं; उन्हें हर चीज़ में अक्षर नज़र आने लगे। जिस प्रकार मनुष्य बादलों में चेहरे और अमूर्त कलाकृति में चित्र देखते हैं, उसी प्रकार उनके कंप्यूटर ने अक्षरों को पूरी तरह से असंबंधित चित्रों में देखा। क्लिंगमैन ने अपने कंप्यूटर को एक खंडहर इमारत का चित्र या नक्काशी दिखाई, और उन्होंने इसके स्थान पर एक अक्षर बी देखा।

क्लिंगमैन ने समझाया कि जब आप किसी कंप्यूटर को छवियों के केवल एक सेट के साथ प्रशिक्षित करते हैं, तो वह हर चीज़ में केवल उसी तरह की छवि देखना शुरू कर देता है। तभी उनकी मशीनों को एक खंडहर में एक चिट्ठी दिखी.

कंप्यूटर को 7 मिलियन छवियों को वर्गीकृत करना सिखाना

जब डिजिटल इंटरेक्शन कलाकार सिरिल डायग्ने सांस्कृतिक संस्थान में शामिल हुए, तो Google ने उनसे एक कठिन प्रश्न पूछा, "आप 7 मिलियन डिजिटल कलाकृतियों के साथ क्या कर सकते हैं?"

डायग्ने इस प्रश्न से अभिभूत हो गया, इसलिए उसने प्रत्येक छवि को शानदार ढंग से बड़े पैमाने पर चित्रित किया साइन लहर, जिसे आप नीचे देख सकते हैं. वह लहर बाद में मशीन लर्निंग के साथ प्रोजेक्ट द्वारा हासिल की जाने वाली हर चीज़ का एक सुंदर प्रतिनिधित्व बन गई। डायग्ने की साइन वेव वास्तव में खोजने योग्य है, इसलिए आप Google सांस्कृतिक संस्थान द्वारा बनाए गए डिजिटल संग्रह में सभी छवियों का एक समुद्र सर्फ कर सकते हैं। छवियों को श्रेणियों में समूहीकृत किया गया है, और एक विहंगम दृश्य से, आप बस बिंदुओं का एक समुद्र देखते हैं। जैसे-जैसे आप अंदर जाते हैं, आप विशिष्ट छवियां देख सकते हैं, सभी एक सामान्य विषय के साथ, चाहे वह पिल्ले हों, खेत हों या लोग हों।

1 का 3

आप इसके माध्यम से भी खोज सकते हैं और अपनी इच्छित छवियाँ पा सकते हैं। यदि आप पर्याप्त ध्यान से देखेंगे, तो आप उस चीज़ में भी पहुँच सकते हैं जिसे डायग्नी पोर्ट्रेट्स का तट कहती है। यहीं पर लोगों के चेहरों की सभी छवियां एकत्रित होती हैं।

संग्रह में प्रत्येक छवि का खोजने योग्य मानचित्र बनाने के लिए, डायग्ने और उनकी टीम को मशीन को यह सिखाने के लिए हर चीज़ के लिए एक श्रेणी बनानी पड़ी कि क्या था।

7 मिलियन कलाकृतियों को वर्गीकृत करना, जिनमें से कई की कई श्रेणियां हो सकती हैं, कोई आसान काम नहीं है। टीम को कुछ ऐसी चीज़ों के बारे में सोचना था जो बॉक्स से बाहर थीं। चीज़ों को केवल उनके स्वरूप के आधार पर वर्गीकृत करना पर्याप्त नहीं है। उन्हें उन भावनाओं के लिए श्रेणियां भी बनानी पड़ीं जो छवियां उत्पन्न करती हैं।

मशीनों को मानवीय भावनाएँ सिखाना उन्हें और अधिक रचनात्मक बनाने की दिशा में एक महत्वपूर्ण कदम है।

इस तरह, आप "शांत" की छवि खोज सकते हैं और कंप्यूटर आपको ऐसी छवियां दिखाएगा जो शांति की भावना पैदा करती हैं, जैसे सूर्यास्त, शांत झीलें, इत्यादि। आश्चर्यजनक रूप से, मशीनों ने मानवीय भावनाओं को इतनी कुशलता से पहचानना सीख लिया कि वे खुद को हमारे स्थान पर रखकर विचार कर सकें कि एक निश्चित छवि एक इंसान को कैसा महसूस कराएगी।

मशीनों को मानवीय भावनाएँ सिखाना उन्हें और अधिक रचनात्मक बनाने की दिशा में एक महत्वपूर्ण कदम है। आख़िरकार, अधिकांश आधुनिक कला मानवीय भावनाओं का दृश्य प्रतिनिधित्व है।

लेकिन क्या कोई मशीन रचनात्मक हो सकती है?

रचनात्मकता और कलात्मकता दो ऐसी चीज़ें हैं जिन्हें हम इंसान केवल अपना मानते हैं। जानवर कला नहीं बनाते, न ही मशीनें... फिर भी। Google का डीप ड्रीम प्रोजेक्ट इस धारणा को बदलने का प्रयास किया गया कि मशीनें अपने सिर पर कला नहीं बना सकतीं। खोज की दिग्गज कंपनी ने कला के विचित्र, साइकेडेलिक कार्यों को बनाने के लिए छवियों में हेरफेर करने के लिए कंप्यूटरों को प्रशिक्षित किया। Google द्वारा बनाई गई छवियां डीप ड्रीम इंजन हो सकता है सुंदर न हों, लेकिन वे निश्चित रूप से अद्वितीय और बेहद रचनात्मक हैं। मशीनी कृतियों में साइकेडेलिक रंग, स्लग, अजीब आंखें और अपरिभाषित स्थानों में घूमते अशरीरी जानवर शामिल हैं।

कुछ लोग यह तर्क दे सकते हैं कि यह वास्तव में कला नहीं है यदि मशीनें केवल मौजूदा छवियों को जोड़ रही हैं, उन्हें मोड़ रही हैं, और उन्हें अत्यधिक रंगों में डुबो रही हैं; Google अलग होना चाहेगा, और कोड-कलाकार क्लिंगमैन भी।

"मनुष्य मूल विचारों में असमर्थ हैं," उन्होंने समझाया।

1 का 8

उन्होंने कहा कि यहां तक ​​कि प्रसिद्ध चित्रों में भी पिछली कलाकृति के तत्व शामिल हैं। पिकासो की 1907 की उत्कृष्ट कृति लेस डेमोइसेल्स डी'एविग्नन, उदाहरण के लिए, से प्रभाव पड़ता है अफ़्रीकी कला और क्यूबिस्ट जैसे पूर्ववर्ती पॉल सीज़ेन. उस मामले में, कोलाज, जो मौजूदा छवियों को कलात्मक तरीके से जोड़ते हैं, एक और अच्छी तरह से स्थापित कला रूप है। पिकासो, एंडी वारहोल, मैन रे और अन्य अपने विलक्षण कोलाज के लिए जाने जाते हैं, तो मशीनों द्वारा बनाए गए कोलाज भी कला के रूप में क्यों नहीं खड़े हो सकते?

क्लिंगमैन डिजिटल कला की सीमाओं को आगे बढ़ाना चाहते थे और देखना चाहते थे कि Google सांस्कृतिक संस्थान में अपना निवास शुरू करने से पहले रचनात्मक मशीनें कैसे आगे बढ़ सकती हैं। अपनी स्वयं की कम शक्तिशाली मशीनों का उपयोग करते हुए, क्लिंगमैन ने इंटरनेट अभिलेखागार और Google के साथ खेलना शुरू कर दिया टेंसरफ़्लो डिजिटल कोलाज बनाने के लिए मशीन लर्निंग सॉफ्टवेयर।

उन्होंने अर्न्स्ट नामक एक मशीन-लर्निंग टूल बनाया, जिसका नाम अतियथार्थवादी और कोलाज कलाकार के नाम पर रखा गया मैक्स अर्न्स्ट. क्लिंगमैन ने अर्न्स्ट के काम से वस्तुओं की एक श्रृंखला की पहचान की और अपने कंप्यूटर को समान तत्वों के साथ अलग-अलग कोलाज बनाने के लिए कहा। परिणाम अक्सर अवास्तविक, कभी-कभी हास्यास्पद और कभी-कभी बिल्कुल भयानक होते थे।

"मनुष्य मौलिक विचारों में असमर्थ हैं।"

क्लिंगमैन अपनी मशीनों द्वारा उत्पादित अराजक छवियों पर अधिक नियंत्रण चाहते थे, इसलिए उन्होंने उन्हें नई चीजें सिखाना शुरू कर दिया। उसने खुद से पूछा, "मनुष्यों के लिए क्या दिलचस्प है?" क्लिंगमैन को पता था कि उसे सिस्टम को प्रशिक्षित करना होगा कि उसे क्या देखना है, उसे सिखाना है कि एक मानव कलाकार की तरह उन सभी तत्वों को कैसे देखना है।

परिणामी कलाकृति भव्य और पूरी तरह अद्वितीय है। हालाँकि क्लिंगमैन ने स्पष्ट रूप से अपने काम को बनाने के लिए पुरानी छवियों का उपयोग किया है, उन्हें एक नए संदर्भ में प्रदर्शित किया गया है, और इससे सारा फर्क पड़ता है।

अभी, कंप्यूटर रचनात्मकता दिलचस्प कोलाज और यह समझने तक ही सीमित है कि कौन सी छवियां एक साथ अच्छी लगती हैं। मशीनें अभी तक अपनी कला नहीं बना रही हैं, लेकिन उन्हें शक्ति प्रदान करने वाले कोड कलाकार इस प्रक्रिया के दौरान निर्माता से अधिक क्यूरेटर बन रहे हैं।

यह देखना बाकी है कि मनुष्य मशीनों के रचनात्मक दिमाग का कितना विस्तार कर सकता है, लेकिन यह देखना निश्चित रूप से आकर्षक है।

संपादकों की सिफ़ारिशें

  • Google Bard अब बोल सकता है, लेकिन क्या यह ChatGPT को ख़त्म कर सकता है?
  • अब आप चैटजीपीटी के प्रतिद्वंद्वी, Google के बार्ड को आज़मा सकते हैं
  • Google का नया बार्ड AI ChatGPT को चिंतित करने के लिए पर्याप्त शक्तिशाली हो सकता है - और यह पहले से ही यहाँ है
  • गूगल मीट या ज़ूम? जल्द ही, इससे कोई फर्क नहीं पड़ेगा
  • Google जापान का विचित्र नया कीबोर्ड (शाब्दिक) बग भी पकड़ सकता है

श्रेणियाँ

हाल का