यदि आप सोच रहे हैं, तो ऊपर दी गई तस्वीर "अनंत काल का एक जटिल चित्रण" है। लेकिन यह किसी मानव कलाकार का काम नहीं है; यह बिगस्लीप की रचना है, जो जनरेटिव का नवीनतम अद्भुत उदाहरण है कृत्रिम होशियारी (ए.आई.) कार्रवाई में।
अंतर्वस्तु
- बिगस्लीप कैसे काम करता है
- छवि निर्माण ए.आई.
के दृश्य संस्करण जैसा कुछ-कुछ टेक्स्ट-जनरेटिंग ए.आई. मॉडल GPT-3, बिगस्लीप किसी भी टेक्स्ट प्रॉम्प्ट को लेने और शब्दों को फिट करने के लिए एक छवि की कल्पना करने में सक्षम है। वह अनंत काल जैसा कुछ गूढ़ हो सकता है, या यह चेरी का एक कटोरा हो सकता है, या एक सुंदर घर (बाद वाला) हो सकता है जिसे नीचे देखा जा सकता है।) इसे Google Images खोज की तरह समझें - केवल उन चित्रों के लिए जो पहले कभी नहीं देखी गईं अस्तित्व में था.
अनुशंसित वीडियो
बिगस्लीप कैसे काम करता है
"उच्च स्तर पर, बिगस्लीप दो तंत्रिका नेटवर्क: बिगगैन और सीएलआईपी को मिलाकर काम करता है।" रयान मर्डॉकबिगस्लीप के 23 वर्षीय निर्माता, यूटा विश्वविद्यालय में संज्ञानात्मक तंत्रिका विज्ञान का अध्ययन करने वाले एक छात्र ने डिजिटल ट्रेंड्स को बताया।
इनमें से पहला, बिगगैन, Google द्वारा बनाई गई एक प्रणाली है जो यादृच्छिक शोर को लेती है और छवियों को आउटपुट करती है। बिगगैन एक जनरेटिव एडवरसैरियल नेटवर्क है: द्वंद्वयुद्ध तंत्रिका नेटवर्क की एक जोड़ी जो क्या करती है मर्डॉक एक छवि-उत्पादक नेटवर्क और एक विभेदक के बीच एक "प्रतिद्वंद्वी रस्साकशी" कहते हैं नेटवर्क। समय के साथ, जनरेटर और विवेचक के बीच बातचीत के परिणामस्वरूप दोनों तंत्रिका नेटवर्क में सुधार होता है।
क्लिपइस बीच, OpenAI द्वारा बनाया गया एक तंत्रिका जाल है जिसे छवियों और विवरणों का मिलान करना सिखाया गया है। CLIP टेक्स्ट और छवियां दें, और यह पता लगाने का प्रयास किया जाएगा कि वे कितनी अच्छी तरह मेल खाते हैं और तदनुसार उन्हें अंक देंगे।
दोनों को मिलाकर, मर्डॉक ने समझाया कि बिगस्लीप बिगगैन के आउटपुट के माध्यम से उन छवियों की खोज करता है जो सीएलआईपी स्कोरिंग को अधिकतम करती हैं। इसके बाद यह बिगगैन के जनरेटर में शोर इनपुट को धीरे-धीरे बदलता है जब तक कि सीएलआईपी यह नहीं कहता कि उत्पादित छवियां विवरण से मेल खाती हैं। प्रॉम्प्ट से मेल खाने के लिए एक छवि तैयार करने में कुल मिलाकर लगभग तीन मिनट लगते हैं।
मर्डॉक ने कहा, "बिगस्लीप महत्वपूर्ण है क्योंकि यह 512 x 512 पिक्सेल रिज़ॉल्यूशन पर विभिन्न प्रकार की अवधारणाओं और वस्तुओं को काफी अच्छी तरह से उत्पन्न कर सकता है।" "पिछले काम ने प्रभावशाली परिणाम दिए हैं, लेकिन, मेरी जानकारी के अनुसार, इसका अधिकांश भाग कम-रिज़ॉल्यूशन वाली छवियों और अधिक रोजमर्रा की वस्तुओं तक ही सीमित है।"
छवि निर्माण ए.आई.
बिगस्लीप पहली बार ए.आई. नहीं है। छवियों को उत्पन्न करने के लिए उपयोग किया गया है। इसका नाम याद दिलाता है गहरा सपना, एक ए.आई. Google इंजीनियर एलेक्स मोर्डविंटसेव द्वारा बनाया गया जो वर्गीकरण मॉडल का उपयोग करके साइकेडेलिक इमेजरी बनाता है। इसे बनाने के लिए GAN-आधारित प्रणाली का भी उपयोग किया गया था ए.आई. पेंटिंग नीलामी में बिकी 2018 में भारी भरकम $432,500 में। हालाँकि, यह निश्चित रूप से एक आकर्षक कदम है।
अपने लिए बिगस्लीप को आज़माने के लिए, मर्डॉक ने उसे जाँचने का सुझाव दिया गूगल कोलाब नोटबुक परियोजना के संबंध में. कोलाब जीयूआई और कुछ अन्य चरणों का उपयोग करने में कुछ सीखने की प्रक्रिया शामिल है, लेकिन इसे मुफ़्त में लिया जा सकता है। आने वाले हफ्तों में इसके परीक्षण के अन्य तरीके भी खुलने की संभावना है। यदि आप रुचि रखते हैं, तो आप भी जा सकते हैं आर/मीडियासिंथेसिस, जहां उपयोगकर्ता सिस्टम के साथ अब तक तैयार की गई कुछ बेहतरीन छवियां पोस्ट कर रहे हैं।
संपादकों की सिफ़ारिशें
- क्या ए.आई. माइक्रोचिप्स डिज़ाइन करने में मानव इंजीनियरों को हराया? Google ऐसा सोचता है
- चतुर नया ए.आई. जब आप घर से दूर होंगे तो सिस्टम आपके कुत्ते को प्रशिक्षित करने का वादा करता है
- ए.आई. की अगली बड़ी चुनौती? गो का क्वांटम संस्करण चला रहा हूँ
- प्रोस्थेटिक्स जिसके लिए अभ्यास की आवश्यकता नहीं है: बायोनिक्स में नवीनतम सफलता के अंदर
- ए.आई. अनुवाद उपकरण चूहों की गुप्त भाषा पर प्रकाश डालता है
अपनी जीवनशैली को उन्नत करेंडिजिटल ट्रेंड्स पाठकों को सभी नवीनतम समाचारों, मजेदार उत्पाद समीक्षाओं, व्यावहारिक संपादकीय और एक तरह की अनूठी झलक के साथ तकनीक की तेज़ गति वाली दुनिया पर नज़र रखने में मदद करता है।