5 चीजें जिनसे एआई छवि जनरेटर अभी भी संघर्ष करते हैं

एआई छवि जनरेटर पसंद करते हैं Dall-ई, स्थिर प्रसार, मध्ययात्रा, और बिंग छवि निर्माता आश्चर्यजनक परिणाम देते हैं, लेकिन कभी-कभी वे अविश्वसनीय रूप से निराशाजनक हो सकते हैं। केवल कुछ शब्दों वाले सरल संकेतों के साथ, एक एआई प्रभावशाली छवियों को आउटपुट कर सकता है जो पेशेवर तस्वीरें और विभिन्न शैलियों में ठोस कला प्रतीत होती हैं। हालाँकि, वही संकेत कभी-कभी कुछ भयानक प्राणी या प्रफुल्लित करने वाला त्रुटिपूर्ण प्रतिपादन पैदा करेगा।

अंतर्वस्तु

  • हाथ का सलाद और उंगलियों की गेंदें
  • परेशान करने वाला पाठ और लेखन
  • आंखों के पास यह नहीं है
  • परेशानी पैदा करने वाले उपकरण
  • दुःस्वप्न दांत
  • एआई कला में तेजी से सुधार हो रहा है

नकारात्मक संकेत इन त्रुटियों की संभावना को कम करने में मदद कर सकते हैं, लेकिन जटिलता आपको हमेशा नहीं बचा सकती। यहां तक ​​कि एआई विशेषज्ञ भी विकृत जीवों और अलौकिक दृश्यों से जूझते हैं, जिसके लिए पारंपरिक फोटो संपादक के साथ लंबे समय तक संकेतों को परिष्कृत करने या छवियों को छूने की आवश्यकता होती है। फिलहाल, यदि आप किसी छवि के सही क्षेत्रों को ध्यान से देखें, तो इस बात की अच्छी संभावना है कि आप यह पहचान सकेंगे कि यह किसी मशीन द्वारा बनाई गई है या नहीं।

अनुशंसित वीडियो

हाथ का सलाद और उंगलियों की गेंदें

एआई डेवलपर्स ने कृत्रिम बुद्धिमत्ता उपकरणों को यह सिखाने के संघर्ष में प्रगति की है कि मानव हाथ कैसे दिखना चाहिए, लेकिन इसमें सुधार की काफी गुंजाइश है। यदि अंगुलियों को प्रमुखता से प्रदर्शित नहीं किया गया है, तो त्रुटियां छूटना आसान है, लेकिन यह एक सतत समस्या है।

संबंधित

  • स्टेबल डिफ्यूज़न का लक्ष्य उंगलियों को उत्पन्न करने की समस्या को ठीक करना है
  • एआई-जनित वीडियो आ गए हैं, और वे तेजी से विकसित हो रहे हैं
  • बिंग इमेज क्रिएटर आपके ब्राउज़र में DALL-E AI-जनरेटेड छवियां लाता है
डैल-ई एक प्रारंभिक एआई नेता था लेकिन हाथ इसकी चीज़ नहीं हैं।
डैल-ई एक प्रारंभिक एआई नेता था, लेकिन हाथ इसकी चीज़ नहीं हैं।डैल-ई को एलन ट्रूली द्वारा प्रेरित किया गया

जनता के लिए उपलब्ध पहले और सर्वोत्तम एआई छवि जनरेटरों में से एक, OpenAI का Dall-E, ने हाथ पकड़े हुए लोगों की ये तस्वीरें बनाईं। पहली नज़र में, यह ठीक लग सकता है। करीब से निरीक्षण करने पर कुछ समस्याएं स्पष्ट हो जाती हैं। अतिरिक्त उंगलियों, अजीब नाखूनों और मिले हुए अंकों से सावधान रहें।

जटिल पकड़ और आपस में जुड़ी हुई उंगलियाँ और भी अधिक चुनौतीपूर्ण हैं। यदि आपकी एआई छवियां क्लासिक गड़बड़ियों के साथ वापस आती हैं जिन्हें "हैंड सलाद" या "उंगलियों की गेंद" कहा जाता है, तो आश्चर्यचकित न हों।

डैल-ई के आपस में जुड़े हाथ परेशान कर रहे हैं।
डैल-ई के आपस में जुड़े हुए हाथ परेशान करने वाले हैं।डैल-ई को एलन ट्रूली द्वारा प्रेरित किया गया

परेशान करने वाला पाठ और लेखन

आप उम्मीद कर सकते हैं कि कंप्यूटर के लिए टेक्स्ट तैयार करना आसान होगा। जब आप फ़ोन उठाते हैं या ब्राउज़र खोलते हैं तो आप प्रतिदिन स्क्रीन पर शब्दों के प्रमाण देखते हैं। प्रारंभिक कंप्यूटर, इसके विपरीत शीर्ष गेमिंग पीसी आज, किसी भी प्रकार का ग्राफ़िक्स प्रदर्शित नहीं किया जा सका। सब कुछ पाठ या संख्याएँ थीं।

लियोनार्डो एआई शैलियों को जानते हैं लेकिन मुद्रित पाठ चुनौतीपूर्ण है।
लियोनार्डो एआई शैलियों को जानते हैं, लेकिन मुद्रित पाठ चुनौतीपूर्ण है।एलन ट्रूली द्वारा लियोनार्डो एआई को प्रेरित किया गया

फिर भी वास्तविक अक्षरों और प्रतीकों को मुद्रित या लिखित शब्दों के रूप में प्रदर्शित करना आश्चर्यजनक रूप से मुश्किल है एआई छवि जनरेटर. इसे हल करना एक आसान समस्या लग सकती है, लेकिन ऐसा नहीं है। कोई ऐप केवल सादे टेक्स्ट को ओवरले नहीं कर सकता। आश्वस्त करने के लिए, पाठ शैली, छायांकन, कोण और परिप्रेक्ष्य को बाकी दृश्य से मेल खाना चाहिए।

उदाहरण में, एक अपेक्षाकृत नए एआई छवि जनरेटर, लियोनार्डो एआई ने जैक रैबिट स्लिम के डिनर के लिए एक पुराने बिलबोर्ड के साथ एक साहसी प्रयास किया। कई कोशिशों के बाद, एआई "जैक रैबिट" का उच्चारण करने में कामयाब रहा, जो अनुरोध के काफी करीब है। प्रत्येक छवि में विंटेज फ़ोटोग्राफ़ शैली सटीक थी, लेकिन अक्षर और शब्द अधिकतर त्रुटिपूर्ण थे।

लियोनार्डो एआई इनमें से एक रेंडर में टेक्स्ट को सही करने के करीब पहुंच गया।
लियोनार्डो एआई बाईं ओर के रेंडर में टेक्स्ट को सही करने के करीब पहुंच गया।एलन ट्रूली द्वारा प्रेरित लियोनार्डो एआई रेंडर

आंखों के पास यह नहीं है

बिंग इमेज क्रिएटर को आँखों से परेशानी हो रही है।
बिंग इमेज क्रिएटर को एलन ट्रूली द्वारा प्रेरित किया गया

यह अक्सर कहा जाता है कि आंखें आत्मा की खिड़कियां होती हैं। हम आंखों के संपर्क पर इतना अधिक भरोसा करते हैं कि यथार्थवादी चित्र बनाने में यह सबसे महत्वपूर्ण विवरण हो सकता है। लेकिन कई एआई उपकरणों को मानव आंखों को प्रस्तुत करने में कठिनाई होती है।

बिंग इमेज क्रिएटर ने स्टूडियो पृष्ठभूमि और एक बहु-पीढ़ी की पारिवारिक तस्वीर तैयार करने में अच्छा काम किया। हालाँकि, लगभग हर व्यक्ति की आँखें विचित्र होती हैं जो देखने में ऐसी लगती हैं जैसे उन्हें एलियंस द्वारा डाला गया हो, या शायद ये मुस्कुराते हुए लोग अलौकिक प्राणियों में बदलने की प्रक्रिया में हैं।

बिंग इमेज क्रिएटर की आंखों की समस्याओं के दो करीबी उदाहरण।
बिंग इमेज क्रिएटर की परेशान करने वाली आंखों की समस्याओं के दो करीबी उदाहरण।बिंग इमेज क्रिएटर को एलन ट्रूली द्वारा प्रेरित किया गया

परेशानी पैदा करने वाले उपकरण

मनुष्य उपकरणों के मामले में महान हैं, न कि केवल एआई जैसी डिजिटल विविधता के मामले में। हम अपनी पकड़ में आने वाले किसी भी भौतिक उपकरण पर तुरंत महारत हासिल कर लेते हैं। दूसरी ओर, एआई को यह समझने में कठिनाई होती है कि वे क्या हैं और उनका उपयोग कैसे किया जाता है।

मिडजॉर्नी हाथों को समझता है लेकिन रिंच से परेशान है।
मिडजॉर्नी हाथों को समझता है, लेकिन रिंच से परेशान है। क्या वह नीचे बायीं ओर एक प्रकाश बल्ब है?एलन ट्रूली द्वारा मिडजॉर्नी को प्रेरित किया गया

मिडजर्नी एक एआई छवि जनरेटर है जो मानव चेहरे और हाथों से समस्याओं को हल करने में शानदार प्रगति कर रहा है। हालाँकि, जब एक मैकेनिक को रिंच के साथ बोल्ट को कसते हुए दिखाने के लिए कहा गया, तो उपकरण पूरी तरह से अनुपस्थित है। एक मामले में दस्ताने में नाखून जोड़े जाते हैं, और दूसरे में किसी तरह एक प्रकाश बल्ब दिखाई देता है।

काटे जा रहे बालों के इस क्लोज़अप रेंडर में बिंग इमेज क्रिएटर के लिए कैंची बहुत जटिल है। वे केवल एक छवि में खुले हैं और कभी काटने की क्रिया में नहीं दिखते।

बिंग इमेज क्रिएटर कैंची का पता नहीं लगा सकता।
बिंग इमेज क्रिएटर यह समझ नहीं पा रहा है कि कैंची कैसे काम करती है।बिंग इमेज क्रिएटर को एलन ट्रूली द्वारा प्रेरित किया गया

दुःस्वप्न दांत

मुस्कुराहट के स्थिर प्रसार रेंडर में कभी-कभी बहुत सारे दांत होते हैं।
लियोनार्डो एआई के माध्यम से स्थिर प्रसार, एलन ट्रूली द्वारा प्रेरित

जब लोग मुस्कुराते हैं और हंसते हैं, तो इससे आमतौर पर तस्वीर बेहतर हो जाती है, जिससे वह सुखद और मजेदार बन जाती है। जब दो छात्रों के मुस्कुराने और हंसने जैसा सरल संकेत दिया जाता है, तो एक एआई इसे दांतों की कई पंक्तियों और अन्य अजीब विकृतियों के साथ दुःस्वप्न ईंधन में बदल सकता है।

लियोनार्डो एआई आपको कई मॉडलों के बीच चयन करने की अनुमति देता है, और कुछ दांतों को अच्छी तरह से संभालते हैं। प्रसिद्ध स्थिर प्रसार 2.1 मॉडल दाँत ठीक करने के लिए कुछ मदद की ज़रूरत है। कुछ नकारात्मक संकेतों के साथ, समस्या का समाधान हो गया। इन एआई छवि समस्याओं के समाधान हैं, लेकिन अच्छे परिणाम प्राप्त करने के लिए अभी भी काम करना पड़ता है।

स्थिर प्रसार मुस्कान नकारात्मक संकेतों से लाभान्वित होती है।
स्थिर प्रसार मुस्कान "अजीब दांत" और "विकृत मुंह" को हटाने के नकारात्मक संकेतों से लाभान्वित होती है।लियोनार्डो एआई के माध्यम से स्थिर प्रसार, एलन ट्रूली द्वारा प्रेरित

एआई कला में तेजी से सुधार हो रहा है

एआई कला के शुरुआती दिनों में, परिणाम अजीब और अद्भुत थे, जो समान रूप से सुंदरता और भयावहता पैदा करते थे। प्रत्येक नए अपडेट के साथ त्रुटियाँ कम ध्यान देने योग्य होती जा रही हैं, और कुछ सुधारों के साथ कई समस्याओं को दूर किया जा सकता है।

साथ बहुत सारे AI उपकरण उपलब्ध हैं, किसी अन्य सिस्टम को आज़माना आसान है। कई एआई छवि जनरेटर एल्गोरिदम को समायोजित करने और बेहतर परिणाम प्राप्त करने के लिए नकारात्मक संकेतों या अन्य विकल्पों की अनुमति देते हैं।

प्रयोग करने योग्य चित्र प्राप्त करने के लिए आपको कई प्रयासों से गुजरना पड़ सकता है, खासकर यदि चेहरे या हाथों पर ध्यान केंद्रित किया गया हो। जब आप मुद्रित या लिखित शब्दों को शामिल करना चाहते हैं, तो एआई के बकवास अक्षरों को मिटाने और सही पाठ में मिश्रण करने के लिए एक छवि संपादक में समय बिताने के लिए तैयार रहें।

अच्छी खबर यह है कि कई एआई छवि जनरेटर मुफ़्त हैं, और सदस्यता मॉडल अपेक्षाकृत सस्ते हैं। एक वर्ष के भीतर, इन लंबित समस्याओं को हल किया जा सकता है, जिससे आप एआई रेंडर को एक तैयार कला कृति के रूप में उपयोग कर सकते हैं एक तस्वीर के लिए एक प्रतिस्थापन.

संपादकों की सिफ़ारिशें

  • मिडजर्नी का नया ज़ूम-आउट फीचर अगली बड़ी एआई सनसनी बन रहा है
  • अपडेटेड बिंग चैट ने 6 महत्वपूर्ण नए तरीकों से चैटजीपीटी को पछाड़ दिया है
  • इस वायरल एआई छवि ने दुनिया को बेवकूफ बना दिया, और आप इसे पहले ही देख चुके होंगे
  • ग्रामरली का नया चैटजीपीटी जैसा एआई जनरेटर आपके लेखन को प्रूफरीड करने के अलावा और भी बहुत कुछ कर सकता है
  • मैंने एआई वेब खोज का (दूरस्थ) भविष्य देखा है - यहां वह जगह है जहां यह अद्भुत है, और जहां यह संघर्ष करता है

अपनी जीवनशैली को उन्नत करेंडिजिटल ट्रेंड्स पाठकों को सभी नवीनतम समाचारों, मजेदार उत्पाद समीक्षाओं, व्यावहारिक संपादकीय और एक तरह की अनूठी झलक के साथ तकनीक की तेज़ गति वाली दुनिया पर नज़र रखने में मदद करता है।

श्रेणियाँ

हाल का

क्या नेटफ्लिक्स द सैंडमैन के लिए सही घर है?

क्या नेटफ्लिक्स द सैंडमैन के लिए सही घर है?

द सैंडमैन, नील गैमन के सपनों, फंतासी और जादू की...

टिक, टिक... बूम! एक आदर्श संगीतमय संख्या बनाने पर संपादक

टिक, टिक... बूम! एक आदर्श संगीतमय संख्या बनाने पर संपादक

मायरोन केर्स्टीन 2003 से बड़े पर्दे पर संगीत का...