5 أشياء لا تزال مولدات الصور بالذكاء الاصطناعي تعاني معها

مولدات صور AI مثل دال- إي, انتشار مستقر, ميدجورني، و منشئ صور بنج نتائج مذهلة ، ولكن في بعض الأحيان يمكن أن تكون محبطة بشكل لا يصدق. من خلال المطالبات البسيطة التي تحتوي على بضع كلمات فقط ، يمكن للذكاء الاصطناعي إنتاج صور رائعة تبدو وكأنها صور احترافية وفن مقنع بأنماط مختلفة. ومع ذلك ، فإن نفس المطالبة ستخلق أحيانًا بعض المخلوقات الرهيبة أو العرض المعيب بشكل مضحك.

محتويات

  • سلطة يدوية وكرات أصابع
  • النص والكتابة المزعجة
  • العيون لا تملكها
  • أدوات مزعجة
  • أسنان كابوس
  • فن الذكاء الاصطناعي يتحسن بسرعة

قد تساعد المطالبات السلبية في تقليل احتمالية حدوث هذه الأخطاء ، ولكن التعقيد لا يمكن أن يوفر عليك دائمًا. حتى خبراء الذكاء الاصطناعي يكافحون مع المخلوقات المشوهة والمشاهد غير الدنيوية ، مما يتطلب ساعات طويلة من مطالبات التحسين أو تحسين الصور باستخدام محرر صور تقليدي. في الوقت الحالي ، إذا نظرت بعناية في المناطق الصحيحة من الصورة ، فهناك فرصة جيدة لتتمكن من تحديد ما إذا كانت قد تم إنشاؤها بواسطة آلة أم لا.

مقاطع الفيديو الموصى بها

سلطة يدوية وكرات أصابع

حقق مطورو الذكاء الاصطناعي تقدمًا في الكفاح من أجل تعليم أدوات الذكاء الاصطناعي كيف يجب أن تبدو الأيدي البشرية ، ولكن هناك مجال كبير للتحسين. إذا لم تظهر الأصابع بشكل بارز ، فمن السهل أن تفوتك الأخطاء ، لكنها مشكلة مستمرة.

متعلق ب

  • يهدف Stable Diffusion إلى حل مشكلته مع توليد الأصابع
  • وصلت مقاطع الفيديو التي تم إنشاؤها بواسطة الذكاء الاصطناعي ، وهي تتطور بسرعة
  • يجلب Bing Image Creator الصور المولدة بالذكاء الاصطناعي DALL-E إلى متصفحك
كان Dall-E قائدًا مبكرًا للذكاء الاصطناعي ولكن الأيدي ليست شيئًا.
كان Dall-E قائدًا مبكرًا للذكاء الاصطناعي ، لكن الأيدي ليست شيئًا.Dall-E بدفع من Alan Truly

واحد من أول وأفضل مولدات صور الذكاء الاصطناعي المتاحة للجمهور ، Dall-E من أوبن إيه آي، أنشأوا هذه الصور لأشخاص يمسكون بأيديهم. للوهلة الأولى ، قد يبدو جيدًا. عند الفحص الدقيق ، تظهر بعض المشاكل. احذر من الأصابع الزائدة والأظافر الغريبة والأرقام المدمجة.

تعتبر القبضة المعقدة والأصابع المتشابكة أكثر صعوبة. لا تتفاجأ إذا عادت صور الذكاء الاصطناعي الخاصة بك مع مواطن الخلل الكلاسيكية المشار إليها باسم "سلطة اليد" أو "كرات الأصابع".

أيدي Dall-E المتشابكة مزعجة.
أيدي Dall-E المتشابكة مزعجة.Dall-E بدفع من Alan Truly

النص والكتابة المزعجة

قد تتوقع أنه سيكون من السهل على الكمبيوتر إنشاء النص. ترى أدلة على الكلمات على الشاشات يوميًا عندما تلتقط الهاتف أو تفتح متصفحًا. أجهزة الكمبيوتر القديمة ، على عكس أفضل أجهزة الكمبيوتر المخصصة للألعاب اليوم ، لا يمكنهم عرض رسومات من أي نوع. كان كل شيء نصًا أو أرقامًا.

يعرف Leonardo AI الأنماط ولكن النص المطبوع يمثل تحديًا.
يعرف Leonardo AI الأنماط ، لكن النص المطبوع يمثل تحديًا.ليوناردو منظمة العفو الدولية بقيادة آلان ترولي

ومع ذلك ، فإن عرض الأحرف والرموز الفعلية ككلمات مطبوعة أو مكتوبة أمر صعب بشكل مدهش بالنسبة لـ مولد الصور AI. قد يبدو الأمر وكأنه مشكلة سهلة الحل ، لكنها ليست كذلك. لا يمكن للتطبيق تراكب النص العادي فقط. لكي تكون مقنعًا ، يجب أن يتطابق نمط النص والتظليل والزاوية والمنظور مع بقية المشهد.

في هذا المثال ، بذل منشئ صور AI جديد نسبيًا ، ليوناردو AI ، جهدًا شجاعًا باستخدام لوحة إعلانية عتيقة لعشاء Jack Rabbit Slim. بعد عدة محاولات ، تمكنت منظمة العفو الدولية من توضيح عبارة "Jack Rabbit’s" ، وهي قريبة جدًا من الطلب. كان أسلوب التصوير القديم موضعيًا في كل صورة ، لكن الحروف والكلمات كانت معيبة في الغالب.

اقترب Leonardo AI من الحصول على نص بشكل صحيح في أحد هذه العروض.
اقترب ليوناردو AI من تصحيح النص في العرض على اليسار.يجعل ليوناردو منظمة العفو الدولية مدفوعة من قبل آلان ترولي

العيون لا تملكها

Bing Image Creator يكافح مع العيون.
Bing Image Creator بتوجيه من Alan Truly

كثيرا ما يقال أن العيون هي نافذة الروح. نحن نعتمد كثيرًا على الاتصال بالعين بحيث يمكن أن يكون أكثر التفاصيل أهمية في إنشاء صورة واقعية. لكن العديد من أدوات الذكاء الاصطناعي تواجه صعوبة في إظهار العيون البشرية.

قام Bing Image Creator بعمل لائق مع خلفية الاستوديو وعرض صورة عائلية متعددة الأجيال. ومع ذلك ، فإن كل شخص تقريبًا لديه عيون غريبة تبدو وكأنها أدخلتها كائنات فضائية ، أو ربما هؤلاء الأشخاص المبتسمون في طريقهم للتحول إلى مخلوقات غير أرضية.

مثالان أقرب لقضايا العين في Bing Image Creator.
مثالان أقرب إلى مشاكل العين المزعجة في Bing Image Creator.Bing Image Creator بتوجيه من Alan Truly

أدوات مزعجة

البشر رائعون في استخدام الأدوات وليس فقط التنوع الرقمي مثل الذكاء الاصطناعي. نتقن بسرعة أي أداة مادية في متناول أيدينا. من ناحية أخرى ، يكافح الذكاء الاصطناعي لفهم ماهيتها وكيفية استخدامها.

يفهم Midjourney الأيدي لكن مفاتيح الربط في حيرة من أمره.
يفهم Midjourney الأيدي ، لكنه يحير من مفاتيح الربط. هل هذا مصباح كهربائي في أسفل اليسار؟ميدجورني مدفوع من قبل آلان ترولي

Midjourney هو منشئ صور الذكاء الاصطناعي الذي يحرز تقدمًا رائعًا في حل مشاكل الوجوه والأيدي البشرية. ومع ذلك ، عندما يُطلب منك إظهار ميكانيكي يشد البرغي بمفتاح ، فإن الأداة غائبة تمامًا. تتم إضافة أظافر الأصابع إلى القفازات في إحدى الحالات ، ويظهر مصباح كهربائي بطريقة ما في حالة أخرى.

المقص معقد للغاية بالنسبة إلى Bing Image Creator في هذا التقريب عن الشعر الذي يتم قصه. يتم فتحها فقط في صورة واحدة ولا يبدو أنها في حالة القطع.

لا يستطيع Bing Image Creator اكتشاف المقص.
لا يستطيع Bing Image Creator معرفة كيفية عمل المقص.Bing Image Creator بتوجيه من Alan Truly

أسنان كابوس

الانتشار المستقر للابتسامات في بعض الأحيان يكون لها أسنان كثيرة.
انتشار مستقر عبر ليوناردو AI ، بدفع من آلان ترولي

عندما يبتسم الناس ويضحكون ، فهذا عادة ما يحسن الصورة ، ويجعلها ممتعة وممتعة. عندما يُعطى موجهًا بسيطًا مثل طالبين يبتسمان ويضحكان ، يمكن للذكاء الاصطناعي تحويل هذا إلى وقود مرعب مع صفوف متعددة من الأسنان والتشوهات الغريبة الأخرى.

يسمح لك Leonardo AI بالاختيار من بين عدة طرز ، وبعضها يتعامل مع الأسنان جيدًا. الشعبية نموذج الانتشار المستقر 2.1 بحاجة إلى بعض المساعدة لتصحيح الأسنان. مع بعض المطالبات السلبية ، تم حل المشكلة. هناك حلول لمشاكل صور الذكاء الاصطناعي هذه ، لكن لا يزال الأمر يتطلب العمل للحصول على نتائج جيدة.

تستفيد ابتسامات الانتشار المستقر من المطالبات السلبية.
تستفيد ابتسامات الانتشار المستقر من المطالبات السلبية لإزالة "الأسنان الغريبة" و "الفم المشوه".انتشار مستقر عبر ليوناردو AI ، بدفع من آلان ترولي

فن الذكاء الاصطناعي يتحسن بسرعة

في الأيام الأولى لفن الذكاء الاصطناعي ، كانت النتائج غريبة ورائعة ، وخلقت الجمال والرعب بتخلي مماثل. أصبحت الأخطاء أقل وضوحًا مع كل تحديث جديد ، ويمكن التغلب على العديد من المشكلات ببعض التحسين.

مع الكثير من أدوات الذكاء الاصطناعي المتاحة، من السهل تجربة نظام آخر. تسمح العديد من مولدات الصور بالذكاء الاصطناعي بالمطالبات السلبية أو الخيارات الأخرى لضبط الخوارزمية والحصول على نتائج أفضل.

قد تحتاج إلى إجراء عدة محاولات للحصول على صورة قابلة للاستخدام ، خاصة إذا كان هناك تركيز على الوجوه أو اليدين. عندما تريد تضمين كلمات مطبوعة أو مكتوبة ، فاستعد لقضاء بعض الوقت في محرر الصور لمحو الأحرف غير المنطقية للذكاء الاصطناعي ومزجها في النص الصحيح.

والخبر السار هو أن العديد من مولدات صور الذكاء الاصطناعي مجانية ، ونماذج الاشتراك غير مكلفة نسبيًا. في غضون عام ، يمكن حل هذه المشكلات العالقة ، مما يتيح لك استخدام عرض AI كقطعة فنية نهائية أو بديل للصورة.

توصيات المحررين

  • أصبحت ميزة التصغير الجديدة في Midjourney هي الإحساس الكبير التالي بالذكاء الاصطناعي
  • تفوقت Bing Chat المحدثة على ChatGPT بست طرق جديدة ومهمة
  • خدعت صورة الذكاء الاصطناعي هذه العالم ، وربما تكون قد شاهدتها بالفعل
  • يمكن لمُنشئ الذكاء الاصطناعي الجديد الشبيه بـ ChatGPT من Grammarly القيام بأكثر من مجرد تصحيح كتاباتك
  • لقد رأيت المستقبل (البعيد) لبحث الويب بالذكاء الاصطناعي - وهنا حيث يكون رائعًا ، وأين يواجه صعوبة

ترقية نمط حياتكتساعد الاتجاهات الرقمية القراء على متابعة عالم التكنولوجيا سريع الخطى من خلال أحدث الأخبار ومراجعات المنتجات الممتعة والافتتاحيات الثاقبة والنظرات الخاطفة الفريدة من نوعها.