مولدات صور AI مثل دال- إي, انتشار مستقر, ميدجورني، و منشئ صور بنج نتائج مذهلة ، ولكن في بعض الأحيان يمكن أن تكون محبطة بشكل لا يصدق. من خلال المطالبات البسيطة التي تحتوي على بضع كلمات فقط ، يمكن للذكاء الاصطناعي إنتاج صور رائعة تبدو وكأنها صور احترافية وفن مقنع بأنماط مختلفة. ومع ذلك ، فإن نفس المطالبة ستخلق أحيانًا بعض المخلوقات الرهيبة أو العرض المعيب بشكل مضحك.
محتويات
- سلطة يدوية وكرات أصابع
- النص والكتابة المزعجة
- العيون لا تملكها
- أدوات مزعجة
- أسنان كابوس
- فن الذكاء الاصطناعي يتحسن بسرعة
قد تساعد المطالبات السلبية في تقليل احتمالية حدوث هذه الأخطاء ، ولكن التعقيد لا يمكن أن يوفر عليك دائمًا. حتى خبراء الذكاء الاصطناعي يكافحون مع المخلوقات المشوهة والمشاهد غير الدنيوية ، مما يتطلب ساعات طويلة من مطالبات التحسين أو تحسين الصور باستخدام محرر صور تقليدي. في الوقت الحالي ، إذا نظرت بعناية في المناطق الصحيحة من الصورة ، فهناك فرصة جيدة لتتمكن من تحديد ما إذا كانت قد تم إنشاؤها بواسطة آلة أم لا.
مقاطع الفيديو الموصى بها
سلطة يدوية وكرات أصابع
حقق مطورو الذكاء الاصطناعي تقدمًا في الكفاح من أجل تعليم أدوات الذكاء الاصطناعي كيف يجب أن تبدو الأيدي البشرية ، ولكن هناك مجال كبير للتحسين. إذا لم تظهر الأصابع بشكل بارز ، فمن السهل أن تفوتك الأخطاء ، لكنها مشكلة مستمرة.
متعلق ب
- يهدف Stable Diffusion إلى حل مشكلته مع توليد الأصابع
- وصلت مقاطع الفيديو التي تم إنشاؤها بواسطة الذكاء الاصطناعي ، وهي تتطور بسرعة
- يجلب Bing Image Creator الصور المولدة بالذكاء الاصطناعي DALL-E إلى متصفحك
واحد من أول وأفضل مولدات صور الذكاء الاصطناعي المتاحة للجمهور ، Dall-E من أوبن إيه آي، أنشأوا هذه الصور لأشخاص يمسكون بأيديهم. للوهلة الأولى ، قد يبدو جيدًا. عند الفحص الدقيق ، تظهر بعض المشاكل. احذر من الأصابع الزائدة والأظافر الغريبة والأرقام المدمجة.
تعتبر القبضة المعقدة والأصابع المتشابكة أكثر صعوبة. لا تتفاجأ إذا عادت صور الذكاء الاصطناعي الخاصة بك مع مواطن الخلل الكلاسيكية المشار إليها باسم "سلطة اليد" أو "كرات الأصابع".
النص والكتابة المزعجة
قد تتوقع أنه سيكون من السهل على الكمبيوتر إنشاء النص. ترى أدلة على الكلمات على الشاشات يوميًا عندما تلتقط الهاتف أو تفتح متصفحًا. أجهزة الكمبيوتر القديمة ، على عكس أفضل أجهزة الكمبيوتر المخصصة للألعاب اليوم ، لا يمكنهم عرض رسومات من أي نوع. كان كل شيء نصًا أو أرقامًا.
ومع ذلك ، فإن عرض الأحرف والرموز الفعلية ككلمات مطبوعة أو مكتوبة أمر صعب بشكل مدهش بالنسبة لـ مولد الصور AI. قد يبدو الأمر وكأنه مشكلة سهلة الحل ، لكنها ليست كذلك. لا يمكن للتطبيق تراكب النص العادي فقط. لكي تكون مقنعًا ، يجب أن يتطابق نمط النص والتظليل والزاوية والمنظور مع بقية المشهد.
في هذا المثال ، بذل منشئ صور AI جديد نسبيًا ، ليوناردو AI ، جهدًا شجاعًا باستخدام لوحة إعلانية عتيقة لعشاء Jack Rabbit Slim. بعد عدة محاولات ، تمكنت منظمة العفو الدولية من توضيح عبارة "Jack Rabbit’s" ، وهي قريبة جدًا من الطلب. كان أسلوب التصوير القديم موضعيًا في كل صورة ، لكن الحروف والكلمات كانت معيبة في الغالب.
العيون لا تملكها
كثيرا ما يقال أن العيون هي نافذة الروح. نحن نعتمد كثيرًا على الاتصال بالعين بحيث يمكن أن يكون أكثر التفاصيل أهمية في إنشاء صورة واقعية. لكن العديد من أدوات الذكاء الاصطناعي تواجه صعوبة في إظهار العيون البشرية.
قام Bing Image Creator بعمل لائق مع خلفية الاستوديو وعرض صورة عائلية متعددة الأجيال. ومع ذلك ، فإن كل شخص تقريبًا لديه عيون غريبة تبدو وكأنها أدخلتها كائنات فضائية ، أو ربما هؤلاء الأشخاص المبتسمون في طريقهم للتحول إلى مخلوقات غير أرضية.
أدوات مزعجة
البشر رائعون في استخدام الأدوات وليس فقط التنوع الرقمي مثل الذكاء الاصطناعي. نتقن بسرعة أي أداة مادية في متناول أيدينا. من ناحية أخرى ، يكافح الذكاء الاصطناعي لفهم ماهيتها وكيفية استخدامها.
Midjourney هو منشئ صور الذكاء الاصطناعي الذي يحرز تقدمًا رائعًا في حل مشاكل الوجوه والأيدي البشرية. ومع ذلك ، عندما يُطلب منك إظهار ميكانيكي يشد البرغي بمفتاح ، فإن الأداة غائبة تمامًا. تتم إضافة أظافر الأصابع إلى القفازات في إحدى الحالات ، ويظهر مصباح كهربائي بطريقة ما في حالة أخرى.
المقص معقد للغاية بالنسبة إلى Bing Image Creator في هذا التقريب عن الشعر الذي يتم قصه. يتم فتحها فقط في صورة واحدة ولا يبدو أنها في حالة القطع.
أسنان كابوس
عندما يبتسم الناس ويضحكون ، فهذا عادة ما يحسن الصورة ، ويجعلها ممتعة وممتعة. عندما يُعطى موجهًا بسيطًا مثل طالبين يبتسمان ويضحكان ، يمكن للذكاء الاصطناعي تحويل هذا إلى وقود مرعب مع صفوف متعددة من الأسنان والتشوهات الغريبة الأخرى.
يسمح لك Leonardo AI بالاختيار من بين عدة طرز ، وبعضها يتعامل مع الأسنان جيدًا. الشعبية نموذج الانتشار المستقر 2.1 بحاجة إلى بعض المساعدة لتصحيح الأسنان. مع بعض المطالبات السلبية ، تم حل المشكلة. هناك حلول لمشاكل صور الذكاء الاصطناعي هذه ، لكن لا يزال الأمر يتطلب العمل للحصول على نتائج جيدة.
فن الذكاء الاصطناعي يتحسن بسرعة
في الأيام الأولى لفن الذكاء الاصطناعي ، كانت النتائج غريبة ورائعة ، وخلقت الجمال والرعب بتخلي مماثل. أصبحت الأخطاء أقل وضوحًا مع كل تحديث جديد ، ويمكن التغلب على العديد من المشكلات ببعض التحسين.
مع الكثير من أدوات الذكاء الاصطناعي المتاحة، من السهل تجربة نظام آخر. تسمح العديد من مولدات الصور بالذكاء الاصطناعي بالمطالبات السلبية أو الخيارات الأخرى لضبط الخوارزمية والحصول على نتائج أفضل.
قد تحتاج إلى إجراء عدة محاولات للحصول على صورة قابلة للاستخدام ، خاصة إذا كان هناك تركيز على الوجوه أو اليدين. عندما تريد تضمين كلمات مطبوعة أو مكتوبة ، فاستعد لقضاء بعض الوقت في محرر الصور لمحو الأحرف غير المنطقية للذكاء الاصطناعي ومزجها في النص الصحيح.
والخبر السار هو أن العديد من مولدات صور الذكاء الاصطناعي مجانية ، ونماذج الاشتراك غير مكلفة نسبيًا. في غضون عام ، يمكن حل هذه المشكلات العالقة ، مما يتيح لك استخدام عرض AI كقطعة فنية نهائية أو بديل للصورة.
توصيات المحررين
- أصبحت ميزة التصغير الجديدة في Midjourney هي الإحساس الكبير التالي بالذكاء الاصطناعي
- تفوقت Bing Chat المحدثة على ChatGPT بست طرق جديدة ومهمة
- خدعت صورة الذكاء الاصطناعي هذه العالم ، وربما تكون قد شاهدتها بالفعل
- يمكن لمُنشئ الذكاء الاصطناعي الجديد الشبيه بـ ChatGPT من Grammarly القيام بأكثر من مجرد تصحيح كتاباتك
- لقد رأيت المستقبل (البعيد) لبحث الويب بالذكاء الاصطناعي - وهنا حيث يكون رائعًا ، وأين يواجه صعوبة
ترقية نمط حياتكتساعد الاتجاهات الرقمية القراء على متابعة عالم التكنولوجيا سريع الخطى من خلال أحدث الأخبار ومراجعات المنتجات الممتعة والافتتاحيات الثاقبة والنظرات الخاطفة الفريدة من نوعها.