AI görüntü oluşturucuların hala mücadele ettiği 5 şey

AI görüntü üreteçleri gibi Dall-E, Kararlı Difüzyon, yolculuk ortası, Ve Bing Resim Oluşturucu harika sonuçlar verir, ancak bazen inanılmaz derecede sinir bozucu olabilirler. Bir yapay zeka, yalnızca birkaç kelime içeren basit istemlerle, profesyonel fotoğraflar gibi görünen etkileyici görüntüler ve çeşitli stillerde ikna edici sanat eserleri üretebilir. Bununla birlikte, aynı istem bazen korkunç bir yaratık veya komik bir şekilde kusurlu işleme yaratacaktır.

İçindekiler

  • El salatası ve parmak topları
  • Sorunlu metin ve yazı
  • Gözler buna sahip değil
  • Zahmetli araçlar
  • Kabus dişleri
  • AI sanatı hızla gelişiyor

Olumsuz istemler, bu hataların olasılığını azaltmaya yardımcı olabilir, ancak karmaşıklık sizi her zaman kurtaramaz. AI uzmanları bile şekilsiz yaratıklar ve dünyevi olmayan sahnelerle mücadele ediyor ve geleneksel bir fotoğraf düzenleyiciyle uzun saatler boyunca hassas komut istemleri veya rötuş görüntüleri gerektiriyor. Şimdilik, bir görüntünün doğru alanlarına dikkatlice bakarsanız, bir makine tarafından yapılıp yapılmadığını belirleme şansınız yüksektir.

Önerilen Videolar

El salatası ve parmak topları

Yapay zeka geliştiricileri, yapay zeka araçlarına insan elinin nasıl görünmesi gerektiğini öğretme mücadelesinde ilerleme kaydetti, ancak iyileştirme için çok yer var. Parmaklar belirgin bir şekilde öne çıkarılmamışsa, hataları gözden kaçırmak kolaydır, ancak bu devam eden bir sorundur.

İlgili

  • Kararlı Difüzyon, parmak üretme sorununu çözmeyi hedefliyor
  • Yapay zeka tarafından oluşturulan videolar geldi ve hızla gelişiyorlar
  • Bing Image Creator, DALL-E yapay zeka tarafından oluşturulan görüntüleri tarayıcınıza getirir
Dall-E erken bir AI lideriydi ama eller onun şeyi değil.
Dall-E erken bir AI lideriydi, ancak eller onun işi değil.Dall-E, Alan Truly tarafından yönlendirildi

Halka sunulan ilk ve en iyi AI görüntü üreticilerinden biri, OpenAI'den Dall-E, el ele tutuşan insanların bu resimlerini yarattı. İlk bakışta, iyi görünebilir. Daha yakından incelendiğinde, bazı sorunlar ortaya çıkıyor. Fazladan parmaklara, garip tırnaklara ve birleştirilmiş rakamlara dikkat edin.

Karmaşık kulplar ve geçmeli parmaklar daha da zordur. AI görüntüleriniz "el salatası" veya "parmak yumakları" olarak adlandırılan klasik aksaklıklarla geri gelirse şaşırmayın.

Dall-E'nin birbirine kenetlenmiş elleri rahatsız edici.
Dall-E'nin birbirine kenetlenmiş elleri rahatsız edici.Dall-E, Alan Truly tarafından yönlendirildi

Sorunlu metin ve yazı

Metnin bir bilgisayarın oluşturmasının kolay olmasını bekleyebilirsiniz. Telefonu elinize aldığınızda veya bir tarayıcı açtığınızda günlük olarak ekranlarda kelimelerin kanıtlarını görürsünüz. Erken bilgisayarlar, aksine en iyi oyun bilgisayarları bugün, herhangi bir grafik görüntüleyemedi. Her şey metin veya sayıydı.

Leonardo AI stilleri bilir ancak basılı metin zordur.
Leonardo AI stilleri bilir, ancak basılı metin zordur.Alan Truly tarafından yönlendirilen Leonardo AI

Yine de, gerçek harfleri ve sembolleri basılı veya yazılı sözcükler olarak göstermek şaşırtıcı derecede zordur. AI görüntü oluşturucu. Çözmesi kolay bir problem gibi gelebilir ama öyle değil. Bir uygulama yalnızca düz metni kaplayamaz. İkna edici olması için metin stili, gölgeleme, açı ve perspektif sahnenin geri kalanıyla eşleşmelidir.

Örnekte, nispeten yeni bir AI görüntü oluşturucu olan Leonardo AI, Jack Rabbit Slim'in lokantası için eski bir reklam panosuyla yiğit bir çaba gösterdi. Birden çok denemeden sonra yapay zeka, talebe oldukça yakın olan "Jack Rabbit's" kelimesini hecelemeyi başardı. Eski fotoğraf stili her görüntüde göze çarpıyordu, ancak harfler ve kelimeler çoğunlukla kusurluydu.

Leonardo AI, bu işlemelerden birinde metni almaya çok yaklaştı.
Leonardo AI, soldaki görüntüde metni düzeltmeye çok yaklaştı.Alan Truly tarafından yönlendirilen Leonardo yapay zeka görselleri

Gözler buna sahip değil

Bing Image Creator, gözlerle mücadele ediyor.
Alan Truly tarafından yönlendirilen Bing Image Creator

Gözlerin ruha açılan pencereler olduğu sık sık söylenir. Göz temasına o kadar güveniyoruz ki, gerçekçi bir portre yaratırken en kritik detay bu olabilir. Ancak birçok AI aracı, insan gözlerini işlemekte zorluk çekiyor.

Bing Image Creator, stüdyo arka planı ve çok kuşaklı bir aile fotoğrafı oluşturma konusunda iyi bir iş çıkardı. Bununla birlikte, hemen hemen her insan, uzaylılar tarafından sokulmuş gibi görünen tuhaf gözlere sahiptir veya belki de bu gülümseyen insanlar, doğaüstü yaratıklara dönüşme sürecindedir.

Bing Image Creator'ın göz sorunlarına daha yakın iki örnek.
Bing Image Creator'ın rahatsız edici göz sorunlarına daha yakın iki örnek.Alan Truly tarafından yönlendirilen Bing Image Creator

Zahmetli araçlar

İnsanlar araçlar konusunda harikadır ve yalnızca yapay zeka gibi dijital çeşitlilikte değildir. Elimizdeki herhangi bir fiziksel araçta hızla ustalaşırız. Öte yandan bir yapay zeka, bunların ne olduğunu ve nasıl kullanıldığını anlamakta zorlanır.

Midjourney ellerden anlıyor ama İngiliz anahtarları aklını karıştırıyor.
Midjourney ellerden anlıyor ama İngiliz anahtarları aklını karıştırıyor. Sol alttaki ampul mü?Alan Truly tarafından yönlendirilen Midjourney

Midjourney, insan yüzleri ve elleriyle ilgili sorunları çözmede harika ilerleme kaydeden bir AI görüntü üreticisidir. Bununla birlikte, bir tamircinin bir cıvatayı anahtarla sıktığını göstermesi istendiğinde, alet tamamen yoktur. Bir durumda eldivenlere tırnaklar eklenir ve diğerinde bir şekilde bir ampul belirir.

Kesilen saçın bu yakın çekim görüntüsünde makas, Bing Image Creator için fazla karmaşık. Yalnızca tek bir görüntüde açıktırlar ve hiçbir zaman kesme işlemindeymiş gibi görünmezler.

Bing Image Creator makası çözemez.
Bing Image Creator, makasın nasıl çalıştığını çözemez.Alan Truly tarafından yönlendirilen Bing Image Creator

Kabus dişleri

Gülümsemelerin Stable Difusion render'larında bazen çok fazla diş bulunur.
Alan Truly tarafından yönlendirilen Leonardo AI aracılığıyla Kararlı Difüzyon

İnsanlar gülümsediğinde ve güldüklerinde, bu genellikle bir resmi iyileştirerek onu keyifli ve eğlenceli hale getirir. İki öğrencinin gülüp gülmesi gibi basit bir komut verildiğinde, bir yapay zeka bunu birden fazla sıra diş ve diğer garip çarpıtmalarla kabus yakıtına dönüştürebilir.

Leonardo AI, birkaç model arasından seçim yapmanıza izin verir ve bazıları dişleri iyi tutar. Popüler Kararlı Difüzyon 2.1 modeli dişlerini düzeltmek için biraz yardıma ihtiyacı vardı. Bazı olumsuz yönlendirmelerle sorun çözüldü. Bu AI görüntü sorunlarına çözümler var, ancak yine de iyi sonuçlar almak için çalışmak gerekiyor.

Kararlı Yayılma gülümsemeleri, olumsuz uyarılardan yararlanır.
Kararlı Difüzyon gülümsemeleri, "garip dişleri" ve "çarpık ağzı" çıkarmak için olumsuz uyarılardan yararlanır.Alan Truly tarafından yönlendirilen Leonardo AI aracılığıyla Kararlı Difüzyon

AI sanatı hızla gelişiyor

AI sanatının ilk günlerinde, sonuçlar tuhaf ve harikaydı, güzellik ve dehşeti eşit bir şekilde terk ederek yaratıyorlardı. Her yeni güncellemede hatalar daha az fark edilir hale geliyor ve bazı iyileştirmelerle birçok sorunun üstesinden gelinebilir.

İle pek çok yapay zeka aracı mevcut, başka bir sistemi denemek kolaydır. Birçok yapay zeka görüntü oluşturucu, algoritmayı ayarlamak ve daha iyi sonuçlar almak için olumsuz istemlere veya diğer seçeneklere izin verir.

Kullanılabilir bir resim elde etmek için, özellikle de yüzlere veya ellere odaklanılmışsa, birkaç deneme yapmanız gerekebilir. Basılı veya yazılı sözcükler eklemek istediğinizde, yapay zekanın saçma sapan harflerini silerek ve doğru metinle karıştırarak bir görüntü düzenleyicide zaman geçirmeye hazırlıklı olun.

İyi haber şu ki, birçok AI görüntü oluşturucu ücretsiz ve abonelik modelleri nispeten ucuz. Bir yıl içinde, bu kalıcı sorunlar çözülerek, bir AI render'ı bitmiş bir sanat eseri olarak kullanmanıza izin verebilir veya bir fotoğrafın yerine geçen.

Editörlerin Önerileri

  • Midjourney'nin yeni uzaklaştırma özelliği, bir sonraki büyük AI hissi haline geliyor
  • Güncellenen Bing Chat, ChatGPT'yi 6 önemli yeni yolla bir adım öteye taşıyor
  • Bu viral AI görüntüsü dünyayı kandırdı ve onu zaten görmüş olabilirsiniz.
  • Grammarly'nin yeni ChatGPT benzeri AI oluşturucu, yazınızı düzeltmekten çok daha fazlasını yapabilir
  • AI web aramasının (uzak) geleceğini gördüm - işte burada harika ve nerede mücadele ediyor

Yaşam tarzınızı yükseltinDijital Eğilimler, en son haberler, eğlenceli ürün incelemeleri, anlayışlı başyazılar ve türünün tek örneği ön incelemelerle okuyucuların hızlı tempolu teknoloji dünyasını takip etmelerine yardımcı olur.