5 hal yang masih diperjuangkan oleh generator gambar AI

Seperti generator gambar AI Dall-E, Difusi Stabil, Pertengahan perjalanan, Dan Pembuat Gambar Bing menghasilkan hasil yang luar biasa, tetapi kadang-kadang bisa sangat membuat frustrasi. Dengan petunjuk sederhana yang hanya berisi beberapa kata, AI dapat menghasilkan gambar mengesankan yang tampak seperti foto profesional dan karya seni yang meyakinkan dalam berbagai gaya. Namun, prompt yang sama kadang-kadang akan membuat beberapa makhluk mengerikan atau rendering cacat yang lucu.

Isi

  • Salad tangan dan bola jari
  • Mengganggu teks dan menulis
  • Mata tidak memilikinya
  • Alat yang merepotkan
  • Gigi mimpi buruk
  • Seni AI berkembang pesat

Petunjuk negatif mungkin membantu mengurangi kemungkinan kesalahan ini, tetapi kerumitan tidak selalu dapat menyelamatkan Anda. Bahkan ahli AI berjuang dengan makhluk cacat dan pemandangan yang tidak biasa, membutuhkan waktu berjam-jam untuk menyempurnakan petunjuk atau menyempurnakan gambar dengan editor foto tradisional. Untuk saat ini, jika Anda melihat dengan cermat di area gambar yang tepat, ada kemungkinan besar Anda dapat mengidentifikasi apakah itu dibuat oleh mesin.

Video yang Direkomendasikan

Salad tangan dan bola jari

Pengembang AI telah membuat kemajuan dalam perjuangan untuk mengajarkan alat kecerdasan buatan bagaimana seharusnya tangan manusia terlihat, tetapi ada banyak ruang untuk perbaikan. Jika jari tidak ditampilkan secara mencolok, mudah untuk melewatkan kesalahan, tetapi ini merupakan masalah yang berkelanjutan.

Terkait

  • Difusi Stabil bertujuan untuk memperbaiki masalahnya dengan menghasilkan jari
  • Video yang dihasilkan AI telah tiba, dan berkembang dengan cepat
  • Bing Image Creator menghadirkan gambar yang dihasilkan DALL-E AI ke browser Anda
Dall-E adalah pemimpin AI awal tetapi tangan bukanlah hal yang penting.
Dall-E adalah pemimpin AI awal, tetapi tangan bukanlah miliknya.Dall-E diminta oleh Alan Truly

Salah satu generator gambar AI pertama dan terbaik yang tersedia untuk umum, Dall-E dari OpenAI, membuat foto-foto orang yang berpegangan tangan ini. Sekilas mungkin terlihat baik-baik saja. Pada pemeriksaan lebih dekat, beberapa masalah menjadi jelas. Waspadai jari ekstra, kuku aneh, dan angka yang digabungkan.

Genggaman yang rumit dan jari yang terjalin bahkan lebih menantang. Jangan heran jika gambar AI Anda kembali dengan gangguan klasik yang disebut sebagai "salad tangan" atau "bola jari".

Jalinan tangan Dall-E mengganggu.
Jalinan tangan Dall-E mengganggu.Dall-E diminta oleh Alan Truly

Mengganggu teks dan menulis

Anda mungkin berharap bahwa teks akan mudah dibuat oleh komputer. Anda melihat bukti kata-kata di layar setiap hari saat Anda mengangkat telepon atau membuka browser. Komputer awal, tidak seperti PC gaming teratas hari ini, tidak dapat menampilkan grafik apa pun. Semuanya adalah teks atau angka.

Leonardo AI tahu gaya tetapi teks cetak itu menantang.
Leonardo AI tahu gaya, tetapi teks cetak itu menantang.Leonardo AI diminta oleh Alan Truly

Namun menampilkan huruf dan simbol yang sebenarnya sebagai kata-kata tercetak atau tertulis ternyata sangat sulit untuk sebuah Pembuat gambar AI. Ini mungkin terdengar seperti masalah yang mudah dipecahkan, tetapi sebenarnya tidak. Sebuah aplikasi tidak bisa hanya melapisi teks biasa. Agar meyakinkan, gaya teks, bayangan, sudut, dan perspektif harus cocok dengan pemandangan lainnya.

Sebagai contoh, pembuat gambar AI yang relatif baru, Leonardo AI, melakukan upaya yang berani dengan papan reklame antik untuk restoran Jack Rabbit Slim. Setelah beberapa kali mencoba, AI berhasil mengeja "Jack Rabbit's", yang cukup mirip dengan permintaan tersebut. Gaya foto vintage sangat tepat di setiap gambar, tetapi sebagian besar huruf dan kata-katanya cacat.

Leonardo AI nyaris mendapatkan teks dengan benar di salah satu render ini.
Leonardo AI nyaris mendapatkan teks yang benar dalam render di sebelah kiri.Render AI Leonardo diminta oleh Alan Truly

Mata tidak memilikinya

Bing Image Creator kesulitan dengan mata.
Bing Image Creator diminta oleh Alan Truly

Sering dikatakan bahwa mata adalah jendela jiwa. Kami sangat mengandalkan kontak mata yang bisa menjadi detail paling penting dalam membuat potret realistis. Tetapi banyak alat AI mengalami kesulitan merender mata manusia.

Bing Image Creator melakukan pekerjaan yang layak dengan latar belakang studio dan menampilkan foto keluarga multigenerasi. Namun, hampir setiap orang memiliki mata aneh yang terlihat seperti telah dimasukkan oleh alien, atau mungkin orang-orang yang tersenyum ini sedang dalam proses berubah menjadi makhluk yang tidak wajar.

Dua contoh lebih dekat dari masalah mata Bing Image Creator.
Dua contoh yang lebih dekat dari masalah mata mengganggu Bing Image Creator.Bing Image Creator diminta oleh Alan Truly

Alat yang merepotkan

Manusia hebat dengan alat dan tidak hanya variasi digital seperti AI. Kami dengan cepat menguasai alat fisik apa pun dalam genggaman kami. AI, di sisi lain, berjuang untuk memahami apa itu dan bagaimana penggunaannya.

Midjourney memahami tangan tetapi bingung dengan kunci pas.
Midjourney memahami tangan, tetapi bingung dengan kunci pas. Apakah itu bola lampu di kiri bawah?Midjourney diminta oleh Alan Truly

Midjourney adalah pembuat gambar AI yang membuat kemajuan luar biasa dalam menyelesaikan masalah dengan wajah dan tangan manusia. Namun, saat diminta untuk menunjukkan mekanik yang sedang mengencangkan baut dengan kunci pas, alat tersebut sama sekali tidak ada. Kuku ditambahkan ke sarung tangan di satu wadah, dan bola lampu entah bagaimana muncul di wadah lain.

Gunting terlalu rumit untuk Bing Image Creator dalam tampilan potongan rambut jarak dekat ini. Mereka hanya terbuka dalam satu gambar dan tidak pernah terlihat sedang memotong.

Bing Image Creator tidak dapat menemukan gunting.
Bing Image Creator tidak tahu cara kerja gunting.Bing Image Creator diminta oleh Alan Truly

Gigi mimpi buruk

Difusi Stabil membuat senyum terkadang memiliki terlalu banyak gigi.
Difusi Stabil melalui Leonardo AI, didorong oleh Alan Truly

Saat orang tersenyum dan tertawa, itu biasanya memperbaiki gambaran, membuatnya menyenangkan dan menyenangkan. Saat diberi perintah sederhana seperti dua siswa tersenyum dan tertawa, AI dapat mengubahnya menjadi bahan bakar mimpi buruk dengan banyak baris gigi dan distorsi aneh lainnya.

Leonardo AI memungkinkan Anda memilih di antara beberapa model, dan beberapa menangani gigi dengan baik. Yang populer Model Difusi Stabil 2.1 membutuhkan bantuan untuk mendapatkan gigi yang benar. Dengan beberapa dorongan negatif, masalah itu terselesaikan. Ada solusi untuk masalah gambar AI ini, tetapi masih perlu kerja keras untuk mendapatkan hasil yang baik.

Senyum Difusi Stabil mendapat manfaat dari petunjuk negatif.
Stable Diffusion smile mendapat manfaat dari petunjuk negatif untuk menghilangkan "gigi aneh" dan "mulut yang terdistorsi".Difusi Stabil melalui Leonardo AI, didorong oleh Alan Truly

Seni AI berkembang pesat

Pada hari-hari awal seni AI, hasilnya aneh dan indah, menciptakan keindahan dan kengerian dengan pengabaian yang sama. Kesalahan menjadi kurang terlihat dengan setiap pembaruan baru, dan banyak masalah dapat diatasi dengan beberapa perbaikan.

Dengan begitu banyak alat AI yang tersedia, mudah untuk mencoba sistem lain. Banyak generator gambar AI memungkinkan petunjuk negatif atau opsi lain untuk menyesuaikan algoritme dan mendapatkan hasil yang lebih baik.

Anda mungkin perlu melakukan beberapa upaya untuk mendapatkan gambar yang dapat digunakan, terutama jika ada fokus pada wajah atau tangan. Saat Anda ingin memasukkan kata-kata cetak atau tertulis, bersiaplah untuk menghabiskan waktu di editor gambar menghapus huruf AI yang tidak masuk akal dan memadukan teks yang benar.

Kabar baiknya adalah banyak generator gambar AI yang gratis, dan model berlangganan relatif tidak mahal. Dalam setahun, masalah yang tersisa ini dapat diselesaikan, memungkinkan Anda untuk menggunakan AI render sebagai karya seni yang telah selesai atau pengganti foto.

Rekomendasi Editor

  • Fitur zoom-out baru Midjourney menjadi sensasi AI besar berikutnya
  • Bing Chat yang diperbarui melompati ChatGPT dalam 6 cara baru yang penting
  • Gambar AI viral ini membodohi dunia, dan Anda mungkin sudah melihatnya
  • Generator AI seperti ChatGPT baru dari Grammarly dapat melakukan lebih dari sekadar mengoreksi tulisan Anda
  • Saya telah melihat masa depan (jauh) pencarian web AI – di sinilah hal yang luar biasa, dan di mana kesulitannya

Tingkatkan gaya hidup AndaTren Digital membantu pembaca mengawasi dunia teknologi yang bergerak cepat dengan semua berita terbaru, ulasan produk yang menyenangkan, editorial yang berwawasan, dan cuplikan unik.