5 lietas, ar kurām AI attēlu ģeneratori joprojām cīnās

AI attēlu ģeneratoriem patīk Dals-E, Stabila difūzija, Pusceļš, un Bing attēlu veidotājs sniedz pārsteidzošus rezultātus, taču dažreiz tie var būt neticami kaitinoši. Izmantojot vienkāršus norādījumus, kas satur tikai dažus vārdus, AI var izvadīt iespaidīgus attēlus, kas šķiet profesionālas fotogrāfijas un pārliecinoša māksla dažādos stilos. Tomēr viena un tā pati uzvedne laiku pa laikam radīs kādu šausminošu būtni vai smieklīgi kļūdainu atveidojumu.

Saturs

  • Roku salāti un pirkstu bumbiņas
  • Satraucošs teksts un rakstīšana
  • Acīs to nav
  • Apgrūtinoši rīki
  • Murga zobi
  • AI māksla strauji uzlabojas

Negatīvās uzvednes var palīdzēt samazināt šo kļūdu iespējamību, taču sarežģītība ne vienmēr var jūs glābt. Pat AI eksperti cīnās ar neformālām būtnēm un nepasaulīgām ainām, kas prasa ilgas stundas, lai uzlabotu uzvednes vai pielāgotu attēlus, izmantojot tradicionālo fotoattēlu redaktoru. Pagaidām, rūpīgi apskatot attēla pareizos apgabalus, pastāv liela iespēja, ka varēsit noteikt, vai to ir izveidojusi mašīna.

Ieteiktie videoklipi

Roku salāti un pirkstu bumbiņas

AI izstrādātāji ir guvuši panākumus cīņā, lai mācītu mākslīgā intelekta rīkiem, kā vajadzētu izskatīties cilvēka rokām, taču ir daudz iespēju uzlabot. Ja pirksti nav redzami, ir viegli palaist garām kļūdas, taču tā ir pastāvīga problēma.

Saistīts

  • Stabilās difūzijas mērķis ir novērst problēmu ar pirkstu ģenerēšanu
  • Ir ieradušies mākslīgā intelekta radīti videoklipi, un tie strauji attīstās
  • Bing Image Creator nodrošina jūsu pārlūkprogrammā DALL-E AI ģenerētus attēlus
Dall-E bija agrīns AI līderis, taču rokas nav tā lieta.
Dall-E bija agrīns AI līderis, taču rokas nav tā lieta.Dall-E, ko mudināja Alans Trulijs

Viens no pirmajiem un labākajiem AI attēlu ģeneratoriem, kas pieejami sabiedrībai, OpenAI Dall-E, radīja šīs bildes ar cilvēkiem, kas sadevušies rokās. No pirmā acu uzmetiena tas varētu izskatīties labi. Rūpīgāk pārbaudot, atklājas dažas problēmas. Uzmanieties no papildu pirkstiem, dīvainiem nagiem un sapludinātiem cipariem.

Sarežģīti rokturi un savīti pirksti ir vēl grūtāki. Nebrīnieties, ja jūsu AI attēli atkal parādās ar klasiskām kļūmēm, kas tiek dēvētas par "roku salātiem" vai "pirkstu bumbiņām".

Dall-E savītās rokas ir satraucošas.
Dall-E savītās rokas ir satraucošas.Dall-E, ko mudināja Alans Trulijs

Satraucošs teksts un rakstīšana

Jūs varētu sagaidīt, ka tekstu datorā būs viegli ģenerēt. Katru dienu ekrānos redzat vārdus, kad paņemat tālruni vai atverat pārlūkprogrammu. Atšķirībā no agrīnajiem datoriem populārākie spēļu datori šodien nevarēja parādīt nekāda veida grafiku. Viss bija teksts vai cipari.

Leonardo AI zina stilus, taču drukātais teksts ir izaicinošs.
Leonardo AI zina stilus, taču drukātais teksts ir izaicinošs.Leonardo AI mudināja Alans Trulijs

Tomēr faktisko burtu un simbolu parādīšana drukātu vai rakstītu vārdu veidā ir pārsteidzoši sarežģīta AI attēlu ģenerators. Tas varētu izklausīties kā viegli atrisināma problēma, bet tā nav. Lietotne nevar tikai pārklāt vienkāršu tekstu. Lai tas būtu pārliecinošs, teksta stilam, ēnojumam, leņķim un perspektīvai ir jāatbilst pārējai ainas daļai.

Piemērā salīdzinoši jauns mākslīgā intelekta attēlu ģenerators Leonardo AI veica drosmīgas pūles, izveidojot senlaicīgu reklāmas stendu Džeka Trusa Slim ēdnīcā. Pēc vairākiem mēģinājumiem AI izdevās uzrakstīt “Jack Rabbit’s”, kas ir diezgan tuvu pieprasījumam. Vintage fotogrāfiju stils bija precīzs katrā attēlā, taču burti un vārdi lielākoties bija kļūdaini.

Leonardo AI tuvojās teksta pareizai iegūšanai vienā no šiem renderējumiem.
Leonardo AI tuvojās teksta pareizai atveidei kreisajā pusē.Leonardo AI renderē Alana Trulija mudināta

Acīs to nav

Bing Image Creator cīnās ar acīm.
Bing Image Creator, ko mudināja Alans Trulijs

Mēdz teikt, ka acis ir logi uz dvēseli. Mēs tik ļoti paļaujamies uz acu kontaktu, ka tā varētu būt vissvarīgākā detaļa, veidojot reālistisku portretu. Taču daudziem AI rīkiem ir grūtības atveidot cilvēka acis.

Bing Image Creator paveica pienācīgu darbu ar studijas fonu un vairāku paaudžu ģimenes fotoattēlu. Tomēr gandrīz katram cilvēkam ir dīvainas acis, kas izskatās tā, it kā tās būtu ielikušas citplanētieši, vai varbūt šie smaidošie cilvēki pārvēršas par nepasaulīgām būtnēm.

Divi tuvāki Bing Image Creator acu problēmu piemēri.
Divi tuvāki piemēri par Bing Image Creator satraucošajām acu problēmām.Bing Image Creator, ko mudināja Alans Trulijs

Apgrūtinoši rīki

Cilvēki lieliski pārvalda rīkus un ne tikai digitālo dažādību, piemēram, AI. Mēs ātri apgūstam jebkuru mūsu rokās esošo fizisko instrumentu. No otras puses, AI cenšas saprast, kas tie ir un kā tie tiek izmantoti.

Midjourney saprot rokas, bet ir neizpratnē par uzgriežņu atslēgām.
Midjourney saprot rokas, bet ir neizpratnē par uzgriežņu atslēgām. Vai tā ir spuldze apakšējā kreisajā stūrī?Pusceļš, ko mudināja Alans Trulijs

Midjourney ir AI attēlu ģenerators, kas gūst fantastisku progresu cilvēku seju un roku problēmu risināšanā. Tomēr, kad tiek prasīts parādīt mehāniķim, kurš pievelk skrūvi ar uzgriežņu atslēgu, instruments pilnībā nav pieejams. Cimdiem vienā gadījumā tiek pievienoti nagi, citā kaut kā parādās spuldzīte.

Šķēres ir pārāk sarežģītas lietotnei Bing Image Creator šajā tuvplānā, kurā tiek griezti mati. Tie ir atvērti tikai vienā attēlā un nekad nešķiet, ka tie tiek griezti.

Bing Image Creator nevar izdomāt šķēres.
Bing Image Creator nevar saprast, kā darbojas šķēres.Bing Image Creator, ko mudināja Alans Trulijs

Murga zobi

Stabilas difūzijas smaidu atveidojumos dažreiz ir pārāk daudz zobu.
Stabila difūzija, izmantojot Leonardo AI, mudināja Alans Trulijs

Kad cilvēki smaida un smejas, tas parasti uzlabo attēlu, padarot to patīkamu un jautru. Saņemot vienkāršu pamudinājumu, piemēram, divus studentus smaidot un smejoties, mākslīgais intelekts to var pārvērst par murgu degvielu ar vairākām zobu rindām un citiem dīvainiem izkropļojumiem.

Leonardo AI ļauj izvēlēties starp vairākiem modeļiem, un daži labi apstrādā zobus. Populārais Stabilas difūzijas 2.1 modelis bija vajadzīga palīdzība, lai pareizi sakārtotu zobus. Ar dažiem negatīviem pamudinājumiem problēma tika atrisināta. Šīm AI attēla problēmām ir risinājumi, taču, lai iegūtu labus rezultātus, joprojām ir jāstrādā.

Stabilas difūzijas smaidi gūst labumu no negatīvām uzvednēm.
Stabilas difūzijas smaidi gūst labumu no negatīviem norādījumiem noņemt “dīvainos zobus” un “izkropļotu muti”.Stabila difūzija, izmantojot Leonardo AI, mudināja Alans Trulijs

AI māksla strauji uzlabojas

AI mākslas pirmajās dienās rezultāti bija dīvaini un brīnišķīgi, radot skaistumu un šausmas ar vienādu atmestību. Kļūdas kļūst mazāk pamanāmas ar katru jaunu atjauninājumu, un daudzas problēmas var novērst, veicot dažus uzlabojumus.

Ar pieejams tik daudz AI rīku, ir viegli izmēģināt citu sistēmu. Daudzi AI attēlu ģeneratori pieļauj negatīvas uzvednes vai citas opcijas, lai pielāgotu algoritmu un iegūtu labākus rezultātus.

Iespējams, jums būs jāveic vairāki mēģinājumi, lai iegūtu izmantojamu attēlu, īpaši, ja fokuss ir uz sejām vai rokām. Ja vēlaties iekļaut drukātus vai rakstītus vārdus, esiet gatavs pavadīt laiku attēlu redaktorā, dzēšot mākslīgā intelekta muļķīgos burtus un sajaucot pareizo tekstu.

Labā ziņa ir tā, ka daudzi AI attēlu ģeneratori ir bezmaksas, un abonēšanas modeļi ir salīdzinoši lēti. Gada laikā šīs ieilgušās problēmas varētu tikt atrisinātas, ļaujot AI renderēšanu izmantot kā gatavu mākslas darbu vai fotogrāfijas aizstājējs.

Redaktoru ieteikumi

  • Midjourney jaunā tālummaiņas funkcija kļūst par nākamo lielo AI sensāciju
  • Atjauninātais Bing Chat pārspēj ChatGPT 6 svarīgos jaunos veidos
  • Šis vīrusu AI attēls apmānīja pasauli, un jūs, iespējams, jau esat to redzējis
  • Grammarly jaunais ChatGPT līdzīgais AI ģenerators var darīt daudz vairāk, nekā tikai labot jūsu rakstīto
  • Esmu redzējis AI tīmekļa meklēšanas (tālo) nākotni — lūk, kur tas ir pārsteidzošs un kur tas ir grūti

Uzlabojiet savu dzīvesveiduDigitālās tendences palīdz lasītājiem sekot līdzi steidzīgajai tehnoloģiju pasaulei, izmantojot visas jaunākās ziņas, jautrus produktu apskatus, ieskatu saturošus rakstus un unikālus ieskatus.