5 stvari, s katerimi se generatorji slik z umetno inteligenco še vedno spopadajo

click fraud protection

Generatorji slik AI, kot so Dall-E, Stabilna difuzija, Midjourney, in Bing Image Creator dajejo osupljive rezultate, včasih pa so lahko neverjetno frustrirajoči. S preprostimi pozivi, ki vsebujejo le nekaj besed, lahko umetna inteligenca ustvari impresivne slike, ki so videti kot profesionalne fotografije in prepričljiva umetnost v različnih slogih. Vendar bo isti poziv občasno ustvaril kakšno grozljivo bitje ali smešno pomanjkljivo upodabljanje.

Vsebina

  • Ročna solata in kroglice iz prstov
  • Moteče besedilo in pisanje
  • Oči ga nimajo
  • Težavna orodja
  • Zobje iz nočne more
  • Umetna inteligenca se hitro izboljšuje

Negativni pozivi lahko pomagajo zmanjšati verjetnost teh napak, vendar vas zapletenost ne more vedno rešiti. Celo strokovnjaki za umetno inteligenco se spopadajo z deformiranimi bitji in nezemeljskimi prizori, ki zahtevajo dolge ure izpopolnjevanja pozivov ali popravljanja slik s tradicionalnim urejevalnikom fotografij. Če zaenkrat pozorno pogledate na prava področja slike, obstaja velika verjetnost, da boste lahko ugotovili, ali jo je naredil stroj.

Priporočeni videoposnetki

Ročna solata in kroglice iz prstov

Razvijalci umetne inteligence so napredovali v boju za učenje orodij umetne inteligence, kako bi morale izgledati človeške roke, vendar je še veliko prostora za izboljšave. Če prsti niso vidno prikazani, je zlahka spregledati napake, vendar je to stalna težava.

Povezano

  • Cilj Stable Diffusion je odpraviti težavo z ustvarjanjem prstov
  • Videoposnetki, ustvarjeni z umetno inteligenco, so prišli in se hitro razvijajo
  • Bing Image Creator prinaša slike, ustvarjene z umetno inteligenco DALL-E, v vaš brskalnik
Dall-E je bil prvi vodja umetne inteligence, vendar roke niso njegova stvar.
Dall-E je bil prvi vodja umetne inteligence, vendar roke niso njegova stvar.Dall-E, ki ga je spodbudil Alan Truly

Eden prvih in najboljših generatorjev slik z umetno inteligenco, ki so na voljo javnosti, Dall-E podjetja OpenAI, je ustvaril te slike ljudi, ki se držijo za roke. Na prvi pogled je morda videti v redu. Ob natančnejšem pregledu postanejo očitne nekatere težave. Pazite se dodatnih prstov, čudnih nohtov in spojenih števk.

Zapleteni prijemi in prepleteni prsti so še večji izziv. Ne bodite presenečeni, če se vaše slike umetne inteligence vrnejo s klasičnimi napakami, imenovanimi "ročna solata" ali "kroglice prstov".

Prepleteni kazalci Dall-E so moteči.
Prepleteni kazalci Dall-E so moteči.Dall-E, ki ga je spodbudil Alan Truly

Moteče besedilo in pisanje

Morda bi pričakovali, da bo računalnik zlahka ustvaril besedilo. Vsak dan vidite dokaze besed na zaslonih, ko dvignete telefon ali odprete brskalnik. Zgodnji računalniki, za razliko od vrhunski igralni računalniki danes ne morejo prikazati nobene grafike. Vse je bilo besedilo ali številke.

Leonardo AI pozna sloge, vendar je natisnjeno besedilo izziv.
Leonardo AI pozna sloge, vendar je natisnjeno besedilo izziv.Leonardo AI, ki ga je spodbudil Alan Truly

Kljub temu je prikazovanje dejanskih črk in simbolov kot natisnjenih ali napisanih besed presenetljivo težavno za AI generator slik. Morda se sliši kot težava, ki jo je enostavno rešiti, vendar ni. Aplikacija ne more samo prekriti navadnega besedila. Če želite biti prepričljivi, se morajo slog besedila, senčenje, kot in perspektiva ujemati s preostalim prizorom.

V primeru se je razmeroma nov generator slik z umetno inteligenco, Leonardo AI, hrabro potrudil s starinskim panojem za restavracijo Jacka Rabbita Slima. Po več poskusih je AI uspel črkovati "Jack Rabbit's", kar je precej blizu zahtevi. Starinski fotografski slog je bil na vsaki sliki očiten, vendar so bile črke in besede večinoma pomanjkljive.

Leonardo AI se je približal pravemu besedilu v enem od teh upodobitev.
Leonardo AI se je približal pravilnemu besedilu v upodabljanju na levi.Leonardo AI upodablja po navodilih Alana Trulyja

Oči ga nimajo

Bing Image Creator ima težave z očmi.
Bing Image Creator, ki ga je spodbudil Alan Truly

Pogosto se reče, da so oči okna v dušo. Toliko se zanašamo na očesni stik, da je to lahko najbolj kritična podrobnost pri ustvarjanju realističnega portreta. Toda veliko orodij AI ima težave pri upodabljanju človeških oči.

Ustvarjalnik slik Bing se je spodobno odrezal s studijskim ozadjem in poziranjem večgeneracijske družinske fotografije. Vendar ima skoraj vsak človek nenavadne oči, ki so videti, kot da so jih vstavili nezemljani, ali pa se morda ti nasmejani ljudje spreminjajo v nezemeljska bitja.

Dva bližja primera težav z očmi Bing Image Creator.
Dva bližja primera motečih težav z očmi Bing Image Creator.Bing Image Creator, ki ga je spodbudil Alan Truly

Težavna orodja

Ljudje smo odlični z orodji in ne le z digitalno sorto, kot je umetna inteligenca. Hitro obvladamo vsako fizično orodje, ki nam je v dosegu. Po drugi strani pa se umetna inteligenca trudi razumeti, kaj so in kako se uporabljajo.

Midjourney razume roke, vendar ga zmedejo ključi.
Midjourney razume roke, vendar ga zmedejo ključi. Je to žarnica levo spodaj?Midjourney, ki ga je spodbudil Alan Truly

Midjourney je generator slik z umetno inteligenco, ki fantastično napreduje pri reševanju težav s človeškimi obrazi in rokami. Ko pa je pozvan, da pokaže mehanika, ki s ključem zateguje vijak, orodja sploh ni. V enem primeru so rokavicam dodani nohti, v drugem pa se nekako pojavi žarnica.

Škarje so preveč zapletene za Bing Image Creator v tem bližnjem posnetku striženja las. Odprti so le na eni sliki in nikoli se ne zdijo, kot da so v fazi rezanja.

Bing Image Creator ne more ugotoviti škarij.
Bing Image Creator ne more ugotoviti, kako delujejo škarje.Bing Image Creator, ki ga je spodbudil Alan Truly

Zobje iz nočne more

Stabilne difuzijske upodobitve nasmehov imajo včasih preveč zob.
Stabilna difuzija prek Leonardo AI, ki jo je spodbudil Alan Truly

Ko se ljudje nasmehnejo in smejijo, to običajno izboljša sliko, jo naredi prijetno in zabavno. Ko prejme preprost poziv, kot sta nasmeh in smeh dveh študentov, lahko umetna inteligenca to spremeni v gorivo nočne more z več vrstami zob in drugimi nenavadnimi popačenji.

Leonardo AI omogoča izbiro med več modeli, nekateri pa dobro obvladajo zobe. Priljubljen Model Stable Diffusion 2.1 potreboval pomoč, da bi si uredil zobe. Z nekaj negativnimi spodbudami je bila težava rešena. Obstajajo rešitve za te težave s slikami AI, vendar je še vedno potrebno delo, da bi dosegli dobre rezultate.

Nasmehi Stable Diffusion imajo koristi od negativnih pozivov.
Nasmehi Stable Diffusion imajo koristi od negativnih pozivov za odstranitev »čudnih zob« in »popačenih ust«.Stabilna difuzija prek Leonardo AI, ki jo je spodbudil Alan Truly

Umetna inteligenca se hitro izboljšuje

V zgodnjih dneh umetnosti umetne inteligence so bili rezultati nenavadni in čudoviti, ustvarjali so lepoto in grozo z enako predanostjo. Napake postajajo z vsako novo posodobitvijo manj opazne in številne težave je mogoče premagati z nekaj izboljšavami.

z na voljo je toliko orodij AI, enostavno je preizkusiti drug sistem. Številni generatorji slik AI omogočajo negativne pozive ali druge možnosti za prilagoditev algoritma in doseganje boljših rezultatov.

Morda boste morali opraviti več poskusov, da dobite uporabno sliko, še posebej, če je fokus na obrazih ali rokah. Ko želite vključiti tiskane ali napisane besede, bodite pripravljeni preživeti čas v urejevalniku slik, da izbrišete nesmiselne črke AI in mešate pravilno besedilo.

Dobra novica je, da je veliko generatorjev slik AI brezplačnih, naročniški modeli pa relativno poceni. V enem letu bi se te dolgotrajne težave lahko rešile, kar bi vam omogočilo uporabo upodobitve z umetno inteligenco kot končnega umetniškega dela ali zamenjava za fotografijo.

Priporočila urednikov

  • Midjourneyjeva nova funkcija pomanjšave postaja naslednja velika senzacija AI
  • Posodobljeni Bing Chat preskoči ChatGPT na 6 pomembnih novih načinov
  • Ta virusna slika AI je preslepila svet in morda ste jo že videli
  • Grammarlyjev novi generator umetne inteligence, podoben ChatGPT, lahko naredi veliko več kot samo lektoriranje vašega pisanja
  • Videl sem (oddaljeno) prihodnost spletnega iskanja z umetno inteligenco – tukaj je neverjetno in kje ima težave

Nadgradite svoj življenjski slogDigitalni trendi bralcem pomagajo slediti hitremu svetu tehnologije z vsemi najnovejšimi novicami, zabavnimi ocenami izdelkov, pronicljivimi uvodniki in enkratnimi vpogledi v vsebine.