5 vecí, s ktorými generátory obrázkov AI stále zápasia

AI generátory obrázkov ako Dall-E, Stabilná difúzia, Stredná cesta, a Bing Image Creator prinášajú úžasné výsledky, no niekedy môžu byť neuveriteľne frustrujúce. Pomocou jednoduchých pokynov obsahujúcich len niekoľko slov môže AI vytvárať pôsobivé obrázky, ktoré vyzerajú ako profesionálne fotografie a presvedčivé umenie v rôznych štýloch. Tá istá výzva však občas vytvorí nejaké hrozné stvorenie alebo veselo chybné vykresľovanie.

Obsah

  • Ručný šalát a guľôčky prstov
  • Znepokojujúci text a písanie
  • Oči to nemajú
  • Problémové nástroje
  • Zuby nočnej mory
  • Umenie AI sa rýchlo zlepšuje

Negatívne výzvy môžu pomôcť znížiť pravdepodobnosť týchto chýb, ale zložitosť vás nemôže vždy zachrániť. Dokonca aj experti na AI bojujú so zdeformovanými tvormi a nepozemskými scénami, ktoré si vyžadujú dlhé hodiny dolaďovania výziev alebo upravovania obrázkov pomocou tradičného editora fotografií. Ak sa zatiaľ pozorne pozriete do správnych oblastí obrázka, je veľká šanca, že budete vedieť identifikovať, či bol vytvorený strojom.

Odporúčané videá

Ručný šalát a guľôčky prstov

Vývojári AI dosiahli pokrok v úsilí naučiť nástroje umelej inteligencie, ako by mali vyzerať ľudské ruky, ale je tu veľa priestoru na zlepšenie. Ak prsty nie sú nápadne zobrazené, je ľahké prehliadnuť chyby, ale je to pretrvávajúci problém.

Súvisiace

  • Cieľom Stable Diffusion je vyriešiť problém s generovaním prstov
  • Prišli videá generované AI a rýchlo sa vyvíjajú
  • Bing Image Creator prináša do vášho prehliadača obrázky generované AI DALL-E
Dall-E bol prvým lídrom v oblasti AI, ale ruky nie sú jeho vecou.
Dall-E bol prvým lídrom AI, ale ruky nie sú jeho vecou.Dall-E nabádal Alan Truly

Jeden z prvých a najlepších generátorov obrázkov AI dostupných verejnosti, OpenAI Dall-E, vytvoril tieto obrázky ľudí, ktorí sa držia za ruky. Na prvý pohľad to môže vyzerať dobre. Pri bližšom skúmaní sa objavia niektoré problémy. Dajte si pozor na ďalšie prsty, zvláštne nechty a zlúčené číslice.

Komplikované úchopy a prepletené prsty sú ešte náročnejšie. Nebuďte prekvapení, ak sa vaše obrázky AI vrátia s klasickými chybami, ktoré sa označujú ako „šalát na ruky“ alebo „klbká prstov“.

Prepletené ruky Dall-E sú znepokojujúce.
Prepletené ruky Dall-E sú znepokojujúce.Dall-E nabádal Alan Truly

Znepokojujúci text a písanie

Možno by ste čakali, že počítač bude ľahko vygenerovať text. Keď vezmete do ruky telefón alebo otvoríte prehliadač, na obrazovkách denne vidíte dôkazy o slovách. Na rozdiel od skorých počítačov špičkové herné počítače dnes nemôže zobraziť grafiku akéhokoľvek druhu. Všetko bol text alebo čísla.

Leonardo AI pozná štýly, ale tlačený text je náročný.
Leonardo AI pozná štýly, ale tlačený text je náročný.Umelá inteligencia Leonarda na podnet Alana Trulyho

Zobrazovanie skutočných písmen a symbolov ako tlačených alebo písaných slov je však pre človeka prekvapivo zložité Generátor obrázkov AI. Môže to znieť ako ľahko riešiteľný problém, ale nie je. Aplikácia nemôže len prekryť obyčajný text. Aby bol text presvedčivý, štýl textu, tieňovanie, uhol a perspektíva musia zodpovedať zvyšku scény.

V tomto príklade relatívne nový generátor obrázkov AI, Leonardo AI, vynaložil statočné úsilie s vintage billboardom pre reštauráciu Jack Rabbit Slim's. Po viacerých pokusoch sa AI podarilo vyhláskovať „Jack Rabbit's“, čo je celkom blízko žiadosti. Štýl vintage fotografie bol na každom obrázku na mieste, ale písmená a slová boli väčšinou chybné.

Leonardo AI sa priblížil k tomu, aby sa text dostal priamo do jedného z týchto vykreslení.
Leonardo AI sa priblížil k správnemu vykresleniu textu na ľavej strane.Leonardo AI vykresľuje na podnet Alana Trulyho

Oči to nemajú

Bing Image Creator bojuje s očami.
Bing Image Creator na podnet Alana Trulyho

Často sa hovorí, že oči sú oknami do duše. Na očný kontakt sa spoliehame natoľko, že by to mohol byť najdôležitejší detail pri vytváraní realistického portrétu. Mnoho nástrojov AI má však problémy s vykresľovaním ľudských očí.

Bing Image Creator odviedol slušnú prácu so štúdiovým pozadím a pózovaním viacgeneračnej rodinnej fotografie. Takmer každý človek má však bizarné oči, ktoré vyzerajú, akoby ich tam vložili mimozemšťania, alebo možno títo usmievaví ľudia sa premieňajú na nadpozemské bytosti.

Dva bližšie príklady očných problémov Bing Image Creator.
Dva bližšie príklady znepokojujúcich problémov s očami Bing Image Creator.Bing Image Creator na podnet Alana Trulyho

Problémové nástroje

Ľudia sú skvelí s nástrojmi a nielen s digitálnou rozmanitosťou, ako je AI. Rýchlo zvládneme akýkoľvek fyzický nástroj, ktorý máme na dosah. Na druhej strane AI má problém pochopiť, čo sú a ako sa používajú.

Midjourney rozumie rukám, no mätú ho kľúče.
Midjourney rozumie rukám, no mätú ho kľúče. Je to žiarovka vľavo dole?Stredná cesta podnietená Alanom Trulym

Midjourney je generátor obrázkov AI, ktorý robí fantastický pokrok pri riešení problémov s ľudskými tvárami a rukami. Keď sa však zobrazí výzva, aby ukázal mechanika, ako uťahuje skrutku kľúčom, nástroj úplne chýba. V jednom prípade sa do rukavíc pridávajú nechty a v druhom sa akosi objaví žiarovka.

V tomto detailnom vykreslení strihaných vlasov sú nožnice pre Bing Image Creator príliš komplikované. Sú otvorené iba na jednom obrázku a nikdy sa nezdá, že by práve strihali.

Bing Image Creator nevie rozoznať nožnice.
Bing Image Creator nedokáže zistiť, ako fungujú nožnice.Bing Image Creator na podnet Alana Trulyho

Zuby nočnej mory

Stabilná difúzia úsmevov má niekedy príliš veľa zubov.
Stabilná difúzia cez Leonardo AI, podnietená Alanom Trulym

Keď sa ľudia usmievajú a smejú, zvyčajne to vylepší obrázok a urobí ho príjemným a zábavným. Keď dostanete jednoduchú výzvu, ako sú dvaja študenti, ktorí sa usmievajú a smejú, AI to môže zmeniť na palivo nočnej mory s viacerými radmi zubov a inými podivnými deformáciami.

Leonardo AI vám umožňuje vybrať si medzi niekoľkými modelmi a niektoré si dobre poradia so zubami. Populárne Stabilný model difúzie 2.1 potrebovali pomoc, aby boli zuby správne. S nejakým negatívnym podnetom bol problém vyriešený. Na tieto problémy s obrázkom AI existujú riešenia, no na dosiahnutie dobrých výsledkov je stále potrebné pracovať.

Úsmevy stabilnej difúzie ťažia z negatívnych výziev.
Úsmevy stabilnej difúzie ťažia z negatívnych výziev na odstránenie „čudných zubov“ a „deformovaných úst“.Stabilná difúzia cez Leonardo AI, podnietená Alanom Trulym

Umenie AI sa rýchlo zlepšuje

V začiatkoch umenia AI boli výsledky zvláštne a úžasné a vytvárali krásu a hrôzu s rovnakou voľnosťou. Chyby sú s každou novou aktualizáciou menej viditeľné a mnohé problémy je možné prekonať určitým vylepšením.

s toľko dostupných nástrojov AI, je ľahké vyskúšať iný systém. Mnoho generátorov obrázkov AI umožňuje negatívne výzvy alebo iné možnosti na úpravu algoritmu a dosiahnutie lepších výsledkov.

Možno budete musieť prejsť niekoľkými pokusmi, aby ste získali použiteľný obrázok, najmä ak je zaostrené na tváre alebo ruky. Ak chcete zahrnúť tlačené alebo písané slová, pripravte sa na to, že strávite čas v editore obrázkov vymazávaním nezmyselných písmen AI a spájaním správneho textu.

Dobrou správou je, že mnohé generátory obrázkov AI sú zadarmo a modely predplatného sú relatívne lacné. Do roka by sa tieto pretrvávajúce problémy mohli vyriešiť, čo vám umožní použiť render AI ako hotové umelecké dielo alebo náhrada za fotografiu.

Odporúčania redaktorov

  • Nová funkcia oddialenia Midjourney sa stáva ďalšou veľkou senzáciou AI
  • Aktualizovaný Bing Chat preskočí ChatGPT 6 dôležitými novými spôsobmi
  • Tento vírusový obrázok AI oklamal svet a možno ste ho už videli
  • Nový generátor umelej inteligencie podobný ChatGPT od Grammarly dokáže oveľa viac, než len korigovať váš text
  • Videl som (vzdialenú) budúcnosť umelej inteligencie na webe – tu je to úžasné a kde má problémy

Zlepšite svoj životný štýlDigitálne trendy pomáhajú čitateľom mať prehľad o rýchlo sa rozvíjajúcom svete technológií so všetkými najnovšími správami, zábavnými recenziami produktov, užitočnými úvodníkmi a jedinečnými ukážkami.