5 věcí, se kterými generátory obrázků AI stále bojují

AI generátory obrázků jako Dall-E, Stabilní difúze, Střední cesta, a Bing Image Creator přinášejí úžasné výsledky, ale někdy mohou být neuvěřitelně frustrující. S jednoduchými výzvami obsahujícími jen pár slov může AI vytvářet působivé obrázky, které vypadají jako profesionální fotografie a přesvědčivé umění v různých stylech. Stejná výzva však občas vytvoří nějaké strašlivé stvoření nebo vesele chybné vykreslování.

Obsah

  • Ruční salát a kuličky prstů
  • Problémový text a psaní
  • Oči to nemají
  • Obtížné nástroje
  • Zuby noční můry
  • Umění umělé inteligence se rychle zlepšuje

Negativní výzvy mohou pomoci snížit pravděpodobnost těchto chyb, ale složitost vás nemůže vždy zachránit. Dokonce i odborníci na umělou inteligenci se potýkají s deformovanými tvory a nepozemskými scénami, které vyžadují dlouhé hodiny vylepšování výzev nebo oprav obrázků pomocí tradičního editoru fotografií. V současné době platí, že pokud se pozorně podíváte do správných oblastí obrázku, je velká šance, že budete schopni identifikovat, zda byl vytvořen strojem.

Doporučená videa

Ruční salát a kuličky prstů

Vývojáři AI pokročili ve snaze naučit nástroje umělé inteligence, jak by měly vypadat lidské ruce, ale existuje spousta prostoru pro zlepšení. Pokud prsty nejsou zvýrazněny, je snadné přehlédnout chyby, ale je to trvalý problém.

Příbuzný

  • Stable Diffusion si klade za cíl vyřešit svůj problém s generováním prstů
  • Přišla videa generovaná umělou inteligencí a rychle se vyvíjejí
  • Bing Image Creator přináší obrázky generované DALL-E AI do vašeho prohlížeče
Dall-E byl raným vůdcem umělé inteligence, ale ruce nejsou jeho věcí.
Dall-E byl raným vůdcem AI, ale ruce nejsou jeho věc.Dall-E na výzvu Alan Truly

Jeden z prvních a nejlepších generátorů obrázků AI dostupných veřejnosti, OpenAI Dall-E, vytvořil tyto obrázky lidí, kteří se drží za ruce. Na první pohled to může vypadat dobře. Při bližším prozkoumání se objeví některé problémy. Dejte si pozor na další prsty, podivné nehty a sloučené číslice.

Složité úchopy a propletené prsty jsou ještě náročnější. Nebuďte překvapeni, když se vaše obrázky umělé inteligence vrátí s klasickými závadami označovanými jako „salát na ruce“ nebo „koule prstů“.

Dall-Eho propletené ruce jsou znepokojivé.
Propletené ruce Dall-E jsou znepokojivé.Dall-E na výzvu Alan Truly

Problémový text a psaní

Můžete očekávat, že text bude pro počítač snadno vygenerovaný. Když zvednete telefon nebo otevřete prohlížeč, na obrazovkách denně vidíte stopy slov. Na rozdíl od raných počítačů nejlepší herní počítače dnes nelze zobrazit grafiku jakéhokoli druhu. Všechno byl text nebo čísla.

Leonardo AI zná styly, ale tištěný text je náročný.
Leonardo AI zná styly, ale tištěný text je náročný.Umělá inteligence Leonarda pod vedením Alana Trulyho

Zobrazování skutečných písmen a symbolů jako tištěných nebo psaných slov je však pro uživatele překvapivě složité Generátor obrázků AI. Může to znít jako snadno řešitelný problém, ale není. Aplikace nemůže pouze překrýt prostý text. Aby byl text přesvědčivý, musí styl textu, stínování, úhel a perspektiva odpovídat zbytku scény.

V tomto příkladu relativně nový generátor obrázků AI, Leonardo AI, vynaložil statečné úsilí s vintage billboardem pro restauraci Jack Rabbit Slim. Po několika pokusech se AI podařilo vyhláskovat „Jack Rabbit’s“, což je docela blízko požadavku. Styl vintage fotografie byl na každém obrázku na místě, ale písmena a slova byly většinou chybné.

Umělá inteligence Leonarda se přiblížila tomu, že se text dostal přímo do jednoho z těchto renderů.
Leonardo AI se přiblížil správnému vykreslení textu na levé straně.Leonardo AI rendery podnítil Alan Truly

Oči to nemají

Bing Image Creator bojuje s očima.
Bing Image Creator na výzvu Alan Truly

Často se říká, že oči jsou okna do duše. Na oční kontakt spoléháme natolik, že by mohl být tím nejkritičtějším detailem při vytváření realistického portrétu. Ale mnoho nástrojů AI má potíže s vykreslováním lidských očí.

Bing Image Creator odvedl slušnou práci se zázemím studia a pózováním vícegenerační rodinné fotografie. Téměř každý člověk má však bizarní oči, které vypadají, jako by je vložili mimozemšťané, nebo se možná tito usměvaví lidé proměňují v nadpozemská stvoření.

Dva bližší příklady očních problémů Bing Image Creator.
Dva bližší příklady znepokojivých očních problémů Bing Image Creator.Bing Image Creator na výzvu Alan Truly

Obtížné nástroje

Lidé jsou skvělí s nástroji a nejen s digitální rozmanitostí, jako je AI. Rychle zvládneme jakýkoli fyzický nástroj v našem dosahu. Na druhé straně AI se snaží pochopit, co jsou a jak se používají.

Midjourney rozumí rukám, ale je zmatený hasákem.
Midjourney rozumí rukám, ale je zmatený hasákem. Je to žárovka vlevo dole?Midjourney podnítil Alan Truly

Midjourney je generátor obrázků AI, který dělá fantastický pokrok v řešení problémů s lidskými tvářemi a rukama. Když však budete vyzváni, aby ukázal mechanika, jak utahuje šroub pomocí klíče, nástroj zcela chybí. V jednom případě se do rukavic přidávají nehty a v jiném se jaksi objeví žárovka.

Nůžky jsou pro Bing Image Creator v tomto detailním vykreslení stříhaných vlasů příliš složité. Jsou otevřené pouze na jednom obrázku a nikdy se nezdají být v aktu řezání.

Bing Image Creator nedokáže rozeznat nůžky.
Bing Image Creator nemůže přijít na to, jak fungují nůžky.Bing Image Creator na výzvu Alan Truly

Zuby noční můry

Stabilní difúzní vykreslení úsměvů má někdy příliš mnoho zubů.
Stabilní difúze přes Leonardo AI, pobídnutá Alanem Trulym

Když se lidé usmívají a smějí, obvykle to obrázek vylepší, takže je příjemný a zábavný. Když dostanete jednoduchou výzvu, jako jsou dva studenti, kteří se usmívají a smějí, může to AI proměnit v palivo noční můry s několika řadami zubů a dalšími podivnými deformacemi.

Leonardo AI vám umožňuje vybrat si mezi několika modely a některé dobře zvládají zuby. Populární Model Stabilní difúze 2.1 potřeboval nějakou pomoc, aby se zuby dostaly do pořádku. S některými negativními výzvami byl problém vyřešen. Existují řešení těchto problémů s obrázky AI, ale stále to vyžaduje práci, abyste dosáhli dobrých výsledků.

Stabilní difúzní úsměvy těží z negativních výzev.
Úsměvy Stabilní difúze těží z negativních výzev k odstranění „divných zubů“ a „zkreslených úst“.Stabilní difúze přes Leonardo AI, pobídnutá Alanem Trulym

Umění umělé inteligence se rychle zlepšuje

V počátcích umění umělé inteligence byly výsledky podivné a úžasné a vytvářely krásu a hrůzu se stejnou lehkostí. Chyby jsou s každou novou aktualizací méně patrné a mnoho problémů lze překonat určitým vylepšením.

S tolik dostupných nástrojů AI, je snadné vyzkoušet jiný systém. Mnoho generátorů obrázků AI umožňuje negativní výzvy nebo jiné možnosti, jak upravit algoritmus a získat lepší výsledky.

Možná budete muset projít několika pokusy, abyste získali použitelný obrázek, zejména pokud je zaostřeno na tváře nebo ruce. Pokud chcete zahrnout tištěná nebo psaná slova, připravte se na to, že strávíte čas v editoru obrázků mazáním nesmyslných písmen AI a mícháním správného textu.

Dobrou zprávou je, že mnoho generátorů obrázků AI je zdarma a modely předplatného jsou relativně levné. Během jednoho roku by mohly být tyto přetrvávající problémy vyřešeny, což vám umožní používat AI render jako hotové umělecké dílo nebo náhrada za fotografii.

Doporučení redakce

  • Nová funkce oddálení Midjourney se stává další velkou senzací AI
  • Aktualizovaný Bing Chat přeskakuje ChatGPT 6 důležitými novými způsoby
  • Tento virální obrázek AI oklamal svět a možná jste ho již viděli
  • Nový generátor umělé inteligence podobný ChatGPT od Grammarly dokáže mnohem víc než jen korektury vašeho psaní
  • Viděl jsem (vzdálenou) budoucnost webového vyhledávání pomocí umělé inteligence – tady je to úžasné a kde se potýká

Upgradujte svůj životní stylDigitální trendy pomáhají čtenářům mít přehled o rychle se měnícím světě technologií se všemi nejnovějšími zprávami, zábavnými recenzemi produktů, zasvěcenými úvodníky a jedinečnými náhledy.