AI generátory obrázků jako Dall-E, Stabilní difúze, Střední cesta, a Bing Image Creator přinášejí úžasné výsledky, ale někdy mohou být neuvěřitelně frustrující. S jednoduchými výzvami obsahujícími jen pár slov může AI vytvářet působivé obrázky, které vypadají jako profesionální fotografie a přesvědčivé umění v různých stylech. Stejná výzva však občas vytvoří nějaké strašlivé stvoření nebo vesele chybné vykreslování.
Obsah
- Ruční salát a kuličky prstů
- Problémový text a psaní
- Oči to nemají
- Obtížné nástroje
- Zuby noční můry
- Umění umělé inteligence se rychle zlepšuje
Negativní výzvy mohou pomoci snížit pravděpodobnost těchto chyb, ale složitost vás nemůže vždy zachránit. Dokonce i odborníci na umělou inteligenci se potýkají s deformovanými tvory a nepozemskými scénami, které vyžadují dlouhé hodiny vylepšování výzev nebo oprav obrázků pomocí tradičního editoru fotografií. V současné době platí, že pokud se pozorně podíváte do správných oblastí obrázku, je velká šance, že budete schopni identifikovat, zda byl vytvořen strojem.
Doporučená videa
Ruční salát a kuličky prstů
Vývojáři AI pokročili ve snaze naučit nástroje umělé inteligence, jak by měly vypadat lidské ruce, ale existuje spousta prostoru pro zlepšení. Pokud prsty nejsou zvýrazněny, je snadné přehlédnout chyby, ale je to trvalý problém.
Příbuzný
- Stable Diffusion si klade za cíl vyřešit svůj problém s generováním prstů
- Přišla videa generovaná umělou inteligencí a rychle se vyvíjejí
- Bing Image Creator přináší obrázky generované DALL-E AI do vašeho prohlížeče
![Dall-E byl raným vůdcem umělé inteligence, ale ruce nejsou jeho věcí.](/f/bc71e7bbc4ede35666767ce84fe5ba78.jpg)
Jeden z prvních a nejlepších generátorů obrázků AI dostupných veřejnosti, OpenAI Dall-E, vytvořil tyto obrázky lidí, kteří se drží za ruce. Na první pohled to může vypadat dobře. Při bližším prozkoumání se objeví některé problémy. Dejte si pozor na další prsty, podivné nehty a sloučené číslice.
Složité úchopy a propletené prsty jsou ještě náročnější. Nebuďte překvapeni, když se vaše obrázky umělé inteligence vrátí s klasickými závadami označovanými jako „salát na ruce“ nebo „koule prstů“.
![Dall-Eho propletené ruce jsou znepokojivé.](/f/b0c2e9302b1b510eca39da69c0f18859.jpg)
Problémový text a psaní
Můžete očekávat, že text bude pro počítač snadno vygenerovaný. Když zvednete telefon nebo otevřete prohlížeč, na obrazovkách denně vidíte stopy slov. Na rozdíl od raných počítačů nejlepší herní počítače dnes nelze zobrazit grafiku jakéhokoli druhu. Všechno byl text nebo čísla.
![Leonardo AI zná styly, ale tištěný text je náročný.](/f/62b94e0df673d143b06fa51c2a21abb9.jpg)
Zobrazování skutečných písmen a symbolů jako tištěných nebo psaných slov je však pro uživatele překvapivě složité Generátor obrázků AI. Může to znít jako snadno řešitelný problém, ale není. Aplikace nemůže pouze překrýt prostý text. Aby byl text přesvědčivý, musí styl textu, stínování, úhel a perspektiva odpovídat zbytku scény.
V tomto příkladu relativně nový generátor obrázků AI, Leonardo AI, vynaložil statečné úsilí s vintage billboardem pro restauraci Jack Rabbit Slim. Po několika pokusech se AI podařilo vyhláskovat „Jack Rabbit’s“, což je docela blízko požadavku. Styl vintage fotografie byl na každém obrázku na místě, ale písmena a slova byly většinou chybné.
![Umělá inteligence Leonarda se přiblížila tomu, že se text dostal přímo do jednoho z těchto renderů.](/f/407bb03593dff20b66529741dfa330a7.jpg)
Oči to nemají
![Bing Image Creator bojuje s očima.](/f/1a4686838ba680c9537b268e75f61559.jpg)
Často se říká, že oči jsou okna do duše. Na oční kontakt spoléháme natolik, že by mohl být tím nejkritičtějším detailem při vytváření realistického portrétu. Ale mnoho nástrojů AI má potíže s vykreslováním lidských očí.
Bing Image Creator odvedl slušnou práci se zázemím studia a pózováním vícegenerační rodinné fotografie. Téměř každý člověk má však bizarní oči, které vypadají, jako by je vložili mimozemšťané, nebo se možná tito usměvaví lidé proměňují v nadpozemská stvoření.
![Dva bližší příklady očních problémů Bing Image Creator.](/f/74a485410fb32c6281e5d40d0fb7a93e.jpg)
Obtížné nástroje
Lidé jsou skvělí s nástroji a nejen s digitální rozmanitostí, jako je AI. Rychle zvládneme jakýkoli fyzický nástroj v našem dosahu. Na druhé straně AI se snaží pochopit, co jsou a jak se používají.
![Midjourney rozumí rukám, ale je zmatený hasákem.](/f/5bfa2e56b8604df48c77a055e08707ba.jpg)
Midjourney je generátor obrázků AI, který dělá fantastický pokrok v řešení problémů s lidskými tvářemi a rukama. Když však budete vyzváni, aby ukázal mechanika, jak utahuje šroub pomocí klíče, nástroj zcela chybí. V jednom případě se do rukavic přidávají nehty a v jiném se jaksi objeví žárovka.
Nůžky jsou pro Bing Image Creator v tomto detailním vykreslení stříhaných vlasů příliš složité. Jsou otevřené pouze na jednom obrázku a nikdy se nezdají být v aktu řezání.
![Bing Image Creator nedokáže rozeznat nůžky.](/f/75e4fff65afe5668c8a2c8811f8b5e09.jpg)
Zuby noční můry
![Stabilní difúzní vykreslení úsměvů má někdy příliš mnoho zubů.](/f/f47cce100755775b0e8a06b02e7fc84b.jpg)
Když se lidé usmívají a smějí, obvykle to obrázek vylepší, takže je příjemný a zábavný. Když dostanete jednoduchou výzvu, jako jsou dva studenti, kteří se usmívají a smějí, může to AI proměnit v palivo noční můry s několika řadami zubů a dalšími podivnými deformacemi.
Leonardo AI vám umožňuje vybrat si mezi několika modely a některé dobře zvládají zuby. Populární Model Stabilní difúze 2.1 potřeboval nějakou pomoc, aby se zuby dostaly do pořádku. S některými negativními výzvami byl problém vyřešen. Existují řešení těchto problémů s obrázky AI, ale stále to vyžaduje práci, abyste dosáhli dobrých výsledků.
![Stabilní difúzní úsměvy těží z negativních výzev.](/f/2911a08c2c40ec940705cfbe76df6c0a.jpg)
Umění umělé inteligence se rychle zlepšuje
V počátcích umění umělé inteligence byly výsledky podivné a úžasné a vytvářely krásu a hrůzu se stejnou lehkostí. Chyby jsou s každou novou aktualizací méně patrné a mnoho problémů lze překonat určitým vylepšením.
S tolik dostupných nástrojů AI, je snadné vyzkoušet jiný systém. Mnoho generátorů obrázků AI umožňuje negativní výzvy nebo jiné možnosti, jak upravit algoritmus a získat lepší výsledky.
Možná budete muset projít několika pokusy, abyste získali použitelný obrázek, zejména pokud je zaostřeno na tváře nebo ruce. Pokud chcete zahrnout tištěná nebo psaná slova, připravte se na to, že strávíte čas v editoru obrázků mazáním nesmyslných písmen AI a mícháním správného textu.
Dobrou zprávou je, že mnoho generátorů obrázků AI je zdarma a modely předplatného jsou relativně levné. Během jednoho roku by mohly být tyto přetrvávající problémy vyřešeny, což vám umožní používat AI render jako hotové umělecké dílo nebo náhrada za fotografii.
Doporučení redakce
- Nová funkce oddálení Midjourney se stává další velkou senzací AI
- Aktualizovaný Bing Chat přeskakuje ChatGPT 6 důležitými novými způsoby
- Tento virální obrázek AI oklamal svět a možná jste ho již viděli
- Nový generátor umělé inteligence podobný ChatGPT od Grammarly dokáže mnohem víc než jen korektury vašeho psaní
- Viděl jsem (vzdálenou) budoucnost webového vyhledávání pomocí umělé inteligence – tady je to úžasné a kde se potýká
Upgradujte svůj životní stylDigitální trendy pomáhají čtenářům mít přehled o rychle se měnícím světě technologií se všemi nejnovějšími zprávami, zábavnými recenzemi produktů, zasvěcenými úvodníky a jedinečnými náhledy.