5 ting AI-billedgeneratorer kæmper stadig med

AI billedgeneratorer som Dall-E, Stabil diffusion, Midjourney, og Bing Image Creator producere fantastiske resultater, men nogle gange kan de være utrolig frustrerende. Med enkle meddelelser, der kun indeholder nogle få ord, kan en AI producere imponerende billeder, der ser ud til at være professionelle fotografier og overbevisende kunst i forskellige stilarter. Den samme prompt vil dog af og til skabe et eller andet rædselsvækkende væsen eller en latterlig mangelfuld gengivelse.

Indhold

  • Håndsalat og kugler af fingre
  • Foruroligende tekst og skrivning
  • Øjnene har det ikke
  • Besværlige værktøjer
  • Mareridtstænder
  • AI-kunsten forbedres hurtigt

Negative meddelelser kan hjælpe med at reducere sandsynligheden for disse fejl, men kompleksitet kan ikke altid redde dig. Selv AI-eksperter kæmper med misdannede væsner og umodne scener, der kræver mange timers finpudsning af prompter eller retablering af billeder med en traditionel fotoeditor. For øjeblikket, hvis du ser omhyggeligt i de rigtige områder af et billede, er der en god chance for, at du vil være i stand til at identificere, om det er lavet af en maskine.

Anbefalede videoer

Håndsalat og kugler af fingre

AI-udviklere har gjort fremskridt i kampen for at lære kunstig intelligens-værktøjer, hvordan menneskelige hænder skal se ud, men der er masser af plads til forbedringer. Hvis fingrene ikke er fremtrædende, er det let at gå glip af fejl, men det er et vedvarende problem.

Relaterede

  • Stabil diffusion sigter mod at løse sit problem med at generere fingre
  • AI-genererede videoer er ankommet, og de udvikler sig hurtigt
  • Bing Image Creator bringer DALL-E AI-genererede billeder til din browser
Dall-E var en tidlig AI-leder, men hænder er ikke dens ting.
Dall-E var en tidlig AI-leder, men hænder er ikke dens ting.Dall-E foranlediget af Alan Truly

En af de første og bedste AI-billedgeneratorer tilgængelig for offentligheden, OpenAI's Dall-E, skabte disse billeder af mennesker, der holder i hånd. Ved første øjekast kan det se fint ud. Ved nærmere eftersyn viser sig nogle problemer. Pas på ekstra fingre, mærkelige fingernegle og flettede cifre.

Komplicerede greb og sammenflettede fingre er endnu mere udfordrende. Bliv ikke overrasket, hvis dine AI-billeder kommer tilbage med klassiske fejl, kaldet "håndsalat" eller "kugler af fingre."

Dall-E's sammenflettede hænder er foruroligende.
Dall-Es sammenflettede hænder er foruroligende.Dall-E foranlediget af Alan Truly

Foruroligende tekst og skrivning

Du kan forvente, at teksten ville være let for en computer at generere. Du ser dagligt tegn på ord på skærmene, når du tager telefonen eller åbner en browser. Tidlige computere, i modsætning til de bedste gaming-pc'er i dag, kunne ikke vise grafik af nogen art. Alt var tekst eller tal.

Leonardo AI kender stilarter, men trykt tekst er udfordrende.
Leonardo AI kender stilarter, men trykt tekst er udfordrende.Leonardo AI tilskyndet af Alan Truly

Alligevel er det overraskende vanskeligt at vise faktiske bogstaver og symboler som trykte eller skrevne ord AI billedgenerator. Det lyder måske som et let problem at løse, men det er det ikke. En app kan ikke bare overlejre almindelig tekst. For at være overbevisende skal tekststilen, skyggen, vinklen og perspektivet matche resten af ​​scenen.

I eksemplet gjorde en relativt ny AI-billedgenerator, Leonardo AI, en tapper indsats med en vintage billboard til Jack Rabbit Slims spisested. Efter flere forsøg lykkedes det AI at stave "Jack Rabbit's", hvilket er ret tæt på anmodningen. Vintage fotografistilen var spot-on i hvert billede, men bogstaverne og ordene var for det meste fejlbehæftede.

Leonardo AI var tæt på at få tekst rigtigt i en af ​​disse gengivelser.
Leonardo AI var tæt på at få tekst korrekt i gengivelsen til venstre.Leonardo AI gengives tilskyndet af Alan Truly

Øjnene har det ikke

Bing Image Creator kæmper med øjnene.
Bing Image Creator bedt om af Alan Truly

Det siges ofte, at øjnene er vinduerne til sjælen. Vi stoler så meget på øjenkontakt, at det kunne være den mest kritiske detalje i at skabe et realistisk portræt. Men mange AI-værktøjer har svært ved at gengive menneskelige øjne.

Bing Image Creator gjorde et anstændigt stykke arbejde med studiebaggrunden og poserede et multigenerationelt familiebillede. Men næsten hver person har bizarre øjne, der ser ud som om de er blevet indsat af aliens, eller måske er disse smilende mennesker i færd med at forvandle sig til ujordiske skabninger.

To nærmere eksempler på Bing Image Creators øjenproblemer.
To nærmere eksempler på Bing Image Creators foruroligende øjenproblemer.Bing Image Creator bedt om af Alan Truly

Besværlige værktøjer

Mennesker er gode med værktøjer og ikke kun den digitale variation som AI. Vi mestrer hurtigt ethvert fysisk værktøj inden for vores rækkevidde. En AI på den anden side kæmper for at forstå, hvad de er, og hvordan de bruges.

Midjourney forstår hænder, men er forundret over skruenøgler.
Midjourney forstår hænder, men er forundret over skruenøgler. Er det en pære nederst til venstre?Midjourney foranlediget af Alan Truly

Midjourney er en AI-billedgenerator, der gør fantastiske fremskridt med at løse problemer med menneskelige ansigter og hænder. Men når du bliver bedt om at vise en mekaniker, der spænder en bolt med en skruenøgle, er værktøjet helt fraværende. Fingernegle føjes til handsker i et tilfælde, og en pære vises på en eller anden måde i et andet.

Saks er for kompliceret til Bing Image Creator i denne nærbillede gengivelse af hår, der bliver klippet. De er kun åbne i ét billede og ser aldrig ud til at være i gang med at skære.

Bing Image Creator kan ikke finde ud af en saks.
Bing Image Creator kan ikke finde ud af, hvordan saks fungerer.Bing Image Creator bedt om af Alan Truly

Mareridtstænder

Stabil spredningsgengivelse af smil har nogle gange for mange tænder.
Stabil diffusion via Leonardo AI, bedt om af Alan Truly

Når folk smiler og griner, forbedrer det normalt et billede, hvilket gør det behageligt og sjovt. Når de får en simpel prompt som to elever, der smiler og griner, kan en AI forvandle dette til mareridtsbrændstof med flere rækker af tænder og andre mærkelige forvrængninger.

Leonardo AI giver dig mulighed for at vælge mellem flere modeller, og nogle håndterer tænder godt. Det populære Stabil Diffusion 2.1 model havde brug for hjælp til at få de rigtige tænder. Med nogle negative tilskyndelser blev problemet løst. Der er løsninger på disse AI-billedproblemer, men det kræver stadig arbejde at få gode resultater.

Stabile diffusionssmil har gavn af negative tilskyndelser.
Stabile diffusionssmil drager fordel af negative opfordringer til at fjerne "mærkelige tænder" og "forvrænget mund."Stabil diffusion via Leonardo AI, bedt om af Alan Truly

AI-kunsten forbedres hurtigt

I de tidlige dage af AI-kunst var resultaterne mærkelige og vidunderlige, hvilket skabte skønhed og rædsel med lige stor opgivelse. Fejlene bliver mindre mærkbare med hver ny opdatering, og mange problemer kan overvindes med en vis forfining.

Med så mange AI-værktøjer tilgængelige, er det nemt at prøve et andet system. Mange AI-billedgeneratorer tillader negative prompter eller andre muligheder for at justere algoritmen og få bedre resultater.

Du skal muligvis gennemgå flere forsøg for at få et brugbart billede, især hvis der er fokus på ansigter eller hænder. Når du vil inkludere trykte eller skrevne ord, skal du være forberedt på at bruge tid i en billededitor på at slette AI's nonsensbogstaver og blande den korrekte tekst.

Den gode nyhed er, at mange AI-billedgeneratorer er gratis, og abonnementsmodeller er relativt billige. Inden for et år kan disse langvarige problemer være løst, så du kan bruge en AI-gengivelse som et færdigt kunstværk eller en erstatning for et fotografi.

Redaktørens anbefalinger

  • Midjourneys nye zoom-ud-funktion er ved at blive den næste store AI-sensation
  • Den opdaterede Bing Chat springer ChatGPT på 6 vigtige nye måder
  • Dette virale AI-billede narrede verden, og du har måske allerede set det
  • Grammarlys nye ChatGPT-lignende AI-generator kan meget mere end at læse korrektur på dit forfatterskab
  • Jeg har set den (fjerne) fremtid for AI-websøgning - her er det fantastisk, og hvor det kæmper

Opgrader din livsstilDigital Trends hjælper læserne med at holde styr på den hurtige teknologiske verden med alle de seneste nyheder, sjove produktanmeldelser, indsigtsfulde redaktionelle artikler og enestående smugkig.