AI billedgeneratorer som Dall-E, Stabil diffusion, Midjourney, og Bing Image Creator producere fantastiske resultater, men nogle gange kan de være utrolig frustrerende. Med enkle meddelelser, der kun indeholder nogle få ord, kan en AI producere imponerende billeder, der ser ud til at være professionelle fotografier og overbevisende kunst i forskellige stilarter. Den samme prompt vil dog af og til skabe et eller andet rædselsvækkende væsen eller en latterlig mangelfuld gengivelse.
Indhold
- Håndsalat og kugler af fingre
- Foruroligende tekst og skrivning
- Øjnene har det ikke
- Besværlige værktøjer
- Mareridtstænder
- AI-kunsten forbedres hurtigt
Negative meddelelser kan hjælpe med at reducere sandsynligheden for disse fejl, men kompleksitet kan ikke altid redde dig. Selv AI-eksperter kæmper med misdannede væsner og umodne scener, der kræver mange timers finpudsning af prompter eller retablering af billeder med en traditionel fotoeditor. For øjeblikket, hvis du ser omhyggeligt i de rigtige områder af et billede, er der en god chance for, at du vil være i stand til at identificere, om det er lavet af en maskine.
Anbefalede videoer
Håndsalat og kugler af fingre
AI-udviklere har gjort fremskridt i kampen for at lære kunstig intelligens-værktøjer, hvordan menneskelige hænder skal se ud, men der er masser af plads til forbedringer. Hvis fingrene ikke er fremtrædende, er det let at gå glip af fejl, men det er et vedvarende problem.
Relaterede
- Stabil diffusion sigter mod at løse sit problem med at generere fingre
- AI-genererede videoer er ankommet, og de udvikler sig hurtigt
- Bing Image Creator bringer DALL-E AI-genererede billeder til din browser
En af de første og bedste AI-billedgeneratorer tilgængelig for offentligheden, OpenAI's Dall-E, skabte disse billeder af mennesker, der holder i hånd. Ved første øjekast kan det se fint ud. Ved nærmere eftersyn viser sig nogle problemer. Pas på ekstra fingre, mærkelige fingernegle og flettede cifre.
Komplicerede greb og sammenflettede fingre er endnu mere udfordrende. Bliv ikke overrasket, hvis dine AI-billeder kommer tilbage med klassiske fejl, kaldet "håndsalat" eller "kugler af fingre."
Foruroligende tekst og skrivning
Du kan forvente, at teksten ville være let for en computer at generere. Du ser dagligt tegn på ord på skærmene, når du tager telefonen eller åbner en browser. Tidlige computere, i modsætning til de bedste gaming-pc'er i dag, kunne ikke vise grafik af nogen art. Alt var tekst eller tal.
Alligevel er det overraskende vanskeligt at vise faktiske bogstaver og symboler som trykte eller skrevne ord AI billedgenerator. Det lyder måske som et let problem at løse, men det er det ikke. En app kan ikke bare overlejre almindelig tekst. For at være overbevisende skal tekststilen, skyggen, vinklen og perspektivet matche resten af scenen.
I eksemplet gjorde en relativt ny AI-billedgenerator, Leonardo AI, en tapper indsats med en vintage billboard til Jack Rabbit Slims spisested. Efter flere forsøg lykkedes det AI at stave "Jack Rabbit's", hvilket er ret tæt på anmodningen. Vintage fotografistilen var spot-on i hvert billede, men bogstaverne og ordene var for det meste fejlbehæftede.
Øjnene har det ikke
Det siges ofte, at øjnene er vinduerne til sjælen. Vi stoler så meget på øjenkontakt, at det kunne være den mest kritiske detalje i at skabe et realistisk portræt. Men mange AI-værktøjer har svært ved at gengive menneskelige øjne.
Bing Image Creator gjorde et anstændigt stykke arbejde med studiebaggrunden og poserede et multigenerationelt familiebillede. Men næsten hver person har bizarre øjne, der ser ud som om de er blevet indsat af aliens, eller måske er disse smilende mennesker i færd med at forvandle sig til ujordiske skabninger.
Besværlige værktøjer
Mennesker er gode med værktøjer og ikke kun den digitale variation som AI. Vi mestrer hurtigt ethvert fysisk værktøj inden for vores rækkevidde. En AI på den anden side kæmper for at forstå, hvad de er, og hvordan de bruges.
Midjourney er en AI-billedgenerator, der gør fantastiske fremskridt med at løse problemer med menneskelige ansigter og hænder. Men når du bliver bedt om at vise en mekaniker, der spænder en bolt med en skruenøgle, er værktøjet helt fraværende. Fingernegle føjes til handsker i et tilfælde, og en pære vises på en eller anden måde i et andet.
Saks er for kompliceret til Bing Image Creator i denne nærbillede gengivelse af hår, der bliver klippet. De er kun åbne i ét billede og ser aldrig ud til at være i gang med at skære.
Mareridtstænder
Når folk smiler og griner, forbedrer det normalt et billede, hvilket gør det behageligt og sjovt. Når de får en simpel prompt som to elever, der smiler og griner, kan en AI forvandle dette til mareridtsbrændstof med flere rækker af tænder og andre mærkelige forvrængninger.
Leonardo AI giver dig mulighed for at vælge mellem flere modeller, og nogle håndterer tænder godt. Det populære Stabil Diffusion 2.1 model havde brug for hjælp til at få de rigtige tænder. Med nogle negative tilskyndelser blev problemet løst. Der er løsninger på disse AI-billedproblemer, men det kræver stadig arbejde at få gode resultater.
AI-kunsten forbedres hurtigt
I de tidlige dage af AI-kunst var resultaterne mærkelige og vidunderlige, hvilket skabte skønhed og rædsel med lige stor opgivelse. Fejlene bliver mindre mærkbare med hver ny opdatering, og mange problemer kan overvindes med en vis forfining.
Med så mange AI-værktøjer tilgængelige, er det nemt at prøve et andet system. Mange AI-billedgeneratorer tillader negative prompter eller andre muligheder for at justere algoritmen og få bedre resultater.
Du skal muligvis gennemgå flere forsøg for at få et brugbart billede, især hvis der er fokus på ansigter eller hænder. Når du vil inkludere trykte eller skrevne ord, skal du være forberedt på at bruge tid i en billededitor på at slette AI's nonsensbogstaver og blande den korrekte tekst.
Den gode nyhed er, at mange AI-billedgeneratorer er gratis, og abonnementsmodeller er relativt billige. Inden for et år kan disse langvarige problemer være løst, så du kan bruge en AI-gengivelse som et færdigt kunstværk eller en erstatning for et fotografi.
Redaktørens anbefalinger
- Midjourneys nye zoom-ud-funktion er ved at blive den næste store AI-sensation
- Den opdaterede Bing Chat springer ChatGPT på 6 vigtige nye måder
- Dette virale AI-billede narrede verden, og du har måske allerede set det
- Grammarlys nye ChatGPT-lignende AI-generator kan meget mere end at læse korrektur på dit forfatterskab
- Jeg har set den (fjerne) fremtid for AI-websøgning - her er det fantastisk, og hvor det kæmper
Opgrader din livsstilDigital Trends hjælper læserne med at holde styr på den hurtige teknologiske verden med alle de seneste nyheder, sjove produktanmeldelser, indsigtsfulde redaktionelle artikler og enestående smugkig.