5 ting AI-bildegeneratorer fortsatt sliter med

AI-bildegeneratorer liker Dall-E, Stabil diffusjon, Midjourney, og Bing Image Creator produsere fantastiske resultater, men noen ganger kan de være utrolig frustrerende. Med enkle spørsmål som inneholder bare noen få ord, kan en AI produsere imponerende bilder som ser ut til å være profesjonelle fotografier og overbevisende kunst i ulike stiler. Imidlertid vil den samme oppfordringen av og til skape en grufull skapning eller morsomt feilaktig gjengivelse.

Innhold

  • Håndsalat og fingerkuler
  • Plagsom tekst og skriving
  • Øynene har det ikke
  • Plagsomme verktøy
  • Mareritt tenner
  • AI-kunsten forbedres raskt

Negative forespørsler kan bidra til å redusere sannsynligheten for disse feilene, men kompleksitet kan ikke alltid redde deg. Til og med AI-eksperter sliter med misformede skapninger og ujordiske scener, som krever lange timer med raffinering av spørsmål eller bearbeiding av bilder med en tradisjonell fotoredigerer. For tiden, hvis du ser nøye i de riktige områdene av et bilde, er det en god sjanse for at du vil kunne identifisere om det ble laget av en maskin.

Anbefalte videoer

Håndsalat og fingerkuler

AI-utviklere har gjort fremskritt i kampen for å lære kunstig intelligens-verktøy hvordan menneskelige hender skal se ut, men det er mye rom for forbedring. Hvis fingrene ikke er fremtredende, er det lett å gå glipp av feil, men det er et pågående problem.

I slekt

  • Stabil diffusjon har som mål å fikse problemet med å generere fingre
  • AI-genererte videoer har kommet, og de utvikler seg raskt
  • Bing Image Creator bringer DALL-E AI-genererte bilder til nettleseren din
Dall-E var en tidlig AI-leder, men hender er ikke dens greie.
Dall-E var en tidlig AI-leder, men hender er ikke dens greie.Dall-E bedt om av Alan Truly

En av de første og beste AI-bildegeneratorene tilgjengelig for publikum, OpenAIs Dall-E, laget disse bildene av folk som holder hender. Ved første øyekast kan det se bra ut. Ved nærmere ettersyn viser noen problemer seg. Pass på ekstra fingre, rare negler og sammenslåtte sifre.

Kompliserte grep og sammenflettede fingre er enda mer utfordrende. Ikke bli overrasket hvis AI-bildene dine kommer tilbake med klassiske feil som kalles "håndsalat" eller "baller av fingre."

Dall-Es sammenflettede hender er urovekkende.
Dall-Es sammenflettede hender er urovekkende.Dall-E bedt om av Alan Truly

Plagsom tekst og skriving

Du kan forvente at teksten er enkel å generere for en datamaskin. Du ser tegn på ord på skjermene daglig når du tar opp telefonen eller åpner en nettleser. Tidlige datamaskiner, i motsetning til de beste spill-PC-ene i dag, kunne ikke vise grafikk av noe slag. Alt var tekst eller tall.

Leonardo AI kjenner stiler, men trykt tekst er utfordrende.
Leonardo AI kan stiler, men trykt tekst er utfordrende.Leonardo AI ledet av Alan Truly

Likevel er det overraskende vanskelig å vise faktiske bokstaver og symboler som trykte eller skrevne ord AI bildegenerator. Det kan høres ut som et enkelt problem å løse, men det er det ikke. En app kan ikke bare legge over ren tekst. For å være overbevisende må tekststilen, skyggeleggingen, vinkelen og perspektivet samsvare med resten av scenen.

I eksemplet gjorde en relativt ny AI-bildegenerator, Leonardo AI, en tapper innsats med en vintage reklametavle for Jack Rabbit Slims spisested. Etter flere forsøk klarte AI å stave "Jack Rabbit's", som er ganske nær forespørselen. Vintagefotografistilen var perfekt i hvert bilde, men bokstavene og ordene var for det meste feil.

Leonardo AI var nær ved å få tekst riktig i en av disse gjengivelsene.
Leonardo AI var nær ved å få tekst korrekt i gjengivelsen til venstre.Leonardo AI gjengir ledet av Alan Truly

Øynene har det ikke

Bing Image Creator sliter med øynene.
Bing Image Creator bedt om av Alan Truly

Det sies ofte at øynene er vinduene til sjelen. Vi stoler så mye på øyekontakt at det kan være den mest kritiske detaljen for å lage et realistisk portrett. Men mange AI-verktøy har problemer med å gjengi menneskelige øyne.

Bing Image Creator gjorde en anstendig jobb med studiobakgrunnen og poserte et familiebilde i flere generasjoner. Imidlertid har nesten hver person bisarre øyne som ser ut som de har blitt satt inn av romvesener, eller kanskje disse smilende menneskene er i ferd med å forvandle seg til ujordiske skapninger.

To nærmere eksempler på Bing Image Creators øyeproblemer.
To nærmere eksempler på Bing Image Creators urovekkende øyeproblemer.Bing Image Creator bedt om av Alan Truly

Plagsomme verktøy

Mennesker er gode med verktøy og ikke bare den digitale variasjonen som AI. Vi mestrer raskt ethvert fysisk verktøy vi har tilgang til. En AI, derimot, sliter med å forstå hva de er og hvordan de brukes.

Midjourney forstår hender, men blir forvirret av skiftenøkler.
Midjourney forstår hender, men blir forvirret av skiftenøkler. Er det en lyspære nederst til venstre?Midjourney bedt om av Alan Truly

Midjourney er en AI-bildegenerator som gjør fantastiske fremskritt i å løse problemer med menneskelige ansikter og hender. Men når du blir bedt om å vise en mekaniker som strammer en bolt med en skiftenøkkel, er verktøyet helt fraværende. Fingernegler legges til hansker i ett tilfelle, og en lyspære vises på en eller annen måte i et annet.

Saks er for komplisert for Bing Image Creator i denne nærbildet av hår som klippes. De er bare åpne i ett bilde og ser aldri ut til å være i ferd med å kutte.

Bing Image Creator kan ikke finne ut saks.
Bing Image Creator kan ikke finne ut hvordan saks fungerer.Bing Image Creator bedt om av Alan Truly

Mareritt tenner

Stabile spredningsgjengivelser av smil har noen ganger for mange tenner.
Stabil diffusjon via Leonardo AI, bedt om av Alan Truly

Når folk smiler og ler, forbedrer det vanligvis et bilde, noe som gjør det hyggelig og morsomt. Når du får en enkel melding som to elever som smiler og ler, kan en AI gjøre dette til marerittdrivstoff med flere rader med tenner og andre merkelige forvrengninger.

Leonardo AI lar deg velge mellom flere modeller, og noen håndterer tenner godt. Det populære Stable Diffusion 2.1 modell trengte litt hjelp for å få riktige tenner. Med noen negative spørsmål ble problemet løst. Det finnes løsninger på disse AI-bildeproblemene, men det krever fortsatt arbeid for å få gode resultater.

Stabile diffusjonssmil drar nytte av negative spørsmål.
Stabile spredningssmil drar nytte av negative oppfordringer om å fjerne "rare tenner" og "forvrengt munn."Stabil diffusjon via Leonardo AI, bedt om av Alan Truly

AI-kunsten forbedres raskt

I de tidlige dagene av AI-kunst var resultatene rare og fantastiske, og skapte skjønnhet og gru med like stor forlatelse. Feilene blir mindre merkbare med hver nye oppdatering, og mange problemer kan overvinnes med litt foredling.

Med så mange AI-verktøy tilgjengelig, er det enkelt å prøve et annet system. Mange AI-bildegeneratorer tillater negative meldinger eller andre alternativer for å justere algoritmen og få bedre resultater.

Du må kanskje kjøre gjennom flere forsøk for å få et brukbart bilde, spesielt hvis det er fokus på ansikter eller hender. Når du vil inkludere trykte eller skrevne ord, vær forberedt på å bruke tid i et bilderedigeringsprogram på å slette AIs tullbokstaver og blande inn riktig tekst.

Den gode nyheten er at mange AI-bildegeneratorer er gratis, og abonnementsmodeller er relativt rimelige. Innen et år kan disse langvarige problemene være løst, slik at du kan bruke en AI-gjengivelse som et ferdig kunstverk eller en erstatning for et fotografi.

Redaktørenes anbefalinger

  • Midjourneys nye zoom-ut-funksjon er i ferd med å bli den neste store AI-sensasjonen
  • Den oppdaterte Bing Chat hopper over ChatGPT på 6 viktige nye måter
  • Dette virale AI-bildet lurte verden, og du har kanskje allerede sett det
  • Grammarlys nye ChatGPT-lignende AI-generator kan gjøre mye mer enn å korrekturlese det du skriver
  • Jeg har sett den (fjerne) fremtiden til AI-nettsøk – her er det fantastisk, og hvor det sliter

Oppgrader livsstilen dinDigitale trender hjelper leserne å følge med på den fartsfylte teknologiverdenen med alle de siste nyhetene, morsomme produktanmeldelser, innsiktsfulle redaksjoner og unike sniktitter.