AI-bildegeneratorer liker Dall-E, Stabil diffusjon, Midjourney, og Bing Image Creator produsere fantastiske resultater, men noen ganger kan de være utrolig frustrerende. Med enkle spørsmål som inneholder bare noen få ord, kan en AI produsere imponerende bilder som ser ut til å være profesjonelle fotografier og overbevisende kunst i ulike stiler. Imidlertid vil den samme oppfordringen av og til skape en grufull skapning eller morsomt feilaktig gjengivelse.
Innhold
- Håndsalat og fingerkuler
- Plagsom tekst og skriving
- Øynene har det ikke
- Plagsomme verktøy
- Mareritt tenner
- AI-kunsten forbedres raskt
Negative forespørsler kan bidra til å redusere sannsynligheten for disse feilene, men kompleksitet kan ikke alltid redde deg. Til og med AI-eksperter sliter med misformede skapninger og ujordiske scener, som krever lange timer med raffinering av spørsmål eller bearbeiding av bilder med en tradisjonell fotoredigerer. For tiden, hvis du ser nøye i de riktige områdene av et bilde, er det en god sjanse for at du vil kunne identifisere om det ble laget av en maskin.
Anbefalte videoer
Håndsalat og fingerkuler
AI-utviklere har gjort fremskritt i kampen for å lære kunstig intelligens-verktøy hvordan menneskelige hender skal se ut, men det er mye rom for forbedring. Hvis fingrene ikke er fremtredende, er det lett å gå glipp av feil, men det er et pågående problem.
I slekt
- Stabil diffusjon har som mål å fikse problemet med å generere fingre
- AI-genererte videoer har kommet, og de utvikler seg raskt
- Bing Image Creator bringer DALL-E AI-genererte bilder til nettleseren din
En av de første og beste AI-bildegeneratorene tilgjengelig for publikum, OpenAIs Dall-E, laget disse bildene av folk som holder hender. Ved første øyekast kan det se bra ut. Ved nærmere ettersyn viser noen problemer seg. Pass på ekstra fingre, rare negler og sammenslåtte sifre.
Kompliserte grep og sammenflettede fingre er enda mer utfordrende. Ikke bli overrasket hvis AI-bildene dine kommer tilbake med klassiske feil som kalles "håndsalat" eller "baller av fingre."
Plagsom tekst og skriving
Du kan forvente at teksten er enkel å generere for en datamaskin. Du ser tegn på ord på skjermene daglig når du tar opp telefonen eller åpner en nettleser. Tidlige datamaskiner, i motsetning til de beste spill-PC-ene i dag, kunne ikke vise grafikk av noe slag. Alt var tekst eller tall.
Likevel er det overraskende vanskelig å vise faktiske bokstaver og symboler som trykte eller skrevne ord AI bildegenerator. Det kan høres ut som et enkelt problem å løse, men det er det ikke. En app kan ikke bare legge over ren tekst. For å være overbevisende må tekststilen, skyggeleggingen, vinkelen og perspektivet samsvare med resten av scenen.
I eksemplet gjorde en relativt ny AI-bildegenerator, Leonardo AI, en tapper innsats med en vintage reklametavle for Jack Rabbit Slims spisested. Etter flere forsøk klarte AI å stave "Jack Rabbit's", som er ganske nær forespørselen. Vintagefotografistilen var perfekt i hvert bilde, men bokstavene og ordene var for det meste feil.
Øynene har det ikke
Det sies ofte at øynene er vinduene til sjelen. Vi stoler så mye på øyekontakt at det kan være den mest kritiske detaljen for å lage et realistisk portrett. Men mange AI-verktøy har problemer med å gjengi menneskelige øyne.
Bing Image Creator gjorde en anstendig jobb med studiobakgrunnen og poserte et familiebilde i flere generasjoner. Imidlertid har nesten hver person bisarre øyne som ser ut som de har blitt satt inn av romvesener, eller kanskje disse smilende menneskene er i ferd med å forvandle seg til ujordiske skapninger.
Plagsomme verktøy
Mennesker er gode med verktøy og ikke bare den digitale variasjonen som AI. Vi mestrer raskt ethvert fysisk verktøy vi har tilgang til. En AI, derimot, sliter med å forstå hva de er og hvordan de brukes.
Midjourney er en AI-bildegenerator som gjør fantastiske fremskritt i å løse problemer med menneskelige ansikter og hender. Men når du blir bedt om å vise en mekaniker som strammer en bolt med en skiftenøkkel, er verktøyet helt fraværende. Fingernegler legges til hansker i ett tilfelle, og en lyspære vises på en eller annen måte i et annet.
Saks er for komplisert for Bing Image Creator i denne nærbildet av hår som klippes. De er bare åpne i ett bilde og ser aldri ut til å være i ferd med å kutte.
Mareritt tenner
Når folk smiler og ler, forbedrer det vanligvis et bilde, noe som gjør det hyggelig og morsomt. Når du får en enkel melding som to elever som smiler og ler, kan en AI gjøre dette til marerittdrivstoff med flere rader med tenner og andre merkelige forvrengninger.
Leonardo AI lar deg velge mellom flere modeller, og noen håndterer tenner godt. Det populære Stable Diffusion 2.1 modell trengte litt hjelp for å få riktige tenner. Med noen negative spørsmål ble problemet løst. Det finnes løsninger på disse AI-bildeproblemene, men det krever fortsatt arbeid for å få gode resultater.
AI-kunsten forbedres raskt
I de tidlige dagene av AI-kunst var resultatene rare og fantastiske, og skapte skjønnhet og gru med like stor forlatelse. Feilene blir mindre merkbare med hver nye oppdatering, og mange problemer kan overvinnes med litt foredling.
Med så mange AI-verktøy tilgjengelig, er det enkelt å prøve et annet system. Mange AI-bildegeneratorer tillater negative meldinger eller andre alternativer for å justere algoritmen og få bedre resultater.
Du må kanskje kjøre gjennom flere forsøk for å få et brukbart bilde, spesielt hvis det er fokus på ansikter eller hender. Når du vil inkludere trykte eller skrevne ord, vær forberedt på å bruke tid i et bilderedigeringsprogram på å slette AIs tullbokstaver og blande inn riktig tekst.
Den gode nyheten er at mange AI-bildegeneratorer er gratis, og abonnementsmodeller er relativt rimelige. Innen et år kan disse langvarige problemene være løst, slik at du kan bruke en AI-gjengivelse som et ferdig kunstverk eller en erstatning for et fotografi.
Redaktørenes anbefalinger
- Midjourneys nye zoom-ut-funksjon er i ferd med å bli den neste store AI-sensasjonen
- Den oppdaterte Bing Chat hopper over ChatGPT på 6 viktige nye måter
- Dette virale AI-bildet lurte verden, og du har kanskje allerede sett det
- Grammarlys nye ChatGPT-lignende AI-generator kan gjøre mye mer enn å korrekturlese det du skriver
- Jeg har sett den (fjerne) fremtiden til AI-nettsøk – her er det fantastisk, og hvor det sliter
Oppgrader livsstilen dinDigitale trender hjelper leserne å følge med på den fartsfylte teknologiverdenen med alle de siste nyhetene, morsomme produktanmeldelser, innsiktsfulle redaksjoner og unike sniktitter.