AI bildgeneratorer gillar Dall-E, Stabil diffusion, Midjourney, och Bing Image Creator ger fantastiska resultat, men ibland kan de vara otroligt frustrerande. Med enkla uppmaningar som bara innehåller några få ord kan en AI producera imponerande bilder som ser ut att vara professionella fotografier och övertygande konst i olika stilar. Men samma uppmaning kommer då och då att skapa någon fasansfull varelse eller lustigt defekt rendering.
Innehåll
- Handsallad och fingerkulor
- Orolig text och skrivande
- Ögonen har det inte
- Besvärliga verktyg
- Mardrömständer
- AI-konsten förbättras snabbt
Negativa uppmaningar kan hjälpa till att minska sannolikheten för dessa fel, men komplexiteten kan inte alltid rädda dig. Till och med AI-experter kämpar med missformade varelser och världsliga scener, som kräver långa timmars förfining av uppmaningar eller finjustering av bilder med en traditionell fotoredigerare. För närvarande, om du tittar noga i de rätta områdena i en bild, finns det en god chans att du kommer att kunna identifiera om den är gjord av en maskin.
Rekommenderade videor
Handsallad och fingerkulor
AI-utvecklare har gjort framsteg i kampen för att lära ut verktyg för artificiell intelligens hur mänskliga händer ska se ut, men det finns gott om utrymme för förbättringar. Om fingrar inte är framträdande är det lätt att missa fel, men det är ett pågående problem.
Relaterad
- Stable Diffusion syftar till att fixa sitt problem med genererande fingrar
- AI-genererade videor har kommit och de utvecklas snabbt
- Bing Image Creator ger DALL-E AI-genererade bilder till din webbläsare
En av de första och bästa AI-bildgeneratorerna tillgängliga för allmänheten, OpenAI: s Dall-E, skapade dessa bilder av människor som håller varandra i hand. Vid första anblicken kan det se bra ut. Vid närmare granskning visar sig vissa problem. Se upp för extra fingrar, konstiga naglar och sammanslagna siffror.
Komplicerade grepp och sammanflätade fingrar är ännu mer utmanande. Bli inte förvånad om dina AI-bilder kommer tillbaka med klassiska fel som kallas "handsallad" eller "kulor av fingrar."
Orolig text och skrivande
Du kanske förväntar dig att texten skulle vara lätt för en dator att generera. Du ser tecken på ord på skärmar dagligen när du lyfter telefonen eller öppnar en webbläsare. Tidiga datorer, till skillnad från de bästa speldatorerna idag, kunde inte visa grafik av något slag. Allt var text eller siffror.
Ändå är det förvånansvärt svårt att visa verkliga bokstäver och symboler som tryckta eller skrivna ord AI bildgenerator. Det kan låta som ett enkelt problem att lösa, men det är det inte. En app kan inte bara lägga över vanlig text. För att vara övertygande måste textstilen, skuggningen, vinkeln och perspektivet matcha resten av scenen.
I exemplet gjorde en relativt ny AI-bildgenerator, Leonardo AI, en tapper insats med en vintage skylt för Jack Rabbit Slims restaurang. Efter flera försök lyckades AI stava ut "Jack Rabbit's", vilket är ganska nära begäran. Vintagefotografistilen var perfekt i varje bild, men bokstäverna och orden var oftast felaktiga.
Ögonen har det inte
Det sägs ofta att ögonen är själens fönster. Vi förlitar oss så mycket på ögonkontakt att det kan vara den mest kritiska detaljen för att skapa ett realistiskt porträtt. Men många AI-verktyg har svårt att återge mänskliga ögon.
Bing Image Creator gjorde ett bra jobb med studiobakgrunden och poserade ett familjefoto i flera generationer. Men nästan varje person har bisarra ögon som ser ut som om de har satts in av utomjordingar, eller så kanske dessa leende människor håller på att förvandlas till ojordiska varelser.
Besvärliga verktyg
Människor är fantastiska med verktyg och inte bara den digitala variationen som AI. Vi behärskar snabbt vilket fysiskt verktyg som helst inom vårt grepp. En AI, å andra sidan, kämpar för att förstå vad de är och hur de används.
Midjourney är en AI-bildgenerator som gör fantastiska framsteg när det gäller att lösa problem med mänskliga ansikten och händer. Men när du uppmanas att visa en mekaniker som drar åt en bult med en skiftnyckel är verktyget helt frånvarande. Naglar läggs till handskar i ett fall, och en glödlampa visas på något sätt i ett annat.
Saxar är för komplicerade för Bing Image Creator i denna närbild av hår som klipps. De är bara öppna i en bild och verkar aldrig vara i färd med att klippa.
Mardrömständer
När människor ler och skrattar förbättrar det vanligtvis en bild, vilket gör den trevlig och rolig. När man får en enkel uppmaning som två elever som ler och skrattar, kan en AI förvandla detta till mardrömsbränsle med flera tandrader och andra konstiga förvrängningar.
Leonardo AI låter dig välja mellan flera modeller, och vissa hanterar tänderna bra. Det populära Stable Diffusion 2.1-modell behövde lite hjälp för att få rätt tänder. Med några negativa uppmaningar löstes problemet. Det finns lösningar på dessa AI-bildproblem, men det krävs fortfarande arbete för att få bra resultat.
AI-konsten förbättras snabbt
I början av AI-konsten var resultaten konstiga och underbara, och skapade skönhet och skräck med lika övergivenhet. Felen blir mindre märkbara med varje ny uppdatering, och många problem kan övervinnas med viss förfining.
Med så många AI-verktyg tillgängliga, det är lätt att prova ett annat system. Många AI-bildgeneratorer tillåter negativa uppmaningar eller andra alternativ för att justera algoritmen och få bättre resultat.
Du kan behöva köra igenom flera försök för att få en användbar bild, särskilt om det är fokus på ansikten eller händer. När du vill inkludera tryckta eller skrivna ord, var beredd att spendera tid i en bildredigerare för att radera AI: s nonsensbokstäver och blanda in rätt text.
Den goda nyheten är att många AI-bildgeneratorer är gratis, och prenumerationsmodeller är relativt billiga. Inom ett år kan dessa kvardröjande problem lösas, så att du kan använda en AI-rendering som ett färdigt konstverk eller en ersättning för ett fotografi.
Redaktörens rekommendationer
- Midjourneys nya zoom-out-funktion håller på att bli nästa stora AI-sensation
- Den uppdaterade Bing Chat hoppar över ChatGPT på 6 viktiga nya sätt
- Denna virala AI-bild lurade världen, och du kanske redan har sett den
- Grammarlys nya ChatGPT-liknande AI-generator kan göra mycket mer än att korrekturläsa ditt skrivande
- Jag har sett den (avlägsna) framtiden för AI-webbsökning – här är det fantastiskt och där det kämpar
Uppgradera din livsstilDigitala trender hjälper läsare att hålla koll på den snabba teknikvärlden med alla de senaste nyheterna, roliga produktrecensioner, insiktsfulla redaktioner och unika smygtittar.