5 dingen waar AI-beeldgeneratoren nog steeds mee worstelen

AI-beeldgeneratoren zoals Dall-E, Stabiele verspreiding, Halverwege de reis, En Bing Afbeeldingsmaker geweldige resultaten opleveren, maar soms kunnen ze ongelooflijk frustrerend zijn. Met eenvoudige prompts die slechts een paar woorden bevatten, kan een AI indrukwekkende afbeeldingen produceren die professionele foto's en overtuigende kunst in verschillende stijlen lijken. Dezelfde prompt zal echter af en toe een gruwelijk wezen of hilarisch gebrekkige weergave creëren.

Inhoud

  • Handsalade en vingerkootjes
  • Problemen met tekst en schrijven
  • De ogen hebben het niet
  • Lastige hulpmiddelen
  • Nachtmerrie tanden
  • AI-kunst verbetert snel

Negatieve prompts kunnen de kans op deze fouten verkleinen, maar complexiteit kan u niet altijd redden. Zelfs AI-experts worstelen met misvormde wezens en onwereldse scènes, waardoor ze urenlang bezig zijn met het verfijnen van prompts of het bijwerken van afbeeldingen met een traditionele foto-editor. Als je goed kijkt in de juiste delen van een afbeelding, is de kans groot dat je kunt zien of de afbeelding door een machine is gemaakt.

Aanbevolen video's

Handsalade en vingerkootjes

AI-ontwikkelaars hebben vooruitgang geboekt in de strijd om hulpmiddelen voor kunstmatige intelligentie te leren hoe menselijke handen eruit moeten zien, maar er is genoeg ruimte voor verbetering. Als vingers niet prominent aanwezig zijn, is het gemakkelijk om fouten over het hoofd te zien, maar het is een voortdurend probleem.

Verwant

  • Stable Diffusion probeert het probleem met het genereren van vingers op te lossen
  • AI-gegenereerde video's zijn gearriveerd en ze evolueren snel
  • Bing Image Creator brengt DALL-E AI-gegenereerde afbeeldingen naar uw browser
Dall-E was een vroege AI-leider, maar handen zijn niet zijn ding.
Dall-E was een vroege AI-leider, maar handen zijn niet zijn ding.Dall-E ingegeven door Alan Truly

Een van de eerste en beste AI-beeldgeneratoren die beschikbaar is voor het publiek, Dall-E van OpenAI, creëerde deze foto's van mensen die elkaars hand vasthouden. Op het eerste gezicht ziet het er misschien goed uit. Bij nader inzien worden enkele problemen duidelijk. Pas op voor extra vingers, rare vingernagels en samengevoegde cijfers.

Gecompliceerde grepen en verweven vingers zijn nog uitdagender. Wees niet verbaasd als uw AI-afbeeldingen terugkomen met klassieke glitches die 'handsalade' of 'vingerballen' worden genoemd.

De verweven handen van Dall-E zijn verontrustend.
De verweven handen van Dall-E zijn verontrustend.Dall-E ingegeven door Alan Truly

Problemen met tekst en schrijven

Je zou verwachten dat tekst gemakkelijk door een computer kan worden gegenereerd. U ziet dagelijks bewijzen van woorden op schermen wanneer u de telefoon oppakt of een browser opent. Vroege computers, in tegenstelling tot de beste gaming-pc's van vandaag, kon geen enkele vorm van grafische weergave weergeven. Alles was tekst of cijfers.

Leonardo AI kent stijlen, maar gedrukte tekst is een uitdaging.
Leonardo AI kent stijlen, maar gedrukte tekst is een uitdaging.Leonardo AI ingegeven door Alan Truly

Toch is het verrassend lastig om echte letters en symbolen weer te geven als gedrukte of geschreven woorden AI-beeldgenerator. Het klinkt misschien als een gemakkelijk op te lossen probleem, maar dat is het niet. Een app kan niet alleen platte tekst overlappen. Om overtuigend te zijn, moeten de tekststijl, schaduw, hoek en perspectief overeenkomen met de rest van de scène.

In het voorbeeld deed een relatief nieuwe AI-beeldgenerator, Leonardo AI, een dappere poging met een vintage reclamebord voor het diner van Jack Rabbit Slim. Na meerdere pogingen slaagde de AI erin om "Jack Rabbit's" te spellen, wat vrij dicht bij het verzoek komt. De vintage fotostijl was perfect in elke afbeelding, maar de letters en woorden waren meestal gebrekkig.

Leonardo AI kwam dicht bij het krijgen van tekst in een van deze renders.
Leonardo AI kwam dicht bij het correct krijgen van de tekst in de weergave aan de linkerkant.Leonardo AI-weergaven ingegeven door Alan Truly

De ogen hebben het niet

Bing Image Creator worstelt met ogen.
Bing Image Creator ingegeven door Alan Truly

Er wordt vaak gezegd dat de ogen de vensters naar de ziel zijn. We vertrouwen zo sterk op oogcontact dat dit het meest kritische detail zou kunnen zijn bij het maken van een realistisch portret. Maar veel AI-tools hebben moeite met het weergeven van menselijke ogen.

Bing Image Creator heeft goed werk geleverd met de studio-achtergrond en het poseren van een familiefoto van meerdere generaties. Bijna iedereen heeft echter bizarre ogen die eruit zien alsof ze door buitenaardse wezens zijn ingebracht, of misschien zijn deze lachende mensen bezig te transformeren in onaardse wezens.

Twee nauwere voorbeelden van de oogproblemen van Bing Image Creator.
Twee voorbeelden van de verontrustende oogproblemen van Bing Image Creator.Bing Image Creator ingegeven door Alan Truly

Lastige hulpmiddelen

Mensen zijn geweldig met tools en niet alleen met de digitale variant zoals AI. We beheersen snel elk fysiek hulpmiddel dat binnen ons bereik ligt. Een AI daarentegen heeft moeite om te begrijpen wat ze zijn en hoe ze worden gebruikt.

Midjourney begrijpt handen, maar is verbaasd over moersleutels.
Midjourney begrijpt handen, maar is verbaasd over moersleutels. Is dat een gloeilamp linksonder?Midjourney ingegeven door Alan Truly

Midjourney is een AI-beeldgenerator die fantastische vooruitgang boekt bij het oplossen van problemen met menselijke gezichten en handen. Wanneer u echter wordt gevraagd om een ​​monteur te laten zien die een bout met een sleutel vastdraait, is het gereedschap volledig afwezig. In het ene geval worden vingernagels aan handschoenen toegevoegd en in een ander geval verschijnt er op de een of andere manier een gloeilamp.

Scharen zijn te gecompliceerd voor Bing Image Creator in deze close-upweergave van haar dat wordt geknipt. Ze zijn slechts in één afbeelding geopend en lijken nooit aan het snijden te zijn.

Bing Image Creator kan een schaar niet achterhalen.
Bing Image Creator kan niet achterhalen hoe een schaar werkt.Bing Image Creator ingegeven door Alan Truly

Nachtmerrie tanden

Stabiele diffusieweergaven van glimlachen hebben soms te veel tanden.
Stabiele verspreiding via Leonardo AI, ingegeven door Alan Truly

Als mensen glimlachen en lachen, verbetert dat meestal een foto, waardoor het aangenaam en leuk wordt. Wanneer een AI een simpele prompt krijgt, zoals twee studenten die glimlachen en lachen, kan dit een nachtmerrie worden met meerdere rijen tanden en andere vreemde vervormingen.

Met Leonardo AI kun je kiezen uit verschillende modellen, en sommige kunnen goed met tanden omgaan. De populaire Stabiel Diffusion 2.1-model had wat hulp nodig om de tanden goed te krijgen. Met wat negatieve aansporingen werd het probleem opgelost. Er zijn oplossingen voor deze AI-beeldproblemen, maar er is nog steeds werk nodig om goede resultaten te krijgen.

Stabiele diffusieglimlachen profiteren van negatieve aanwijzingen.
Stabiele diffusieglimlachen profiteren van negatieve aanwijzingen om 'rare tanden' en 'vervormde mond' te verwijderen.Stabiele verspreiding via Leonardo AI, ingegeven door Alan Truly

AI-kunst verbetert snel

In de begindagen van AI-kunst waren de resultaten raar en prachtig, en creëerden schoonheid en horror met evenveel overgave. De fouten worden bij elke nieuwe update minder opvallend en veel problemen kunnen met enige verfijning worden opgelost.

Met zoveel AI-tools beschikbaar, is het gemakkelijk om een ​​ander systeem te proberen. Veel AI-beeldgeneratoren staan ​​negatieve prompts of andere opties toe om het algoritme aan te passen en betere resultaten te krijgen.

Het kan zijn dat je meerdere pogingen moet doen om een ​​bruikbare foto te krijgen, vooral als de focus ligt op gezichten of handen. Als u gedrukte of geschreven woorden wilt opnemen, wees dan bereid om tijd door te brengen in een afbeeldingseditor om de onzinletters van de AI te wissen en de juiste tekst in te voegen.

Het goede nieuws is dat veel AI-beeldgeneratoren gratis zijn en dat abonnementsmodellen relatief goedkoop zijn. Binnen een jaar kunnen deze aanhoudende problemen worden opgelost, zodat u een AI-weergave kunt gebruiken als een voltooid kunstwerk of een vervanging voor een foto.

Aanbevelingen van de redactie

  • De nieuwe uitzoomfunctie van Midjourney wordt de volgende grote AI-sensatie
  • De bijgewerkte Bing Chat springt op 6 belangrijke nieuwe manieren over ChatGPT
  • Dit virale AI-beeld hield de wereld voor de gek, en je hebt het misschien al gezien
  • De nieuwe ChatGPT-achtige AI-generator van Grammarly kan veel meer dan alleen je schrijven proeflezen
  • Ik heb de (verre) toekomst van AI-webzoeken gezien: hier is het geweldig en waar het moeilijk is

Upgrade je levensstijlDigital Trends helpt lezers de snelle wereld van technologie in de gaten te houden met het laatste nieuws, leuke productrecensies, verhelderende hoofdartikelen en unieke sneak peeks.