5 asiaa, joiden kanssa tekoälykuvageneraattorit kamppailevat edelleen

AI-kuvageneraattorit pitävät Dall-E, Vakaa diffuusio, Keskimatka, ja Bing Image Creator tuottaa uskomattomia tuloksia, mutta joskus ne voivat olla uskomattoman turhauttavia. Yksinkertaisilla kehotteilla, jotka sisältävät vain muutaman sanan, tekoäly voi tuottaa vaikuttavia kuvia, jotka näyttävät ammattimaisista valokuvista ja vakuuttavista eri tyyleistä. Sama kehote saa kuitenkin toisinaan aikaan jonkin kauhistuttavan olennon tai naurettavan virheellisen renderöinnin.

Sisällys

  • Käsisalaattia ja sormipalloja
  • Häiritsevä teksti ja kirjoittaminen
  • Silmillä sitä ei ole
  • Hankalat työkalut
  • Painajaisen hampaat
  • AI-taide kehittyy nopeasti

Negatiiviset kehotteet voivat auttaa vähentämään näiden virheiden todennäköisyyttä, mutta monimutkaisuus ei aina pelasta sinua. Jopa tekoälyasiantuntijat kamppailevat epämuodostuneiden olentojen ja epämaailmallisten kohtausten kanssa, mikä vaatii pitkiä tunteja tarkentamalla kehotteita tai parantamalla kuvia perinteisellä kuvankäsittelyohjelmalla. Jos katsot tarkasti kuvan oikeita alueita, voit toistaiseksi tunnistaa, onko se koneella tehty.

Suositellut videot

Käsisalaattia ja sormipalloja

Tekoälykehittäjät ovat edistyneet taistelussaan opettaa tekoälytyökaluja, miltä ihmiskäsien pitäisi näyttää, mutta parantamisen varaa on runsaasti. Jos sormet eivät ole näkyvästi esillä, virheet jäävät helposti huomaamatta, mutta se on jatkuva ongelma.

Liittyvät

  • Stable Diffusion pyrkii korjaamaan ongelmansa sormien synnyttämisellä
  • Tekoälyllä luotuja videoita on saapunut, ja ne kehittyvät nopeasti
  • Bing Image Creator tuo DALL-E AI: lla luodut kuvat selaimeesi
Dall-E oli varhainen tekoälyjohtaja, mutta kädet eivät ole sen asia.
Dall-E oli varhainen tekoälyjohtaja, mutta kädet eivät ole sen asia.Dall-E Alan Trulyn kehotuksesta

Yksi ensimmäisistä ja parhaista yleisön saatavilla olevista tekoälykuvageneraattoreista, OpenAI: n Dall-E, loi nämä kuvat ihmisistä, jotka pitävät kädestä. Ensi silmäyksellä se saattaa näyttää hyvältä. Tarkemmin tarkasteltuna huomaa joitakin ongelmia. Varo ylimääräisiä sormia, outoja kynsiä ja yhdistettyjä numeroita.

Monimutkaiset kahvat ja lomitetut sormet ovat vieläkin haastavampia. Älä ylläty, jos tekoälykuvasi tulevat takaisin klassisilla virheillä, joita kutsutaan "käsisalaattiksi" tai "sormipalloiksi".

Dall-E: n lomitetut kädet ovat häiritseviä.
Dall-E: n lomitetut kädet ovat häiritseviä.Dall-E Alan Trulyn kehotuksesta

Häiritsevä teksti ja kirjoittaminen

Saatat odottaa, että tekstin luominen tietokoneella on helppoa. Näet todisteita sanoista näytöillä päivittäin, kun nostat puhelimen tai avaat selaimen. Varhaiset tietokoneet, toisin kuin suosituimmat pelitietokoneet ei pystynyt näyttämään minkäänlaista grafiikkaa. Kaikki oli tekstiä tai numeroita.

Leonardo AI tuntee tyylit, mutta painettu teksti on haastavaa.
Leonardo AI tuntee tyylit, mutta painettu teksti on haastavaa.Leonardo AI Alan Trulyn kehotuksesta

Varsinaisten kirjainten ja symbolien näyttäminen painetuina tai kirjoitettuina sanoina on kuitenkin yllättävän hankalaa AI-kuvageneraattori. Se saattaa kuulostaa helpolta ongelmalta ratkaista, mutta se ei ole sitä. Sovellus ei voi vain peittää pelkkää tekstiä. Ollakseen vakuuttava tekstin tyylin, varjostuksen, kulman ja perspektiivin on vastattava kohtauksen muuta osaa.

Esimerkissä suhteellisen uusi tekoälykuvageneraattori, Leonardo AI, teki urheasti töitä vintage-mainostaulun kanssa Jack Rabbit Slimin ruokalassa. Useiden yritysten jälkeen tekoäly onnistui täsmentämään "Jack Rabbit's", joka on melko lähellä pyyntöä. Vintage-valokuvatyyli oli jokaisessa kuvassa paikallaan, mutta kirjaimet ja sanat olivat enimmäkseen virheellisiä.

Leonardo AI oli lähellä tekstin saamista oikeaan yhdessä näistä hahmonnuksista.
Leonardo AI oli lähellä saada tekstiä oikeaan vasemmanpuoleisessa renderöinnissa.Leonardo AI renderöi Alan Trulyn kehotuksesta

Silmillä sitä ei ole

Bing Image Creator kamppailee silmien kanssa.
Alan Trulyn kehottama Bing Image Creator

Usein sanotaan, että silmät ovat sielun ikkuna. Luotamme niin paljon katsekontaktiin, että se voi olla kriittisin yksityiskohta realistisen muotokuvan luomisessa. Mutta monilla tekoälytyökaluilla on vaikeuksia renderöidä ihmissilmiä.

Bing Image Creator teki kunnollisen työn studiotaustalla ja poseerasi usean sukupolven perhekuvan. Melkein jokaisella ihmisellä on kuitenkin omituiset silmät, jotka näyttävät alienien laittamalta, tai ehkä nämä hymyilevät ihmiset ovat muuttumassa epämallisiksi olentoiksi.

Kaksi lähempää esimerkkiä Bing Image Creatorin silmäongelmista.
Kaksi lähempää esimerkkiä Bing Image Creatorin häiritsevistä silmäongelmista.Alan Trulyn kehottama Bing Image Creator

Hankalat työkalut

Ihminen osaa hyvin työkaluja, ei vain digitaalista monipuolisuutta, kuten tekoälyä. Hallitsemme nopeasti kaikki käsissämme olevat fyysiset työkalut. Tekoäly sen sijaan yrittää ymmärtää, mitä ne ovat ja miten niitä käytetään.

Midjourney ymmärtää käsiä, mutta on ymmällään jakoavaimista.
Midjourney ymmärtää käsiä, mutta on ymmällään jakoavaimista. Onko tuo lamppu vasemmassa alakulmassa?Keskimatka Alan Trulyn kehotuksesta

Midjourney on tekoälykuvageneraattori, joka edistyy loistavasti ihmisten kasvojen ja käsien ongelmien ratkaisemisessa. Kuitenkin, kun sinua kehotetaan näyttämään mekaanikkoa kiristämässä pulttia avaimella, työkalu puuttuu kokonaan. Käsineisiin lisätään yhdessä tapauksessa kynnet ja toisessa näkyy jotenkin hehkulamppu.

Sakset ovat liian monimutkaisia ​​Bing Image Creatorille tässä leikattavien hiusten lähikuvassa. Ne ovat auki vain yhdessä kuvassa eivätkä koskaan näytä olevan leikkausvaiheessa.

Bing Image Creator ei voi keksiä saksia.
Bing Image Creator ei voi selvittää, miten sakset toimivat.Alan Trulyn kehottama Bing Image Creator

Painajaisen hampaat

Hymyjen vakaan diffuusiorenderöinnissä on joskus liikaa hampaita.
Vakaa diffuusio Leonardo AI: n kautta, Alan Trulyn kehotuksesta

Kun ihmiset hymyilevät ja nauravat, se yleensä parantaa kuvaa, mikä tekee siitä miellyttävän ja hauskan. Kun tekoäly antaa yksinkertaisen kehotuksen, kuten kaksi hymyilevää ja nauravaa opiskelijaa, tekoäly voi muuttaa tämän painajaispolttoaineeksi, jossa on useita hammasrivejä ja muita outoja vääristymiä.

Leonardo AI antaa sinun valita useiden mallien välillä, ja jotkut käsittelevät hampaita hyvin. Suosittu Stable Diffusion 2.1 -malli tarvitsi apua saadakseen hampaat kuntoon. Kielteisellä kehotuksella ongelma ratkesi. Näihin tekoälykuvaongelmiin on ratkaisuja, mutta hyvien tulosten saavuttaminen vaatii silti työtä.

Vakaa diffuusiohymyt hyötyvät negatiivisista kehotuksista.
Vakaat diffuusiohymyt hyötyvät negatiivisista kehotuksista poistaa "outot hampaat" ja "vääristynyt suu".Vakaa diffuusio Leonardo AI: n kautta, Alan Trulyn kehotuksesta

AI-taide kehittyy nopeasti

Tekoälytaiteen alkuaikoina tulokset olivat outoja ja upeita, luoden kauneutta ja kauhua yhtä lailla. Virheet ovat yhä vähemmän havaittavissa jokaisen uuden päivityksen myötä, ja monet ongelmat voidaan ratkaista pienellä tarkennuksella.

Kanssa niin monia AI-työkaluja saatavilla, on helppo kokeilla toista järjestelmää. Monet tekoälykuvageneraattorit sallivat negatiivisten kehotteiden tai muiden vaihtoehtojen säätää algoritmia ja saada parempia tuloksia.

Saatat joutua kokeilemaan useita yrityksiä saadaksesi käyttökelpoisen kuvan, varsinkin jos keskitytään kasvoihin tai käsiin. Kun haluat sisällyttää painettuja tai kirjoitettuja sanoja, ole valmis viettämään aikaa kuvankäsittelyohjelmassa pyyhkiäksesi tekoälyn järjettömiä kirjaimia ja sekoittamalla oikean tekstin.

Hyvä uutinen on, että monet tekoälykuvageneraattorit ovat ilmaisia, ja tilausmallit ovat suhteellisen edullisia. Nämä jatkuvat ongelmat voitaisiin ratkaista vuoden sisällä, jolloin voit käyttää tekoälyä valmiina taideteoksena tai valokuvan tilalle.

Toimittajien suositukset

  • Midjourneyn uudesta zoomausominaisuudesta on tulossa seuraava suuri tekoälysensaatio
  • Päivitetty Bing Chat hyppää ChatGPT: hen kuudella tärkeällä uudella tavalla
  • Tämä viraalinen AI-kuva hämäsi maailmaa, ja olet ehkä jo nähnyt sen
  • Grammarlyn uusi ChatGPT: n kaltainen tekoälygeneraattori voi tehdä paljon enemmän kuin oikolukea kirjoituksesi
  • Olen nähnyt tekoälyn verkkohaun (kaukaisen) tulevaisuuden – täällä se on hämmästyttävää ja missä se kamppailee

Päivitä elämäntapasiDigital Trends auttaa lukijoita pysymään tekniikan nopeatempoisessa maailmassa uusimpien uutisten, hauskojen tuotearvostelujen, oivaltavien toimitusten ja ainutlaatuisten kurkistusten avulla.