5 dalykai, su kuriais AI vaizdo generatoriai vis dar kovoja

AI vaizdo generatoriai mėgsta Dall-E, Stabili difuzija, Vidurinė kelionė, ir Bing vaizdo kūrėjas duoda nuostabių rezultatų, tačiau kartais jie gali būti neįtikėtinai varginantys. Naudodamas paprastus raginimus, kuriuose yra vos keli žodžiai, AI gali išvesti įspūdingus vaizdus, ​​​​kurie atrodo kaip profesionalios nuotraukos ir įtikinantis įvairių stilių menas. Tačiau tas pats raginimas retkarčiais sukurs kokį nors siaubingą padarą arba linksmai klaidingą atvaizdavimą.

Turinys

  • Rankų salotos ir pirštų kamuoliukai
  • Nerimą keliantis tekstas ir rašymas
  • Akys to neturi
  • Varginantys įrankiai
  • Košmariški dantys
  • AI menas sparčiai tobulėja

Neigiami raginimai gali padėti sumažinti šių klaidų tikimybę, tačiau sudėtingumas ne visada gali jus išgelbėti. Net dirbtinio intelekto ekspertai kovoja su neformaliais padarais ir nesvietiškomis scenomis, todėl jiems reikia ilgų valandų tikslinti raginimus arba taisyti vaizdus naudojant tradicinę nuotraukų redagavimo priemonę. Kol kas, jei atidžiai pažvelgsite į tinkamas vaizdo sritis, yra didelė tikimybė, kad galėsite nustatyti, ar jį padarė mašina.

Rekomenduojami vaizdo įrašai

Rankų salotos ir pirštų kamuoliukai

Dirbtinio intelekto kūrėjai padarė pažangą, siekdami išmokyti dirbtinio intelekto įrankius, kaip turėtų atrodyti žmogaus rankos, tačiau yra daug galimybių tobulėti. Jei pirštai nėra aiškiai matomi, nesunku nepastebėti klaidų, tačiau tai yra nuolatinė problema.

Susijęs

  • „Stable Diffusion“ siekiama išspręsti problemą generuojant pirštus
  • Pasirodė dirbtinio intelekto sukurti vaizdo įrašai ir jie sparčiai tobulėja
  • Bing Image Creator pateikia DALL-E AI sukurtus vaizdus į jūsų naršyklę
Dall-E buvo ankstyvas AI lyderis, tačiau rankos nėra jo dalykas.
Dall-E buvo ankstyvas AI lyderis, tačiau rankos nėra jo dalykas.Dall-E paskatino Alanas Truly

Vienas iš pirmųjų ir geriausių AI vaizdo generatorių, prieinamų visuomenei, OpenAI Dall-E, sukūrė šias rankomis susikibusių žmonių nuotraukas. Iš pirmo žvilgsnio tai gali atrodyti gerai. Atidžiau pažvelgus, paaiškėja kai kurios problemos. Saugokitės papildomų pirštų, keistų nagų ir sujungtų skaitmenų.

Sudėtingos rankenos ir susipynę pirštai yra dar sudėtingesni. Nenustebkite, jei jūsų AI vaizdai sugrįš su klasikiniais trūkumais, vadinamais „rankų salotomis“ arba „pirštų kamuoliukais“.

Susipynusios Dall-E rankos kelia nerimą.
Susipynusios Dall-E rankos kelia nerimą.Dall-E paskatino Alanas Truly

Nerimą keliantis tekstas ir rašymas

Galite tikėtis, kad tekstą bus lengva sugeneruoti kompiuteriui. Kiekvieną dieną ekranuose matote žodžių įrodymus, kai paimate telefoną arba atidarote naršyklę. Ankstyvieji kompiuteriai, skirtingai nei populiariausi žaidimų kompiuteriai šiandien negalėjo rodyti jokios grafikos. Viskas buvo tekstas arba skaičiai.

Leonardo AI žino stilius, bet spausdintas tekstas yra sudėtingas.
Leonardo AI žino stilius, bet spausdintas tekstas yra sudėtingas.Leonardo AI paskatino Alanas Truly

Tačiau rodyti tikras raides ir simbolius kaip spausdintus ar rašytus žodžius yra stebėtinai sudėtinga AI vaizdo generatorius. Tai gali atrodyti kaip lengvai išsprendžiama problema, bet taip nėra. Programa negali tiesiog perdengti paprasto teksto. Kad būtų įtikinami, teksto stilius, šešėliai, kampas ir perspektyva turi atitikti likusią scenos dalį.

Pavyzdyje palyginti naujas dirbtinio intelekto vaizdų generatorius Leonardo AI įdėjo dideles pastangas su senoviniu Jack Rabbit Slim užkandinės reklaminiu skydeliu. Po kelių bandymų AI sugebėjo ištarti „Jack Rabbit's“, kuris yra gana artimas užklausai. Senovinės fotografijos stilius buvo ryškus kiekviename vaizde, tačiau raidės ir žodžiai dažniausiai buvo klaidingi.

Leonardo AI priartėjo prie to, kad tekstas būtų tinkamas viename iš šių atvaizdų.
Leonardo AI priartėjo prie to, kad tekstas būtų teisingas kairėje esančiame atvaizde.„Leonardo AI“ atvaizduoja paskatintas Alano Truly

Akys to neturi

Bing Image Creator kovoja su akimis.
„Bing Image Creator“ paragino Alanas Truly

Dažnai sakoma, kad akys yra sielos langas. Mes labai pasitikime akių kontaktu, kad tai gali būti pati svarbiausia detalė kuriant tikrovišką portretą. Tačiau daugeliui AI įrankių sunku atvaizduoti žmogaus akis.

Bing Image Creator atliko neblogą darbą su studijos fonu ir pozuodama kelių kartų šeimos nuotrauką. Tačiau beveik kiekvienas žmogus turi keistas akis, kurios atrodo tarsi ateivių įkištos, o gal šie besišypsantys žmonės virsta nežemiškais padarais.

Du artimesni Bing Image Creator akių problemų pavyzdžiai.
Du artimesni Bing Image Creator nerimą keliančių akių problemų pavyzdžiai.„Bing Image Creator“ paragino Alanas Truly

Varginantys įrankiai

Žmonės puikiai valdo įrankius, o ne tik skaitmeninę įvairovę, pvz., AI. Greitai įvaldome bet kokį mums prieinamą fizinį įrankį. Kita vertus, AI stengiasi suprasti, kas tai yra ir kaip jie naudojami.

Midjourney supranta rankas, bet glumina veržliarakčiais.
Midjourney supranta rankas, bet glumina veržliarakčiais. Ar tai lemputė apačioje kairėje?Vidurinė kelionė paskatino Alanas Truly

„Midjourney“ yra AI vaizdo generatorius, kuris daro fantastišką pažangą sprendžiant problemas, susijusias su žmonių veidais ir rankomis. Tačiau kai būsite paraginti parodyti mechaniką, priveržiantį varžtą veržliarakčiu, įrankio visiškai nėra. Prie pirštinių vienu atveju dedami nagai, kitu kažkaip atsiranda lemputė.

Žirklės yra per sudėtingos „Bing Image Creator“, atliekant šį kirpamų plaukų atvaizdavimą iš arti. Jie yra atviri tik viename paveikslėlyje ir niekada neatrodo, kad jie pjaustomi.

„Bing Image Creator“ negali suprasti žirklių.
„Bing Image Creator“ negali suprasti, kaip veikia žirklės.„Bing Image Creator“ paragino Alanas Truly

Košmariški dantys

Stabilios difuzijos šypsenos kartais turi per daug dantų.
Stabili difuzija per Leonardo AI, paskatinta Alano Truly

Kai žmonės šypsosi ir juokiasi, tai paprastai pagerina vaizdą, padaro jį malonų ir linksmą. Gavęs paprastą raginimą, pavyzdžiui, du besišypsančius ir besijuokiančius mokinius, dirbtinis intelektas gali tai paversti košmaro kuru su keliomis dantų eilėmis ir kitais keistais iškraipymais.

Leonardo AI leidžia rinktis iš kelių modelių, o kai kurie puikiai susitvarko su dantimis. Populiarieji Stabilios difuzijos 2.1 modelis Reikėjo pagalbos, kad dantys susitvarkytų. Su tam tikru neigiamu raginimu problema buvo išspręsta. Yra šių AI vaizdo problemų sprendimų, tačiau norint pasiekti gerų rezultatų, vis tiek reikia padirbėti.

Stabilios difuzijos šypsenoms naudingi neigiami raginimai.
Stabilios difuzijos šypsenoms naudingi neigiami raginimai pašalinti „keistus dantis“ ir „iškreiptą burną“.Stabili difuzija per Leonardo AI, paskatinta Alano Truly

AI menas sparčiai tobulėja

Pirmosiomis dirbtinio intelekto meno dienomis rezultatai buvo keisti ir nuostabūs, kūrė grožį ir siaubą vienodai. Su kiekvienu nauju atnaujinimu klaidos tampa vis mažiau pastebimos, o daug problemų galima įveikti patobulinus.

Su tiek daug AI įrankių, nesunku išbandyti kitą sistemą. Daugelis AI vaizdų generatorių leidžia neigiamus raginimus ar kitas parinktis koreguoti algoritmą ir gauti geresnių rezultatų.

Gali tekti atlikti kelis bandymus, kad gautumėte tinkamą vaizdą, ypač jei dėmesys sutelkiamas į veidus ar rankas. Jei norite įtraukti spausdintus ar rašytus žodžius, būkite pasirengę praleisti laiką vaizdų rengyklėje, ištrindami AI nesąmones raides ir sumaišydami teisingą tekstą.

Geros naujienos yra tai, kad daugelis AI vaizdo generatorių yra nemokami, o prenumeruojami modeliai yra palyginti nebrangūs. Per metus šios užsitęsusios problemos gali būti išspręstos, todėl dirbtinio intelekto atvaizdą galite naudoti kaip baigtą meno kūrinį arba nuotraukos pakaitalas.

Redaktorių rekomendacijos

  • Naujoji „Midjourney“ priartinimo funkcija tampa kita didele AI sensacija
  • Atnaujintas „Bing Chat“ peršoka „ChatGPT“ 6 svarbiais naujais būdais
  • Šis virusinis dirbtinio intelekto vaizdas suklaidino pasaulį ir galbūt jau matėte tai
  • Naujasis „Grammarly“ į „ChatGPT“ panašus AI generatorius gali padaryti daug daugiau, nei tik korektuoti jūsų raštą
  • Mačiau (tolimą) AI žiniatinklio paieškos ateitį – štai kur ji nuostabi ir kur jai sunku

Atnaujinkite savo gyvenimo būdąSkaitmeninės tendencijos padeda skaitytojams stebėti sparčiai besivystantį technologijų pasaulį – pateikiamos visos naujausios naujienos, smagios produktų apžvalgos, įžvalgūs vedamieji leidiniai ir unikalūs žvilgsniai.