Naujausia dirbtinio intelekto plėtra yra įrankis, leidžiantis redaguoti jau sukurtą vaizdą pagal savo specifikacijas.
Tarkime, kad norite „pakeisti automobilio matmenis arba manipuliuoti šypsena susiraukusiu paprastu paspaudimu ir vilkimu“, galite tai padaryti naudodami šį modelį, pavadintą DragGAN.
Vilkite savo GAN: interaktyvus taškais pagrįstas manipuliavimas generuojamojo vaizdo kolektorius
popierinis puslapis: https://t.co/Gjcm1smqflpic.twitter.com/XHQIiMdYOA
– AK (@_akhaliq) 2023 m. gegužės 19 d
„Generative Adversarial Network“ (GAN) šiuo metu yra mokslinio darbo forma, tačiau jis sulaukė tokio dėmesio iš tų, kurie nori peržiūrėti jo demonstracines versijas, kad tyrimo grupės pagrindiniame puslapyje patyrė avariją dėl intensyvaus eismo.
Rekomenduojami vaizdo įrašai
The Verge palygino „DragGAN“ su „Warp“ įrankiu „Photoshop“ ir pridūrė, kad jis yra daug galingesnis „nesmulkina pikselių“, o „iš naujo generuoja pagrindinį objektą“ ir netgi gali pasukti 3D vaizdai.
Tokio įrankio potencialas slypi tame, kad teksto į vaizdą generuojantis AI ne visada išveda tai, ko galbūt norėsite. Taigi galite vėliau grįžti ir redaguoti esamą vaizdą, o ne automatiškai generuoti naują vaizdą.
Kai kurios demonstracinės versijos, kurios yra tyrimo darbo dalis, apima kalno aukščio pridėjimą, modelio padėties keitimą ir redaguoti savo drabužių ilgį ir formą, atidaryti arba uždaryti liūto burną ir pakeisti žmogaus veidą iš paprasto į šypsokis. Turėdami daug šiuo metu turimų AI įrankių, vartotojai turi atkurti vaizdą su konkretesniu raginimu, kad gautų labiau pageidaujamą rezultatą.
Tyrimo grupė savo darbe pažymėjo, kad atkuriant redaguotus vaizdų aspektus, kurie yra naudingi atnaujinimui, galima pridėti naujų detalių. „Mūsų požiūris gali haliucinuoti užsikimšusią turinį, pavyzdžiui, dantis liūto burnoje, ir deformuotis dėl objekto standumo, kaip arklio kojos lenkimas.
Yra daug prekių ženklų, kurie bando pasiūlyti generatyvaus AI turinio redagavimo parinktis. Tačiau dauguma jų nesiima tiek, kiek leidžia faktiškai redaguoti vaizdus, o tokius aspektus kaip vaizdų redagavimas. Pavyzdžiui, „Microsoft“ dizainerio programa leidžia generuoti dirbtinio intelekto vaizdus iš teksto raginimo, o iš trijų rezultatų galite pasirinkti mėgstamiausią, tada nunešti į dizaino studiją, kur galite kurkite daugybę kūrybiškumu ir produktyvumu pagrįstų projektų, pvz., socialinių tinklų įrašus, kvietimus, skaitmeninius atvirukus ar grafiką su vaizdu kaip pagrindiniu tašką. Tačiau negalite redaguoti dirbtinio intelekto sukurto vaizdo.
Kol DragGAN įrankis vis dar yra demonstracinis, negalima pasakyti, kokia yra lengvai prieinamo įrankio kokybė technologija būtų, ar net būtų įmanoma, juolab kad demonstracinės versijos yra pagrįstos maža raiška vaizdo įrašus. Tačiau tai įdomus pavyzdys, kaip greitai AI toliau vystosi.
Redaktorių rekomendacijos
- Geriausi AI vaizdo redagavimo įrankiai
- Šios išradingos idėjos gali padėti AI padaryti mažiau blogą
- Šios 2 naujos „ChatGPT“ funkcijos viską pakeis
- 5 dalykai, su kuriais AI vaizdo generatoriai vis dar kovoja
- Dirbtinis intelektas galėtų pakeisti apie 7 800 darbo vietų IBM, kaip įdarbinimo pauzės dalį
Atnaujinkite savo gyvenimo būdąSkaitmeninės tendencijos padeda skaitytojams stebėti sparčiai besivystantį technologijų pasaulį – pateikiamos visos naujausios naujienos, smagios produktų apžvalgos, įžvalgūs vedamieji leidiniai ir unikalūs žvilgsniai.