A mesterséges intelligencia legújabb fejlesztése egy olyan eszköz, amely lehetővé teszi a már generált kép szerkesztését az Ön igényei szerint.
Tegyük fel, hogy egy egyszerű kattintással és húzással meg akarta változtatni egy autó méreteit, vagy egy mosolyt szemöldökráncolttá akart alakítani, ezt megteheti ezzel a DragGAN nevű modellel.
Drag Your GAN: Interactive Point-based Manipulation on the Generative Image Manifold
papír oldal: https://t.co/Gjcm1smqflpic.twitter.com/XHQIiMdYOA
– AK (@_akhaliq) 2023. május 19
A Generatív Adversarial Network (GAN) jelenleg kutatási cikk formájában zajlik, azonban olyan figyelmet kapott a demóinak megtekintése iránt érdeklődők körében, hogy kutatócsoport honlapja balesetet szenvedett a nagy forgalom miatt.
Ajánlott videók
A perem összehasonlította a DragGAN-t a Photoshop Warp eszközével, hozzátéve, hogy azóta sokkal erősebb nem „ütögeti a pixeleket”, hanem „újragenerálja a mögöttes objektumot”, és még a 3D-t is el tudja forgatni képeket.
Az ilyen eszközben rejlő lehetőségek abban rejlenek, hogy a szöveg-kép generatív AI nem mindig azt adja ki, amit szeretne. Így később visszatérhet, és szerkesztheti a meglévő képet, ahelyett, hogy automatikusan új képet kellene létrehoznia.
Néhány demó, amely a kutatás részét képezi, magában foglalja a hegy magasságának hozzáadását, a modell helyzetének megváltoztatását és ruhái hosszának és formájának szerkesztése, az oroszlán szájának kinyitása vagy bezárása, valamint a személy arcának sima kinézetűvé alakítása mosoly. A jelenleg rendelkezésre álló sok mesterséges intelligencia-eszközzel a felhasználóknak újra kell generálniuk a képet egy konkrétabb felszólítással, hogy kívánatosabb eredményt érjenek el.
A kutatócsoport közleményében megjegyezte, hogy a képek szerkesztett aspektusainak regenerálása során új részleteket lehet hozzáadni, amelyek a frissítés szempontjából előnyösek. "Megközelítésünk hallucinálhatja az elzáródott tartalmat, például az oroszlán szájában lévő fogakat, és deformálódhat a tárgy merevsége nyomán, mint egy lóláb meghajlítása."
Számos márka próbál szerkesztési lehetőségeket kínálni a generatív AI-tartalomhoz. A legtöbb azonban nem megy odáig, hogy lehetővé tegye a képek tényleges szerkesztését, hanem olyan szempontokat, mint például a képek körüli szerkesztés. Például, Microsoft Designer alkalmazás lehetővé teszi mesterséges intelligencia képek generálását szöveges promptból, és három eredmény közül kiválaszthatja kedvencét, majd elviheti a tervezőstúdióba, ahol kreativitáson és termelékenységen alapuló projektek sorát hozhatja létre, például közösségi médiás bejegyzéseket, meghívókat, digitális képeslapokat vagy grafikákat, amelyekben a kép áll a középpontban pont. Az AI által generált kép azonban nem szerkeszthető.
Mivel a DragGAN eszköz egyelőre még demó, nem lehet tudni, milyen minőségű egy könnyen elérhető technológia lenne, vagy ha egyáltalán lehetséges lenne, főleg, hogy a demók alacsony felbontáson alapulnak videókat. Azonban ez egy érdekes példa arra, hogy az AI milyen gyorsan fejlődik tovább.
Szerkesztői ajánlások
- A legjobb AI videószerkesztő eszközök
- Ezek a zseniális ötletek segíthetnek abban, hogy az AI egy kicsit kevésbé legyen gonosz
- Ez a két új ChatGPT funkció mindent megváltoztat
- 5 dolog, amivel az AI képgenerátorok még mindig küzdenek
- A mesterséges intelligencia mintegy 7800 álláshelyet cserélhet le az IBM-nél a munkaerő-felvételi szünet részeként
Frissítse életmódjátA Digital Trends segítségével az olvasók nyomon követhetik a technológia rohanó világát a legfrissebb hírekkel, szórakoztató termékismertetőkkel, éleslátó szerkesztőségekkel és egyedülálló betekintésekkel.