Klicka och dra AI-bildredigering kan förändra allt

click fraud protection

Den senaste utvecklingen inom artificiell intelligens är ett verktyg som låter dig redigera en redan genererad bild enligt dina specifikationer.

Säg att du ville "ändra dimensionerna på en bil eller manipulera ett leende till en rynka pannan med ett enkelt klick och dra", du kan göra det med den här modellen som kallas DragGAN.

Dra din GAN: Interactive Point-based Manipulation på Generative Image Manifold

papperssida: https://t.co/Gjcm1smqflpic.twitter.com/XHQIiMdYOA

— AK (@_akhaliq) 19 maj 2023

The Generative Adversarial Network (GAN) är för närvarande i form av en forskningsartikel, men den har fått sådan uppmärksamhet från dem som är intresserade av att se dess demos att forskargruppens hemsida har råkat ut för krock på grund av den tunga trafiken.

Rekommenderade videor

Gränsen jämförde DragGAN med Warp-verktyget i Photoshop och tillade att det är mycket kraftfullare sedan det "smushar inte runt pixlar" utan "återskapar det underliggande objektet" och kan till och med rotera 3D bilder.

Potentialen med ett sådant verktyg ligger i det faktum att text-till-bild generativ AI inte alltid producerar det du kanske vill ha. Så du kan gå tillbaka in efteråt och göra ändringar i en befintlig bild, istället för att automatiskt behöva generera en ny bild.

Några demos som är en del av forskningsrapporten inkluderar att lägga till höjd till ett berg, ändra placeringen av en modell och redigera längden och formen på hennes kläder, öppna eller stänga ett lejons mun och ändra en persons ansikte från en vanlig blick till en leende. Med många AI-verktyg som för närvarande är tillgängliga, måste användare återskapa en bild med en mer specifik uppmaning för att få ett mer önskvärt resultat.

Forskargruppen noterade i sin uppsats att nya detaljer kan läggas till i regenereringen av de redigerade aspekterna av bilder som är fördelaktiga för uppdateringen. "Vårt tillvägagångssätt kan hallucinera tilltäppt innehåll, som tänderna inuti ett lejons mun, och kan deformeras efter föremålets stelhet, som böjning av ett hästben."

Det finns många märken som försöker erbjuda redigeringsalternativ för generativt AI-innehåll. De flesta går dock inte så långt som att tillåta själva redigeringen av bilder, utan snarare för aspekter som att redigera runt bilder. Till exempel, Microsofts Designer-app låter dig generera AI-bilder från en textuppmaning, och du kan välja din favorit bland tre resultat och sedan ta den till designstudion där du kan skapa en mängd kreativitet och produktivitetsbaserade projekt, såsom inlägg på sociala medier, inbjudningar, digitala vykort eller grafik med bilden som fokus punkt. Du kan dock inte redigera den AI-genererade bilden.

Med DragGAN-verktyget som fortfarande är en demo för tillfället, finns det inget att säga vad kvaliteten på en lättillgänglig teknik skulle vara, eller om det ens skulle vara möjligt, särskilt eftersom demos är baserade på lågupplösning videoklipp. Det är dock ett intressant exempel på hur snabbt AI fortsätter att utvecklas.

Redaktörens rekommendationer

  • De bästa AI-videoredigeringsverktygen
  • Dessa geniala idéer kan hjälpa till att göra AI lite mindre ond
  • Dessa 2 nya ChatGPT-funktioner är på väg att förändra allt
  • 5 saker AI-bildgeneratorer fortfarande kämpar med
  • AI skulle kunna ersätta cirka 7 800 jobb hos IBM som en del av en anställningspaus

Uppgradera din livsstilDigitala trender hjälper läsare att hålla koll på den snabba teknikvärlden med alla de senaste nyheterna, roliga produktrecensioner, insiktsfulla redaktioner och unika smygtittar.