De nieuwste ontwikkeling op het gebied van kunstmatige intelligentie is een tool waarmee u een reeds gegenereerde afbeelding kunt bewerken volgens uw specificaties.
Stel dat u "de afmetingen van een auto wilt veranderen of een glimlach wilt veranderen in een frons met een simpele klik en sleep", dan zou dat kunnen met dit model genaamd DragGAN.
Sleep uw GAN: interactieve op punten gebaseerde manipulatie op de generatieve beeldverdeelinrichting
papieren pagina: https://t.co/Gjcm1smqflpic.twitter.com/XHQIiMdYOA
— AK (@_akhaliq) 19 mei 2023
Het Generative Adversarial Network (GAN) is momenteel in de vorm van een onderzoekspaper, maar het heeft zoveel aandacht gekregen van degenen die geïnteresseerd zijn in het bekijken van de demo's dat de homepage van het onderzoeksteam crashte door het drukke verkeer.
Aanbevolen video's
De rand vergeleek DragGAN met de Warp-tool in Photoshop, eraan toevoegend dat het sindsdien veel krachtiger is niet "pixels rondsmijten", maar eerder "het onderliggende object opnieuw genereren" en zelfs 3D roteren afbeeldingen.
Het potentieel van zo'n tool ligt in het feit dat text-to-image generatieve AI niet altijd uitvoert wat je zou willen. U kunt dus achteraf teruggaan en bewerkingen uitvoeren aan een bestaande afbeelding, in plaats van automatisch een nieuwe afbeelding te moeten genereren.
Sommige demo's die deel uitmaken van het onderzoeksdocument zijn onder meer het toevoegen van hoogte aan een berg, het veranderen van de positionering van een model en het bewerken van de lengte en vorm van haar kleding, het openen of sluiten van een leeuwenbek, en het veranderen van iemands gezicht van een gewone blik in een glimlach. Met veel AI-tools die momenteel beschikbaar zijn, moeten gebruikers een afbeelding opnieuw genereren met een specifiekere prompt om een wenselijker resultaat te krijgen.
Het onderzoeksteam merkte in zijn paper op dat nieuwe details kunnen worden toegevoegd binnen de regeneratie van de bewerkte aspecten van afbeeldingen die gunstig zijn voor de update. "Onze benadering kan verstopte inhoud hallucineren, zoals de tanden in de bek van een leeuw, en kan vervormen als gevolg van de stijfheid van het object, zoals het buigen van een paardenbeen."
Er zijn veel merken die bewerkingsopties voor generatieve AI-inhoud proberen aan te bieden. De meeste gaan echter niet zo ver dat het daadwerkelijk bewerken van afbeeldingen mogelijk is, maar eerder aspecten zoals het bewerken rond afbeeldingen. Bijvoorbeeld, De Designer-app van Microsoft stelt u in staat om AI-afbeeldingen te genereren op basis van een tekstprompt, en u kunt uw favoriet selecteren uit drie resultaten en deze vervolgens naar de ontwerpstudio brengen waar u kunt maak een groot aantal op creativiteit en productiviteit gebaseerde projecten, zoals berichten op sociale media, uitnodigingen, digitale ansichtkaarten of afbeeldingen met de afbeelding als middelpunt punt. U kunt de door AI gegenereerde afbeelding echter niet bewerken.
Nu de DragGAN-tool voorlopig nog een demo is, is het niet te zeggen wat de kwaliteit is van een direct beschikbare tool technologie zou zijn, of als het zelfs maar mogelijk zou zijn, vooral omdat de demo's gebaseerd zijn op lage resolutie videos. Het is echter een interessant voorbeeld van hoe snel AI zich blijft ontwikkelen.
Aanbevelingen van de redactie
- De beste AI-videobewerkingstools
- Deze ingenieuze ideeën zouden kunnen helpen om AI iets minder kwaadaardig te maken
- Deze 2 nieuwe ChatGPT-functies gaan alles veranderen
- 5 dingen waar AI-beeldgeneratoren nog steeds mee worstelen
- AI zou ongeveer 7.800 banen bij IBM kunnen vervangen als onderdeel van een aanwervingspauze
Upgrade je levensstijlDigital Trends helpt lezers de snelle wereld van technologie in de gaten te houden met het laatste nieuws, leuke productrecensies, verhelderende hoofdartikelen en unieke sneak peeks.