Najnowszym osiągnięciem w dziedzinie sztucznej inteligencji jest narzędzie, które pozwala edytować już wygenerowany obraz zgodnie z Twoimi specyfikacjami.
Załóżmy, że chcesz „zmienić wymiary samochodu lub zmanipulować uśmiech w zmarszczkę za pomocą jednego kliknięcia i przeciągnięcia”, możesz to zrobić za pomocą tego modelu o nazwie DragGAN.
Przeciągnij swój GAN: interaktywna manipulacja punktowa na generatywnym kolektorze obrazów
strona papierowa: https://t.co/Gjcm1smqflpic.twitter.com/XHQIiMdYOA
— AK (@_akhaliq) 19 maja 2023 r
Generative Adversarial Network (GAN) jest obecnie w formie artykułu badawczego, jednak zyskała taką uwagę osób zainteresowanych obejrzeniem jej wersji demonstracyjnych, że strona internetowa zespołu badawczego doświadczył awarii z powodu dużego natężenia ruchu.
Polecane filmy
Krawędź porównał DragGAN z narzędziem Warp w Photoshopie, dodając, że od tego czasu jest znacznie potężniejsze nie „rozbija pikseli dookoła”, ale raczej „ponownie generuje obiekt leżący pod spodem”, a nawet może obracać 3D obrazy.
Potencjał takiego narzędzia polega na tym, że generatywna sztuczna inteligencja przekształcająca tekst na obraz nie zawsze generuje to, czego byśmy chcieli. Możesz więc wrócić później i wprowadzić zmiany w istniejącym obrazie, zamiast automatycznie generować nowy obraz.
Niektóre demonstracje, które są częścią artykułu badawczego, obejmują dodawanie wysokości do góry, zmianę pozycji modelu i edytowanie długości i kształtu jej ubrania, otwieranie lub zamykanie paszczy lwa i zmienianie twarzy osoby ze zwykłego wyglądu na uśmiech. Przy wielu obecnie dostępnych narzędziach sztucznej inteligencji użytkownicy muszą ponownie wygenerować obraz z bardziej szczegółowym monitem, aby uzyskać bardziej pożądany rezultat.
Zespół badawczy zauważył w swoim artykule, że nowe szczegóły mogą być dodawane w ramach regeneracji edytowanych aspektów obrazów, które są korzystne dla aktualizacji. „Nasze podejście może powodować halucynacje zasłoniętych treści, takich jak zęby w paszczy lwa, i może odkształcać się pod wpływem sztywności obiektu, jak zginanie nogi konia”.
Istnieje wiele marek, które próbują oferować opcje edycji generatywnych treści AI. Jednak większość z nich nie pozwala na rzeczywistą edycję obrazów, ale raczej na takie aspekty, jak edycja wokół obrazów. Na przykład, Aplikacja Designer firmy Microsoft pozwala generować obrazy AI z monitu tekstowego i możesz wybrać swój ulubiony z trzech wyników, a następnie zabrać go do studia projektowego, gdzie możesz tworzyć wiele projektów opartych na kreatywności i produktywności, takich jak posty w mediach społecznościowych, zaproszenia, pocztówki cyfrowe lub grafiki, których głównym elementem jest obraz punkt. Nie można jednak edytować obrazu wygenerowanego przez sztuczną inteligencję.
Ponieważ narzędzie DragGAN wciąż jest na razie wersją demonstracyjną, nie wiadomo, jaka jest jakość łatwo dostępnego narzędzia technologia byłaby, czy w ogóle byłaby możliwa, zwłaszcza że dema bazują na niskiej rozdzielczości wideo. Jest to jednak ciekawy przykład tego, jak szybko rozwija się sztuczna inteligencja.
Zalecenia redaktorów
- Najlepsze narzędzia do edycji wideo AI
- Te genialne pomysły mogą sprawić, że sztuczna inteligencja będzie trochę mniej zła
- Te 2 nowe funkcje ChatGPT zmienią wszystko
- 5 rzeczy, z którymi wciąż borykają się generatory obrazów AI
- Sztuczna inteligencja może zastąpić około 7800 miejsc pracy w IBM w ramach przerwy w zatrudnieniu
Ulepsz swój styl życiaTrendy cyfrowe pomagają czytelnikom śledzić szybko zmieniający się świat technologii dzięki najnowszym wiadomościom, zabawnym recenzjom produktów, wnikliwym artykułom redakcyjnym i jedynym w swoim rodzaju zapowiedziom.