Ta sztuczna inteligencja przypomina wyszukiwarkę grafiki Google w poszukiwaniu wyimaginowanych obrazów

Wieczność
Wielki Sen

Jeśli się zastanawiasz, powyższy obrazek to „skomplikowany rysunek wieczności”. Ale to nie jest dzieło ludzkiego artysty; to stworzenie BigSleep, najnowszego niesamowitego przykładu generatywnego sztuczna inteligencja (AI) w akcji.

Zawartość

  • Jak działa BigSleep
  • Sztuczna inteligencja generująca obraz

Trochę jak wersja wizualna sztuczna inteligencja generująca tekst model GPT-3, BigSleep jest w stanie przyjąć dowolny komunikat tekstowy i wizualizować obraz pasujący do słów. Może to być coś ezoterycznego, jak wieczność, może to być miska wiśni lub piękny dom (to drugie z co można zobaczyć poniżej). Pomyśl o tym jak o wyszukiwaniu w Grafice Google — tylko w przypadku zdjęć, których nigdy wcześniej nie było istniał.

Polecane filmy

Jak działa BigSleep

„Na wysokim poziomie BigSleep działa poprzez połączenie dwóch sieci neuronowych: BigGAN i CLIP” Ryana Murdocka, 23-letni twórca BigSleep, student neurologii poznawczej na Uniwersytecie Utah, powiedział Digital Trends.

Pierwszy z nich, BigGAN

, to system stworzony przez Google, który pobiera losowy szum i generuje obrazy. BigGAN to generatywna sieć przeciwna: para pojedynkujących się sieci neuronowych, które wykonują określone zadania Murdock nazywa „kontradykcyjnym przeciąganiem liny” pomiędzy siecią generującą obrazy a podmiotem dyskryminującym sieć. Z biegiem czasu interakcja między generatorem a dyskryminatorem skutkuje ulepszeniami obu sieci neuronowych.

Piękny dom
Według BigSleep „piękny dom”. To nie jest złe.Wielki Sen

SPINACZTymczasem jest to sieć neuronowa stworzona przez OpenAI, która została nauczona dopasowywania obrazów i opisów. Podaj tekst i obrazy CLIP, a program spróbuje ustalić, jak dobrze pasują i przyzna im odpowiednią ocenę.

Łącząc te dwa elementy, Murdock wyjaśnił, że BigSleep przeszukuje dane wyjściowe BigGAN w poszukiwaniu obrazów, które maksymalizują punktację CLIP. Następnie powoli dostosowuje sygnał wejściowy szumu w generatorze BigGAN, aż CLIP powie, że utworzone obrazy odpowiadają opisowi. Generowanie obrazu pasującego do monitu zajmuje łącznie około trzech minut.

„BigSleep jest znaczący, ponieważ może dość dobrze generować szeroką gamę koncepcji i obiektów w rozdzielczości 512 x 512 pikseli” – powiedział Murdock. „Poprzednie prace przyniosły imponujące rezultaty, ale według mojej wiedzy większość z nich ograniczała się do obrazów o niższej rozdzielczości i większej liczby przedmiotów codziennego użytku”.

Sztuczna inteligencja generująca obraz

BigSleep nie jest pierwszym przypadkiem, w którym sztuczna inteligencja został wykorzystany do generowania obrazów. Jego nazwa przypomina Głęboki Sen, sztuczna inteligencja stworzony przez inżyniera Google Alexa Mordvintseva, który tworzy psychodeliczne obrazy przy użyciu modeli klasyfikacyjnych. Do stworzenia wykorzystano także system oparty na GAN sztuczna inteligencja obraz sprzedany na aukcji w 2018 r. za ogromną kwotę 432 500 dolarów. Jednak z pewnością jest to fascynujący krok naprzód.

Aby samemu wypróbować BigSleep, Murdock zasugerował sprawdzenie jego Notatnik Google Colab odnośnie projektu. Korzystanie z graficznego interfejsu użytkownika Colab i wykonanie kilku innych kroków wymaga trochę nauki, ale można poćwiczyć. Inne sposoby testowania prawdopodobnie pojawią się również w nadchodzących tygodniach. Jeśli jesteś zainteresowany, możesz również odwiedzić r/MediaSynteza, gdzie użytkownicy publikują jedne z najlepszych zdjęć, jakie do tej pory wygenerowali w systemie.

Zalecenia redaktorów

  • Czy sztuczna inteligencja pokonać inżynierów w projektowaniu mikroczipów? Google tak uważa
  • Inteligentna nowa sztuczna inteligencja system obiecuje wyszkolić Twojego psa, gdy będziesz poza domem
  • Kolejne duże wyzwanie AI? Gram w kwantową wersję Go
  • Protetyka niewymagająca praktyki: najnowsze przełomy w bionice
  • sztuczna inteligencja Narzędzie do tłumaczenia rzuca światło na tajny język myszy

Ulepsz swój styl życiaDigital Trends pomaga czytelnikom śledzić szybko rozwijający się świat technologii dzięki najnowszym wiadomościom, zabawnym recenzjom produktów, wnikliwym artykułom redakcyjnym i jedynym w swoim rodzaju zajawkom.