Ten bot odtwarzający obrazki to ogromny kamień milowy w rozwoju sztucznej inteligencji.

Podobnie jak nowe umiejętności Alexa w Amazon Echo, w ciągu ostatnich kilku dekad sztuczna inteligencja stopniowo zdobywaj zdolność do pokonania człowieczeństwa w coraz większej liczbie naszych ukochanych gier: Szachy z Deep Blue w 1997 roku, Niebezpieczeństwo z IBM Watson w 2011 roku, Gry Atari z DeepMind w 2013 roku, Iść z AlphaGo w 2016 r, i tak dalej. Przynajmniej dla ogółu społeczeństwa każdy przypadek zamienia abstrakcyjną ścieżkę postępu obliczeniowego w sport widowiskowy. Skynet staje się mądrzejszy. Skąd wiemy? Ponieważ sprawdź rosnącą liczbę rozrywek, w których może nas przekonująco pokonać.

Zawartość

  • Budowanie mistrza Pictionary
  • Więcej niż na pierwszy rzut oka

W tym kontekście nie jest zbyt szokujące, gdy usłyszymy, że A.I. może teraz występować zniewalająco dobrze na Obrazkowy, inspirowana szaradami gra w odgadywanie słów, w której jedna osoba musi narysować obrazek, a druga stara się jak najszybciej odgadnąć, co naszkicowała.

Polecane filmy

Właśnie to przeprowadzili niedawno naukowcy z brytyjskiego Uniwersytetu Surrey, tworząc Pixelor, „konkurencyjne narzędzie do szkicowania oparte na sztucznej inteligencji”. agent." Biorąc pod uwagę wizualizację koncepcji Pixelor jest w stanie narysować szkic, który jest rozpoznawalny (zarówno przez ludzi, jak i maszyny) jako zamierzony obiekt równie szybko — lub nawet szybciej — niż człowiek konkurent.

Powiązany

  • Jak Nintendo mogłoby wykorzystać sztuczną inteligencję aby przenieść gry 4K na Switch Pro
  • Dyrektor Yakuzy uważa, że ​​ewolucja PS5 skupi się na sztucznej inteligencji. i uczenie maszynowe

„Nasza sztuczna inteligencja agent jest w stanie wyrenderować szkic od zera”, Piosenka Yi-Zhe, czytelnik książki Computer Vision and Machine Learning w Center for Vision Speech and Signal Processing na Uniwersytecie w Surrey, powiedział Digital Trends. „Daj mu słowo takie jak „twarz”, a będzie wiedział, co narysować. … Za każdym razem narysuje innego kota, innego psa, inną twarz. Ale zawsze ze świadomością, jak wygrać grę Pictionary.

Budowanie mistrza Pictionary

Możliwość zredukowania złożonego obrazu świata rzeczywistego do szkicu sama w sobie jest imponująca. Trzeba pewnego poziomu abstrakcji, aby spojrzeć na ludzką twarz i zobaczyć ją jako owal z dwoma mniejszymi owalami zamiast oczu, linią nosa i półkolem ust. U dzieci umiejętność postrzegania obrazu w ten sposób świadczy między innymi o rozwijającym się poznawczym rozumieniu pojęć.

Jednakże, podobnie jak w przypadku wielu aspektów sztucznej inteligencji, często podsumowywanych jako Paradoks Moraveca że „trudne problemy są łatwe, a łatwe problemy są trudne”, jest to duże wyzwanie dla maszyny inteligencja — mimo że dla większości dwulatków jest to podstawowa, niczym nie rzucająca się w oczy umiejętność dzieci.

Laboratorium SketchX

Nie jest to jednak wyzwanie nie do rozwiązania. W 2016 r, pisaliśmy o pracy Songa z narzędziem o nazwie Sketch, głęboko uczącą się siecią neuronową, która potrafiła rozpoznawać ręcznie rysowane szkice i wykorzystywać je do wyszukiwania rzeczywistych produktów. Tę konkretną sieć przeszkolono przy użyciu zbioru danych składającego się z około 30 000 porównań szkiców i zdjęć, co umożliwiło jej rozpoznanie sposobu, w jaki rzeczywiste obiekty są przedstawiane na rysunkach ręcznych. Pixelor robi coś podobnego, ale może również generować własne rysunki, zamiast tylko rozpoznawać rysunki innych osób.

Ale to nie wystarczy, aby wygrać Obrazkowy. Obrazkowy to gra wymagająca czasu, w której celem nie jest tylko narysowanie, powiedzmy, kota, ale narysowanie kota jak najmniejszą liczbą pociągnięć. Mógłbyś być największym artystą na świecie, ale jeśli narysowanie idealnego kota zajmie ci 12 godzin, jesteś okropnym Obrazkowy gracz.

Oznaczało to zbudowanie AI. które mogłyby badać ludzi, aby zobaczyć, jakich strategii używają, aby dobrze grać w Pictionary. Jak powiedział Song: „Jakie są najważniejsze elementy do narysowania, aby inni sędziowie mogli zgadywać? Chcemy, aby nasz rysunek został odgadnięty jak najwcześniej.”

Aby to zrobić, badacze skorzystali z QuickDraw, największego dostępnego dotychczas zbioru danych szkiców ludzkich. Następnie zbudowali algorytm sortowania neuronowego, który ustala kolejność pociągnięć, jakie artysta musi wykonać; dając zgadliwą reprezentację obiektu w jak najmniejszej liczbie linii. Oznacza to podzielenie szkiców na pociągnięcia, następnie przetasowanie kolejności tych pociągnięć i testowanie wyników, aż ustalą dokładną kolejność, w jakiej należy je ułożyć na papierze.

Na przykład artysta może zacząć rysować kota, szkicując okrągły zarys jego głowy. Ale okrąg może oznaczać dowolną liczbę rzeczy, nawet jeśli wiesz, że ma reprezentować głowę. Jeśli jednak narysujesz dwa spiczaste uszy lub dwa zestawy wąsów, liczba potencjalnych rzeczy, które możesz narysować, zmniejszy się bardzo, bardzo szybko. Informacje te są następnie wykorzystywane do instruowania agenta szkicującego.

Song powiedział, że zespół może opublikować wersję tego utworu dostępną publicznie Obrazkowy-granie na bocie, aby gracze mogli na własną rękę pokonać szkicującą sztuczną inteligencję. gospodarz. (Kto wie? Zabawa w eksperta może nawet pomóc w ulepszeniu własnego Obrazkowy gra.)

Więcej niż na pierwszy rzut oka

Jednak Pixelor to coś więcej niż tylko kolejny trywialny bot do grania. Podobnie jak system komputerowy ma zarówno interfejs na poziomie powierzchni, z którym współdziałamy, jak i ukryty kod zaplecza, tak samo każda większa sztuczna inteligencja. kamienie milowe w grach mają ukryty motyw. Laboratoria badawcze nie spędzają niezliczonych osobogodzin na budowaniu, chyba że zajmują się bezpośrednio tworzeniem gier komputerowych grająca w gry AI agentów, żeby dodać kolejny wpis na dużej liście rzeczy, w których ludzie nie są już najlepsi Na. Celem jest zawsze rozwinięcie jakiejś zasadniczej części sztucznej inteligencji. rozwiązywanie problemów.

W przypadku Pixelora ukrytym celem jest stworzenie maszyn, które będą w stanie lepiej zrozumieć, co jest ważne dla człowieka w danej scenie. Kiedy patrzymy na zdjęcie, od razu jesteśmy w stanie rozpoznać najważniejsze szczegóły.

Załóżmy, że wracasz z pracy do domu. Choć drzewa rosnące wzdłuż drogi mogą być malownicze, a billboard promujący nowy film może być interesujący, żadne z nich nie jest tak ważne jak twarz i język ciała osoby, która może, ale nie musi, mieć zamiar wyjść przed siebie Ty. Zanim w ogóle świadomie przetworzysz informacje, Twój mózg wyodrębnia najważniejsze szczegóły. Jak nauczyć komputer, aby mógł to robić? Okazuje się, że świetnym sposobem na to jest sprawdzenie, jak ludzie podczas szkicowania nadają priorytet najważniejszym, rozpoznawalnym szczegółom obrazu.

„W samych zdjęciach nie ma ludzkiej wiedzy” – stwierdził Song. „Chcemy danych ludzkich, które mogą dać nam sygnały dotyczące tego, jak ludzie rozumieją obiekt”.

Jak zauważono, dobrze Obrazkowy Gracz, podobnie jak dobry bokser, będzie wiedział, jakie absolutne minimum musi zrobić, aby osiągnąć określony cel. Na tym w sensie makro zależy Yi-Zhe Songowi i jego współpracownikom. Nie jest to nic tak trywialnego, jak uruchomienie komputera do grania; chodzi o to, aby komputer zrozumiał, co jest ważne w niektórych scenach – i, miejmy nadzieję, mógł lepiej uogólniać.

Jak wszystko od samochody autonomiczne stosowania robotów w miejscu pracy staje się coraz bardziej powszechne, jest to istotne zadanie do rozwiązania.

Artykuł opisujący prace zostanie zaprezentowany na listopadowej konferencji SIGGRAPH Asia 2020.

Zalecenia redaktorów

  • Voyage to sztuczna inteligencja raj dla graczy, w którym boty piszą zasady
  • Szachy. Niebezpieczeństwo. Iść. Dlaczego używamy gier jako punktu odniesienia dla sztucznej inteligencji?
  • sztuczna inteligencja projektuje gry wideo w stylu retro — i są one zaskakująco dobre