Dieser Pictionary-Playing-Bot ist ein großer Meilenstein für die KI.

Wie bei den neuen Alexa-Skills auf Ihrem Amazon Echo gab es in den letzten Jahrzehnten KI-basierte Technologien. Erwerben Sie nach und nach die Fähigkeit, die Menschheit in immer mehr unserer geliebten Spiele zu besiegen: Schach mit Deep Blue im Jahr 1997, Gefahr mit IBM Watson im Jahr 2011, Atari-Spiele mit DeepMind im Jahr 2013, Gehen mit AlphaGo im Jahr 2016, und so weiter. Zumindest für die breite Öffentlichkeit verwandelt jeder Fall den abstrakten Weg des rechnerischen Fortschritts in einen Zuschauersport. Skynet wird intelligenter. Woher wissen wir? Denn schauen Sie sich die wachsende Zahl an Freizeitbeschäftigungen an, bei denen es uns überzeugend schlagen kann.

Inhalt

  • Erstellen eines Pictionary-Masters
  • Da steckt mehr dahinter

Vor diesem Hintergrund ist es nicht allzu schockierend zu hören, dass K.I. kann nun überzeugend gute Leistungen erbringen Bildnis, das von Scharaden inspirierte Wortratespiel, bei dem eine Person ein Bild zeichnen muss und die anderen versuchen, so schnell wie möglich herauszufinden, was sie skizziert haben.

Empfohlene Videos

Das haben Forscher der britischen University of Surrey kürzlich mit der Entwicklung von Pixelor geschafft, einer „kompetitiven Skizzier-KI“. Agent." Ein Bild gegeben Konzept ist Pixelor in der Lage, eine Skizze zu zeichnen, die (sowohl für Menschen als auch für Maschinen) genauso schnell – oder sogar schneller – als das beabsichtigte Motiv erkennbar ist als ein Mensch Wettbewerber.

Verwandt

  • Wie Nintendo K.I. nutzen könnte um 4K-Gaming auf die Switch Pro zu bringen
  • Yakuza-Direktor glaubt, dass sich die Weiterentwicklung der PS5 auf KI konzentrieren wird. und maschinelles Lernen

„Unsere K.I. Der Agent ist in der Lage, eine Skizze von Grund auf zu rendern.“ Yi-Zhe-Lied, Dozent für Computer Vision und maschinelles Lernen am Center for Vision Speech and Signal Processing der University of Surrey, sagte gegenüber Digital Trends. „Geben Sie ihm ein Wort wie ‚Gesicht‘ und es weiß, was es zeichnen soll. … Es wird jedes Mal eine andere Katze, einen anderen Hund, ein anderes Gesicht zeichnen. Aber immer mit dem Wissen, wie man das Pictionary-Spiel gewinnt.“

Erstellen eines Pictionary-Masters

Die Möglichkeit, ein komplexes Bild aus der realen Welt in eine Skizze zu reduzieren, ist an sich schon ziemlich beeindruckend. Es bedarf einer gewissen Abstraktion, um ein menschliches Gesicht als Oval mit zwei kleineren Ovalen für die Augen, einer Linie für die Nase und einem Halbkreis für den Mund zu betrachten. Bei Kindern zeigt die Fähigkeit, ein Bild auf diese Weise wahrzunehmen, unter anderem ein aufkeimendes kognitives Verständnis von Konzepten.

Wie bei vielen Aspekten der KI werden sie jedoch oft zusammengefasst als: Moravecs Paradoxon dass „die schwierigen Probleme einfach und die einfachen Probleme schwierig sind“, ist dies eine große Herausforderung für die Maschine Intelligenz – obwohl es sich bei den meisten Zweijährigen um eine grundlegende, unauffällige Fähigkeit handelt Kinder.

SketchX-Labor

Es ist jedoch keine unlösbare Herausforderung. Im Jahr 2016, schrieben wir über Songs Arbeit mit einem Tool namens Sketch, einem Deep-Learning-Neuronalen Netzwerk, das handgezeichnete Skizzen erkennen und für die Suche nach realen Produkten verwenden konnte. Dieses spezielle Netzwerk wurde anhand eines Datensatzes trainiert, der aus etwa 30.000 Skizzen-Foto-Vergleichen bestand, sodass es erkennen konnte, wie reale Objekte in Handzeichnungen dargestellt werden. Pixelor macht etwas Ähnliches, kann aber auch eigene Zeichnungen erstellen, anstatt nur die anderer Leute zu erkennen.

Aber das reicht nicht aus, um zu gewinnen Bildnis. Bildnis ist ein zeitintensives Spiel, bei dem das Ziel nicht nur darin besteht, beispielsweise eine Katze zu zeichnen, sondern darin, eine Katze mit möglichst wenigen Zügen zu zeichnen. Sie könnten der größte Künstler der Welt sein, aber wenn Sie 12 Stunden brauchen, um eine bildschöne Katze zu zeichnen, sind Sie eine schreckliche Person Bildnis Spieler.

Dies bedeutete den Aufbau einer KI. Das könnte Menschen untersuchen, um herauszufinden, welche Strategien sie verwenden, um Pictionary gut zu spielen. Wie Song sagte: „Was sind die wichtigsten Teile, die man zeichnen muss, damit andere menschliche Richter raten können? Wir möchten, dass unsere Zeichnung so früh wie möglich erraten wird.“

Zu diesem Zweck verwendeten die Forscher QuickDraw, den bislang größten verfügbaren Datensatz menschlicher Skizzen. Anschließend entwickelten sie einen neuronalen Sortieralgorithmus, der die Reihenfolge der Striche priorisiert, die ein Künstler ausführen muss. Geben Sie eine erratene Darstellung eines Objekts in möglichst wenigen Zeilen. Das bedeutet, Skizzen in Striche zu zerlegen, dann die Reihenfolge dieser Striche zu ändern und die Ergebnisse zu testen, bis sie die genaue Reihenfolge festlegen, in der sie auf Papier gebracht werden müssen.

Beispielsweise könnte ein Künstler mit dem Zeichnen einer Katze beginnen, indem er einen kreisförmigen Umriss für ihren Kopf skizziert. Aber ein Kreis könnte alles mögliche sein, selbst wenn man weiß, dass er einen Kopf darstellen soll. Zeichnen Sie jedoch zwei spitze Ohren oder zwei Paar Schnurrhaare, und die Anzahl der möglichen Dinge, die Sie zeichnen könnten, verringert sich sehr, sehr schnell. Diese Informationen werden dann verwendet, um dem Skizzieragenten Anweisungen zu geben.

Song sagte, dass das Team eine öffentliche Version davon veröffentlichen könnte Bildnis-Spielender Bot, damit menschliche Spieler selbst versuchen können, eine skizzierende KI zu schlagen. Meister. (Wer weiß? Einen Experten zu spielen, könnte Ihnen sogar dabei helfen, Ihr eigenes Spiel zu verbessern Bildnis Spiel.)

Da steckt mehr dahinter

Pixelor bietet jedoch mehr als nur einen weiteren trivialen Spiele-Bot. So wie ein Computersystem sowohl über eine oberflächliche Schnittstelle, mit der wir interagieren, als auch über einen hinter der Haube verborgenen Backend-Code verfügt, so verfügt auch jede große KI über eine Schnittstelle, mit der wir interagieren. Meilensteine ​​im Spiel haben einen Hintergedanken. Sofern sie nicht ausdrücklich Computerspiele entwickeln, investieren Forschungslabore nicht unzählige Arbeitsstunden in den Aufbau Spiel-K.I. Agenten, nur um einen weiteren Eintrag auf der großen Liste der Dinge hinzuzufügen, die Menschen nicht mehr die Besten sind bei. Der Zweck besteht immer darin, einen grundlegenden Teil der KI voranzutreiben. Probleme lösen.

Im Fall von Pixelor besteht das versteckte Ziel darin, Maschinen zu entwickeln, die besser erkennen können, was für einen Menschen in einer bestimmten Szene wichtig ist. Wenn wir ein Bild betrachten, erkennen wir sofort die hervorstechendsten Details.

Nehmen wir an, Sie fahren von der Arbeit nach Hause. Auch wenn die Bäume am Straßenrand malerisch sein mögen und die Werbetafel für einen neuen Film interessant sein könnte, Beides ist nicht so wichtig wie das Gesicht und die Körpersprache der Person, vor der sie vielleicht gerade hinausgeht oder auch nicht Du. Noch bevor Sie die Informationen bewusst verarbeitet haben, hat Ihr Gehirn die wichtigsten Details herausgegriffen. Wie bringt man einem Computer bei, das zu können? Nun, es stellt sich heraus, dass eine gute Möglichkeit, dies zu tun, darin besteht, zu beobachten, wie Menschen beim Skizzieren den hervorstechenden erkennbaren Details in einem Bild Priorität einräumen.

„In Fotos ist kein menschliches Wissen verankert“, sagte Song. „Was wir wollen, sind menschliche Daten, die uns Signale darüber geben können, wie Menschen ein Objekt verstehen.“

Wie bereits erwähnt, ein gutes Bildnis Der Spieler weiß, wie ein guter Boxer, das absolute Minimum, das er tun muss, um ein bestimmtes Ziel zu erreichen. Das ist es, was Yi-Zhe Song und seinen Kollegen im Makrosinn am Herzen liegt. Es ist nichts so Triviales, wie einen Computer dazu zu bringen, ein Spiel zu spielen; Es geht darum, einen Computer dazu zu bringen, zu verstehen, was an bestimmten Szenen wichtig ist – und hoffentlich besser verallgemeinern zu können.

Wie alles von selbstfahrende Autos Da Roboter am Arbeitsplatz immer häufiger eingesetzt werden, ist dies eine wesentliche Aufgabe, die es zu lösen gilt.

Ein Papier, das die Arbeit beschreibt, wird im November auf der SIGGRAPH Asia 2020 vorgestellt.

Empfehlungen der Redaktion

  • Voyage ist eine KI. Gaming-Paradies, in dem Bots die Regeln schreiben
  • Schach. Gefahr. Gehen. Warum nutzen wir Spiele als Maßstab für KI?
  • Eine K.I. entwickelt Retro-Videospiele – und sie sind überraschend gut