Ce robot jouant au Pictionary est une étape importante pour l'IA.

À l’instar des nouvelles compétences Alexa sur votre Amazon Echo, ces deux dernières décennies ont vu l’IA s’améliorer. acquérez progressivement la capacité de battre l’humanité dans de plus en plus de nos jeux bien-aimés: Échecs avec Deep Blue en 1997, Péril avec IBM Watson en 2011, Jeux Atari avec DeepMind en 2013, Aller avec AlphaGo en 2016, et ainsi de suite. Pour le grand public, au moins, chaque exemple transforme la voie abstraite du progrès informatique en un sport de spectateur. Skynet devient plus intelligent. Comment savons nous? Parce que jetez un œil au nombre croissant de passe-temps dans lesquels il peut nous battre de manière convaincante.

Contenu

  • Construire un maître Pictionary
  • Plus que ne discerne l'œil

Dans ce contexte, il n’est pas trop choquant d’entendre que l’IA. peut désormais performer de manière convaincante à Pictionnaire, le jeu de devinettes de mots inspiré des charades qui demande à une personne de dessiner une image et à d'autres d'essayer de comprendre ce qu'elles ont dessiné le plus rapidement possible.

Vidéos recommandées

C’est ce qu’ont récemment réalisé des chercheurs de l’Université britannique de Surrey avec la création de Pixelor, un « outil d’IA de dessin compétitif ». agent." Étant donné un visuel concept, Pixelor est capable de dessiner un croquis reconnaissable (à la fois par les humains et les machines) comme son sujet prévu aussi rapidement – ​​voire plus vite – qu'un humain. concurrent.

En rapport

  • Comment Nintendo pourrait utiliser l'IA pour apporter le jeu 4K au Switch Pro
  • Le directeur de Yakuza pense que l’évolution de la PS5 se concentrera sur l’IA. et apprentissage automatique

« Notre I.A. l'agent est capable de restituer un croquis à partir de zéro », Chanson de Yi-Zhe, lecteur de Computer Vision and Machine Learning au Centre for Vision Speech and Signal Processing de l'Université de Surrey, a déclaré à Digital Trends. « Donnez-lui un mot comme « visage » et il saura quoi dessiner. … Cela dessinera un chat différent, un chien différent, un visage différent, à chaque fois. Mais toujours en sachant comment gagner au jeu Pictionary.

Construire un maître Pictionary

Être capable de réduire une image complexe du monde réel en un croquis est en soi assez impressionnant. Il faut un certain niveau d'abstraction pour regarder un visage humain et le voir comme un ovale avec deux ovales plus petits pour les yeux, une ligne pour le nez et un demi-cercle pour la bouche. Chez les enfants, la capacité de percevoir une image de cette manière témoigne, entre autres, d’une compréhension cognitive naissante des concepts.

Cependant, comme pour de nombreux aspects de l’IA, souvent résumés comme suit: Le paradoxe de Moravec que « les problèmes difficiles sont faciles et les problèmes faciles sont difficiles », c'est un défi important pour les machines. intelligence - malgré le fait qu'il s'agisse d'une compétence de base et banale pour la majorité des enfants de deux ans enfants.

Laboratoire SketchX

Ce n’est cependant pas un défi insoluble. En 2016, nous avons écrit sur le travail de Song avec un outil appelé Sketch, un réseau neuronal d'apprentissage en profondeur capable de reconnaître des croquis dessinés à la main et de les utiliser pour rechercher des produits réels. Ce réseau particulier a été formé à l'aide d'un ensemble de données composé de quelque 30 000 comparaisons de croquis et de photos, lui permettant de reconnaître la manière dont les objets réels sont présentés dans les dessins manuels. Pixelor fait quelque chose de similaire, mais peut également générer ses propres dessins, plutôt que de simplement reconnaître ceux des autres.

Mais cela ne suffit pas pour gagner Pictionnaire. Pictionnaire est un jeu chronométré dans lequel le but n'est pas seulement de dessiner, disons, un chat, mais de dessiner un chat en aussi peu de coups que possible. Vous pourriez être le plus grand artiste du monde, mais s’il vous faut 12 heures pour dessiner un chat parfait, vous êtes un terrible Pictionnaire joueur.

Cela impliquait de construire une IA. qui pourrait étudier les humains pour voir quelles stratégies ils utilisent pour bien jouer à Pictionary. Comme l'a dit Song: « Quels sont les éléments les plus importants à dessiner pour permettre à d'autres juges humains de deviner? Nous voulons que notre dessin soit deviné le plus tôt possible.

Pour ce faire, les chercheurs ont utilisé QuickDraw, le plus grand ensemble de données de croquis humains disponible à ce jour. Ils ont ensuite construit un algorithme de tri neuronal qui donne la priorité à l'ordre des traits qu'un artiste doit réaliser; donner une représentation devinable d'un objet en aussi peu de lignes que possible. Cela signifie décomposer les croquis en traits, puis mélanger l'ordre de ces traits et tester les résultats jusqu'à ce qu'ils établissent l'ordre précis dans lequel ils doivent être couchés sur papier.

Par exemple, un artiste pourrait commencer à dessiner un chat en dessinant un contour circulaire pour sa tête. Mais un cercle peut représenter bien des choses, même si l’on sait qu’il est censé représenter une tête. Dessinez cependant deux oreilles pointues ou deux paires de moustaches et le nombre de choses potentielles que vous pourriez dessiner diminue très, très rapidement. Ces informations sont ensuite utilisées pour instruire l'agent de dessin.

Song a déclaré que l'équipe pourrait publier une version publique de ce document. Pictionnaire-jouer à un robot pour que les joueurs humains puissent tenter leur chance pour battre une IA en train de dessiner. maître. (Qui sait? Jouer un expert pourrait même vous aider à améliorer le vôtre Pictionnaire jeu.)

Plus que ne discerne l'œil

Cependant, Pixelor ne se résume pas à un simple robot de jeu trivial. Tout comme un système informatique possède à la fois une interface au niveau de la surface avec laquelle nous interagissons et un code backend sous le capot, il en va de même pour tous les principaux systèmes d'IA. le jalon du jeu a une arrière-pensée. À moins qu’ils ne créent explicitement des jeux informatiques, les laboratoires de recherche ne consacrent pas d’innombrables heures-personnes à la construction. IA de jeu agents juste pour ajouter une autre entrée à la grande liste de choses que les humains ne sont plus les meilleurs à. Le but est toujours de faire progresser certains éléments fondamentaux de l’IA. résolution de problème.

Dans le cas de Pixelor, l’objectif caché est de créer des machines plus capables de comprendre ce qui est important pour un humain dans une scène particulière. Lorsque nous regardons une image, nous sommes immédiatement capables de déterminer quels sont les détails les plus marquants.

Disons que vous rentrez du travail en voiture. Même si les arbres bordant la route peuvent être pittoresques et que le panneau publicitaire d'un nouveau film peut être intéressant, ni l’un ni l’autre n’est aussi important que le visage et le langage corporel de la personne qui peut ou non être sur le point de sortir devant toi. Avant même que vous ayez consciemment traité les informations, votre cerveau a sélectionné les détails les plus importants. Comment apprendre à un ordinateur à faire cela? Eh bien, il s’avère qu’un excellent moyen d’y parvenir est de voir comment les humains donnent la priorité aux détails reconnaissables saillants d’une image lorsqu’ils la dessinent.

"Il n'y a aucune connaissance humaine inhérente aux photos [seules]", a déclaré Song. "Ce que nous voulons, ce sont des données humaines qui peuvent nous donner des signaux sur la façon dont les humains comprennent un objet."

Comme indiqué, un bon Pictionnaire Le joueur, comme un bon boxeur, connaîtra le minimum absolu qu’il doit faire pour atteindre un certain objectif. D’un point de vue macro, c’est ce qui intéresse Yi-Zhe Song et ses collègues. Ce n’est pas aussi trivial que de faire jouer un jeu à un ordinateur; il s’agit d’amener un ordinateur à comprendre ce qui est important dans certaines scènes – et, espérons-le, à pouvoir mieux généraliser.

Comme tout depuis voitures autonomes Les robots sur le lieu de travail deviennent de plus en plus courants, c'est une tâche essentielle à résoudre.

Un article décrivant le travail sera présenté au SIGGRAPH Asia 2020 en novembre.

Recommandations des rédacteurs

  • Voyage est une I.A. paradis du jeu où les robots écrivent les règles
  • Échecs. Péril. Aller. Pourquoi utilisons-nous les jeux comme référence pour l’IA?
  • Une I.A. conçoit des jeux vidéo rétro – et ils sont étonnamment bons