Este bot que reproduz pictionary é um grande marco para a IA.

Assim como as novas habilidades Alexa em seu Amazon Echo, nas últimas décadas vimos a IA. gradualmente ganhar a capacidade de superar a humanidade em cada vez mais dos nossos amados jogos: Xadrez com Deep Blue em 1997, Perigo com IBM Watson em 2011, Jogos Atari com DeepMind em 2013, Ir com AlphaGo em 2016, e assim por diante. Para o público em geral, pelo menos, cada instância transforma o caminho abstrato do progresso computacional em um esporte para espectadores. A Skynet está ficando mais inteligente. Como nós sabemos? Porque verifique o número crescente de passatempos em que ele pode nos vencer de forma convincente.

Conteúdo

Construindo um mestre Pictionary
Mais do que se vê

Com esse histórico, não é muito chocante ouvir que a I.A. agora pode ter um desempenho convincentemente bom em Piccionário, o jogo de adivinhação de palavras inspirado em charadas que exige que uma pessoa desenhe uma imagem e outras tentem descobrir o que esboçaram o mais rápido possível.

Vídeos recomendados

Foi isso que pesquisadores da Universidade de Surrey, no Reino Unido, realizaram recentemente com a criação do Pixelor, um “desenhador de IA competitivo”. agente." Dado um visual conceito, o Pixelor é capaz de desenhar um esboço que seja reconhecível (tanto por humanos quanto por máquinas) como o objeto pretendido tão rapidamente - ou até mais rápido - do que um ser humano concorrente.

Relacionado

Como a Nintendo poderia usar IA para trazer jogos em 4K para o Switch Pro
O diretor da Yakuza acha que a evolução do PS5 se concentrará na IA. e aprendizado de máquina

“Nossa IA agente é capaz de renderizar um esboço do zero”, Canção Yi-Zhe, leitor de Visão Computacional e Aprendizado de Máquina do Centro de Processamento de Fala e Sinal de Visão da Universidade de Surrey, disse à Digital Trends. “Dê-lhe uma palavra como ‘rosto’ e ele saberá o que desenhar. … Ele vai desenhar um gato diferente, um cachorro diferente, um rosto diferente, a cada vez. Mas sempre sabendo como vencer o jogo Pictionary.”

Construindo um mestre Pictionary

Ser capaz de reduzir uma imagem complexa do mundo real a um esboço é, por si só, bastante impressionante. É necessário um certo nível de abstração para olhar para um rosto humano e vê-lo como uma forma oval com duas formas ovais menores para os olhos, uma linha para o nariz e um semicírculo para a boca. Nas crianças, a capacidade de perceber uma imagem desta forma mostra, entre outras coisas, uma crescente compreensão cognitiva de conceitos.

No entanto, como acontece com muitos aspectos da IA, muitas vezes resumidos como O Paradoxo de Moravec que “os problemas difíceis são fáceis e os problemas fáceis são difíceis”, é um desafio significativo para a máquina inteligência – apesar de ser uma habilidade básica e normal para a maioria das crianças de dois anos crianças.

No entanto, não é um desafio insolúvel. Em 2016, escrevemos sobre o trabalho de Song com uma ferramenta chamada Sketch, uma rede neural de aprendizagem profunda que foi capaz de reconhecer esboços desenhados à mão e usá-los para procurar produtos da vida real. Essa rede específica foi treinada usando um conjunto de dados que consiste em cerca de 30.000 comparações de esboços e fotos, permitindo-lhe reconhecer a forma como os objetos reais são apresentados no desenho à mão. Pixelor faz algo semelhante, mas também pode gerar seus próprios desenhos, em vez de apenas reconhecer os de outras pessoas.

Mas isso não é suficiente para vencer em Piccionário. Piccionário é um jogo desafiado pelo tempo, onde o objetivo não é apenas desenhar, digamos, um gato, mas desenhá-lo com o menor número de golpes possível. Você poderia ser o maior artista do mundo, mas se levar 12 horas para desenhar um gato perfeito, você é um péssimo Piccionário jogador.

Isso significou construir uma IA. que poderia estudar os humanos para ver quais estratégias eles usam para jogar bem o Pictionary. Como disse Song: “Quais são as partes mais importantes a serem desenhadas para permitir que outros juízes humanos sejam capazes de adivinhar? Queremos que nosso desenho seja adivinhado o mais cedo possível.”

Para fazer isso, os pesquisadores usaram o QuickDraw, o maior conjunto de dados de esboços humanos disponível até o momento. Eles então construíram um algoritmo de classificação neural que prioriza a ordem dos traços que um artista precisa fazer; fornecendo uma representação adivinhada de um objeto no menor número de linhas possível. Isso significa dividir os esboços em traços, depois embaralhar a ordem desses traços e testar os resultados até que eles estabeleçam a ordem precisa em que precisam ser colocados no papel.

Por exemplo, um artista poderia começar a desenhar um gato esboçando um contorno circular para sua cabeça. Mas um círculo pode ser uma série de coisas, mesmo que você saiba que ele supostamente representa uma cabeça. Desenhe duas orelhas pontudas, no entanto, ou dois conjuntos de bigodes e o número de coisas potenciais que você poderia desenhar diminui muito, muito rapidamente. Esta informação é então usada para instruir o agente de desenho.

Song disse que a equipe poderia lançar uma versão pública deste Piccionário-playing bot para que os jogadores humanos possam tentar vencer um esboço de IA. mestre. (Quem sabe? Jogar com um especialista pode até ajudar a melhorar o seu próprio Piccionário jogo.)

Mais do que se vê

No entanto, o Pixelor é mais do que apenas outro bot trivial de jogo. Assim como um sistema de computador tem uma interface de nível de superfície com a qual interagimos e um código de back-end subjacente, o mesmo acontece com todos os principais sistemas de IA. marco do jogo tem um motivo oculto. A menos que estejam explicitamente criando jogos de computador, os laboratórios de pesquisa não gastam incontáveis horas construindo IA de jogo agentes apenas para adicionar mais uma entrada na grande lista de coisas que os humanos não são mais os melhores no. O objetivo é sempre avançar alguma parte fundamental da IA. Solução de problemas.

No caso do Pixelor, o objetivo oculto é criar máquinas mais capazes de descobrir o que é importante para um ser humano em uma determinada cena. Quando olhamos para uma imagem, somos imediatamente capazes de dizer quais são os detalhes mais salientes.

Digamos que você esteja voltando do trabalho para casa. Embora as árvores ao longo da estrada possam ser pitorescas e o outdoor de um novo filme possa ser interessante, nenhum deles é tão importante quanto o rosto e a linguagem corporal da pessoa que pode ou não estar prestes a sair na frente de você. Antes mesmo de você processar conscientemente as informações, seu cérebro identificou os detalhes mais importantes. Como você ensina um computador a fazer isso? Bem, acontece que uma ótima maneira de fazer isso é ver como os humanos priorizam os detalhes reconhecíveis e salientes em uma imagem quando a estão esboçando.

“Não há conhecimento humano inerentemente incorporado nas fotos [por si só]”, disse Song. “O que queremos são dados humanos que possam nos dar sinais sobre como os humanos entendem um objeto.”

Como observado, um bom Piccionário O jogador, como um bom boxeador, saberá o mínimo que precisa fazer para atingir determinado objetivo. Isso, em um sentido macro, é o que interessa a Yi-Zhe Song e seus colegas. Não é algo tão trivial quanto fazer um computador jogar; é fazer com que um computador entenda o que é importante em certas cenas – e, esperançosamente, seja capaz de generalizar melhor.

Como tudo desde carros autônomos aos robôs no local de trabalho se tornam cada vez mais comuns, esta é uma tarefa essencial a resolver.

Um artigo descrevendo o trabalho será apresentado na SIGGRAPH Asia 2020 em novembro.

Recomendações dos Editores

Voyage é uma IA. paraíso dos jogos onde os bots escrevem as regras
Xadrez. Perigo. Ir. Por que usamos jogos como referência para IA?
Uma IA está projetando videogames retrô – e eles são surpreendentemente bons

Este bot que reproduz pictionary é um grande marco para a IA.

Construindo um mestre Pictionary

Mais do que se vê

Recomendações dos Editores

Categorias

Recente

Fazendo um oásis pessoal: como construí meu próprio teatro ao ar livre

Como a demonstração do Super Bowl da Verizon finalmente me empolgou com o 5G

O único recurso que a Apple TV ainda está faltando