Nova técnica de brainsourcing treina IA Com ondas cerebrais

Imagine uma sala cheia de mesas, totalizando mais de duas dúzias. Em cada mesa idêntica há um computador com uma pessoa sentada em frente jogando um jogo simples de identificação. O jogo pede ao usuário para completar uma variedade de tarefas básicas de reconhecimento, como escolher qual foto de uma série que mostra alguém sorrindo ou retrata uma pessoa com cabelos escuros ou usando copos. O jogador deve tomar sua decisão antes de passar para a próxima imagem.

Conteúdo

  • Uma nova versão de uma ideia antiga
  • Entre no mundo do brainsourcing
  • O futuro está chegando

Só que eles não fazem isso clicando com o mouse ou tocando na tela sensível ao toque. Em vez disso, eles selecionam a resposta certa simplesmente pensando nela.

Cada pessoa na sala está equipada com uma calota craniana de eletroencefalograma (EEG); um rastro de fios que vai de cada pessoa até um dispositivo de gravação próximo que monitores a atividade de voltagem elétrica em seu couro cabeludo. A cena parece um escritório de plano aberto em que todos estão conectados ao Matrix.

Relacionado

  • IA analógica? Parece loucura, mas pode ser o futuro
  • O mais recente A.I. da Nvidia os resultados provam que o ARM está pronto para o data center
  • A IA do ‘droidlet’ do Facebook poderia levar o reconhecimento de fala a um nível totalmente novo
John MacDougall/Getty

“Os participantes [em nosso estudo] tiveram a tarefa simples de apenas reconhecer [o que foram solicitados a procurar],” Tuukka Ruotsalo, pesquisador da Universidade de Helsinque, que liderou a pesquisa publicada recentemente, disse Tendências Digitais. “Eles não foram solicitados a fazer mais nada. Eles apenas olharam as imagens que lhes foram mostradas. Em seguida, construímos um classificador para ver se conseguíamos identificar o rosto correto com as características alvo, apenas com base no sinal cerebral. Nada mais foi utilizado, além do sinal EEG no momento em que os participantes viram a imagem.”

No experimento, foram mostradas a um total de 30 voluntários imagens de rostos humanos sintetizados (para evitar a chance de um dos participantes reconhecer uma pessoa que lhes foi mostrada e, portanto, distorcer o resultados). Os participantes foram solicitados a rotular mentalmente os rostos com base no que viram e foram solicitados a procurar. Usando apenas esses dados de atividade cerebral, um inteligência artificial algoritmo aprendeu a reconhecer imagens, como quando uma pessoa loira aparecia na tela.

Uma nova versão de uma ideia antiga

Isso é algo impressionante, mas não é especialmente novo. Pelo menos durante a última década, os investigadores usaram dados de actividade cerebral, recolhidos através de EEG ou fMRI, para realizar uma variedade de demonstrações de leitura de pensamentos cada vez mais impressionantes. Em alguns casos, é a identificação de uma imagem ou vídeo específico, como aconteceu com um estudo recente durante o qual pesquisadores do Laboratório de Neurorobótica em Moscou mostraram que é possível descobrir qual videoclipes que as pessoas estão assistindo monitorando sua atividade cerebral.

Em outros casos, esses insights podem ser usados ​​para desencadear certas respostas. Por exemplo, em 2011, investigadores da Universidade de Washington, em St. Louis, colocaram eléctrodos temporários sobre o centro da fala do cérebro de uma pessoa e depois demonstraram que eram capazes de mover um cursor de computador na tela simplesmente fazendo com que a pessoa pense sobre para onde deseja movê-lo. Ainda outros estudos mostraram que os dados do cérebro podem ser usados ​​para mover membros robóticos ou drones flutuantes.

O que torna o recente estudo da Universidade de Helsinque novo e interessante é que ele se concentra em como a atividade cerebral de um grupo de pessoas, em vez de pessoas isoladas, pode ser usado para tirar conclusões, como classificar imagens. Eles não apenas mostraram que funciona, mas que – pelo menos até certo ponto – quanto mais pessoas você adiciona ao grupo, mais precisos os dados se tornam.

Chris So/Getty

“Quando adicionamos mais pessoas ao conjunto de fontes cerebrais, para que os dados cerebrais de um grupo de pessoas sejam registrados, alcançamos um desempenho com precisão bem superior a 90%”, disse Ruotsalo. “[Isso] está quase no nível de [pedir a um grupo para marcar manualmente as respostas.]”

Isto pode inicialmente parecer contra-intuitivo. Se os dados cerebrais são barulhentos, adicionar mais pessoas não os tornaria ainda mais barulhentos? Afinal, se você quiser ouvir um som particularmente difícil de ouvir em uma sala, é mais fácil se você tiver apenas uma pessoa falando além do que 10. Ou 30. Mas como a história da revolução do big data e muitas das demonstrações mais notáveis ​​de aprendizagem automática em ação, deixaram claro, quanto mais dados você tiver à sua disposição para resolver um problema, mais precisos os sistemas tornar-se.

“O sinal geralmente é ruidoso no EEG ou em qualquer outra imagem cerebral, e os participantes ou humanos nem sempre atendem 100%”, explicou Ruotsalo. “Pense em olhar as fotos você mesmo. Às vezes, depois de olhar para muitos, sua mente pode estar divagando. Mesmo com participantes únicos, os pesquisadores costumam usar truques, como repetir o mesmo estímulo novamente para poder calcular a média do ruído. Aqui, usamos sinais de muitos participantes.”

A chance de pelo menos alguns indivíduos estarem focados a cada momento aumenta muito em comparação com apenas um indivíduo. Adicione a noção da sabedoria das multidões (mais sobre isso mais tarde) e você terá uma combinação poderosa.

Entre no mundo do brainsourcing

Tuukka Ruotsalo e sua equipe chamam essa leitura cerebral baseada em grupo de “brainsourcing”. É uma brincadeira com o termo crowdsourcing, referindo-se a uma forma de dividir uma grande tarefa em tarefas menores que podem ser distribuídas a grandes grupos de pessoas para ajudar resolver. Aqui em 2020, crowdsourcing pode ser mais sinônimo de plataformas de arrecadação de dinheiro como o Kickstarter, onde a “grande tarefa” é o capital inicial necessário para lançar um produto e o elemento distribuído com base na multidão envolve pedir às pessoas que contribuam com quantias menores de dinheiro.

No entanto, o crowdsourcing também pode servir para outras aplicações. Plataforma Mechanical Turk da Amazon e Kit de pesquisa da Apple são ferramentas de crowdsourcing que aproveitam o poder da multidão para tarefas que vão desde responder pesquisas até realizar pesquisas acadêmicas importantes. Enquanto isso, empresas como TaskRabbit e 99designs aproveitam a multidão para ajudar os clientes a encontrar a pessoa certa para entregar qualquer coisa, desde jardinagem e compras de supermercado até criar o logotipo ou cabeçalho perfeito para o seu site.

Brainsourcing: tarefas de reconhecimento de crowdsourcing por meio de interface colaborativa cérebro-computador (Teaser)

IA também pode se beneficiar do crowdsourcing. Considere, por exemplo, Tecnologia reCAPTCHA do Google. A maioria de nós provavelmente considera o reCAPTCHA uma forma de os sites verificarem se somos ou não um bot antes de nos permitir realizar uma tarefa específica. Concluir um reCAPTCHA pode envolver a leitura de uma linha de texto ondulada ou clicar em cada imagem em uma seleção que inclua um gato. Mas os reCAPTCHAs não servem apenas para testar se somos humanos ou não; eles também são uma maneira muito inteligente de coletar dados que podem ser usados ​​para tornar a IA de reconhecimento de imagem do Google uma ferramenta útil. mais esperto. Cada vez que você lê um fragmento de texto de uma placa de sinalização em uma imagem reCAPTCHA, você pode estar contribuindo para tornar, digamos, os carros autônomos do Google um pouco melhores no reconhecimento do mundo real. Quando o Google coleta respostas suficientes para uma imagem, o Google tem certeza razoável de que possui uma resposta correta.

É demasiado cedo para considerar como o brainsourcing poderia, na prática, desenvolver estas ideias. “Temos tentado pensar sobre isso nós mesmos”, disse Ruotsalo. “Acho que ainda nem temos as ideias. É apenas uma prova de conceito de que podemos fazer isso. Agora está aberto para outras pessoas explorarem quão bem, e que tipos de tarefas, e para quais tipos de grupos de pessoas poderíamos usar isso.”

O futuro está chegando

Mas o potencial certamente existe. Monitores de EEG vestíveis disponíveis comercialmente estão começando a ficar disponíveis - em formatos que variam de fones de ouvido para leitura cerebral para tatuagens inteligentes. Actualmente, as demonstrações de EEG como a deste estudo medem apenas uma pequena percentagem da actividade cerebral total de uma pessoa. Mas com o tempo isso poderá aumentar, o que significa que uma coleção menos binária de informações poderá ser coletada. Em vez de apenas obter respostas “sim” ou “não” às perguntas, esta tecnologia poderia observar a resposta das pessoas a mais questões complexas, poderia monitorar as respostas à mídia, como um programa de TV ou filme, e então alimentar dados agregados da multidão de volta aos seus fabricantes.

“Em vez de usar classificações convencionais ou botões semelhantes, você poderia simplesmente ouvir uma música ou assistir a um programa, e seu cérebro atividade por si só seria suficiente para determinar sua resposta a ela”, Keith Davis, estudante e assistente de pesquisa no projeto, disse em um comunicado de imprensa acompanhando o trabalho.

Imagine se milhões de pessoas usassem dispositivos vestíveis de rastreamento de EEG e você oferecesse a uma porcentagem delas um micropagamento 10 vezes por dia em troca de alguns segundos para ajudar a resolver uma tarefa específica. Fantástico? Talvez agora, mas o mesmo aconteceu com muitas das tecnologias de crowdsourcing atuais, apenas alguns anos atrás.

No game show Quem quer Ser um milionário, uma das “tábuas de salvação” à disposição dos competidores é a opção de fazer determinada pergunta ao público. Quando esta tábua de salvação única é acionada, o público usa blocos de votação fixados em seus assentos e vota na resposta a uma pergunta de múltipla escolha que acredita ser correta. O computador então contabiliza os resultados e os mostra como uma porcentagem ao competidor. De acordo com o livro de James Surowiecki, A sabedoria das multidões, perguntar ao público resulta na resposta correta em mais de 90% das vezes. Isso é significativamente melhor do que a opção 50/50 do programa, que elimina duas respostas incorretas, e a opção de telefonar para um amigo, que dá a resposta certa cerca de dois terços das vezes.

Poderia o brainsourcing ser a próxima grande ideia da tecnologia; ajudando a fazer tudo, desde melhorar o entretenimento até treinar melhor IA. para responder a todos os tipos de perguntas? É certo que é muito cedo para dizer. Mas este é definitivamente um termo sobre o qual você ouvirá muito mais nos próximos meses, anos e décadas.

Recomendações dos Editores

  • O supercomputador da Nvidia pode trazer uma nova era de ChatGPT
  • A fórmula engraçada: por que o humor gerado por máquina é o Santo Graal da IA
  • A nova voz A.I. da Nvidia parece uma pessoa real
  • A incrível IA de rastreamento de atletas da Intel é o ‘Santo Graal’ da tecnologia de treinamento
  • Tecnologia de reconhecimento facial para ursos visa manter os humanos seguros