Ilusões de ótica podem nos ajudar a construir uma nova geração de IA

Você olha para a imagem de um círculo preto em uma grade de pontos circulares. Assemelha-se a um buraco gravado em um pedaço de malha branca, embora na verdade seja uma imagem plana e estacionária em uma tela ou pedaço de papel. Mas seu cérebro não compreende assim. Como uma experiência alucinatória de baixo nível, sua mente dispara; percebendo a imagem estática como a boca de um túnel preto que se move em sua direção.

Conteúdo

Uma vantagem evolutiva
A visão mecânica está melhorando
Um teste de Turing para visão de máquina
Usa a tua ilusão
Alcançando a Visão Geral

Respondendo à verossimilhança do efeito, o corpo começa a reagir inconscientemente: as pupilas do olho dilatam-se para deixar mais luz, assim como eles se ajustariam se você estivesse prestes a mergulhar na escuridão para garantir o melhor possível visão.

O efeito em questão foi criado por Akiyoshi Kitaoka, psicólogo da Universidade Ritsumeikan em Kobe, Japão. É uma das dezenas de ilusões de ótica que ele criou ao longo de uma longa carreira. (“Gosto de todos”, disse ele, respondendo à pergunta da Digital Trend sobre se ele tem um favorito.)

Vídeos recomendados

Esta nova ilusão foi objeto de uma pesquisa publicada recentemente na revista Frontiers in Human Neuroscience. Embora o foco do artigo esteja firmemente nas respostas fisiológicas humanas ao novo efeito (que cerca de 86 por cento de nós experimentará), o O tópico geral também pode ter muita relevância quando se trata do futuro da inteligência de máquina – como um dos pesquisadores estava ansioso para explicar ao Digital Tendências.

Uma vantagem evolutiva

uma ilusão de ótica conhecida como espiral de Fraser — À primeira vista, pode parecer que esta imagem mostra uma espiral que serpenteia em direção ao centro. Mas tente seguir uma das linhas que aparentemente se curva para dentro e você perceberá que não é uma espiral.

Algo está errado com seu cérebro. Pelo menos, essa é uma conclusão fácil de tirar da maneira como o cérebro humano percebe as ilusões de ótica. Que outra explicação existe para uma imagem estática e bidimensional que o cérebro percebe como algo totalmente diferente? Por muito tempo, a psicologia convencional imaginou exatamente isso.

“Inicialmente as pessoas pensavam: ‘Tudo bem, nosso cérebro não é perfeito… Ele nem sempre acerta’. Isso é um fracasso, certo?” disse Bruno Laeng, professor do Departamento de Psicologia da Universidade de Oslo e primeiro autor do referido estudo. “Nesse caso, as ilusões eram interessantes porque revelariam algum tipo de imperfeição no maquinário.”

O cérebro não tem como saber o que [realmente] está lá fora.”

Os psicólogos não os veem mais dessa forma. Na verdade, pesquisas como esta destacam como o sistema visual não é apenas uma câmera simples. A ilusão de ótica do “Buraco de Expansão Ilusório” deixa claro que o olho se ajusta à luz e à escuridão percebidas, até mesmo imaginadas, e não à energia física.

Mais significativamente, mostra que não apenas registamos o mundo com os nossos sistemas visuais, mas em vez disso, realize um conjunto contínuo de experimentos científicos, a fim de obter um ligeiro avanço evolutivo. vantagem. O objetivo é analisar os dados que nos são apresentados e tentar lidar preventivamente com os problemas antes que eles se tornem, bem, problemas.

“O cérebro não tem como saber o que [realmente] está lá fora”, disse Laeng. “O que está fazendo é construir uma espécie de realidade virtual do que poderia estar lá fora. Há um pouco de suposição. A este respeito, podemos pensar no cérebro como uma espécie de máquina probabilística. Você pode chamá-lo de Bayesiano máquina se você quiser. É usar algumas hipóteses anteriores e tentar testá-las o tempo todo para ver se funcionam.”

Laeng dá o exemplo de nossos olhos fazendo ajustes com base em nada mais do que a impressão da luz do sol: mesmo quando esta é avistada através de nuvens ou de uma copa de folhas. Apenas no caso de.

“O que importa na evolução não é que seja verdade [naquele momento], mas é provável”, continuou ele. “Ao contrair a pupila, seu corpo já se adapta a uma situação que tem grande probabilidade de acontecer em um curto espaço de tempo. O que acontece [se o sol aparecer de repente] é que você fica deslumbrado. Deslumbrado significa incapacitado temporariamente. Isso tem consequências enormes, quer você seja uma presa ou um predador. Você perde uma fração de segundo em uma situação específica e pode não sobreviver.”

Não é apenas na luz e na escuridão que nossos sistemas visuais precisam fazer suposições. Pense em uma partida de tênis, onde a bola viaja em alta velocidade. Se baseássemos nosso comportamento inteiramente no que o sistema visual está recebendo em um determinado momento, ficaríamos para trás da realidade e não conseguiríamos devolver a bola. “Somos capazes de perceber o presente embora estejamos realmente presos ao passado”, disse Laeng. “A única maneira de fazer isso é prevendo o futuro. Parece um jogo de palavras, mas em poucas palavras é isso.”

A visão mecânica está melhorando

reconhecimento facial — izusek/Getty Images

Então, o que isso tem a ver com visão computacional? Potencialmente tudo. Para que um robô, por exemplo, seja capaz de funcionar de forma eficaz no mundo real, ele precisa ser capaz de fazer esses tipos de ajustes em tempo real. Os computadores têm uma vantagem quando se trata da capacidade de realizar cálculos extremamente rápidos. O que eles não têm são milhões de anos de evolução ao seu lado.

Mesmo assim, nos últimos anos, a visão mecânica fez enormes avanços. Eles podem identificar rostos ou movimentos em transmissões de vídeo em tempo real – potencialmente até mesmo em grandes multidões de pessoas. Classificação de imagens e ferramentas tecnológicas semelhantes também podem reconhecer a presença de outros objetos, enquanto avanços na segmentação de objetos tornam possível compreender melhor o conteúdo de diferentes cenas. Houve também um progresso significativo no que diz respeito à extrapolação de imagens 3D a partir de cenas 2D, permitindo que as máquinas “leiam” informações tridimensionais, como a profundidade, das cenas. Isso aproxima a visão computacional moderna da percepção humana da imagem.

No entanto, ainda existe um abismo entre os melhores algoritmos de visão mecânica e os tipos de capacidades baseadas na visão que a esmagadora maioria dos humanos é capaz de realizar desde tenra idade. Embora não possamos articular exatamente como executamos estas tarefas baseadas na visão (para citar o polímata húngaro-britânico Michael Polanyi, “podemos saber mais do que podemos dizer”), ainda assim somos capazes de realizar uma impressionante variedade de tarefas que nos permitem aproveitar a nossa visão para uma variedade de funções inteligentes. caminhos.

Um teste de Turing para visão de máquina

Se pesquisadores e engenheiros esperam criar sistemas de visão computacional que operem pelo menos no mesmo nível do visual habilidades de processamento do cérebro wetware, construir algoritmos que possam entender ilusões de ótica não é um mau começo apontar. No mínimo, poderia ser uma boa maneira de medir o quão bem os sistemas de visão mecânica funcionam em nossos próprios cérebros. Pode não ser a resposta para o mítico Inteligência Geral Artificial, mas pode ser a chave para desbloquear a Visão Geral.

uma ilusão de ótica que engana seu cérebro fazendo-o ver cores falsas — Acredite ou não, mas todas essas bolas têm o mesmo tom de cinza, e seu cérebro as interpreta como tendo cores diferentes com base nas pistas contextuais das linhas coloridas que as cruzam.

“Se alguém desenvolvesse, um dia, um sistema visual artificial que cometesse os mesmos erros de percepção ilusória que fazemos, você saberia neste momento que eles estão [alcançando] uma boa simulação de como nosso cérebro funciona”, Laeng disse. “Seria uma espécie de Teste de Turing. Se você tiver uma rede artificial que é enganada pela ilusão como nós, então estaríamos muito perto de compreender a computação subjacente do próprio cérebro.”

Canção Yi-Zhe, leitor de Visão Computacional e Aprendizado de Máquina no Centro de Processamento de Fala e Sinais de Visão da Universidade de Surrey, no Reino Unido, concorda com a hipótese. “Pedir aos algoritmos de visão que entendam as ilusões de ótica como um tópico geral é de grande valor para a comunidade”, disse ele ao Digital Trends. “Isso vai além do foco atual da comunidade de pedir às máquinas que [reconheçam], indo além [e] pedindo às máquinas que raciocinem. Este impulso [representaria] um passo significativo em direção à ‘Visão Geral’, onde interpretações subjetivas de conceitos visuais precisam ser acomodadas.”

Usa a tua ilusão

Até à data, tem havido alguma investigação limitada em direcção a este objectivo – embora permaneça numa fase relativamente inicial. Nasim Nematzadeh, pesquisador com doutorado. em Inteligência Artificial e Robótica - modelos de visão de baixo nível, é uma pessoa que tem trabalho publicado sobre este tema.

“Acreditamos que uma exploração mais aprofundada do papel de modelos simples do tipo gaussiano no processamento retinal de baixo nível e do kernel gaussiano no estágio inicial [deep neural redes] e sua previsão de perda de ilusão perceptual levarão a técnicas e modelos de visão computacional mais precisos”, disse Nematzadeh à Digital Trends. “[Isso poderia] contribuir para modelos de nível superior de processamento de profundidade e movimento e generalizados para a compreensão computacional de imagens naturais.”

Movendo círculos imóveis (ilusão de ótica)!

Max Williams, um pesquisador de IA que ajudou a compilar um conjunto de dados de milhares de imagens de ilusão de ótica para sistemas de visão computacional, coloca a relação entre visão geral e ilusões de ótica de forma mais sucinta: “As ilusões existem porque nossos olhos e cérebros estão realizando um trabalho confuso e processo ad-hoc para extrair uma cena visual de um campo de luz de outra forma incompreensível, criado por um mundo físico do qual estamos quase completamente isolados”, disseram eles ao Digital Tendências. “Não creio que seja possível tornar um sistema visual expressivo o suficiente para ser considerado uma ‘percepção’ que também esteja livre de ilusões.”

Alcançando a Visão Geral

Para ser claro, alcançar a Visão Geral de nível humano (ou melhor) para IA não significa simplesmente treiná-los para reconhecer ilusões de ótica padrão. Nenhuma capacidade hiperespecífica de, digamos, decodificar ilusões do Olho Mágico com 99,9% de precisão em 0,001 segundos substituirá milhões de anos de evolução humana.

(Curiosamente, a visão mecânica já tem sua própria versão de ilusões de ótica na forma de modelos adversários, o que pode levá-los a errar – como em uma ilustração alarmante – um Tartaruga de brinquedo impressa em 3D para um rifle. No entanto, estas não produzem os mesmos benefícios evolutivos que as ilusões de ótica que funcionam nos humanos.)

Ainda assim, fazer com que as máquinas compreendam as ilusões de ótica humanas e respondam a elas da mesma forma que nós o fazemos poderia ser uma investigação muito útil.

E uma coisa é certa: quando a General Vision AI é alcançado, cairá nos mesmos tipos de ilusões de ótica que nós. Pelo menos, no caso do Buraco Expansível Ilusório, 86% de nós.

Recomendações dos Editores

Wix usa ChatGPT para ajudá-lo a construir rapidamente um site inteiro
OpenAI construindo nova equipe para impedir que a IA superinteligente se torne desonesta
Essas ideias engenhosas podem ajudar a tornar a IA um pouco menos maligna
A ferramenta de detecção de imagens de IA do Google parece que pode funcionar
A IA poderia substituir cerca de 7.800 empregos na IBM como parte de uma pausa nas contratações

Ilusões de ótica podem nos ajudar a construir uma nova geração de IA

Uma vantagem evolutiva

A visão mecânica está melhorando

Um teste de Turing para visão de máquina

Usa a tua ilusão

Alcançando a Visão Geral

Recomendações dos Editores

Categorias

Recente

Shadow Warrior 3 não é revolucionário e isso é revigorante

9 jogos que roubam a cena que jogamos no Summer Game Fest

Meu Steam Deck e Nintendo Switch vivem em perfeita harmonia