A mais recente IA do MIT é incrível para determinar o que está acontecendo nos vídeos

click fraud protection

Como uma Rede de Relações Temporais entende o que está acontecendo ali

Apenas alguns quadros de informação contando uma história são tudo o que precisamos para entender o que está acontecendo. Afinal de contas, esta é a base para as histórias em quadrinhos – que fornecem apenas o suficiente das partes importantes da história para que possamos acompanhar o que aconteceu. Infelizmente, os robôs equipados com tecnologia de visão computacional lutam para fazer isso. Até agora, pelo menos.

Vídeos recomendados

Recentemente, o Instituto de Tecnologia de Massachusetts (MIT) demonstrou um novo tipo de inteligência artificial sistema que usa uma rede neural para preencher os espaços em branco nos quadros de vídeo para descobrir qual atividade está ocorrendo lugar. Os resultados tornam-no surpreendentemente bom para determinar o que está acontecendo em um vídeo.

“Os módulos de relação temporal recentemente desenvolvidos permitem que a I.A. sistema para analisar alguns quadros-chave e estimar o tempo relação entre eles, para entender o que está acontecendo no vídeo — como uma pilha de objetos [sendo] derrubados”,

Bolei Zhou, um ex-Ph. estudante do Laboratório de Ciência da Computação e Inteligência Artificial do MIT (CSAIL), que agora é professor assistente de ciência da computação na Universidade Chinesa de Hong Kong, disse à Digital Trends. “Como o modelo funciona com quadros-chave amostrados de forma esparsa do vídeo recebido, a eficiência do processamento é bastante melhorada, permitindo o reconhecimento de atividades em tempo real.”

Outra propriedade interessante do A.I. modelo é que ele pode antecipar e prever o que acontecerá desde o início, visualizando quadros de vídeo. Por exemplo, se vir uma pessoa segurando uma garrafa, o algoritmo antecipa que ela poderá tomar um gole ou possivelmente espremê-lo. Essas capacidades de antecipação serão essenciais para a inteligência artificial utilizada em domínios como condução autônoma, onde poderia prevenir acidentes de forma proativa, adivinhando o que acontecerá a cada momento.

“Ele [poderia também] ser usado para monitorar o comportamento humano, como um assistente de robô doméstico que poderia antecipar sua intenção, entregando as coisas com antecedência”, continuou Zhou. “Ele [poderia também ser empregado] para analisar o enorme [número de] vídeos on-line, para melhorar a compreensão e a recuperação de vídeos.”

A próxima etapa do projeto envolverá aumentar a capacidade da IA ​​de reconhecer um número mais amplo de objetos e atividades. A equipe também está trabalhando com pesquisadores de robótica para implantar esse reconhecimento de atividade em sistemas robóticos. Como resultado, eles poderiam ter percepção aprimorada e habilidades de raciocínio visual.

Recomendações dos Editores

  • Ninguém quer comprar chips Zen 4 da AMD – o que está acontecendo?
  • IA do Zoom tecnologia para detectar emoções durante ligações incomoda críticos
  • A fórmula engraçada: por que o humor gerado por máquina é o Santo Graal da IA
  • Nvidia reduz a barreira de entrada na IA com Comando de Frota e LaunchPad
  • IA da IBM O navio Mayflower está cruzando o Atlântico e você pode assisti-lo ao vivo

Atualize seu estilo de vidaDigital Trends ajuda os leitores a manter o controle sobre o mundo acelerado da tecnologia com as últimas notícias, análises divertidas de produtos, editoriais criteriosos e prévias únicas.