La última IA del MIT es sorprendente para determinar lo que sucede en los videos

Cómo una Red de Relaciones Temporales entiende lo que sucede allí

Sólo unos pocos cuadros de información que cuentan una historia son todo lo que necesitamos para comprender lo que está sucediendo. Después de todo, esta es la base de los cómics, que proporcionan la cantidad suficiente de ritmos importantes de la historia para que podamos seguir lo que sucedió. Lamentablemente, los robots equipados con tecnología de visión por computadora tienen dificultades para lograrlo. Hasta ahora, al menos.

Vídeos recomendados

Recientemente, el Instituto Tecnológico de Massachusetts (MIT) demostró un nuevo tipo de inteligencia artificial. Sistema que utiliza una red neuronal para completar los espacios en blanco en los cuadros de video y determinar qué actividad se está realizando. lugar. Los resultados lo hacen sorprendentemente bueno para determinar lo que sucede en un video.

“Los módulos de relación temporal recientemente desarrollados permiten que la A.I. sistema para analizar algunos fotogramas clave y estimar el tiempo relación entre ellos, para poder entender lo que sucede en el video, como una pila de objetos [que son] derribados”,

Bolei Zhou, ex Ph. D. dijo a Digital Trends un estudiante del Laboratorio de Ciencias de la Computación e Inteligencia Artificial (CSAIL) del MIT, que ahora es profesor asistente de ciencias de la computación en la Universidad China de Hong Kong. "Debido a que el modelo funciona con fotogramas clave escasamente muestreados del vídeo entrante, la eficiencia del procesamiento mejora enormemente, lo que permite el reconocimiento de actividad en tiempo real".

Otra propiedad interesante del A.I. El modelo es que puede anticipar y pronosticar lo que sucederá desde el principio viendo fotogramas de vídeo. Por ejemplo, si ve a una persona sosteniendo una botella, el algoritmo anticipa que podría tomar un trago o posiblemente exprimirla. Estas capacidades de anticipación serán esenciales para la inteligencia artificial utilizada en dominios como conducción autónoma, donde podría prevenir accidentes de forma proactiva al adivinar lo que sucederá en cada momento.

"[También podría] usarse para monitorear comportamientos humanos, como un robot asistente doméstico que podría anticipar su intención entregándole cosas de antemano", continuó Zhou. "[Podría utilizarse adicionalmente] para analizar la enorme [cantidad de] videos en línea, para comprender y recuperar mejor los videos".

El siguiente paso del proyecto implicará aumentar la capacidad de la IA para reconocer una cantidad más amplia de objetos y actividades. El equipo también está trabajando con investigadores de robótica para implementar este reconocimiento de actividad en sistemas robóticos. Como resultado, estos podrían ver una mejora en la percepción y las habilidades de razonamiento visual.

Recomendaciones de los editores

  • Nadie quiere comprar los chips Zen 4 de AMD: ¿qué está pasando?
  • La IA de Zoom La tecnología para detectar emociones durante las llamadas molesta a los críticos
  • La fórmula divertida: por qué el humor generado por máquinas es el santo grial de la IA
  • Nvidia reduce la barrera de entrada a la A.I. con Fleet Command y LaunchPad
  • La IA de IBM El barco Mayflower cruza el Atlántico y podrás verlo en vivo

Mejora tu estilo de vidaDigital Trends ayuda a los lectores a mantenerse al tanto del vertiginoso mundo de la tecnología con las últimas noticias, reseñas divertidas de productos, editoriales interesantes y adelantos únicos.