Новейший искусственный интеллект Массачусетского технологического института потрясающе определяет, что происходит в видео

Как сеть временных отношений понимает, что там происходит

Всего несколько кадров информации, рассказывающих историю, — это все, что нам нужно, чтобы понять, что происходит. В конце концов, это основа комиксов, которые содержат достаточно важных сюжетных моментов, чтобы мы могли проследить за происходящим. К сожалению, роботы, оснащенные технологиями компьютерного зрения, с трудом справляются с этой задачей. До сих пор, по крайней мере.

Рекомендуемые видео

Недавно Массачусетский технологический институт (MIT) продемонстрировал новый тип искусственного интеллекта. система, которая использует нейронную сеть для заполнения пробелов в видеокадрах и определения того, какая активность происходит место. Результаты делают его удивительно эффективным в определении того, что происходит в видео.

«Недавно разработанные модули временных отношений позволяют ИИ. система для анализа нескольких ключевых кадров и оценки временного отношения между ними, чтобы понять, что происходит на видео — например, сбитая стопка объектов».

Болей Чжоу, бывший доктор философии. Студент Лаборатории компьютерных наук и искусственного интеллекта Массачусетского технологического института (CSAIL), который сейчас является доцентом кафедры информатики в Китайском университете Гонконга, рассказал Digital Trends. «Поскольку модель работает с ключевыми кадрами, редко выбранными из входящего видео, эффективность обработки значительно повышается, что позволяет распознавать действия в реальном времени».

Еще одно интересное свойство A.I. Модель заключается в том, что она может заранее предвидеть и прогнозировать, что произойдет, просматривая кадры видео. Например, если алгоритм видит человека, держащего бутылку, он предполагает, что он может выпить или, возможно, сжать ее. Такие способности предвидения будут необходимы для искусственного интеллекта, используемого в таких областях, как автономное вождение, где он мог бы заранее предотвращать несчастные случаи, угадывая, что произойдет в любой момент.

«Его [также можно] использовать для мониторинга поведения человека, например, в качестве домашнего робота-помощника, который может предугадывать ваши намерения, доставляя вещи заранее», — продолжил Чжоу. «Его [также можно использовать] для анализа огромного [количества] видео в Интернете, чтобы лучше понимать видео и находить видео».

Следующий шаг проекта будет включать повышение способности ИИ распознавать большее количество объектов и действий. Команда также работает с исследователями робототехники над внедрением этого распознавания активности в роботизированные системы. В результате они могли улучшить навыки восприятия и визуального мышления.

Рекомендации редакции

  • Никто не хочет покупать чипы AMD Zen 4 — что происходит?
  • ИИ Zoom Технология определения эмоций во время звонков расстроила критиков
  • Забавная формула: Почему машинный юмор — это Святой Грааль искусственного интеллекта
  • Nvidia снижает барьер для входа в сферу искусственного интеллекта. с Fleet Command и LaunchPad
  • ИИ от IBM Корабль Mayflower пересекает Атлантику, и вы можете наблюдать за этим в прямом эфире

Обновите свой образ жизниDigital Trends помогает читателям быть в курсе быстро меняющегося мира технологий благодаря всем последним новостям, забавным обзорам продуктов, содержательным редакционным статьям и уникальным кратким обзорам.