Процесс распознавания лиц Новый стандарт MPEG

Корпорация NEC (NEC) и Институт передовых технологий Samsung (SAIT) сегодня объявили, что комитет MPEG (Группа экспертов по движущимся изображениям) решил принять NEC и SAIT совместно предложили новую технологию распознавания лиц для будущего стандарта MPEG-7 (*), который будет опубликован в «ISO/IEC 15938-3:2002/Amd.1». весной 2004.

Стандарт MPEG-7 предоставляет набор стандартизированных инструментов для описания контента, важного для поиска мультимедиа. На сегодняшний день возникла необходимость стандартизировать описание лица, чтобы представить черты лица как инструмент идентификации людей. Технология NEC/SAIT была выбрана из-за лучших показателей точности извлечения, скорости и размера данных, предложенных в тестах производительности MPEG-7.

Рекомендуемые видео

Эта технология, получившая название MPEG-7 AFR (расширенный дескриптор распознавания лиц), представляет собой метод описания, который представляет черты лица в виде неподвижного или движущегося изображения для поиска мультимедиа. Он может похвастаться чрезвычайно малым размером данных, а также быстрым и точным поиском. Черты лица можно описать как метаданные, позволяющие использовать различные приложения, например мгновенное извлечение данных. сцена из большого видеоархива или появление в актерской сцене с использованием человеческого лица в качестве запроса фактор. Благодаря принятию в международную стандартизацию это позволит создать большие архивные системы с функцией поиска и извлечения сцен, используя лицо в качестве изображения. фактор запроса и, как ожидается, развернет новые услуги на рынке распространения цифрового вещания и Интернета, такие как видеоархивы, домашнее видео и наблюдение. системы.

Это было достигнуто за счет следующего:
(1) NEC разработала «Каскадный линейный дискриминантный анализ», который выбирает черты человеческих лиц в порядке производительности. в каскадной архитектуре и реализует точное описание каждого изображения лица с минимальным размером данных 253. кусочки/лицо.
(2) Компания SAIT разработала «Метод представления черт лица на основе компонентов лица», который извлекает черты лица из каждый компонент лица, такой как глаза и рот, и при применении к (1) повышает уровень точности технологии.

По сравнению с предыдущим стандартом эта технология позволяет снизить уровень ошибок поиска в среднем на одну восьмую (1/8). Кроме того, он реализует возможность согласования скорости в один миллион раз в секунду на обычном ПК, таким образом что позволяет получить сцену с участием конкретного человека примерно за одну секунду из 24-часового периода. видео.

В связи с быстрым распространением сетевых технологий в последние годы технологии поиска мультимедиа стали становится все более важным для обеспечения доступа к содержимому, которое требуется пользователям от больших мультимедийных видео и аудио. базы данных. Каждая компания продолжит развивать технологии мультимедийного поиска путем дальнейшей интеграции распознавания видео и аудио и стремиться как можно скорее разработать продукт на основе этой технологии. возможность.

Подробнее читайте на Веб-сайт NEC.

Рекомендации редакции

  • Новая 3D-технология Sony предназначена не для телевизоров, а для наших телефонов

Обновите свой образ жизниDigital Trends помогает читателям быть в курсе быстро меняющегося мира технологий благодаря всем последним новостям, забавным обзорам продуктов, содержательным редакционным статьям и уникальным кратким обзорам.