Корпорація NEC (NEC) і Інститут передових технологій Samsung (SAIT) сьогодні оголосили, що Комітет MPEG (група експертів з рухомого зображення) вирішив прийняти NEC і SAIT спільно запропонували нову технологію розпізнавання обличчя для майбутнього стандарту MPEG-7 (*), який буде опубліковано в «ISO/IEC 15938-3:2002/Amd.1». навесні 2004.
Стандарт MPEG-7 надає набір стандартизованих інструментів для опису вмісту, важливого для пошуку мультимедіа. На сьогоднішній день існувала потреба стандартизувати опис обличчя, щоб представити риси обличчя як інструмент для ідентифікації людей. Технологія NEC/SAIT була обрана завдяки найкращій продуктивності щодо точності пошуку, швидкості та розміру даних, запропонованих у порівняльних тестах MPEG-7.
Рекомендовані відео
Ця технологія, яка називається MPEG-7 AFR (Advanced Face Recognition Descriptor), являє собою метод опису, який представляє риси обличчя у формі нерухомого або рухомого зображення для мультимедійного пошуку. Він може похвалитися надзвичайно малим розміром даних, а також швидким і точним пошуком. Риси обличчя можна описати як метадані, які дають змогу використовувати різні програми, наприклад миттєве отримання сцена з великої системи відеоархіву або поява в акторській сцені з використанням людського обличчя як запиту фактор. Завдяки прийняттю міжнародної стандартизації це дозволить створити великі архівні системи з функцією пошуку та отримання сцен, використовуючи обличчя як фактор запиту та, як очікується, розгорне нові послуги на ринку поширення цифрового мовлення та Інтернету, такі як відеоархіви, домашнє відео та спостереження системи.
Це було досягнуто наступним чином:
(1) NEC розробила «Каскадний лінійний дискримінантний аналіз», який вибирає риси людських облич у порядку виконання в рамках каскадної архітектури та реалізує точний опис кожного зображення обличчя в мінімальному розмірі даних 253 біти/обличчя.
(2) SAIT розробив «Метод представлення ознак обличчя на основі компонентів обличчя», який витягує риси обличчя з кожен компонент обличчя, наприклад очі та рот, і при застосуванні до (1) покращує рівень точності технології.
У порівнянні з попереднім стандартом, ця технологія досягає зниження частоти помилок пошуку в середньому на одну восьму (1/8). Крім того, він реалізує відповідну швидкість в один мільйон разів на секунду на звичайному ПК що дозволяє отримати сцену з конкретною особою приблизно за одну секунду з 24 годин відео.
Зі швидким розповсюдженням ІТ-мережевих технологій в останні роки, мультимедійні технології пошуку стали стає все більш важливим для надання доступу до вмісту, який потрібен користувачам із великого мультимедійного відео та аудіо бази даних. Кожна компанія продовжуватиме розвивати мультимедійні технології пошуку шляхом подальшої інтеграції розпізнавання відео та аудіо, і прагнути якнайшвидше розробити продукт на основі цієї технології можливість.
Докладніше на Веб-сайт NEC.
Рекомендації редакції
- Нова 3D-технологія від Sony не для телевізорів, а для наших телефонів
Оновіть свій спосіб життяDigital Trends допомагає читачам стежити за динамічним світом технологій завдяки всім останнім новинам, цікавим оглядам продуктів, проникливим редакційним статтям і унікальним у своєму роді коротким оглядам.