Proceso de reconocimiento facial Nuevo estándar MPEG

NEC Corporation (NEC) y Samsung Advanced Institute of Technology (SAIT) anunciaron hoy que el Comité MPEG (Moving Picture Experts Group) ha decidido adoptar NEC y SAIT propusieron conjuntamente una nueva tecnología de reconocimiento facial para el próximo estándar MPEG-7 (*) que se publicará en “ISO/IEC 15938-3:2002/Amd.1”. en la primavera de 2004.

El estándar MPEG-7 proporciona un conjunto de herramientas estandarizadas para describir contenido importante para la recuperación multimedia. Hasta la fecha ha existido la necesidad de estandarizar la descripción facial para representar los rasgos faciales como herramienta para identificar personas. Se eligió la tecnología NEC/SAIT debido al mejor rendimiento en precisión de recuperación, velocidad y tamaño de datos propuesto en las pruebas comparativas de MPEG-7.

Vídeos recomendados

Conocida como MPEG-7 AFR (Descriptor avanzado de reconocimiento facial), la tecnología es un método de descripción que presenta rasgos faciales en forma de imágenes fijas o en movimiento para su recuperación multimedia. Ofrece un tamaño de datos extremadamente pequeño y una recuperación rápida y precisa. Los rasgos faciales pueden describirse como metadatos que permiten una variedad de aplicaciones, como la recuperación instantánea de un escena de un gran sistema de archivo de vídeo, o de una aparición en una escena de actuación utilizando el rostro humano como consulta factor. Su adopción en la normalización internacional permitirá el establecimiento de grandes sistemas de archivo con la función de buscar y recuperar escenas utilizando el rostro como elemento. factor de consulta y se espera que despliegue nuevos servicios en el mercado de la difusión de la radiodifusión digital e Internet, como archivos de vídeo, vídeos domésticos y vigilancia. sistemas.

Se ha logrado mediante lo siguiente:
(1) NEC desarrolló el “Análisis discriminante lineal en cascada”, que selecciona características de rostros humanos en orden de desempeño. dentro de la arquitectura en cascada y realiza una descripción precisa de cada imagen facial en un tamaño de datos mínimo de 253 bits/cara.
(2) SAIT desarrolló un “Método de representación de rasgos faciales basado en componentes faciales” que extrae los rasgos faciales de cada componente de la cara, como los ojos y la boca, y cuando se aplica a (1) mejora el nivel de precisión de la tecnología.

En comparación con el estándar anterior, esta tecnología consigue una reducción de la tasa de error de recuperación de un octavo (1/8) de media. Además, logra una capacidad de velocidad equivalente de un millón de veces por segundo en una PC convencional, por lo que permitiendo recuperar una escena protagonizada por una persona específica en aproximadamente un segundo a partir de un programa de 24 horas. video.

Con la rápida difusión de las tecnologías de redes de TI en los últimos años, las tecnologías de recuperación multimedia se han convertido en Cada vez más importante para proporcionar acceso a los contenidos que los usuarios requieren de grandes formatos multimedia de vídeo y audio. bases de datos. Cada empresa seguirá desarrollando tecnologías de recuperación multimedia mediante una mayor integración de reconocimiento de vídeo y audio, y nos esforzamos por desarrollar un producto basado en esta tecnología lo antes posible. oportunidad.

Lea mas en Sitio web de NEC.

Recomendaciones de los editores

  • El nuevo impulso tecnológico 3D de Sony no es para televisores, es para nuestros teléfonos

Mejora tu estilo de vidaDigital Trends ayuda a los lectores a mantenerse al tanto del vertiginoso mundo de la tecnología con las últimas noticias, reseñas divertidas de productos, editoriales interesantes y adelantos únicos.