Processo de reconhecimento facial Novo padrão MPEG

click fraud protection

A NEC Corporation (NEC) e o Samsung Advanced Institute of Technology (SAIT) anunciaram hoje que o Comitê MPEG (Moving Picture Experts Group) decidiu adotar A NEC e a SAIT propuseram conjuntamente uma nova tecnologia de reconhecimento facial para a próxima norma MPEG-7 (*) a ser publicada em “ISO/IEC 15938-3:2002/Amd.1”. na primavera de 2004.

O padrão MPEG-7 fornece um conjunto de ferramentas padronizadas para descrever conteúdo importante para recuperação multimídia. Até o momento, tem havido uma necessidade de padronizar a descrição facial para representar características faciais como uma ferramenta para identificar pessoas. A tecnologia NEC/SAIT foi escolhida devido ao melhor desempenho em precisão de recuperação, velocidade e tamanho de dados proposto nos testes de benchmark MPEG-7.

Vídeos recomendados

Chamada de MPEG-7 AFR (Advanced Face Recognition Descriptor), a tecnologia é um método de descrição que apresenta características faciais em formato de imagem estática ou em movimento para recuperação multimídia. Possui tamanho de dados extremamente pequeno, bem como recuperação rápida e precisa. As características faciais podem ser descritas como metadados que permitem uma variedade de aplicações, como a recuperação instantânea de um cena de um grande sistema de arquivo de vídeo ou de uma aparição em uma cena de atuação usando o rosto humano como consulta fator. Através da adoção na padronização internacional, permitirá o estabelecimento de grandes sistemas de arquivo com a função de pesquisar e recuperar cenas usando o rosto como fator de consulta e deverá implantar novos serviços no mercado de difusão da radiodifusão digital e da Internet, como arquivos de vídeo, vídeos domésticos e vigilância sistemas.

Isso foi alcançado através do seguinte:
(1) A NEC desenvolveu a “Análise Discriminante Linear em Cascata”, que seleciona características de rostos humanos por ordem de desempenho dentro da arquitetura em cascata e realiza uma descrição precisa de cada imagem facial em um tamanho mínimo de dados de 253 pedaços/cara.
(2) A SAIT desenvolveu o “Método de representação de características faciais baseado em componentes faciais” que extrai características faciais de cada componente do rosto, como olhos e boca, e quando aplicado a (1) melhora o nível de precisão do tecnologia.

Em comparação com o padrão anterior, esta tecnologia consegue uma redução na taxa de erro de recuperação em um oitavo (1/8) em média. Além disso, ele alcança uma capacidade de velocidade correspondente de um milhão de vezes por segundo em um PC convencional, portanto tornando possível recuperar uma cena estrelada por uma pessoa específica em aproximadamente um segundo a partir de um período de 24 horas vídeo.

Com a rápida disseminação das tecnologias de redes de TI nos últimos anos, as tecnologias de recuperação multimídia tornaram-se cada vez mais importante para fornecer acesso aos conteúdos que os usuários necessitam de grandes sistemas multimídia de vídeo e áudio bancos de dados. Cada empresa continuará a desenvolver tecnologias de recuperação multimídia através de maior integração de reconhecimento de vídeo e áudio e nos esforçamos para desenvolver um produto baseado nesta tecnologia o mais rápido possível oportunidade.

Leia mais em Site da NEC.

Recomendações dos Editores

  • O novo impulso tecnológico 3D da Sony não é para TVs – é para nossos telefones

Atualize seu estilo de vidaDigital Trends ajuda os leitores a manter o controle sobre o mundo acelerado da tecnologia com as últimas notícias, análises divertidas de produtos, editoriais criteriosos e prévias únicas.