Ansigtsgenkendelsesproces Ny MPEG-standard

NEC Corporation (NEC) og Samsung Advanced Institute of Technology (SAIT) meddelte i dag, at MPEG (Moving Picture Experts Group) Committee har besluttet at vedtage NEC og SAIT foreslog i fællesskab ny ansigtsgenkendelsesteknologi til den kommende MPEG-7 standard (*), der skal offentliggøres i "ISO/IEC 15938-3:2002/Amd.1." i foråret 2004.

MPEG-7-standarden giver et sæt standardiserede værktøjer til at beskrive indhold, der er vigtigt for multimediehentning. Til dato har der været et behov for at standardisere ansigtsbeskrivelser til at repræsentere ansigtstræk som et værktøj til at identificere personer. NEC/SAIT-teknologien blev valgt på grund af den bedste ydeevne i genfindingsnøjagtighed, hastighed og datastørrelse foreslået i MPEG-7 benchmark-testene.

Anbefalede videoer

Benævnt MPEG-7 AFR (Advanced Face Recognition Descriptor), teknologien er en beskrivelsesmetode, der præsenterer ansigtstræk i stillbilleder eller levende billeder til multimedie-hentning. Det kan prale af ekstremt lille datastørrelse samt hurtig og præcis hentning. Ansigtstræk kan beskrives som metadata, der muliggør en række applikationer, såsom øjeblikkelig hentning af en scene fra et stort videoarkivsystem eller af en optræden i en skuespillerscene, der bruger det menneskelige ansigt som forespørgsel faktor. Gennem adoption i international standardisering vil det muliggøre etablering af store arkivsystemer med funktionen til at søge og hente scener ved at bruge ansigtet som forespørgselsfaktor og forventes at implementere nye tjenester på markedet for spredning af digital udsendelse og internettet, såsom videoarkiver, hjemmevideoer og overvågning systemer.

Det er opnået ved følgende:
(1) NEC udviklede "Cascaded Linear Discriminant Analysis", som udvælger træk ved menneskelige ansigter i rækkefølge inden for den kaskadende arkitektur og realiserer en nøjagtig beskrivelse af hvert ansigtsbillede i en minimumsdatastørrelse på 253 bits/ansigt.
(2) SAIT udviklede "Face Component Based Face Feature Representation Method", der uddrager ansigtstræk fra hver ansigtskomponent, såsom øjne og mund, og når de påføres (1) forbedrer nøjagtighedsniveauet af teknologi.

I sammenligning med den tidligere standard opnår denne teknologi en reduktion i frekvensen af ​​genfindingsfejl med en ottendedel (1/8) i gennemsnit. Derudover realiserer den en matchende hastighedskapacitet på en million gange i sekundet på en konventionel pc således gør det muligt at hente en scene med en bestemt person i hovedrollen på cirka et sekund fra et 24 timer video.

Med den hurtige udbredelse af IT-netværksteknologier i de senere år er multimediesøgningsteknologier blevet stadig vigtigere for at give adgang til indhold, som brugerne kræver fra store multimedievideoer og -lyd databaser. Hver virksomhed vil fortsætte med at udvikle multimedie-hentningsteknologier gennem yderligere integration af video- og lydgenkendelse, og stræber efter at udvikle et produkt baseret på denne teknologi tidligst lejlighed.

Læs mere på NECs hjemmeside.

Redaktørens anbefalinger

  • Sonys nye 3D-teknologiske push er ikke til tv - det er til vores telefoner

Opgrader din livsstilDigital Trends hjælper læserne med at holde styr på den hurtige teknologiske verden med alle de seneste nyheder, sjove produktanmeldelser, indsigtsfulde redaktionelle artikler og enestående smugkig.