LipNet: ¿Qué tan fácil crees que es leer los labios?
Sabiendo que HAL escucha constantemente lo que dicen, se retiran a algún lugar donde saben que HAL no puede escuchar y aceptan desconectarlo. HAL desmiente su plan después de que los dos astronautas no tuvieran en cuenta la Las capacidades superiores de lectura de labios de la IA.
Cosas futuristas, ¿eh? No según una investigación realizada por investigadores de la Universidad de Oxford. Han desarrollado un programa de inteligencia artificial llamado LipNet, que es capaz de interpretar con precisión lo que dicen las personas, basándose únicamente en la forma en que mueven la boca al hablar.
Relacionado
- Photoshop AI cree que la "felicidad" es una sonrisa con dientes podridos
- Le presenté mi ridícula idea de inicio a un robot VC
- ¿Cómo sabremos cuándo una IA realmente se vuelve sensible?
"LipNet realiza la lectura de labios a nivel de oración mediante el aprendizaje automático". Brendan Shillingford, uno de los investigadores del papel, dijo a Digital Trends. “Una red neuronal similar a los modelos de reconocimiento de voz más modernos procesa una secuencia de fotogramas de vídeo y los asigna a una frase. Los enfoques anteriores funcionaban mediante palabras individuales predichas en lugar de oraciones”.
Vídeos recomendados
El rendimiento de LipNet se compara increíblemente favorablemente con el de los expertos en lectura de labios humanos en el corpus GRID, el conjunto de datos de lectura de labios a nivel de oración más grande disponible públicamente. De hecho, mientras que los expertos humanos obtuvieron sólo el 52 por ciento, LipNet obtuvo el 93 por ciento. Su enfoque de lectura de labios basado en oraciones también superó el mejor intento anterior realizado por una máquina, que logró una precisión del 79,6 por ciento en el mismo conjunto de datos.
Sin embargo, mientras que el ficticio HAL 9000 utiliza sus poderes de lectura de labios para nada bueno, el equipo detrás de LipNet tiene otros objetivos para su creación. Alrededor de 360 millones de personas en todo el mundo padecen pérdida auditiva incapacitante. Herramientas como LipNet podrían ser muy importantes para estas personas, ya que les ayudarán a interpretar con precisión el habla de una manera que les facilite la vida.
“Otras aplicaciones que nos interesan incluyen el dictado silencioso en espacios públicos, conversaciones encubiertas, reconocimiento de voz en entornos ruidosos, identificación biométrica y procesamiento de películas mudas”, Shillingford continuado.
Si bien la vigilancia será un problema con cualquier tecnología como ésta, Nando de Freitas, que también trabajó en el proyecto, dijo que no es una aplicación en la que se hayan centrado. Sin embargo, dijo que “no sería sorprendente” que otros laboratorios intentaran aprovechar ese trabajo para ese propósito en el futuro.
"El público debe ser consciente de esto y confiar en nuestras instituciones democráticas legales para establecer leyes apropiadas que protejan nuestra privacidad y dignidad", continuó de Freitas. "Esperamos que al publicar este trabajo ayudemos a crear conciencia y, al mismo tiempo, enfaticemos la utilidad de esta tecnología para ayudar a las personas necesitadas".
Recomendaciones de los editores
- El rival ChatGPT de Apple puede escribir código automáticamente por usted
- Meta creó DALL-E para video, y es a la vez espeluznante y sorprendente.
- Las ilusiones ópticas podrían ayudarnos a construir la próxima generación de IA
- La computadora portátil de aprendizaje automático de Lambda es un Razer disfrazado
- Lea la inquietantemente hermosa "escritura sintética" de una IA. que piensa que es dios
Mejora tu estilo de vidaDigital Trends ayuda a los lectores a mantenerse al tanto del vertiginoso mundo de la tecnología con las últimas noticias, reseñas divertidas de productos, editoriales interesantes y adelantos únicos.