ИИ, читающий по губам, ломает людей при интерпретации немых предложений

LipNet: Насколько легко, по вашему мнению, читать по губам?

Одна из самых запоминающихся частей научно-фантастического шедевра Стэнли Кубрика. 2001: Космическая одиссея представляет собой сюжетную линию, в которой два члена Дискавери Один Экипаж космического корабля все больше подозрительно относится к поведению корабельного ИИ-помощника HAL 9000.

Зная, что HAL постоянно прислушивается к тому, что они говорят, они уходят туда, где, как они знают, HAL не может слушать, и соглашаются отключить его. HAL разрушает свой план после того, как два астронавта не приняли во внимание Превосходные возможности ИИ читать по губам.

Футуристическая штука, да? Нет, согласно исследованию, проведенному исследователями Оксфордского университета. Они разработали программу искусственного интеллекта под названием LipNet, которая способна точно интерпретировать то, что говорят люди, основываясь исключительно на том, как они двигают ртом во время разговора.

Связанный

  • Искусственный интеллект Photoshop считает, что «счастье» — это улыбка с гнилыми зубами
  • Я поделился своей нелепой идеей стартапа с роботом-венчурцем.
  • Как мы узнаем, когда ИИ действительно станет разумным?

«LipNet выполняет чтение по губам на уровне предложений с помощью машинного обучения», Брендан Шиллингфорд, один из исследователей бумага, рассказал Digital Trends. «Нейронная сеть, подобная современным моделям распознавания речи, обрабатывает последовательность видеокадров, сопоставляя их с предложением. Предыдущие подходы работали на основе предсказания отдельных слов, а не предложений».

Рекомендуемые видео

Производительность LipNet невероятно выгодно отличается от результатов экспертов по чтению по губам среди людей в корпусе GRID, крупнейшем общедоступном наборе данных по чтению по губам на уровне предложений. Фактически, если эксперты-люди получили всего 52 процента, то LipNet набрал 93 процента. Его подход к чтению по губам, основанный на предложениях, также разбил лучшую предыдущую попытку машины, которая добилась точности 79,6 процента на том же наборе данных.

Однако, хотя вымышленный HAL 9000 использует свои способности чтения по губам во вред, у команды LipNet есть другие цели для своего создания. Около 360 миллионов человек во всем мире страдают инвалидизирующей потерей слуха. Такие инструменты, как LipNet, могут быть очень важны для этих людей, помогая точно интерпретировать речь и облегчая их жизнь.

«Другие приложения, которые нас интересуют, включают тихую диктовку в общественных местах, тайные разговоры, распознавание речи в шумной обстановке, биометрическая идентификация и обработка немого кино», Шиллингфорд. продолжение.

Хотя слежка будет проблемой при использовании любой подобной технологии, Нандо де Фрейтас, который также работал над проектом, сказал, что они сосредоточены не на этом приложении. Однако он сказал, что «не было бы удивительно», если бы другие лаборатории попытались продолжить подобную работу для этой цели в будущем.

«Общественность должна знать об этом и полагаться на наши правовые демократические институты в принятии соответствующих законов, которые защищают нашу частную жизнь и достоинство», — продолжил де Фрейтас. «Мы надеемся, что, опубликовав эту работу, мы поможем повысить осведомленность, одновременно подчеркивая полезность этой технологии для помощи нуждающимся людям».

Рекомендации редакции

  • Конкурент Apple ChatGPT может автоматически писать для вас код
  • Мета сделала DALL-E для видео, и это одновременно жутко и потрясающе
  • Оптические иллюзии могут помочь нам создать ИИ следующего поколения
  • Ноутбук Lambda для машинного обучения — это замаскированная Razer
  • Прочтите устрашающе красивое «синтетическое писание» ИИ. который думает, что это Бог

Обновите свой образ жизниDigital Trends помогает читателям быть в курсе быстро меняющегося мира технологий благодаря всем последним новостям, забавным обзорам продуктов, содержательным редакционным статьям и уникальным кратким обзорам.