Майбутнє AR – це навушники, а не окуляри

ілюстрація навушника у вусі людини
Genevieve Poblano/Digital Trends Graphics

Роміт Рой Чоудхурі має великі вуха. Але не в що спосіб. Рой Чоудхурі, професор електротехніки та інформатики в Університеті Іллінойсу в Урбана-Шампейн, твердо вірить у потенціал зміни парадигми того, що він називає earable (ні, не носимий) комп’ютер.

Зміст

  • Навушники для читання думок?
  • Розвантаження до вух
  • Закон Дормеля
  • Обіцянка носіння

Це означає підключитися до величезних можливостей апаратного та програмного забезпечення, які працюють за допомогою цих двох фантастичних отворів для прослуховування з боків вашої голови. А також допомагати в розробці всього: від додатків конфіденційності та безпеки до медичної діагностики інструментів, орієнтованих на майбутнє доповненої реальності, він збирає команду експертів, щоб допомогти йому.

Рекомендовані відео

«Я можу використовувати майже будь-кого в інформатиці та електротехніці», — сказав він Digital Trends. «Спектр проблем на моєму радарі величезний».

Пов'язані

  • Вас хвилює глибоке фейкове попередження ФБР? Дотримуйтеся цих порад експертів
  • Нова програма ChatGPT від OpenAI є безкоштовною для iPhone та iPad
  • Тепер ви можете спілкуватися у відеочаті за допомогою ШІ ChatGPT — ось як це виглядає
Apple AirPods Pro і Samsung Galaxy Buds Live
Джарон Шнайдер / Digital Trends

Навушники вже є величезним ринком. Apple AirPods, її лінійка бездротових навушників, лише у 2019 році було продано 60 мільйонів одиниць. У минулому році така кількість була за оцінками, зросте до 85 мільйонів. Сьогодні багато компаній виробляють розумні навушники, які пропонують активне шумозаглушення, A.I. розумні помічники тощо.

За кілька десятиліть до AirPods, ще у 1980-х роках, з’явився Walkman, чи не перша сучасна технологія, що носиться, яка дозволяла користувачам брати музику з собою куди завгодно. Walkman дав користувачам панування не лише над тим, що вони слухали (скажімо, The Smiths), але також, завдяки пластиковим навушникам, що затикали їм вуха, над тим, що вони не слухали (скажімо, їхні батьки). Це дозволило людям створювати та контролювати саундтрек до свого життя, надаючи нам усім наші власні бульбашки сенсу. У той час як бумбокс мав на меті дозволити — або, у деяких випадках, змусити — інших слухати нашу музику, Walkman зробив прослуховування фундаментально особистим, ізольованим досвідом.

Флоріан Шмец/Unsplash

Але Рой Чоудхурі та його команда хочуть піти далі. Вони прагнуть перетворити сучасні навушники-вкладиші на абсолютно нову обчислювальну платформу, яка могла б у деяких випадках замінити вам потребу тягнутися до смартфон або комп'ютер. Якби програвач Walkman видав кожному свій власний міхур звуку, щоб насолоджуватися, коли вони йшли вулицею, у цю епоху розумніші технології та персоналізація, ці бульбашки можна використати в нових, захоплюючих і — іноді — трохи дивних шляхи.

Навушники для читання думок?

«Більшість ринку носимих комп’ютерів [поки що] зосереджено на пристроях, які носяться на нижній частині тіла, переважно в кишенях або на зап’ястях, можливо, у взутті», — сказав Рой Чоудхурі. «Це означає, що ви відчуваєте нижню частину тіла, наприклад, що ви робите своїми руками, зап’ястями, ногами. Але є багато інформації, яка генерується у верхній частині тіла, головним чином у вашій голові, наприклад слухання, розмова, їжа, емоції на обличчі, потенційні ключі до медичної інформації — це може бути безцінний. Святий Грааль, останній кордон цього, може навіть бути сприйняття сигналів мозку близько до вашої голови».

Ідея можливості не просто пасивно слухати пристрій-вкладиш, але й розмовляти з ним, є основою розумних помічників, таких як Siri. Але мова, яка використовується в сучасному ШІ. помічників, навмисне дрібний. Порівняно із зображенням (вартістю тисячі слів), Siri найкраща з швидкими вибухами інформації, як-от пошук прогнозу погоди чи встановлення таймера на кухні. Але це приблизно межа. Ідея earable computing полягає в тому, щоб знайти способи розвантажити деякі інші речі, заради яких ми зараз змушені дивитися на екрани, і поставити їх на (і в) наші вуха.

пісня ідентифікація ai
Крішна П. Міяпурам

«Усе, що ви робите на візуальному екрані, ви зосереджуєте всю свою когнітивну увагу», — сказав він. «Читати — навіть якщо це дурний жарт, який ви читаєте на екрані — ви не можете зосередитися ні на чому іншому. Читання повністю захоплює вашу когнітивну увагу. Я переконаний, що є багато таких речей, які не заслуговують вашої повної когнітивної уваги. Ми можемо витягнути їх із візуальної області та підштовхнути до невикористаної та немонополізованої аудіосфери, де людський мозок природним чином дуже добре розвинувся, щоб мультиплекс між такою аудіоінформацією… Чому б не взяти ці прості речі та не перемістити їх із вашого когнітивного, візуального когнітивного каналу в акустичний пропускна здатність?»

Недавній експеримент, проведений командою, включав дослідження способів, якими ми можемо більш осмислено споживати текст чутний форму. Якщо ви читаєте статтю, ви можете побачити ключове слово, яке вас цікавить, і з цього моменту почати читати. Однак немає простого способу зробити це, коли, наприклад, ви слухаєте подкаст.

«Одна з речей, які ми намагаємося зробити в нашій лабораторії, це [запитати], чи можу я пришвидшити прослуховування статті?» — сказав Рой Чоудхурі.

Розвантаження до вух

У груповій демонстрації підтвердження концепції слухачеві одночасно читають кілька абзаців статті. Ця хитрість полягає в тому, що використовується обробка сигналу, щоб кожен абзац звучав так, ніби він надходить з іншого напрямку – це схоже на те, щоб сидіти у ресторані та ведуть чотири розмови за сусідніми столиками, але набирають один, тому що мешканці згадують особу, яку ви знати. Щоб покращити цю роботу, команда встановила інерційний вимірювальний блок (IMU) у навушниках, щоб користувач може підвищити певний голос (одну частину тексту), злегка повернувши при цьому голову напрямок.

«Я називаю цей проект «читанням в акустичній сфері», де я дивлюся на напрямок голосу третього абзацу, і цей голос стає голоснішим, а інші голоси трохи слабшають», — сказав він.

Це також не все про мову. Команда також виявила, що як мікрофон, так і IMU в навушниках можна використовувати, щоб вловлювати неймовірно ледь помітні вібрації на обличчі, такі ж крихітні, як людина цокає зубами або мімічні м’язи хмуряться або посміхаються. Ні, ви, мабуть, не відмовлятиметеся від свого смартфона, щоб лепетати зубами повідомлення азбукою Морзе. Але ідея, що ці незначні викривлення обличчя, такі як ковзання правих зубів, можуть бути використані для виконувати команди — або навіть діяти як підтвердження особи для двофакторної автентифікації — безперечно цікаво.

«Кожен знайомий із Siri, але уявіть, скільки потенційних можливостей можна було б використовувати для Siri, якби вона мала просторовий вимір, як вентрилоквіст, який здатний вимовляти свій голос».

Крім того, це може бути корисним для збору лонгітюдних даних для таких речей, як медична діагностика. Тривожні розлади, наприклад, можна діагностувати за певними закономірностями, виявленими в русі зубів. Рой Чоудхурі також зазначив, що є дослідники, які працюють над такими проблемами, як вимірювання кровотоку через вуха, щоб оцінити частоту серцевих скорочень, рівень глюкози, м’язову активність тощо.

Бажаєте інше можливе використання? Як на рахунок звукова доповнена реальність? Доповнена реальність наразі найбільш відома тим, що накладає створені комп’ютером об’єкти на реальний світ. Але немає причин, чому збільшення має відбуватися виключно на візуальному спектрі. Команда Роя Чоудхурі в захваті від перспективи використання технології обробки сигналів для відображення певних звуків на вашому ландшафті, щоб ви могли орієнтуватися в аеропорт, музей чи будь-яке інше громадське місце може включати ходьбу до голосу, який каже «йди за мною», який, здається, йде з того напрямку, у якому вам потрібно прямувати в.

Siri

Усі знайомі з Siri, але уявіть, скільки потенційних можливостей можна було б використати для Siri, якби вона мала просторовий вимір, як-от вентрилоквіст, який здатний вимовляти свій голос. Це розширення простору також може допомогти покращити великі віртуальні зустрічі, коли голос кожної особи буде відображено в певному місці, що спростить одразу визначити, хто говорить.

Звичайно, не все це здійсниться. Вони є інженерною версією копірайтера, який малює ідеї для реклами. Багато з них можуть і не потрапити до списку, але один або два приклади можуть бути дуже корисними.

Закон Дормеля

Це ще одна причина, чому Рой Чоудхурі так захоплений потенціалом постійних навушних комп’ютерів — і його шансами на успіх у реальному світі. Суспільна реакція на те, які технології будуть використовуватися, залежить набагато більше, ніж того хотілося б технологам. Нові технології, за визначенням, є новими. Нове може прирівнюватися до дивного. Щоб використати моє власне формулювання (назвемо його законом Дормеля, для удару по нащадкам), очевидна корисність будь-якої нової технології має подвійно компенсувати притаманну тупість її використання.

«Це проблема, оскільки дуже мало технологій з’являються повністю сформованими».

Персональний комп’ютер, який люди використовували вдома, не міг дозволити собі нічого використовувати протягом перших кількох років на ринку, оскільки соціальні ставки від його використання були дуже низькими. Трохи вищі ставки були на ноутбук, який використовується в громадських місцях. Носимі речі, які особливо помітні через те, що їх носять на тілі, є більш помітно дивними, ніж більшість технологій. Частина техніки, яку збираються застрягти на голові, виглядаючи як кібернетичний імплантат на дроні Борга, має бути блискучий і негайно корисний, якщо користувач вважає, що він вартий того, щоб його побачили носити його.

Джарон Шнайдер / Digital Trends

Це проблема, оскільки дуже мало технологій з’являються повністю сформованими. У більшості випадків перші кілька поколінь продукту побудовані на помилкових обіцянках, перш ніж десь приблизно на третій ітерації з’явиться більш переконлива пропозиція. Якщо високопомітний продукт не досягає успіху з першого дня, його шанси на успіх у довгостроковій перспективі можуть бути зведені нанівець, навіть якщо він зрештою перетвориться на хороший продукт. Для старших шанувальників техніки варто розглянути портативний пристрій Apple Newton і його першу спробу розпізнавання рукописного тексту. Для молодших шанувальників закон Дормела може пояснити невдачу Google Glass, яка викликала величезну суспільну стигматизацію та осуд і спрацювала… майже добре.

Навушники, як зазначив Рой Чоудхурі, бувають різними. Будь-які битви, які могли колись існувати навколо них, більш-менш уже виграні. «Суспільство вже сприйняло людей, які носять навушники», — сказав він. «... У певному сенсі лише алгоритми, датчики та апаратне забезпечення тепер потрібно оновити. Це лише технологічне вузьке місце, а не соціальне, психологічне».

Обіцянка носіння

Той факт, що навушники були прийняті, знижує ставки та означає, що більше не потрібно мати негайний бінарний результат. Навіть якщо найвищі цілі, описані Роєм Чоудхурі, не будуть досягнуті протягом тривалого часу, поступове вдосконалення додасть користі перевіреному форм-фактору.

«Високо висять фрукти [це такі речі, як] «за жестами моїх зубів я можу виявити напади» або «за моїми жести обличчя, я можу зрозуміти настрій людини, так що це стає схожим на Fitbit для настрою", - він сказав. «Але навіть якщо це не вдасться, це не завадить продуктопроводу. Однак якщо вони досягли успіху, це просто перетворило продукт на щось фантастичне».

Рой Чоудхурі вважає, що потенціал вушних комп’ютерів майже безмежний. «Я думаю, що дорога попереду виходить далеко за межі мови», — сказав він. «Я б сказав, що мова – це найвнутрішнє коло, яке лежить в основі [цієї технології]. Поза цією взаємодією є акустика загалом. А зовнішня акустика – це всілякі інші датчики та можливості. Якщо ви думаєте про те, як ми збираємося почати будувати цю платформу, то це буде низьким результатом мовленнєва взаємодія: «Встановіть таймер», «Привіт, Сірі, яка сьогодні погода?» Але це може зайти далеко, далеко поза цим."

Інші дослідники, які разом із Роєм Чоудхурі працюють над носимими комп’ютерами, включають Чжицзянь Ян, Ю-Лінь Вей, Джей Пракаш, і Цзіюе Лі.

Рекомендації редакції

  • Додаток ChatGPT для iPhone тепер має вбудований Bing
  • Apple не зробила Siri вбивцею ChatGPT на WWDC — і це мене лякає
  • Забудьте про ChatGPT — Siri та Google Assistant роблять ці 4 речі краще
  • Apple створює тренера зі штучного інтелекту для здоров’я Apple Watch, стверджує звіт
  • Цей дивний пристрій штучного інтелекту може замінити ваш смартфон у майбутньому