Бъдещето на AR са слушалките, а не очилата

илюстрация на слушалка в ухото на човек
Genevieve Poblano/Digital Trends Graphics

Romit Roy Choudhury е голям в ушите. Но не и в че начин. Рой Чудхури, професор по електроинженерство и компютърни науки в Университета на Илинойс в Урбана-Шампейн, силно вярва в потенциала за промяна на парадигмата на това, което той нарича компютри за уши (не, не за носене)..

Съдържание

  • Слушалки за четене на мисли?
  • Разтоварване до ушите
  • Законът на Дормел
  • Обещанието за носими

Това означава да се включите в огромните възможности за хардуер и софтуер, които работят с тези два фантастични отвора за слушане отстрани на главата ви. И за подпомагане на разработването на всичко - от приложения за поверителност и сигурност до медицинска диагностика инструменти, фокусирани върху бъдещето на добавената реалност, той събира крак екип от експерти, които да му помогнат.

Препоръчани видеоклипове

„Мога да използвам почти всеки в областта на компютърните науки и електротехниката“, каза той пред Digital Trends. „Гамата от проблеми на моя радар е огромна.“

Свързани

  • Притеснявате се от дълбокото фалшиво предупреждение на ФБР? Следвайте тези експертни съвети
  • Новото приложение ChatGPT на OpenAI е безплатно за iPhone и iPad
  • Вече можете да водите видео чат с ChatGPT AI — ето как изглежда
Apple AirPods Pro и Samsung Galaxy Buds Live
Джарон Шнайдер / Дигитални тенденции

Слушалките вече са огромен пазар. на Apple AirPods, неговата линия безжични слушалки, продаде 60 милиона броя само през 2019 г. Миналата година това число беше се очаква да нарасне до 85 милиона. Днес много компании правят интелигентни слушалки, които предлагат активно шумопотискане, A.I. интелигентни асистенти и др.

Няколко десетилетия преди AirPods, през 80-те години на миналия век, имаше Walkman, може би първата модерна носима технология, която позволяваше на потребителите да носят музиката си със себе си, където и да отидат. Walkman даде на потребителите господство не само върху това, което слушаха (да речем The Smiths), но също така, благодарение на пластмасовите му слушалки, запушващи ушите им, това, което не слушаха (да речем родителите им). Това позволи на хората да създават и упражняват контрол върху саундтрака на живота си, давайки на всички ни собствени индивидуални мехурчета със смисъл. Докато бумбоксът позволяваше — или, в някои случаи, принуждаваше — другите да слушат нашата музика, Walkman превърна слушането в основно лично, изолирано изживяване.

Флориан Шметц/Unsplash

Но Рой Чудхури и неговият екип искат да стигнат по-далеч от това. Те се стремят да трансформират днешните слушалки в изцяло нова компютърна платформа, която в някои случаи може да замени необходимостта да посягате към своите смартфон или компютър. Ако Walkman издаде на всеки свой личен балон от звук, на който да се наслаждава, докато върви по улицата, в тази епоха на по-интелигентни технологии и персонализация, същите тези балони могат да бъдат използвани в нови, вълнуващи и – понякога – малко странни начини.

Слушалки за четене на мисли?

„По-голямата част от пазара на носими компютри (досега) се фокусира върху устройства, които се носят в долната част на тялото, най-вече в джобовете или на китките ви, може би в обувките ви“, каза Рой Чудхури. „Това означава, че можете да усетите долната част на тялото, като например това, което правите с ръцете си, с китките си, с краката си. Но има много информация, която се генерира в горната част на тялото, главно главата ви - като напр. слушане, говорене, хранене, емоции на лицето, потенциални улики за медицинска информация - това може да бъде безценен. Свещеният граал, последната граница на това, може дори да бъде усещане на мозъчни сигнали отблизо до главата ви.

Идеята да можеш не само да слушаш пасивно устройство за поставяне в ушите, но и да говориш с него, е в основата на интелигентни асистенти като Siri. Но речта, използвана в днешния ИИ. помощници, е нарочно плитък. В сравнение с картина (струваща хиляда думи), Siri е в най-добрия си вид с бързи вълни от информация, като намиране на прогнозата за времето или настройване на таймер в кухнята. Но това е границата. Идеята на компютрите с възможност за слушане е да намерим начини да разтоварим някои от другите неща, за които в момента трябва да се взираме в екраните, и да ги поставим в (и в) ушите си.

песен, идентифицираща ai
Кришна П. Мияпурам

„Всичко, което правите на визуалния екран, влагате цялото си когнитивно внимание“, каза той. „За да четете – дори и да е глупава шега, която четете на екрана – не можете да се съсредоточите върху нищо друго. Четенето отнема цялото ви когнитивно внимание. Вярвам, че има много такива неща, които не заслужават пълното ви когнитивно внимание. Можем да ги извадим от визуалната област и да ги тласнем към неизползваната и немонополизирана аудио област, където човешкият мозък естествено е еволюирал много добре, за да мултиплекс между такава аудио информация... Защо не вземете тези прости неща и не ги преместите от вашия когнитивен, визуален когнитивен канал в акустичния честотна лента?"

Скорошен експеримент, извършен от екипа, включваше изследване на начините, по които можем да използваме текст по-смислено звуков форма. Ако четете статия, може да видите ключова дума, която ви интересува, и да започнете да четете в този момент. Въпреки това, няма лесен начин да направите това, когато например слушате подкаст.

„Едно от нещата, които се опитваме да направим в нашата лаборатория, е [попитайте], мога ли да ускоря слушането на статия?“ каза Рой Чудхури.

Разтоварване до ушите

При груповата демонстрация на доказателство за концепцията слушателят има няколко параграфа в статия, които им се четат едновременно. Номерът да направите това да работи е да използвате обработка на сигнала, за да накарате всеки абзац да звучи така, сякаш идва от различна посока – това е малко като да седите в ресторант и провеждане на четири разговора на околните маси, но набиране на една, защото обитателите споменават човек, който вие зная. За да направи тази работа по-добра, екипът докосна инерционния измервателен модул (IMU) в слушалките, така че потребителят може да повиши определен глас (една част от текста), като завърти леко главата си в това посока.

„Наричам този проект „четене в акустичната област“, ​​където гледам посоката на гласа на третия параграф и този глас става по-силен, а другите гласове някак затихват“, каза той.

Освен това не всичко опира до реч. Екипът също установи, че и микрофонът, и IMU в слушалките могат да се използват за улавяне на невероятно фини вибрации в лицето, толкова малки, колкото човек трака със зъби или лицевите мускули се намръщват или се усмихват. Не, вероятно няма да зарежете смартфона си, за да бърборите със зъби съобщения чрез морзовата азбука. Но идеята, че тези малки изкривявания на лицето, като плъзгане на зъбите от дясната страна, могат да се използват за изпълнява команди - или дори да действа като потвърждение на самоличността за двуфакторно удостоверяване - със сигурност е интересно.

„Всеки е запознат със Siri, но си представете колко потенциални приложения биха могли да се отворят за Siri, ако имаше само пространствено измерение, като вентрилоквист, който е способен да хвърля гласа си.“

Това може да бъде допълнително полезно за улавяне на надлъжни данни за неща като медицинска диагноза. Тревожните разстройства, например, могат да бъдат диагностицирани от определени модели, открити в движението на зъбите. Рой Чоудхури също така отбеляза, че има изследователи, които работят върху проблеми като измерване на притока на кръв през ушите за измерване на сърдечната честота, нивата на глюкозата, мускулната активност и други.

Искате друга възможна употреба? Какво ще кажеш звукова добавена реалност? Разширената реалност в момента е най-известна с наслагването на компютърно генерирани обекти върху реалния свят. Но няма причина увеличенията да се извършват само във визуалния спектър. Екипът на Roy Choudhury е развълнуван от перспективата да използва технология за обработка на сигнали, за да картографира определени звуци върху вашия пейзаж, така че да навигирате през летище, музей или всяко друго обществено пространство може да включва ходене към глас, който казва „последвайте ме“, който изглежда идва от посоката, в която трябва да се насочите в.

Siri

Всеки е запознат със Siri, но си представете колко потенциални приложения биха могли да бъдат отворени за Siri, ако имаше само пространствено измерение, като вентрилоквист, който е способен да хвърля гласа си. Това пространствено увеличение може също така да помогне за подобряване на големи виртуални срещи, като гласът на всеки човек се картографира към конкретно място, което улеснява незабавното разпознаване кой говори.

Не всички от тях ще се сбъднат, разбира се. Те са инженерната версия на копирайтър, който рисува идеи за реклама. Много от тях може да не успеят, но един или два примера могат да бъдат изключително полезни.

Законът на Дормел

Това е още една причина, поради която Рой Чоудхури е толкова ентусиазиран от потенциала на продължаването на изчисленията с възможност за слушане – и шансовете им за успех в реалния свят. Отговорите на обществото диктуват много повече за това кои технологии да се прихванат, отколкото технолозите непременно биха искали. Новите технологии по дефиниция са нови. Новото може да се равнява на странно. За да използвам моя собствена формулировка (да я наречем закон на Дормел, за да ударим потомците), обикновената полезност на всяка нова технология трябва двойно да компенсира присъщата глупост на нейното използване.

„Това е проблем, защото много малко технологии се появяват напълно оформени.“

Персоналният компютър, който хората използваха в домовете си, можеше да си позволи малко да се използва през първите няколко години на пазара, защото социалните залози от използването му бяха толкова ниски. Лаптоп, който се използва публично, имаше малко по-високи залози. Устройствата за носене, които са особено изпъкнали поради това, че се носят върху тялото, са видимо по-странни от повечето технологии. Част от технологията, която ще бъде залепена на главата, изглеждаща като кибернетичен имплант на дрон на Борг, трябва да бъде брилянтен и незабавно полезен, ако потребителят смята, че си струва пагубното социално въздействие от това да бъде видян носейки го.

Джарон Шнайдер / Дигитални тенденции

Това е проблем, защото много малко технологии се появяват напълно оформени. В повечето случаи първите няколко поколения на даден продукт са изградени върху грешни обещания, преди някъде около третата итерация да се появи по-завладяващо предложение. Ако силно видим продукт не успее да постигне резултат от първия ден, шансовете му за успех в дългосрочен план може да бъдат осуетени, дори ако в крайна сметка се превърне в добър продукт. За по-възрастните фенове на технологиите, помислете за преносимото устройство Apple Newton и ранния му опит в разпознаването на ръкописен текст. За по-младите фенове законът на Дормел може да обясни провала на Google Glass, който дойде с огромна обществена стигма и осъждане и работеше... почти добре.

Слушалките, както отбеляза Рой Чудхури, са различни. Каквито и битки някога да са съществували за тях, повече или по-малко вече са спечелени. „Обществото вече е приело хората, носещи слушалки“, каза той. „… В известен смисъл само алгоритмите, сензорите и хардуерът сега трябва да бъдат надградени. Това е само технологично пречка, а не вече обществено, психологическо пречка.“

Обещанието за носими

Фактът, че слушалките са приети, намалява залозите и означава, че вече не трябва да има незабавен двоичен резултат. Дори ако най-високите цели, описани от Рой Чудхури, не бъдат постигнати за дълго време, постепенното подобрение ще добави полезност към доказан форм фактор.

„Висящият плод [са неща като] „от жестовете на зъбите си, мога да открия припадъци“ или „от моите жестове на лицето, мога да разбера настроението на човека, така че това да стане като Fitbit за настроение," той казах. „Но дори и това да се провали, това не възпрепятства продуктовия тръбопровод. Но ако са успешни, това просто превръща продукта в нещо фантастично.

Рой Чоудхури вярва, че потенциалът за изчисления в ушите е почти неограничен. „Мисля, че пътят напред отива далеч отвъд речта“, каза той. „Бих казал, че речта е най-вътрешният кръг, който е в основата [на тази технология]. Извън това взаимодействие е акустиката като цяло. А външната акустика е всякакви други сензори и възможности. Ако мислите как ще започнем да изграждаме тази платформа, ниско висящите плодове са базирано на реч взаимодействие: „Задайте таймер“, „Хей, Сири, какво е времето днес?“ Но може да стигне далеч, далеч отвъд това."

Други изследователи, работещи върху носимите компютри с Рой Чудхури, включват Джиджиян Янг, Ю-Лин Уей, Джей Пракаш, и Зиюе Ли.

Препоръки на редакторите

  • Приложението за iPhone на ChatGPT вече има вграден Bing
  • Apple не направи Siri убиец на ChatGPT в WWDC - и това ме плаши
  • Забравете ChatGPT – Siri и Google Assistant правят тези 4 неща по-добре
  • Apple създава AI здравен треньор за Apple Watch, твърди доклад
  • Това странно AI устройство може да замени вашия смартфон в бъдеще