Prihodnost AR so ušesne slušalke, ne očala

ilustracija ušesnega čepka v ušesu osebe
Genevieve Poblano/Grafika digitalnih trendov

Romit Roy Choudhury je na ušesa. Ampak ne v to način. Roy Choudhury, profesor elektrotehnike in računalništva na Univerzi Illinois v Urbana-Champaignu, močno verjame v potencial spreminjanja paradigme tega, kar imenuje ušesno (ne, ne nosljivo) računalništvo.

Vsebina

  • Slušalke za branje misli?
  • Razbremenitev do ušes
  • Dormehlov zakon
  • Obljuba nosljivih izdelkov

To pomeni vključitev v ogromne možnosti za strojno in programsko opremo, ki delujeta z uporabo teh dveh modnih lukenj za poslušanje na straneh vaše glave. In za pomoč pri razvoju vsega, od aplikacij za zasebnost in varnost do medicinske diagnoze orodij, osredotočenih na prihodnost razširjene resničnosti, zbira skupino strokovnjakov za crack, ki mu bodo pomagali.

Priporočeni videoposnetki

»V računalništvu in elektrotehniki lahko uporabim skoraj vsakogar,« je povedal za Digital Trends. "Paleta težav na mojem radarju je ogromna."

Povezano

  • Vas skrbi FBI-jevo opozorilo deepfake? Upoštevajte te nasvete strokovnjakov
  • Nova aplikacija OpenAI ChatGPT je brezplačna za iPhone in iPad
  • Zdaj lahko videoklepetate z AI ChatGPT - tako izgleda
Apple AirPods Pro in Samsung Galaxy Buds Live
Jaron Schneider / Digitalni trendi

Slušalke so že ogromen trg. Jabolka AirPods, njegova linija brezžičnih ušesnih čepkov, je samo v letu 2019 prodala 60 milijonov enot. Lani je bila ta številka ocenjeno na 85 milijonov. Danes mnoga podjetja izdelujejo pametne ušesne slušalke, ki ponujajo aktivno odpravljanje hrupa, A.I. pametni pomočniki in še več.

Nekaj ​​desetletij pred slušalkami AirPods, v osemdesetih letih prejšnjega stoletja, se je pojavil Walkman, morda prva sodobna nosljiva tehnologija, ki je uporabnikom omogočala, da so svojo glasbo vzeli s seboj, kamorkoli so šli. Walkman je uporabnikom dal oblast ne le nad tem, kaj so poslušali (recimo The Smiths), ampak tudi, s pomočjo plastičnih ušesnih čepkov, ki so jim zamašili ušesa, tudi nad tem, česar niso poslušali (recimo njihovi starši). Ljudem je omogočil ustvarjanje in nadzor nad zvočnim posnetkom svojih življenj, kar nam je vsem dalo lastne individualne mehurčke pomena. Medtem ko je bil namen boomboxa omogočiti - ali v nekaterih primerih prisiliti - drugim, da poslušajo našo glasbo, je Walkman poslušanje naredil v osnovi osebno, izolirano izkušnjo.

Florian Schmetz/Unsplash

Toda Roy Choudhury in njegova ekipa želijo iti dlje od tega. Prizadevajo si preoblikovati današnje ušesne slušalke v povsem novo računalniško platformo, ki bi lahko v nekaterih primerih nadomestila potrebo, da posežete po pametni telefon ali računalnik. Če bi predvajalnik Walkman vsakemu izdal svoj osebni mehurček zvoka, v katerem bi lahko užival, ko bi hodil po ulici, bi v tej dobi pametnejšo tehnologijo in personalizacijo bi te iste mehurčke lahko izkoristili v nove, vznemirljive in – občasno – rahlo čudne načine.

Slušalke za branje misli?

»Večina trga nosljivih računalnikov se je [doslej] osredotočila na naprave, ki jih nosite na spodnjem delu telesa, večinoma v žepih ali na zapestjih, morda v čevljih,« je dejal Roy Choudhury. »To pomeni, da začutiš spodnji del telesa, na primer, kaj počneš z rokami, z zapestji, z nogami. Toda veliko informacij se ustvari na zgornjem delu telesa, predvsem na glavi - kot npr. poslušanje, govorjenje, prehranjevanje, obrazna čustva, potencialni namigi za informacije, povezane z medicino – to bi lahko neprecenljivo. Sveti gral, zadnja meja tega, bi lahko celo bil zaznavanje možganskih signalov od blizu vaše glave."

Osnova pametnih pomočnikov, kot je Siri, je zamisel, da lahko ne samo pasivno poslušate ušesno napravo, temveč tudi govorite z njo. Toda govor, kot se uporablja v današnji A.I. pomočnikov, je namenoma plitek. V primerjavi s sliko (vredno tisoč besed) je Siri najboljša s hitrimi informacijami, kot je iskanje vremenske napovedi ali nastavitev časovnika v kuhinji. Ampak to je meja. Ideja ušesnega računalništva je najti načine za razbremenitev nekaterih drugih stvari, zaradi katerih moramo trenutno strmeti v zaslone, in jih namestiti na (in v) naša ušesa.

ai za prepoznavanje pesmi
Krišna P. Miyapuram

"Vse, kar počnete na vizualnem zaslonu, vložite svojo celotno kognitivno pozornost," je dejal. »Če želite brati – tudi če gre za neumno šalo, ki jo berete na ekranu – se ne morete osredotočiti na nič drugega. Branje prevzame vašo popolno kognitivno pozornost. Moje prepričanje je, da je veliko takih stvari, ki si ne zaslužijo vaše popolne kognitivne pozornosti. Te lahko izvlečemo iz vizualne domene in potisnemo v neizkoriščeno in nemonopolno zvočno domeno, kjer so se človeški možgani naravno zelo dobro razvili, multipleks med takšnimi zvočnimi informacijami... Zakaj ne bi vzeli teh preprostih stvari in jih premaknili stran od svojega kognitivnega, vizualnega kognitivnega kanala v akustični pasovna širina?"

Nedavni eksperiment, ki ga je izvedla ekipa, je vključeval raziskovanje načinov, na katere bi lahko bolj smiselno porabili besedilo slišno oblika. Če berete članek, boste morda videli ključno besedo, ki vas zanima, in na tej točki začeli brati. Vendar pa ni preprostega načina za to, ko na primer poslušate podcast.

"Ena od stvari, ki jih poskušamo narediti v našem laboratoriju, je [vprašanje], ali lahko pospešim poslušanje članka?" je rekel Roy Choudhury.

Razbremenitev do ušes

Pri predstavitvi skupinskega dokaza koncepta se poslušalcu hkrati bere več odstavkov v članku. Trik, da to deluje, je uporaba obdelave signala, da vsak odstavek zveni, kot da prihaja iz druge smeri – to je podobno sedenju v restavraciji in imate štiri pogovore, ki potekajo za okoliškimi mizami, vendar pokličete eno, ker stanovalci omenijo osebo, ki jo vedeti. Da bi izboljšali to delovanje, je ekipa v ušesne čepke dotaknila inercialno merilno enoto (IMU), tako da uporabnik lahko povzdigne določen glas (en del besedila), tako da pri tem rahlo obrne glavo smer.

"Ta projekt imenujem 'branje v akustični domeni', kjer pogledam smer glasu tretjega odstavka in ta glas postane glasnejši, drugi glasovi pa nekako zatemnjeni," je dejal.

Tudi ni vse v govoru. Ekipa je tudi ugotovila, da se tako mikrofon kot IMU v slušalkah lahko uporabita za zaznavanje neverjetno subtilnih tresljajev v obrazu, tako majhnih kot oseba, ki šklepeta z zobmi ali obrazne mišice namrščene ali nasmejane. Ne, verjetno ne boste zavrgli pametnega telefona, da bi z zobmi klepetali sporočila prek Morsejeve abecede. Toda zamisel, da bi te majhne zvitosti obraza, kot je drsenje desnih zob, lahko uporabili za izvajati ukaze - ali celo delovati kot potrditev identitete za dvostopenjsko avtentikacijo - je zagotovo zanimivo.

"Vsi poznajo Siri, a predstavljajte si, koliko potencialnih uporab bi lahko Siri odprla, če bi le imela prostorsko razsežnost, kot je ventrilokvist, ki je sposoben dati svoj glas."

To bi lahko bilo tudi koristno za zajemanje longitudinalnih podatkov za stvari, kot je medicinska diagnoza. Anksiozne motnje, na primer, je mogoče diagnosticirati na podlagi določenih vzorcev, zaznanih pri premikanju zob. Roy Choudhury je tudi opozoril, da obstajajo raziskovalci, ki se ukvarjajo s težavami, kot je merjenje pretoka krvi skozi ušesa za merjenje srčnega utripa, ravni glukoze, mišične aktivnosti in več.

Želite drugo možno uporabo? Kaj pa če zvočna obogatena resničnost? Obogatena resničnost je trenutno najbolj znana po prekrivanju računalniško ustvarjenih objektov na vrhu resničnega sveta. Vendar ni razloga, zakaj bi se povečave izvajale zgolj na vizualnem spektru. Ekipa Roya Choudhuryja je navdušena nad možnostjo uporabe tehnologije za obdelavo signalov za preslikavo določenih zvokov v vašo pokrajino, tako da bo vaša pot skozi letališče, muzej ali kateri koli drug javni prostor lahko vključuje hojo proti glasu, ki pravi "sledi mi", kar se zdi, da prihaja iz smeri, kamor se morate usmeriti v.

Siri

Vsi poznajo Siri, a predstavljajte si, koliko možnih uporab bi lahko imela Siri, če bi le imela prostorsko razsežnost, kot je ventrilokvist, ki je sposoben dati svoj glas. Ta prostorska razširitev bi lahko pomagala izboljšati tudi velika virtualna srečanja, pri čemer bi bil glas vsake osebe preslikan na določeno lokacijo, kar bi olajšalo takojšnje razločevanje, kdo govori.

Vse to se seveda ne bo uresničilo. So inženirska različica tekstopisca, ki črčka ideje za oglas. Mnogi od njih morda ne bodo uspeli, vendar bi bil en ali dva primera lahko zelo koristen.

Dormehlov zakon

To je še en razlog, da je Roy Choudhury tako navdušen nad potencialom nadaljnjega ušesnega računalništva – in njegovimi možnostmi za uspeh v resničnem svetu. Družbeni odzivi narekujejo veliko več o tem, katere tehnologije se bodo uveljavile, kot bi si tehnologi nujno želeli. Nove tehnologije so po definiciji nove. Novo se lahko izenači s čudnim. Da bi uporabil lastno formulacijo (recimo ji Dormehlov zakon, za piko na i zanamcem), mora neposredna uporabnost katere koli nove tehnologije dvakrat izravnati inherentno neumnost njene uporabe.

"To je problem, ker se zelo malo tehnologij pojavi popolnoma oblikovanih."

Osebni računalnik, ki so ga ljudje uporabljali v svojih domovih, si je prvih nekaj let na trgu lahko privoščil le malo uporabe, ker so bili družbeni vložki njegove uporabe tako nizki. Prenosni računalnik, ki se uporablja v javnosti, je imel nekoliko višje vložke. Nosljivi izdelki, ki so še posebej izstopajoči zaradi nošenja na telesu, so bolj vidno čudni kot večina tehnologije. Kos tehnologije, ki bo obtičal na glavi in ​​izgledal kot kibernetski vsadek na Borgovem dronu, mora biti briljantno in takoj uporabno, če bo uporabnik menil, da je vredno škodljivega družbenega vpliva, da ga vidijo ga nositi.

Jaron Schneider / Digitalni trendi

To je problem, ker se zelo malo tehnologij pojavi popolnoma oblikovanih. V večini primerov je prvih nekaj generacij izdelka zgrajenih na napačnih obljubah, preden se nekje okoli tretje ponovitve pojavi bolj prepričljiva ponudba. Če zelo viden izdelek ne uspe doseči rezultatov od prvega dne, so lahko njegove možnosti za dolgoročni uspeh izničene, tudi če se na koncu spremeni v dober izdelek. Za starejše ljubitelje tehnologije razmislite o prenosni napravi Apple Newton in njenem zgodnjem poskusu prepoznavanja rokopisa. Za mlajše oboževalce lahko Dormehlov zakon pojasni neuspeh Google Glass, ki je bil povezan z ogromno družbeno stigmo in obsojanjem ter je deloval … skoraj OK.

Kot je opazil Roy Choudhury, so slušalke drugačne. Kakršne koli bitke so nekoč obstajale o njih, so bolj ali manj že dobljene. "Družba je že sprejela ljudi, ki nosijo slušalke," je dejal. »... V nekem smislu je zdaj treba nadgraditi samo algoritme, senzorje in strojno opremo. To je samo tehnološko ozko grlo in ne več družbeno, psihološko ozko grlo.«

Obljuba nosljivih izdelkov

Dejstvo, da so bili ušesni čepki sprejeti, zniža vložke in pomeni, da ni več treba imeti takojšnjega binarnega izida. Tudi če najvišji cilji, ki jih je opisal Roy Choudhury, še dolgo ne bodo doseženi, bo postopna izboljšava dodala uporabnost dokazanemu faktorju oblike.

»Visoko viseče sadje [so stvari, kot so] 'iz potez mojih zob lahko zaznam napade' ali 'iz mojih mimiko, lahko razumem razpoloženje osebe, tako da to postane kot Fitbit za razpoloženje,« je rekel. »Toda tudi če to ne uspe, to ne ovira produktnega cevovoda. Vendar, če so uspešni, je izdelek preprosto spremenil v nekaj fantastičnega.«

Roy Choudhury verjame, da je potencial za ušesno računalništvo skoraj neomejen. "Mislim, da pot pred nami presega govor," je dejal. »Rekel bi, da je govor najbolj notranji krog, ki je jedro [te tehnologije]. Zunaj te interakcije je akustika na splošno. In zunanja akustika so vse vrste drugih senzorjev in zmogljivosti. Če pomislite, kako bomo začeli graditi to platformo, so plodovi nizko viseči govorna interakcija: »Nastavi časovnik,« »Hej Siri, kakšno je vreme danes?« Lahko pa gre daleč, daleč onkraj tega."

Drugi raziskovalci, ki z Royem Choudhuryjem delajo na področju nosljivega računalništva, vključujejo Zhijian Yang, Yu-Lin Wei, Jay Prakash, in Ziyue Li.

Priporočila urednikov

  • Aplikacija ChatGPT za iPhone ima zdaj vgrajen Bing
  • Apple na WWDC ni naredil Siri za morilca ChatGPT - in to me straši
  • Pozabite na ChatGPT – Siri in Google Assistant delata te 4 stvari bolje
  • Apple izdeluje zdravstvenega trenerja AI za Apple Watch, trditve poročila
  • Ta nenavadna naprava z umetno inteligenco bo morda v prihodnosti nadomestila vaš pametni telefon