Romit Roy Choudhury má veľké uši. Ale nie v že spôsobom. Roy Choudhury, profesor elektrotechniky a informatiky na University of Illinois v Urbana-Champaign, pevne verí v potenciál zmeny paradigmy toho, čo nazýva earable (nie, nenositeľné) počítanie.
Obsah
- Slúchadlá na čítanie myšlienok?
- Vyloženie do uší
- Dormehlov zákon
- Prísľub nositeľných zariadení
To znamená zapojiť sa do obrovských možností hardvéru a softvéru, ktoré bežia pomocou týchto dvoch efektných otvorov na počúvanie po stranách vašej hlavy. A pomáhať pri vývoji všetkého od aplikácií na ochranu súkromia a zabezpečenia až po lekársku diagnostiku nástrojov zameraných na budúcnosť rozšírenej reality, zostavuje crackový tím odborníkov, ktorí mu pomôžu.
Odporúčané videá
„V počítačovej vede a elektrotechnike môžem použiť takmer kohokoľvek,“ povedal pre Digital Trends. "Škála problémov na mojom radare je obrovská."
Súvisiace
- Máte obavy z hlbokého falošného varovania FBI? Postupujte podľa týchto odborných rád
- Nová aplikácia ChatGPT od OpenAI je zadarmo pre iPhone a iPad
- Teraz môžete videorozhovor s ChatGPT AI – vyzerá to takto
Slúchadlá sú už teraz obrovským trhom. od spoločnosti Apple AirPods, jej rad bezdrôtových slúchadiel, len v roku 2019 predal 60 miliónov kusov. Minulý rok toto číslo bolo odhaduje sa, že vzrastie na 85 miliónov. Dnes veľa spoločností vyrába inteligentné slúchadlá, ktoré ponúkajú aktívne potlačenie hluku, A.I. inteligentní asistenti a ďalšie.
Niekoľko desaťročí pred AirPods, teda v osemdesiatych rokoch minulého storočia, existoval Walkman, možno prvá moderná nositeľná technológia, ktorá používateľom umožňovala vziať si hudbu so sebou kamkoľvek. Walkman dal užívateľom nadvládu nielen nad tým, čo počúvali (povedzme The Smiths), ale aj tým, čo im plastové slúchadlá zapchávali do uší, aj nad tým, čo nepočúvali (povedzme, ich rodičia). Umožnil ľuďom vytvárať a ovládať soundtrack k ich životom, čo nám všetkým dávalo naše vlastné bubliny významu. Zatiaľ čo boombox bol o ponechaní – alebo v niektorých prípadoch o prinútení – iných, aby počúvali našu hudbu, Walkman urobil z počúvania zásadne osobný, izolovaný zážitok.
Ale Roy Choudhury a jeho tím chcú ísť ešte ďalej. Snažia sa premeniť dnešné slúchadlá na úplne novú počítačovú platformu, ktorá by v niektorých prípadoch mohla nahradiť potrebu siahnuť po smartfón alebo počítač. Keby Walkman vydal každému svoju vlastnú osobnú bublinu zvuku, ktorú by si mohol vychutnať, keď kráčal po ulici, v tomto veku inteligentnejšie technológie a personalizácia, tie isté bubliny by sa dali využiť v novom, vzrušujúcom a – občas – trochu divnom spôsoby.
Slúchadlá na čítanie myšlienok?
„Väčšina trhu s nositeľnými počítačmi sa [zatiaľ] sústredila na zariadenia, ktoré sa nosia na spodnej časti tela, väčšinou vo vreckách alebo na zápästiach, možno v topánkach,“ povedal Roy Choudhury. „To znamená, že dokážete vnímať spodnú časť tela, napríklad to, čo robíte rukami, zápästiami, nohami. Existuje však veľa informácií, ktoré sa generujú na hornej časti tela, najmä na hlave - ako napr počúvanie, rozprávanie, jedenie, emócie tváre, potenciálne stopy pre medicínske informácie – to by mohlo byť neoceniteľné. Môže to byť aj svätý grál, posledná hranica snímanie signálov mozgu z tesnej blízkosti hlavy."
Základom inteligentných asistentov, ako je Siri, je myšlienka, že zariadenie do uší môžete nielen pasívne počúvať, ale aj s ním hovoriť. Ale reč, ako sa používa v dnešnej A.I. asistentov, je zámerne plytký. V porovnaní s obrázkom (za tisíc slov) je Siri na tom najlepšie s rýchlymi prívalmi informácií, ako je nájdenie predpovede počasia alebo nastavenie časovača v kuchyni. Ale to je asi hranica. Myšlienkou sluchového počítania je nájsť spôsoby, ako zložiť niektoré z ďalších vecí, na ktoré v súčasnosti musíme hľadieť na obrazovky, a nasadiť si ich do uší (a do uší).
"Všetko, čo robíte na vizuálnej obrazovke, venujete celú svoju kognitívnu pozornosť," povedal. „Na čítanie – aj keď je to hlúpy vtip, ktorý čítate na obrazovke – sa nemôžete sústrediť na nič iné. Čítanie zaberá vašu úplnú kognitívnu pozornosť. Verím, že existuje veľa takých vecí, ktoré si nezaslúžia vašu plnú kognitívnu pozornosť. Môžeme ich vytiahnuť z vizuálnej domény a posunúť ich do nevyužitej a nemonopolizovanej zvukovej domény, kde sa ľudský mozog prirodzene veľmi dobre vyvinul. multiplex medzi takými zvukovými informáciami... Prečo nezobrať tieto jednoduché veci a neposunúť ich preč z vášho kognitívneho, vizuálneho kognitívneho kanála do akustického šírka pásma?"
Nedávny experiment, ktorý tím uskutočnil, zahŕňal skúmanie spôsobov, akými by sme mohli zmysluplnejšie konzumovať text počuteľný formulár. Ak čítate článok, možno uvidíte kľúčové slovo, ktoré vás zaujíma, a v tomto bode začnite čítať. Neexistuje však jednoduchý spôsob, ako to urobiť, keď napríklad počúvate podcast.
„Jednou z vecí, o ktoré sa v našom laboratóriu snažíme, je [spýtať sa], môžem urýchliť počúvanie článku? povedal Roy Choudhury.
Vyloženie do uší
V demonštrácii skupinového dôkazu o koncepte má poslucháč súčasne prečítaných viacero odsekov v článku. Trik na to, aby to fungovalo, je použitie spracovania signálu, aby každý odsek znel, akoby prichádzal z iného smeru – je to trochu ako sedieť v reštaurácii a vediete štyri konverzácie pri okolitých stoloch, ale vytočíte jeden, pretože obyvatelia spomínajú osobu, ktorú vedieť. Aby to fungovalo lepšie, tím poklepal na inerciálnu meraciu jednotku (IMU) v slúchadlách, aby používateľ môže zvýšiť určitý hlas (jednu časť textu) miernym otočením hlavy smer.
„Tento projekt nazývam ‚čítanie v akustickej doméne‘, kde sa pozriem na smer hlasu tretieho odseku a ten hlas zosilnie a ostatné hlasy sa trochu stlmia,“ povedal.
Nie je to všetko ani o reči. Tím tiež zistil, že mikrofón aj IMU v slúchadlách možno použiť na zachytenie neuveriteľne jemných vibrácií v tvári, tak malých ako osoba drkotala zubami alebo tvárové svaly sa mračia alebo usmievajú. Nie, pravdepodobne neodložíte svoj smartfón, aby ste zubami prehovorili správy cez morzeovku. Ale myšlienka, na ktorú by sa dali použiť tieto drobné skrútenia tváre, ako napríklad posúvanie zubov na pravej strane vykonávať príkazy – alebo dokonca pôsobiť ako potvrdenie identity pre dvojfaktorovú autentifikáciu – určite áno zaujímavé.
"Všetci poznajú Siri, ale predstavte si, koľko potenciálnych využití by sa pre Siri dalo otvoriť, keby mala len priestorový rozmer, ako bruškohovorkyňa, ktorá je schopná vrhnúť svoj hlas."
To by mohlo byť užitočné aj na zaznamenávanie dlhodobých údajov pre veci, ako je lekárska diagnóza. Úzkostné poruchy môžu byť napríklad diagnostikované z určitých vzorcov zistených v pohybe zubov. Roy Choudhury tiež poznamenal, že existujú výskumníci, ktorí pracujú na problémoch, ako je meranie prietoku krvi cez uši na meranie srdcovej frekvencie, hladiny glukózy, svalovej aktivity a ďalších.
Chcete ďalšie možné využitie? Čo tak počuteľná rozšírená realita? Rozšírená realita je v súčasnosti najznámejšia pre prekrývanie počítačom generovaných objektov na vrchole skutočného sveta. Nie je však dôvod, prečo by sa augmentácie mali uskutočňovať výlučne na vizuálnom spektre. Tím Roya Choudhuryho je nadšený z vyhliadky na použitie technológie spracovania signálu na mapovanie určitých zvukov na vašu krajinu, takže navigácia cez letisko, múzeum alebo akýkoľvek iný verejný priestor môže zahŕňať kráčanie smerom k hlasu, ktorý hovorí „nasleduj ma“, a zdá sa, že prichádza zo smeru, ktorým sa musíte vydať v.
Každý pozná Siri, ale predstavte si, koľko potenciálnych využití by sa dalo pre Siri otvoriť, keby mala len priestorový rozmer, ako bruškohovorkyňa, ktorá je schopná vrhnúť svoj hlas. Toto priestorové zväčšenie by tiež mohlo pomôcť zlepšiť veľké virtuálne stretnutia, pričom hlas každej osoby je namapovaný na konkrétne miesto, čo uľahčuje okamžité zistenie, kto hovorí.
Nie všetky sa, samozrejme, splnia. Ide o inžiniersku verziu copywritera, ktorý čmára nápady pre reklamu. Mnohé z nich možno neprejdú, ale jeden alebo dva príklady by mohli byť veľmi užitočné.
Dormehlov zákon
To je ďalší dôvod, prečo je Roy Choudhury taký nadšený z potenciálu pokračujúcich ušných výpočtových systémov – a ich šancí na úspech v reálnom svete. Spoločenské reakcie diktujú oveľa viac o tom, ktoré technológie sa uchytia, než by si technológovia nevyhnutne priali. Nové technológie sú podľa definície nové. Nové sa môže rovnať divnému. Aby som použil svoju vlastnú formuláciu (nazvime to Dormehlov zákon, na bodnutie do potomstva), mimoriadna užitočnosť akejkoľvek novej technológie musí dvojnásobne kompenzovať prirodzenú otupenosť jej používania.
"Toto je problém, pretože len veľmi málo technológií sa objavuje úplne sformovaných."
Osobný počítač, ktorý ľudia používali vo svojich domácnostiach, si prvých niekoľko rokov na trhu mohol dovoliť málo používať, pretože sociálne stávky na jeho používanie boli také nízke. O niečo vyšší podiel mal notebook, ktorý sa používa na verejnosti. Nositeľné veci, ktoré sú obzvlášť výrazné vďaka noseniu na tele, sú viditeľnejšie divné ako väčšina technológií. Technika, ktorá sa prilepí na hlavu a vyzerá ako kybernetický implantát na Borgskom drone, musí byť brilantné a okamžite užitočné, ak to používateľ bude považovať za hodné škodlivého sociálneho vplyvu, keď ho bude vidieť nosenie.
To je problém, pretože len veľmi málo technológií sa objavuje plne formovaných. Vo väčšine prípadov je niekoľko prvých generácií produktu postavených na chybnom prísľube, kým sa niekde okolo tretej iterácie objaví presvedčivejšia ponuka. Ak sa dobre viditeľný produkt nepodarí dodať od prvého dňa, jeho šance na úspech v dlhodobom horizonte môžu byť zmarené, aj keď sa nakoniec zmení na dobrý produkt. Pre starších technologických fanúšikov zvážte prenosné zariadenie Apple Newton a jeho skoré bodnutie pri rozpoznávaní rukopisu. Pre mladších fanúšikov by Dormehlov zákon mohol vysvetliť zlyhanie okuliarov Google Glass, ktoré prišlo s obrovskou spoločenskou stigmou a úsudkom a fungovalo...takmer OK.
Slúchadlá, ako poznamenal Roy Choudhury, sú odlišné. Akékoľvek bitky, ktoré o nich kedysi existovali, sú už viac-menej vyhraté. „Spoločnosť už akceptovala ľudí so slúchadlami,“ povedal. „...V určitom zmysle sú to len algoritmy, senzory a hardvér, ktoré teraz treba upgradovať. Je to len technologická prekážka a už nie spoločenská, psychologická prekážka.“
Prísľub nositeľných zariadení
Skutočnosť, že slúchadlá boli prijaté, znižuje stávku a znamená, že už nemusí existovať okamžitý binárny výsledok. Aj keď sa tie najvyššie ciele, ktoré opísal Roy Choudhury, dlho nedosahujú, postupné vylepšenie prispeje k užitočnosti overeného tvarového faktora.
„Vysoko visiace ovocie [sú veci ako] ‚podľa mojich zubných gest dokážem rozpoznať záchvaty‘ alebo ‚zo svojich gestá tváre, dokážem pochopiť náladu človeka, takže sa to stane ako Fitbit pre náladu,“ povedal povedal. „Ale aj keby to zlyhalo, nebránilo to produktovodu. Ak sú však úspešní, produkt sa len pretransformoval na niečo fantastické.“
Roy Choudhury verí, že potenciál pre ušnú výpočtovú techniku je takmer neobmedzený. „Myslím si, že cesta vpred siaha ďaleko za hranice reči,“ povedal. „Povedal by som, že reč je najvnútornejší kruh, ktorý je jadrom [tejto technológie]. Mimo tejto interakcie je akustika vo všeobecnosti. A vonkajšia akustika sú všetky druhy iných senzorov a schopností. Ak si myslíte, ako začneme budovať túto platformu, nízko visiace plody sú interakcia založená na reči: ‚Nastav časovač,‘ ‚Ahoj, Siri, aké je dnes počasie?‘ Ale môže to ísť ďaleko, ďaleko nad rámec toho."
Medzi ďalších výskumníkov pracujúcich na nositeľnom počítači s Royom Choudhurym patrí Zhijian Yang, Yu-Lin Wei, Jay Prakash, a Ziyue Li.
Odporúčania redaktorov
- Aplikácia ChatGPT pre iPhone má teraz vstavaný Bing
- Apple na WWDC nespravil zo Siri zabijaka ChatGPT – a to ma desí
- Zabudnite na ChatGPT – Siri a Google Assistant robia tieto 4 veci lepšie
- Apple buduje trénera zdravia AI pre Apple Watch, tvrdí správa
- Toto bizarné AI zariadenie môže v budúcnosti nahradiť váš smartfón