Romit Roy Choudhury má velké uši. Ale ne dovnitř že cesta. Roy Choudhury, profesor elektrotechniky a informatiky na University of Illinois v Urbana-Champaign, pevně věří v potenciál změny paradigmat toho, co nazývá earable (ne, nenositelné) computing.
Obsah
- Sluchátka na čtení myšlenek?
- Vyložení do uší
- Dormehlův zákon
- Příslib nositelných zařízení
To znamená zapojit se do obrovských možností hardwaru a softwaru, které běží pomocí těchto dvou efektních odposlechových otvorů po stranách vaší hlavy. A pomáhat s vývojem všeho od aplikací pro ochranu soukromí a zabezpečení až po lékařskou diagnostiku nástrojů zaměřených na budoucnost rozšířené reality, sestavuje crackový tým odborníků, kteří mu pomáhají.
Doporučená videa
„Mohu využít prakticky kohokoli v informatice a elektrotechnice,“ řekl Digital Trends. "Škála problémů na mém radaru je obrovská."
Příbuzný
- Máte obavy z hluboce falešného varování FBI? Postupujte podle těchto odborných rad
- Nová aplikace ChatGPT od OpenAI je zdarma pro iPhone a iPad
- Nyní můžete videochatovat s ChatGPT AI – vypadá to takto
Sluchátka jsou již obrovským trhem. od Applu AirPods, její řada bezdrátových sluchátek, jen v roce 2019 prodala 60 milionů kusů. Loni toto číslo bylo odhaduje se, že vzroste na 85 milionů. Dnes mnoho společností vyrábí chytrá sluchátka, která nabízejí aktivní potlačení hluku, A.I. chytré asistenty a další.
Několik desetiletí před AirPods, v 80. letech minulého století, existoval Walkman, možná první moderní nositelná technologie, která uživatelům umožňovala vzít si hudbu s sebou, kamkoli šli. Walkman dal uživatelům nadvládu nejen nad tím, co poslouchali (řekněme The Smiths), ale také tím, co jim plastové špunty zacpaly do uší, neposlouchali (řekněme jejich rodiče). Umožnil lidem vytvářet a ovládat soundtrack k jejich životům, což nám všem dalo naše vlastní bubliny významu. Zatímco boombox byl o tom, nechat – nebo v některých případech přinutit – ostatní poslouchat naši hudbu, Walkman učinil z poslechu zásadně osobní, izolovaný zážitek.
Ale Roy Choudhury a jeho tým chtějí jít ještě dál. Snaží se přeměnit dnešní sluchátka na zcela novou počítačovou platformu, která by v některých případech mohla nahradit nutnost sahat po chytrý telefon nebo počítač. Kdyby Walkman vydal každému svou vlastní osobní bublinu zvuku, kterou by si mohl vychutnat, když šel po ulici, v tomto věku chytřejší technologie a personalizace, stejné bubliny by mohly být využity v nových, vzrušujících a – příležitostně – trochu divných způsoby.
Sluchátka na čtení myšlenek?
„Většina trhu s nositelnými počítači se [zatím] soustředila na zařízení, která se nosí na spodní části těla, většinou v kapsách nebo na zápěstích, možná v botách,“ řekl Roy Choudhury. „To znamená, že můžete vnímat spodní část těla, například to, co děláte rukama, zápěstími, nohama. Ale existuje spousta informací, které se generují na horní části těla, hlavně na hlavě – jako např naslouchání, mluvení, jídlo, emoce ve tváři, potenciálně vodítka pro lékařské informace – to by mohlo být neocenitelný. Svatý grál, konečná hranice tohohle, může dokonce být snímání mozkových signálů z blízkosti vaší hlavy."
Myšlenka možnosti nejen pasivně poslouchat zařízení do uší, ale také s ním mluvit, je základem chytrých asistentů, jako je Siri. Ale řeč, jak se používá v dnešním A.I. asistentů, je záměrně mělký. V porovnání s obrázkem (za tisíc slov) je Siri na tom nejlépe s rychlými návaly informací, jako je nalezení předpovědi počasí nebo nastavení časovače v kuchyni. Ale to je asi limit. Myšlenka earable computingu je najít způsoby, jak odstranit některé další věci, kvůli kterým v současnosti musíme zírat na obrazovky, a nasadit si je do (a do) našich uší.
„Do všeho, co děláte na vizuální obrazovce, vkládáte veškerou svou kognitivní pozornost,“ řekl. „Na čtení – i když je to hloupý vtip, který čtete na obrazovce – se nemůžete soustředit na nic jiného. Čtení zabírá vaši úplnou kognitivní pozornost. Věřím, že existuje mnoho takových věcí, které si nezaslouží vaši plnou kognitivní pozornost. Můžeme je vytáhnout z vizuální domény a přesunout je do nevyužité a nemonopolizované zvukové domény, kde se lidský mozek přirozeně velmi dobře vyvinul. multiplex mezi takovými zvukovými informacemi… Proč nevzít tyto jednoduché věci a přesunout je pryč z vašeho kognitivního, vizuálního kognitivního kanálu do akustického šířku pásma?"
Nedávný experiment, který tým provedl, zahrnoval zkoumání způsobů, jak bychom mohli smysluplněji konzumovat text slyšitelný formulář. Pokud čtete článek, možná se vám zobrazí klíčové slovo, které vás zajímá, a v tomto okamžiku můžete začít číst. Neexistuje však snadný způsob, jak to udělat, když například posloucháte podcast.
"Jedna z věcí, o které se v naší laboratoři snažíme, je [zeptat se], mohu urychlit poslech článku?" řekl Roy Choudhury.
Vyložení do uší
V demonstraci skupinového proof-of-conceptu má posluchač několik odstavců v článku, které mu čte současně. Trik k tomu, aby to fungovalo, je použití zpracování signálu, aby každý odstavec zněl, jako by přicházel z jiného směru – je to trochu jako sedět v restauraci a vedete čtyři konverzace u okolních stolů, ale vytočíte jednu, protože se cestující zmíní o osobě, kterou vědět. Aby to fungovalo lépe, tým poklepal na inerciální měřicí jednotku (IMU) ve sluchátkách, aby uživatel může zvýšit určitý hlas (jednu část textu) mírným otočením hlavy v něm směr.
„Tomuto projektu říkám ‚čtení v akustické doméně‘, kde se podívám na směr hlasu třetího odstavce a ten hlas se zesílí a ostatní hlasy se trochu ztlumí,“ řekl.
Není to všechno ani o řeči. Tým také zjistil, že jak mikrofon, tak IMU ve sluchátkách lze použít k zachycení neuvěřitelně jemných vibrací v obličeji, nepatrných jako člověk drkotající zuby nebo obličejové svaly se mračí nebo usmívají. Ne, pravděpodobně nebudete zahazovat svůj smartphone, abyste zuby štěbetali zprávy pomocí morseovky. Ale představa, že na tyto drobné zkroucení obličeje, jako je sklouznutí zubů na pravé straně, by se dalo použít spouštět příkazy – nebo dokonce fungovat jako potvrzení identity pro dvoufaktorovou autentizaci – je určitě zajímavý.
"Každý zná Siri, ale představte si, kolik potenciálních využití by se pro Siri dalo otevřít, kdyby měla jen prostorový rozměr, jako břichomluvec, který je schopen vrhnout svůj hlas."
To by mohlo být navíc užitečné pro zachycení dlouhodobých dat pro věci, jako je lékařská diagnóza. Úzkostné poruchy mohou být například diagnostikovány z určitých vzorců detekovaných v pohybu zubů. Roy Choudhury také poznamenal, že existují výzkumníci, kteří pracují na problémech, jako je měření průtoku krve ušima, aby změřili srdeční frekvenci, hladinu glukózy, svalovou aktivitu a další.
Chcete další možné využití? Co takhle slyšitelná rozšířená realita? Rozšířená realita je v současnosti známá především tím, že překrývá počítačem generované objekty na vrcholu skutečného světa. Ale není důvod, proč by se augmentace měly odehrávat čistě na vizuálním spektru. Tým Roye Choudhuryho je nadšený vyhlídkou na využití technologie zpracování signálu k mapování určitých zvuků na vaši krajinu, takže navigace letiště, muzeum nebo jakýkoli jiný veřejný prostor může zahrnovat chůzi směrem k hlasu, který říká „následuj mě“, a zdá se, že přichází ze směru, kterým se potřebujete vydat v.
Každý zná Siri, ale představte si, kolik potenciálních využití by se pro Siri mohlo otevřít, kdyby měla jen prostorový rozměr, jako břichomluvec, který je schopen vrhnout svůj hlas. Tato prostorová augmentace by také mohla pomoci zlepšit velká virtuální setkání, přičemž hlas každého člověka je namapován na konkrétní místo, takže je snazší okamžitě zjistit, kdo mluví.
Ne všechny se samozřejmě splní. Jedná se o technickou verzi copywritera, který si kreslí nápady pro reklamu. Mnoho z nich se možná nepodaří, ale jeden nebo dva příklady by mohly být velmi užitečné.
Dormehlův zákon
To je další důvod, proč je Roy Choudhury tak nadšený z potenciálu nepřetržitého uchopitelného počítání – a jeho šancí na úspěch v reálném světě. Společenské reakce diktují mnohem více o tom, které technologie se uchytí, než by si technologové nezbytně přáli. Nové technologie jsou ze své podstaty nové. Nové se může rovnat divnému. Abych použil svou vlastní formulaci (říkejme tomu Dormehlův zákon, pro bodnutí do potomstva), musí mimořádná užitečnost jakékoli nové technologie dvojnásobně kompenzovat vrozenou otupělost jejího použití.
"To je problém, protože jen velmi málo technologií se objevuje plně formovaných."
Osobní počítač, který lidé používali ve svých domovech, si prvních několik let na trhu mohl dovolit jen málo využití, protože společenské sázky na jeho používání byly tak nízké. O něco vyšší podíl měl notebook, který se používá na veřejnosti. Nositelné předměty, které jsou zvláště výrazné díky nošení na těle, jsou viditelněji podivné než většina technologií. Technika, která se přilepí na hlavu a vypadá jako kybernetický implantát na Borgském dronu, musí být brilantní a okamžitě užitečné, pokud si uživatel bude myslet, že to stojí za škodlivý společenský dopad toho, že bude viděn nosit to.
To je problém, protože jen velmi málo technologií se objevuje plně formovaných. Ve většině případů je několik prvních generací produktu postaveno na chybném slibu, než se někde kolem třetí iterace objeví přesvědčivější nabídka. Pokud vysoce viditelný produkt nefunguje od prvního dne, jeho šance na úspěch v dlouhodobém horizontu mohou být zmařeny, i když se nakonec změní v dobrý produkt. Pro starší technologické fanoušky zvažte přenosné zařízení Apple Newton a jeho rané bodnutí při rozpoznávání rukopisu. Pro mladší fanoušky by Dormehlův zákon mohl vysvětlit selhání Google Glass, které přišlo s obrovským společenským stigmatem a úsudkem a fungovalo... téměř OK.
Sluchátka, jak poznamenal Roy Choudhury, jsou odlišná. Jakékoli bitvy, které se o nich kdysi vedly, jsou již víceméně vyhrány. "Společnost již přijala lidi, kteří nosí sluchátka," řekl. „… V jistém smyslu jsou to pouze algoritmy, senzory a hardware, které je nyní třeba upgradovat. Je to pouze technologická překážka a již ne společenská, psychologická překážka."
Příslib nositelných zařízení
Skutečnost, že sluchátka byla přijata, snižuje sázku a znamená, že již nemusí existovat okamžitý binární výsledek. I když těch nejvznešenějších cílů, které Roy Choudhury popsal, nebylo dosaženo po dlouhou dobu, postupné zlepšování přidá užitečnost osvědčenému tvarovému faktoru.
„Vysoce visící ovoce [jsou věci jako] ‚z gest mých zubů dokážu rozpoznat záchvaty‘ nebo ‚z mých gesta obličeje, dokážu porozumět náladě člověka, takže se to stane jako Fitbit pro náladu,“ řekl řekl. „Ale i když se to nepodaří, nebrání to produktovodu. Pokud však budou úspěšní, produkt se přemění v něco fantastického.“
Roy Choudhury se domnívá, že potenciál pro uchopitelné výpočty je téměř neomezený. "Myslím, že cesta vpřed jde daleko za hranice řeči," řekl. „Řekl bych, že řeč je nejvnitřnější kruh, který je jádrem [této technologie]. Mimo tuto interakci je akustika obecně. A vnější akustika je celá řada dalších senzorů a schopností. Pokud přemýšlíte o tom, jak začneme budovat tuto platformu, nízko visící plody jsou interakce založená na řeči: ‚Nastav časovač,‘ ‚Ahoj Siri, jaké je dnes počasí?‘ Ale může to dojít daleko, daleko Kromě toho."
Mezi další výzkumníky pracující na nositelných počítačích s Royem Choudhurym patří Zhijian Yang, Yu-Lin Wei, Jay Prakash, a Ziyue Li.
Doporučení redakce
- Aplikace ChatGPT pro iPhone má nyní vestavěný Bing
- Apple na WWDC neudělal ze Siri zabijáka ChatGPT – a to mě děsí
- Zapomeňte na ChatGPT – Siri a Google Assistant dělají tyto 4 věci lépe
- Apple buduje trenéra pro zdraví AI pro Apple Watch, tvrdí zpráva
- Toto bizarní zařízení AI může v budoucnu nahradit váš smartphone