Romit Roy Choudhury ha grandi orecchie. Ma non dentro Quello modo. Roy Choudhury, professore di ingegneria elettrica e informatica presso l'Università dell'Illinois a Urbana-Champaign, crede fermamente nel potenziale di cambiamento di paradigma di ciò che definisce computer earable (no, non indossabili)..
Contenuti
- Auricolari per la lettura del pensiero?
- Scarico alle orecchie
- Legge di Dormehl
- La promessa dei dispositivi indossabili
Ciò significa sfruttare le enormi possibilità di hardware e software che funzionano utilizzando quei due fantasiosi fori di ascolto ai lati della testa. E per assistere nello sviluppo di qualsiasi cosa, dalle applicazioni per la privacy e la sicurezza alla diagnosi medica strumenti incentrati sul futuro della realtà aumentata, sta mettendo insieme un team di esperti per aiutarlo.
Video consigliati
"Posso usare praticamente chiunque in informatica e ingegneria elettrica", ha detto a Digital Trends. “La gamma di problemi sul mio radar è enorme.”
Imparentato
- Preoccupato per l’avvertimento deepfake dell’FBI? Segui questi consigli degli esperti
- La nuova app ChatGPT di OpenAI è gratuita per iPhone e iPad
- Ora puoi chattare in video con un'intelligenza artificiale ChatGPT: ecco come appare
Gli auricolari sono già un mercato enorme. Mele AirPods, la sua linea di auricolari wireless, ha venduto 60 milioni di unità solo nel 2019. L'anno scorso, questo numero era stimato in 85 milioni. Oggi molte aziende stanno realizzando auricolari intelligenti che offrono la cancellazione attiva del rumore, A.I. assistenti intelligenti e altro ancora.
Diversi decenni prima degli AirPods, negli anni '80, c'era il Walkman, forse la prima tecnologia indossabile moderna, che permetteva agli utenti di portare con sé la propria musica ovunque andassero. Il Walkman ha dato agli utenti il dominio non solo su ciò che ascoltavano (ad esempio, The Smiths), ma anche, grazie ai suoi auricolari di plastica che si tappavano le orecchie, su ciò che non ascoltavano (ad esempio, i loro genitori). Ha permesso alle persone di creare ed esercitare il controllo sulla colonna sonora delle loro vite, dandoci le nostre singole bolle di significato. Mentre il boombox permetteva – o, in alcuni casi, obbligava – ad altri di ascoltare la nostra musica, il Walkman rendeva l’ascolto un’esperienza fondamentalmente personale e isolata.
Ma Roy Choudhury e il suo team vogliono andare oltre. Cercano di trasformare gli auricolari di oggi in una piattaforma informatica completamente nuova che potrebbe, in alcuni casi, sostituire la necessità di raggiungere il proprio smartphone o computer. Se il Walkman emettesse a ognuno la propria personale bolla sonora da godersi mentre camminavano per strada, in questa epoca di tecnologia e personalizzazione più intelligenti, quelle stesse bolle potrebbero essere sfruttate in modo nuovo, eccitante e, a volte, leggermente strano modi.
Auricolari per la lettura del pensiero?
"La maggior parte del mercato dei computer indossabili si è [finora] concentrata su dispositivi indossati sulla parte inferiore del corpo, principalmente in tasca o sui polsi, magari nelle scarpe", ha affermato Roy Choudhury. “Ciò significa che puoi percepire la parte inferiore del corpo, ad esempio quello che stai facendo con le mani, con i polsi, con le gambe. Ma ci sono molte informazioni che vengono generate nella parte superiore del corpo, principalmente nella testa, ad esempio ascoltare, parlare, mangiare, emozioni facciali, potenzialmente indizi per informazioni di carattere medico: potrebbe essere inestimabile. Il Santo Graal, l’ultima frontiera di tutto questo, potrebbe addirittura esserlo percepire i segnali cerebrali da vicino alla tua testa."
L'idea di poter non solo ascoltare passivamente un dispositivo intraauricolare, ma anche di poter parlare con esso, è alla base degli assistenti intelligenti come Siri. Ma il discorso, come viene utilizzato oggi nell’A.I. assistenti, è volutamente superficiale. Rispetto a un'immagine (che vale più di mille parole), Siri dà il meglio di sé con rapide ondate di informazioni, come trovare le previsioni del tempo o impostare un timer in cucina. Ma questo è il limite. L’idea dell’informatica udibile è quella di trovare modi per scaricare alcune delle altre cose per le quali attualmente dobbiamo fissare gli schermi e metterle nelle (e nelle) nostre orecchie.
"In tutto ciò che fai sullo schermo visivo, metti tutta la tua attenzione cognitiva", ha detto. “Per leggere – anche se è una battuta sciocca che leggi su uno schermo – non puoi concentrarti su nient’altro. La lettura richiede la tua completa attenzione cognitiva. La mia convinzione è che ci siano molte cose simili che non meritano la tua piena attenzione cognitiva. Possiamo estrarli dal dominio visivo e spingerli nel dominio audio non sfruttato e non monopolizzato, dove il cervello umano si è evoluto naturalmente molto bene per multiplex tra tali informazioni audio... Perché non prendere queste semplici cose e spostarle lontano dal tuo canale cognitivo, visivo e cognitivo e spostarle in quello acustico? larghezza di banda?"
Un recente esperimento condotto dal team prevedeva un’esplorazione dei modi in cui potremmo consumare il testo in modo più significativo udibile modulo. Se stai leggendo un articolo, potresti vedere una parola chiave che ti interessa e iniziare a leggere da quel punto. Tuttavia, non esiste un modo semplice per farlo quando, ad esempio, stai ascoltando un podcast.
"Una delle cose che stiamo cercando di fare nel nostro laboratorio è [chiedere], posso accelerare l'ascolto di un articolo?" disse Roy Choudhury.
Scarico alle orecchie
Nella dimostrazione di prova del gruppo, all’ascoltatore vengono letti simultaneamente più paragrafi di un articolo. Il trucco per far funzionare tutto questo è usare l’elaborazione del segnale per far sì che ogni paragrafo sembri provenire da una direzione diversa: è un po’ come sedersi in un ristorante e avendo quattro conversazioni che si svolgono ai tavoli circostanti, ma collegandosi a una perché gli occupanti menzionano una persona che tu Sapere. Per migliorare il funzionamento, il team ha inserito l'unità di misura inerziale (IMU) negli auricolari in modo che l'utente può alzare una voce particolare (una parte del testo) girando leggermente la testa direzione.
"Chiamo questo progetto 'lettura nel dominio acustico', in cui guardo la direzione della voce del terzo paragrafo, e quella voce diventa più forte e le altre voci si attenuano", ha detto.
Non si tratta nemmeno solo di parlare. Il team ha anche scoperto che sia il microfono che l’IMU degli auricolari possono essere utilizzati per captare vibrazioni incredibilmente sottili del viso, minuscole come un persona che batte i denti o i muscoli facciali accigliati o sorridenti. No, probabilmente non abbandonerai il tuo smartphone per chiacchierare di messaggi tramite il codice Morse con i denti. Ma l’idea che queste piccole contorsioni facciali, come lo scorrimento dei denti del lato destro, potrebbero essere utilizzate eseguire comandi, o addirittura agire come conferma dell'identità per l'autenticazione a due fattori, lo è certamente interessante.
"Tutti hanno familiarità con Siri, ma immagina quanti potenziali usi potrebbero essere aperti per Siri se solo avesse una dimensione spaziale, come un ventriloquo capace di lanciare la sua voce."
Ciò potrebbe inoltre essere utile per acquisire dati longitudinali per cose come la diagnosi medica. I disturbi d'ansia, ad esempio, possono essere diagnosticati da alcuni modelli rilevati nel movimento dei denti. Roy Choudhury ha anche notato che ci sono ricercatori che lavorano su problemi come la misurazione del flusso sanguigno attraverso le orecchie per valutare la frequenza cardiaca, i livelli di glucosio, l'attività muscolare e altro ancora.
Vuoi un altro possibile utilizzo? Che ne dite di realtà aumentata udibile? La realtà aumentata è attualmente meglio conosciuta per la sovrapposizione di oggetti generati dal computer al mondo reale. Ma non c’è motivo per cui gli aumenti dovrebbero avvenire esclusivamente nello spettro visivo. Il team di Roy Choudhury è entusiasta all'idea di utilizzare la tecnologia di elaborazione del segnale per mappare determinati suoni nel tuo paesaggio, in modo che tu possa navigare attraverso un Un aeroporto, un museo o qualsiasi altro spazio pubblico potrebbe implicare il camminare verso una voce che dice "seguimi", che sembra provenire dalla direzione in cui devi andare In.
Tutti hanno familiarità con Siri, ma immagina quanti potenziali usi potrebbero aprirsi per Siri se solo avesse una dimensione spaziale, come un ventriloquo capace di lanciare la sua voce. Questo ampliamento spaziale potrebbe anche contribuire a migliorare le riunioni virtuali di grandi dimensioni, con la voce di ogni persona mappata in un luogo specifico, rendendo più semplice capire immediatamente chi sta parlando.
Non tutto ciò si realizzerà, ovviamente. Sono la versione ingegneristica di un copywriter che scarabocchia idee per un annuncio. Molti di loro potrebbero non farcela, ma uno o due esempi potrebbero essere profondamente utili.
Legge di Dormehl
Questo è un altro motivo per cui Roy Choudhury è così entusiasta del potenziale dell’informatica ascoltabile e delle sue possibilità di successo nel mondo reale. Le risposte della società dettano molto di più su quali tecnologie prendere piede di quanto i tecnologi necessariamente vorrebbero. Le nuove tecnologie, per definizione, sono nuove. Nuovo può equivalere a strano. Per usare una mia formulazione (chiamiamola Legge di Dormehl, per una pugnalata ai posteri), l’utilità immediata di qualsiasi nuova tecnologia deve doppiamente compensare l’intrinseca stupidità del suo utilizzo.
“Questo è un problema perché pochissime tecnologie emergono completamente formate”.
Il personal computer, che le persone usavano nelle loro case, poteva permettersi di fare ben poco nei primi anni sul mercato perché la posta in gioco sociale del suo utilizzo era molto bassa. Un laptop utilizzato in pubblico aveva una posta in gioco leggermente più alta. I dispositivi indossabili, che sono particolarmente importanti perché indossati sul corpo, sono visibilmente più strani della maggior parte della tecnologia. Un pezzo di tecnologia che resterà bloccato in testa, somigliante a un impianto cibernetico su un drone Borg, deve essere brillante e immediatamente utile se l'utente ritiene che valga l'impatto sociale dannoso di essere visto indossandolo.
Questo è un problema perché pochissime tecnologie emergono completamente formate. Nella maggior parte dei casi, le prime generazioni di un prodotto si basano su promesse imperfette, prima che un’offerta più convincente emerga da qualche parte intorno alla terza iterazione. Se un prodotto altamente visibile non riesce a fornire risultati fin dal primo giorno, le sue possibilità di successo a lungo termine potrebbero essere vanificate, anche se alla fine si trasformasse in un buon prodotto. Per gli appassionati di tecnologia più anziani, considera il dispositivo portatile Apple Newton e il suo primo tentativo di riconoscimento della grafia. Per i fan più giovani, la Legge di Dormehl potrebbe spiegare il fallimento di Google Glass, che è arrivato con un tremendo stigma e giudizio sociale e ha funzionato... quasi bene.
Gli auricolari, come ha notato Roy Choudhury, sono diversi. Qualunque battaglia possa essere esistita una volta su di essi, è più o meno già stata vinta. “La società ha già accettato che le persone indossino gli auricolari”, ha detto. “… In un certo senso, sono solo gli algoritmi, i sensori e l’hardware che ora devono essere aggiornati. È solo un collo di bottiglia tecnologico e non più un collo di bottiglia sociale e psicologico”.
La promessa dei dispositivi indossabili
Il fatto che gli auricolari siano stati accettati abbassa la posta in gioco e significa che non deve più esserci un risultato binario immediato. Anche se gli obiettivi più ambiziosi descritti da Roy Choudhury non verranno raggiunti per molto tempo, il miglioramento incrementale aggiungerà utilità a un fattore di forma comprovato.
“I frutti più ambiziosi [sono cose come] ‘dai gesti dei miei denti, posso rilevare le convulsioni’ o ‘dai miei gesti gesti facciali, posso capire l’umore della persona in modo che questo diventi come un Fitbit per l’umore’”, ha disse. “Ma anche se fallisse, ciò non impedirebbe la pipeline del prodotto. Tuttavia, se hanno successo, trasformano il prodotto in qualcosa di fantastico”.
Il potenziale dell'informatica udibile, ritiene Roy Choudhury, è quasi illimitato. “Penso che la strada da percorrere vada ben oltre la parola”, ha detto. “Direi che il discorso è il cerchio più interno, che è al centro [di questa tecnologia]. Al di fuori di questa interazione c’è l’acustica in generale. E l'acustica esterna è costituita da tutti i tipi di altri sensori e capacità. Se si pensa a come inizieremo a costruire questa piattaforma, i frutti sono a portata di mano interazione basata sulla voce: "Imposta un timer", "Ehi Siri, che tempo fa oggi?" Ma può andare lontano, lontano oltre a questo."
Altri ricercatori che lavorano sull'informatica indossabile con Roy Choudhury includono Zhijian Yang, Yu-Lin Wei, Jay Prakash, E Ziyue Li.
Raccomandazioni degli editori
- L'app per iPhone di ChatGPT ora ha Bing integrato
- Apple non ha reso Siri un killer ChatGPT al WWDC – e questo mi spaventa
- Dimentica ChatGPT: Siri e Google Assistant fanno meglio queste 4 cose
- Apple sta costruendo un coach sanitario basato sull'intelligenza artificiale per Apple Watch, riportano le affermazioni
- Questo bizzarro dispositivo AI potrebbe sostituire il tuo smartphone in futuro