
Ο Romit Roy Choudhury είναι μεγάλος στα αυτιά. Όχι όμως μέσα ότι τρόπος. Roy Choudhury, καθηγητής Ηλεκτρολόγων Μηχανικών και Επιστήμης Υπολογιστών στο Πανεπιστήμιο του Ιλινόις στο Urbana-Champaign, πιστεύει ακράδαντα στη δυνατότητα αλλαγής παραδείγματος αυτού που αποκαλεί ακουστικός (όχι, μη φορετός) υπολογισμός.
Περιεχόμενα
- Ακουστικά που διαβάζουν τη σκέψη;
- Εκφόρτωση στα αυτιά
- Νόμος του Dormehl
- Η υπόσχεση των wearables
Αυτό σημαίνει να συνδέσετε τις τεράστιες δυνατότητες για υλικό και λογισμικό που τρέχουν χρησιμοποιώντας αυτές τις δύο φανταχτερές οπές ακρόασης στα πλάγια του κεφαλιού σας. Και για να βοηθήσετε στην ανάπτυξη των πάντων, από εφαρμογές απορρήτου και ασφάλειας έως ιατρική διάγνωση εργαλεία που επικεντρώνονται στο μέλλον της επαυξημένης πραγματικότητας, συγκεντρώνει μια ομάδα ειδικών για να τον βοηθήσουν.
Προτεινόμενα βίντεο
«Μπορώ να χρησιμοποιήσω σχεδόν οποιονδήποτε στην επιστήμη των υπολογιστών και στην ηλεκτρική μηχανική», είπε στο Digital Trends. "Η γκάμα των προβλημάτων στο ραντάρ μου είναι τεράστια."
Σχετίζεται με
- Ανησυχείτε για την ψεύτικη προειδοποίηση του FBI; Ακολουθήστε αυτές τις συμβουλές των ειδικών
- Η νέα εφαρμογή ChatGPT του OpenAI είναι δωρεάν για iPhone και iPad
- Τώρα μπορείτε να συνομιλείτε μέσω βίντεο με ένα ChatGPT AI — εδώ είναι πώς φαίνεται

Τα ακουστικά είναι ήδη μια τεράστια αγορά. της Apple AirPods, η σειρά ασύρματων ακουστικών της, πούλησε 60 εκατομμύρια μονάδες μόνο το 2019. Πέρυσι, αυτός ο αριθμός ήταν εκτιμάται ότι θα ανέλθει σε 85 εκατομμύρια. Σήμερα, πολλές εταιρείες κατασκευάζουν έξυπνα ακουστικά που προσφέρουν ενεργή ακύρωση θορύβου, A.I. έξυπνους βοηθούς και πολλά άλλα.
Αρκετές δεκαετίες πριν από τα AirPods, στη δεκαετία του 1980, υπήρχε το Walkman, ίσως η πρώτη σύγχρονη τεχνολογία φορητών συσκευών, που επέτρεπε στους χρήστες να παίρνουν τη μουσική τους μαζί τους όπου κι αν πήγαιναν. Το Walkman έδωσε στους χρήστες κυριαρχία όχι μόνο σε ό, τι άκουγαν (ας πούμε, The Smiths), αλλά επίσης, επειδή τα πλαστικά ακουστικά του κλείνουν τα αυτιά τους, αυτά που δεν άκουγαν (ας πούμε, οι γονείς τους). Επέτρεψε στους ανθρώπους να δημιουργήσουν και να ασκήσουν έλεγχο στο soundtrack της ζωής τους, δίνοντάς μας σε όλους μας τις δικές μας ατομικές φυσαλίδες νοήματος. Ενώ το boombox επρόκειτο να αφήσουμε —ή, σε ορισμένες περιπτώσεις, να αναγκάσουμε— άλλους να ακούσουν τη μουσική μας, το Walkman έκανε την ακρόαση μια βασικά προσωπική, απομονωμένη εμπειρία.

Αλλά ο Roy Choudhury και η ομάδα του θέλουν να προχωρήσουν περισσότερο από αυτό. Επιδιώκουν να μετατρέψουν τα σημερινά ακουστικά σε μια εντελώς νέα πλατφόρμα υπολογιστών που θα μπορούσε, σε ορισμένες περιπτώσεις, να αντικαταστήσει την ανάγκη να προσεγγίσετε smartphone ή υπολογιστή. Αν το Walkman έδωσε σε όλους τη δική τους προσωπική φούσκα ήχου για να την απολαύσουν καθώς περπατούσαν στο δρόμο, σε αυτήν την εποχή πιο έξυπνη τεχνολογία και εξατομίκευση, αυτές οι ίδιες φυσαλίδες θα μπορούσαν να αξιοποιηθούν σε νέα, συναρπαστικά και — κατά περίπτωση — ελαφρώς περίεργα τρόπους.
Ακουστικά που διαβάζουν τη σκέψη;
«Το μεγαλύτερο μέρος της αγοράς φορητών υπολογιστών έχει επικεντρωθεί [μέχρι στιγμής] σε συσκευές που φοριούνται στο κάτω μέρος του σώματος, κυρίως στις τσέπες ή στους καρπούς σας, ίσως στα παπούτσια σας», δήλωσε ο Roy Choudhury. «Αυτό σημαίνει ότι μπορείτε να αισθανθείτε το κάτω μέρος του σώματος, όπως αυτό που κάνετε με τα χέρια σας, με τους καρπούς σας, με τα πόδια σας. Αλλά υπάρχουν πολλές πληροφορίες που δημιουργούνται στο πάνω μέρος του σώματος, κυρίως στο κεφάλι σας — όπως π.χ. ακρόαση, ομιλία, φαγητό, συναισθήματα προσώπου, πιθανές ενδείξεις για ιατρικές πληροφορίες — που θα μπορούσαν να είναι ανεκτίμητος. Το ιερό δισκοπότηρο, το τελευταίο σύνορο αυτού, θα μπορούσε ακόμη και να είναι ανίχνευση εγκεφαλικών σημάτων από κοντά στο κεφάλι σου».
Η ιδέα του να μπορείς όχι απλώς να ακούς παθητικά μια συσκευή στο αυτί, αλλά και να μιλάς μαζί της, είναι η βάση πίσω από έξυπνους βοηθούς όπως η Siri. Αλλά ο λόγος, όπως χρησιμοποιείται στο σημερινό A.I. βοηθοί, είναι σκόπιμα ρηχή. Σε σύγκριση με μια εικόνα (αξίας χιλίων λέξεων), το Siri είναι στα καλύτερά του με γρήγορες εκρήξεις πληροφοριών, όπως η εύρεση της πρόγνωσης του καιρού ή η ρύθμιση ενός χρονοδιακόπτη στην κουζίνα. Αλλά αυτό είναι το όριο. Η ιδέα του earable computing είναι να βρούμε τρόπους για να αποφορτίσουμε μερικά από τα άλλα πράγματα για τα οποία πρέπει να κοιτάμε επί του παρόντος τις οθόνες και να τα βάζουμε στα αυτιά μας (και μέσα).

«Ό, τι κάνεις στην οπτική οθόνη, δίνεις όλη σου τη γνωστική προσοχή», είπε. «Το να διαβάζεις —ακόμα κι αν είναι ένα ανόητο αστείο που διαβάζεις στην οθόνη— δεν μπορείς να εστιάζεις σε τίποτα άλλο. Η ανάγνωση καταλαμβάνει την πλήρη γνωστική σας προσοχή. Η πεποίθησή μου είναι ότι υπάρχουν πολλά τέτοια πράγματα που δεν αξίζουν την πλήρη γνωστική σας προσοχή. Μπορούμε να τα βγάλουμε από τον οπτικό τομέα και να τα ωθήσουμε στον αναξιοποίητο και μη μονοπωλιακό τομέα ήχου, όπου ο ανθρώπινος εγκέφαλος έχει φυσικά εξελιχθεί πολύ καλά για να πολυπλεξία μεταξύ τέτοιων ηχητικών πληροφοριών… Γιατί να μην πάρετε αυτά τα απλά πράγματα και να τα απομακρύνετε από το γνωστικό, οπτικό γνωστικό κανάλι σας και στο ακουστικό εύρος ζώνης?"
Ένα πρόσφατο πείραμα που πραγματοποιήθηκε από την ομάδα περιελάμβανε μια εξερεύνηση των τρόπων με τους οποίους θα μπορούσαμε να καταναλώνουμε πιο ουσιαστικά το κείμενο ακουστός μορφή. Εάν διαβάζετε ένα άρθρο, μπορεί να δείτε μια λέξη-κλειδί που σας ενδιαφέρει και να αρχίσετε να διαβάζετε σε αυτό το σημείο. Ωστόσο, δεν υπάρχει εύκολος τρόπος να το κάνετε αυτό όταν, για παράδειγμα, ακούτε ένα podcast.
«Ένα από τα πράγματα που προσπαθούμε να κάνουμε στο εργαστήριό μας είναι [να ρωτήσουμε], μπορώ να επιταχύνω την ακρόαση ενός άρθρου;» είπε ο Roy Choudhury.
Εκφόρτωση στα αυτιά
Στην επίδειξη απόδειξης της ιδέας της ομάδας, ο ακροατής έχει πολλές παραγράφους σε ένα άρθρο που του διαβάζονται ταυτόχρονα. Το κόλπο για να κάνετε αυτό το έργο είναι να χρησιμοποιήσετε επεξεργασία σήματος για να κάνετε κάθε παράγραφο να ακούγεται σαν να έρχεται από διαφορετική κατεύθυνση - είναι λίγο σαν να κάθεστε σε ένα εστιατόριο και έχοντας τέσσερις συνομιλίες που γίνονται στα γύρω τραπέζια, αλλά καλείτε σε ένα επειδή οι ένοικοι αναφέρουν ένα άτομο που εσείς ξέρω. Για να λειτουργήσει καλύτερα, η ομάδα χτύπησε την αδρανειακή μονάδα μέτρησης (IMU) στα ακουστικά, έτσι ώστε η Ο χρήστης μπορεί να υψώσει μια συγκεκριμένη φωνή (ένα μέρος του κειμένου) στρέφοντας ελαφρά το κεφάλι του σε αυτό κατεύθυνση.
«Ονομάζω αυτό το έργο «ανάγνωση στον ακουστικό τομέα», όπου κοιτάζω την κατεύθυνση της φωνής της τρίτης παραγράφου και αυτή η φωνή γίνεται πιο δυνατή και οι άλλες φωνές κάπως χαμηλώνουν», είπε.
Δεν είναι όλα στον λόγο, επίσης. Η ομάδα ανακάλυψε επίσης ότι τόσο το μικρόφωνο όσο και το IMU στα ακουστικά μπορούν να χρησιμοποιηθούν για να ανιχνεύουν απίστευτα λεπτές δονήσεις στο πρόσωπο, τόσο μικροσκοπικές όσο άτομο που χτυπάει τα δόντια του ή οι μύες του προσώπου συνοφρυώνονται ή χαμογελούν. Όχι, πιθανότατα δεν θα παρατήσετε το smartphone σας για να κουβεντιάσετε μηνύματα μέσω του κώδικα Μορς με τα δόντια σας. Αλλά η ιδέα ότι αυτές οι μικρές συσπάσεις του προσώπου, όπως η ολίσθηση των δοντιών της δεξιάς πλευράς, θα μπορούσαν να χρησιμοποιηθούν για εκτέλεση εντολών - ή ακόμα και να λειτουργήσει ως επιβεβαίωση ταυτότητας για έλεγχο ταυτότητας δύο παραγόντων - είναι σίγουρα ενδιαφέρων.
«Όλοι είναι εξοικειωμένοι με τη Siri, αλλά φανταστείτε πόσες πιθανές χρήσεις θα μπορούσαν να ανοίξουν για τη Siri αν είχε μόνο μια χωρική διάσταση, όπως μια κοιλιολόγος που είναι ικανή να εκτοξεύσει τη φωνή της».
Αυτό θα μπορούσε επιπλέον να είναι χρήσιμο για τη λήψη διαχρονικών δεδομένων για πράγματα όπως η ιατρική διάγνωση. Οι αγχώδεις διαταραχές, για παράδειγμα, μπορεί να διαγνωστούν από ορισμένα μοτίβα που ανιχνεύονται στην κίνηση των δοντιών. Ο Roy Choudhury σημείωσε επίσης ότι υπάρχουν ερευνητές που εργάζονται σε προβλήματα όπως η μέτρηση της ροής του αίματος μέσω των αυτιών για τη μέτρηση του καρδιακού παλμού, των επιπέδων γλυκόζης, της μυϊκής δραστηριότητας και πολλά άλλα.
Θέλετε άλλη πιθανή χρήση; Τι λέτε για ηχητική επαυξημένη πραγματικότητα? Η επαυξημένη πραγματικότητα είναι σήμερα περισσότερο γνωστή για την επικάλυψη αντικειμένων που δημιουργούνται από υπολογιστή πάνω από τον πραγματικό κόσμο. Αλλά δεν υπάρχει κανένας λόγος για τον οποίο οι αυξήσεις πρέπει να γίνονται καθαρά στο οπτικό φάσμα. Η ομάδα του Roy Choudhury είναι ενθουσιασμένη με την προοπτική να χρησιμοποιήσει τεχνολογία επεξεργασίας σήματος για να χαρτογραφήσει ορισμένους ήχους στο τοπίο σας, έτσι ώστε η πλοήγηση σας μέσα από αεροδρόμιο, μουσείο ή οποιοσδήποτε άλλος δημόσιος χώρος μπορεί να περιλαμβάνει το περπάτημα προς μια φωνή που λέει «ακολουθήστε με», η οποία φαίνεται να έρχεται από την κατεύθυνση που πρέπει να κατευθυνθείτε σε.

Όλοι είναι εξοικειωμένοι με το Siri, αλλά φανταστείτε πόσες πιθανές χρήσεις θα μπορούσαν να ανοίξουν για το Siri αν είχε μόνο μια χωρική διάσταση, όπως μια κοιλιολόγος που είναι ικανή να εκτοξεύσει τη φωνή της. Αυτή η χωρική αύξηση θα μπορούσε επίσης να βοηθήσει στη βελτίωση μεγάλων εικονικών συναντήσεων, με τη φωνή του κάθε ατόμου να αντιστοιχίζεται σε μια συγκεκριμένη τοποθεσία, καθιστώντας ευκολότερο να διακρίνει κανείς αμέσως ποιος μιλάει.
Δεν θα γίνουν όλα αυτά φυσικά. Αποτελούν τη μηχανική εκδοχή ενός κειμενογράφου που σχεδιάζει ιδέες για μια διαφήμιση. Πολλά από αυτά μπορεί να μην κάνουν το κόψιμο, αλλά ένα ή δύο παραδείγματα θα μπορούσαν να είναι πολύ χρήσιμα.
Νόμος του Dormehl
Αυτός είναι ένας άλλος λόγος για τον οποίο ο Roy Choudhury είναι τόσο ενθουσιασμένος με τις δυνατότητες του συνεχούς ακουστικού υπολογισμού — και τις πιθανότητές του για επιτυχία στον πραγματικό κόσμο. Οι κοινωνικές απαντήσεις υπαγορεύουν πολύ περισσότερα σχετικά με το ποιες τεχνολογίες πιάνουν από ό, τι θα ήθελαν αναγκαστικά οι τεχνολόγοι. Οι νέες τεχνολογίες, εξ ορισμού, είναι νέες. Το νέο μπορεί να ισοδυναμεί με παράξενο. Για να χρησιμοποιήσω μια δική μου διατύπωση (ας την ονομάσουμε Νόμο του Dormehl, για ένα μαχαίρι στους μεταγενέστερους), η εξωγενής χρησιμότητα οποιασδήποτε νέας τεχνολογίας πρέπει να αντισταθμίσει διπλά την εγγενή βαρετή χρήση της.
«Αυτό είναι ένα πρόβλημα γιατί πολύ λίγες τεχνολογίες εμφανίζονται πλήρως διαμορφωμένες».
Ο προσωπικός υπολογιστής, τον οποίο οι άνθρωποι χρησιμοποιούσαν στα σπίτια τους, είχαν την οικονομική δυνατότητα να χρησιμοποιήσουν ελάχιστα τα πρώτα χρόνια του στην αγορά, επειδή τα κοινωνικά διακυβεύματα χρήσης του ήταν τόσο χαμηλά. Ένας φορητός υπολογιστής, που χρησιμοποιείται στο κοινό, είχε ελαφρώς υψηλότερα πονταρίσματα. Τα φορητά, τα οποία είναι ιδιαίτερα εμφανή λόγω του ότι φοριούνται στο σώμα, είναι πιο ορατά περίεργα από τις περισσότερες τεχνολογίες. Ένα κομμάτι τεχνολογίας που θα κολλήσει στο κεφάλι, μοιάζει με ένα κυβερνητικό εμφύτευμα σε ένα drone Borg, πρέπει να λαμπρό και άμεσα χρήσιμο εάν ο χρήστης πρόκειται να θεωρήσει ότι αξίζει τον επιζήμιο κοινωνικό αντίκτυπο της προβολής του φορώντας το.

Αυτό είναι ένα πρόβλημα γιατί πολύ λίγες τεχνολογίες εμφανίζονται πλήρως διαμορφωμένες. Στις περισσότερες περιπτώσεις, οι πρώτες γενιές ενός προϊόντος βασίζονται σε ελαττωματική υπόσχεση, πριν εμφανιστεί μια πιο συναρπαστική προσφορά κάπου γύρω από την τρίτη επανάληψη. Εάν ένα προϊόν με υψηλή προβολή αποτύχει να παραδοθεί από την πρώτη μέρα, οι πιθανότητες επιτυχίας του μακροπρόθεσμα μπορεί να ακυρωθούν, ακόμα κι αν τελικά μετατραπεί σε καλό προϊόν. Για τους παλιότερους λάτρεις της τεχνολογίας, σκεφτείτε τη φορητή συσκευή Apple Newton και την πρώιμη μαχαιριά της στην αναγνώριση χειρογράφου. Για τους νεότερους θαυμαστές, ο νόμος του Dormehl μπορεί να εξηγήσει την αποτυχία του Google Glass, το οποίο ήρθε με τεράστιο κοινωνικό στίγμα και κρίση και λειτούργησε… σχεδόν εντάξει.
Τα ακουστικά, όπως σημείωσε ο Roy Choudhury, είναι διαφορετικά. Όποιες μάχες μπορεί να υπήρχαν κάποτε γι 'αυτούς, λίγο πολύ έχουν ήδη κερδηθεί. «Η κοινωνία έχει ήδη δεχτεί ανθρώπους που φορούν ακουστικά», είπε. «… Κατά κάποιο τρόπο, είναι μόνο οι αλγόριθμοι και οι αισθητήρες και το υλικό που πρέπει τώρα να αναβαθμιστούν. Είναι μόνο μια τεχνολογική συμφόρηση, και όχι πλέον μια κοινωνική, ψυχολογική συμφόρηση».
Η υπόσχεση των wearables
Το γεγονός ότι τα ακουστικά έχουν γίνει αποδεκτά μειώνει το ποντάρισμα και σημαίνει ότι δεν χρειάζεται πλέον να υπάρχει ένα άμεσο δυαδικό αποτέλεσμα. Ακόμα κι αν οι υψηλότεροι στόχοι που περιέγραψε ο Roy Choudhury δεν επιτευχθούν για μεγάλο χρονικό διάστημα, η σταδιακή βελτίωση θα προσθέσει χρησιμότητα σε έναν αποδεδειγμένο παράγοντα μορφής.
«Ο καρπός που κρέμεται ψηλά [είναι πράγματα όπως] «από τις χειρονομίες των δοντιών μου, μπορώ να ανιχνεύσω επιληπτικές κρίσεις» ή «από το χειρονομίες του προσώπου, μπορώ να καταλάβω τη διάθεση του ατόμου, έτσι ώστε αυτό να γίνει σαν Fitbit για τη διάθεση», είπε. «Αλλά ακόμα κι αν αυτό αποτύχει, δεν εμποδίζει τον αγωγό του προϊόντος. Ωστόσο, εάν είναι επιτυχείς, απλώς μεταμόρφωσε το προϊόν σε κάτι φανταστικό».
Οι δυνατότητες για ακουστικούς υπολογιστές, πιστεύει ο Roy Choudhury, είναι σχεδόν απεριόριστες. «Νομίζω ότι ο δρόμος μπροστά είναι πολύ πιο πέρα από την ομιλία», είπε. «Θα έλεγα ότι η ομιλία είναι ο πιο εσωτερικός κύκλος, ο οποίος βρίσκεται στον πυρήνα [αυτής της τεχνολογίας]. Έξω από αυτή την αλληλεπίδραση είναι η ακουστική γενικά. Και η εξωτερική ακουστική είναι κάθε είδους άλλοι αισθητήρες και δυνατότητες. Αν σκεφτείτε πώς θα ξεκινήσουμε την κατασκευή αυτής της πλατφόρμας, τα φρούτα είναι χαμηλά αλληλεπίδραση βασισμένη στην ομιλία: «Ρύθμιση χρονοδιακόπτη», «Γεια σου Siri, τι καιρό έχει σήμερα;» Αλλά μπορεί να πάει πολύ μακριά πέρα από αυτό."
Άλλοι ερευνητές που εργάζονται σε φορετούς υπολογιστές με τον Roy Choudhury περιλαμβάνουν Ζιτζιάν Γιανγκ, Yu-Lin Wei, Τζέι Πράκας, και Ζιγιούε Λι.
Συστάσεις των συντακτών
- Η εφαρμογή iPhone του ChatGPT έχει πλέον ενσωματωμένο Bing
- Η Apple δεν έκανε το Siri δολοφόνο ChatGPT στο WWDC — και αυτό με τρομάζει
- Ξεχάστε το ChatGPT — Το Siri και ο Βοηθός Google κάνουν αυτά τα 4 πράγματα καλύτερα
- Η Apple κατασκευάζει έναν προπονητή υγείας AI για το Apple Watch, ισχυρίζεται η έκθεση
- Αυτή η παράξενη συσκευή AI μπορεί να αντικαταστήσει το smartphone σας στο μέλλον