רומית רוי צ'ודהורי היא גדולה באוזניים. אבל לא פנימה זֶה דֶרֶך. רוי צ'ודהורי, פרופסור להנדסת חשמל ומדעי המחשב באוניברסיטת אילינוי באורבנה-שמפיין, מאמין חזק בפוטנציאל שינוי הפרדיגמה של מה שהוא מכנה מחשוב אוזן (לא, לא לביש)..
תוכן
- אוזניות לקריאת מחשבות?
- פריקה לאוזניים
- חוק דורמל
- ההבטחה של דברים לבישים
זה אומר להתחבר לאפשרויות העצומות של חומרה ותוכנה הפועלות באמצעות שני חורי האזנה מפוארים בצדי הראש שלך. ולסייע בפיתוח הכל, החל מיישומי פרטיות ואבטחה ועד לאבחון רפואי כלים המתמקדים בעתיד של מציאות רבודה, הוא מרכיב צוות קראק של מומחים שיסייע לו.
סרטונים מומלצים
"אני יכול להשתמש כמעט בכל אחד במדעי המחשב והנדסת חשמל", אמר ל-Digital Trends. "מכלול הבעיות על הרדאר שלי הוא עצום."
קָשׁוּר
- מודאג מהאזהרה העמוקה של ה-FBI? עקוב אחר עצות המומחים האלה
- אפליקציית ChatGPT החדשה של OpenAI היא בחינם לאייפון ולאייפד
- עכשיו אתה יכול צ'אט וידאו עם ChatGPT AI - כך זה נראה
אוזניות הן כבר שוק ענק. תפוחים AirPods, קו האוזניות האלחוטיות שלה, נמכר ב-60 מיליון יחידות ב-2019 בלבד. בשנה שעברה, המספר הזה היה
מוערך לעלות ל-85 מיליון. כיום, חברות רבות מייצרות אוזניות חכמות המציעות ביטול רעשים אקטיבי, A.I. עוזרים חכמות ועוד.כמה עשורים לפני ה-AirPods, עוד בשנות השמונים, היה הווקמן, אולי הטכנולוגיה הלבישה המודרנית הראשונה, שאפשרה למשתמשים לקחת איתם את המוזיקה שלהם לכל מקום שאליו הלכו. הווקמן העניק למשתמשים שליטה לא רק על מה שהם הקשיבו לו (נגיד, The Smiths), אלא גם, בגלל אוזניות הפלסטיק שלו אטמו את האוזניים שלהם, מה שהם לא הקשיבו לו (נגיד, ההורים שלהם). זה אפשר לאנשים ליצור ולהפעיל שליטה על פס הקול לחייהם, ונתן לכולנו את בועות המשמעות האישיות שלנו. בעוד שה-boombox עסק במתן - או, במקרים מסוימים, לאלץ - אחרים להאזין למוזיקה שלנו, הווקמן הפך את ההאזנה לחוויה אישית ומבודדת ביסודה.
אבל רוי צ'ודהורי והצוות שלו רוצים ללכת רחוק יותר מזה. הם מבקשים להפוך את האוזניות של היום לפלטפורמת מחשוב חדשה לגמרי שיכולה, במקרים מסוימים, להחליף את הצורך שלך להגיע אל סמארטפון או מחשב. אם הווקמן הוציא לכל אחד את בועת הסאונד האישית שלו כדי ליהנות מהם בזמן שהם הולכים ברחוב, בעידן הזה של טכנולוגיה והתאמה אישית חכמה יותר, ניתן היה לרתום את אותן בועות בחדשות, מרגשות, ולעתים גם קצת מוזרות דרכים.
אוזניות לקריאת מחשבות?
"רוב שוק המחשוב הלביש התמקד [עד כה] במכשירים הנלבשים על החלק התחתון של הגוף, בעיקר בכיסים שלך או על פרקי הידיים שלך, אולי בנעליים שלך", אמר רוי צ'ודהורי. "זה אומר שאתה יכול לחוש את החלק התחתון של הגוף, כמו מה שאתה עושה עם הידיים, עם פרקי הידיים, עם הרגליים. אבל יש הרבה מידע שנוצר בחלק העליון של הגוף, בעיקר בראש שלך - כגון הקשבה, דיבור, אכילה, רגשות פנים, רמזים פוטנציאליים למידע הקשור לרפואה - שיכולים להיות לֹא יְסוּלֵא בְּפָּז. הגביע הקדוש, הגבול הסופי של זה, עשוי להיות אפילו חישת אותות מוח מקרוב לראש שלך."
הרעיון של היכולת לא רק להאזין באופן פסיבי למכשיר בתוך האוזן, אלא גם לדבר איתו, הוא הבסיס מאחורי עוזרות חכמות כמו סירי. אבל הדיבור, כפי שמשתמשים בו ב-A.I של היום. עוזרים, הוא רדוד בכוונה. בהשוואה לתמונה (שווה אלף מילים), סירי נמצאת במיטבה עם פיצוצי מידע מהירים, כמו מציאת תחזית מזג האוויר או הגדרת טיימר במטבח. אבל זה בערך הגבול. הרעיון של מחשוב אוזן הוא למצוא דרכים להוריד כמה מהדברים האחרים שאנחנו צריכים כרגע לבהות במסכים עבורם ולהכניס אותם לאוזניים שלנו (ולפנים).
"כל מה שאתה עושה על המסך החזותי, אתה שם את כל תשומת הלב הקוגניטיבית שלך", הוא אמר. "לקרוא - גם אם זו בדיחה מטופשת שאתה קורא על מסך - אתה לא יכול להתמקד בשום דבר אחר. הקריאה תופסת את מלוא תשומת הלב הקוגניטיבית שלך. האמונה שלי היא שיש הרבה דברים כאלה שאינם ראויים לתשומת לבך הקוגניטיבית המלאה. אנחנו יכולים לשלוף אותם מהתחום הוויזואלי, ולדחוף אותם לתחום האודיו הלא מנוצל והלא מונופול, שבו המוח האנושי התפתח בצורה טובה מאוד ריבוי בין מידע אודיו כזה... למה לא לקחת את הדברים הפשוטים האלה, ולהרחיק אותם מהערוץ הקוגניטיבי, הוויזואלי הקוגניטיבי שלך ואל האקוסטי רוחב פס?"
ניסוי שנערך לאחרונה על ידי הצוות כלל חקירה של הדרכים בהן נוכל לצרוך טקסט בצורה משמעותית יותר נִשׁמָע טופס. אם אתה קורא מאמר, ייתכן שתראה מילת מפתח שמעניינת אותך, ותתחיל לקרוא בנקודה זו. עם זאת, אין דרך קלה לעשות זאת כאשר, למשל, אתה מאזין לפודקאסט.
"אחד הדברים שאנו מנסים לעשות במעבדה שלנו הוא [שאל], האם אני יכול להאיץ את ההאזנה למאמר?" אמר רוי צ'ודהורי.
פריקה לאוזניים
בהדגמת הוכחת הרעיון של הקבוצה, למאזין יש מספר פסקאות במאמר שמוקראות לו בו-זמנית. הטריק לגרום לזה לעבוד הוא להשתמש בעיבוד אותות כדי לגרום לכל פסקה להישמע כאילו היא מגיעה מכיוון אחר - זה קצת כמו ישיבה במסעדה ומקיימים ארבע שיחות בשולחנות מסביב, אבל מחייגים לאחד מכיוון שהדיירים מזכירים אדם שאתה לָדַעַת. כדי לגרום לזה לעבוד טוב יותר, הצוות הקש על יחידת המדידה האינרציאלית (IMU) באוזניות כך שה המשתמש יכול להרים קול מסוים (חלק אחד של הטקסט) על ידי סיבוב ראשו קלות בו כיוון.
"אני קורא לפרויקט הזה 'קריאה בתחום האקוסטי', שבו אני מסתכל על כיוון הקול של הפסקה השלישית, והקול הזה הופך חזק יותר והקולות האחרים קצת מתעממים", אמר.
זה גם לא הכל עניין של דיבור. הצוות גם מצא שניתן להשתמש גם במיקרופון וגם ב-IMU שבאוזניות כדי לקלוט רעידות עדינות להפליא בפנים, זעירות כמו אדם מקשקש בשיניים או שרירי הפנים מזעיפים פנים או מחייכים. לא, כנראה שלא תעזוב את הטלפון החכם שלך כדי לפטפט הודעות באמצעות קוד מורס עם השיניים. אבל אפשר להתרגל לרעיון שעיוותי הפנים הקטנים האלה, כמו החלקת שיניים בצד ימין ביצוע פקודות - או אפילו לשמש כאישור זהות עבור אימות דו-גורמי - הוא בהחלט מעניין.
"כולם מכירים את סירי, אבל תארו לעצמכם כמה שימושים פוטנציאליים יכולים להיפתח עבור סירי אם רק היה לה ממד מרחבי, כמו דוברת גח שמסוגלת להטיל את קולה".
זה יכול להיות שימושי בנוסף ללכידת נתונים אורכיים עבור דברים כמו אבחון רפואי. הפרעות חרדה, למשל, עשויות להיות מאובחנים מדפוסים מסוימים שזוהו בתנועת שיניים. רוי צ'ודהורי גם ציין שיש חוקרים שעובדים על בעיות כמו מדידת זרימת דם דרך האוזניים כדי לאמוד את קצב הלב, רמות הגלוקוז, פעילות השרירים ועוד.
רוצה עוד שימוש אפשרי? מה דעתך מציאות רבודה נשמעת? מציאות רבודה ידועה כיום בעיקר בזכות שכבת אובייקטים שנוצרו על ידי מחשב על גבי העולם האמיתי. אבל אין שום סיבה שהגדלות יתרחשו אך ורק על הספקטרום החזותי. הצוות של רוי צ'ודהורי נרגש מהסיכוי להשתמש בטכנולוגיית עיבוד אותות כדי למפות צלילים מסוימים אל הנוף שלך, כך שניווט את דרכך שדה תעופה, מוזיאון או כל מרחב ציבורי אחר יכולים לכלול הליכה לעבר קול שאומר "עקוב אחרי", שנראה כאילו מגיע מהכיוון אליו אתה צריך ללכת ב.
כולם מכירים את סירי, אבל תארו לעצמכם כמה שימושים פוטנציאליים יכולים להיפתח עבור סירי אם רק היה לה ממד מרחבי, כמו דוברת גחון שמסוגלת לזרוק את קולה. הגדלה מרחבית זו יכולה גם לעזור לשפר פגישות וירטואליות גדולות, כאשר קולו של כל אדם ממופה למיקום ספציפי, מה שמקל על זיהוי מיידי מי מדבר.
לא כל אלה יתממשו, כמובן. הם הגרסה ההנדסית של קופירייטר שמשרבט רעיונות למודעה. רבים מהם אולי לא יצליחו, אבל דוגמה אחת או שתיים עשויות להיות שימושיות מאוד.
חוק דורמל
זוהי סיבה נוספת לכך שרוי צ'ודהורי כל כך מתלהב מהפוטנציאל של המשך מחשוב אוזן - ומהסיכויים שלו להצליח בעולם האמיתי. התגובות החברתיות מכתיבות הרבה יותר על אילו טכנולוגיות תופסות מאשר בהכרח טכנולוגים יאהבו. טכנולוגיות חדשות, בהגדרה, הן חדשות. חדש יכול להשוות למוזר. כדי להשתמש בניסוח משלי (בואו נקרא לזה חוק דורמהל, למען דקירה של הדורות הבאים), התועלת היוצאת מהשער של כל טכנולוגיה חדשה חייבת לקזז כפליים את המעוות הטבועה בשימוש בה.
"זו בעיה כי מעט מאוד טכנולוגיות צצות בצורה מלאה."
המחשב האישי, שאנשים השתמשו בו בבתיהם, יכול היה להרשות לעצמו לעשות שימוש מועט במשך השנים הראשונות שלו בשוק, כי ההימור החברתי בשימוש בו היה כה נמוך. מחשב נייד, המשמש בציבור, היה בעל הימור מעט גבוה יותר. פריטים לבישים, הבולטים במיוחד עקב הלבישה על הגוף, הם מוזרים בעליל מרוב הטכנולוגיה. פיסת טכנולוגיה שתהיה תקועה על הראש, תיראה כמו שתל קיברנטי על מזל"ט בורג, חייבת להיות מבריק ושימושי מיד אם המשתמש מתכוון לשקול את ההשפעה החברתית המזיקה של להיראות לובש את זה.
זו בעיה מכיוון שמעט מאוד טכנולוגיות צצות בצורה מלאה. ברוב המקרים, הדורות הראשונים של מוצר בנויים על הבטחה פגומה, לפני שהצעה משכנעת יותר מופיעה אי שם בסביבות האיטרציה השלישית. אם מוצר בולט לעין לא מצליח לספק מהיום הראשון, סיכויי ההצלחה שלו בטווח הארוך עלולים להיות מסוכלים, גם אם הוא יהפוך בסופו של דבר למוצר טוב. לחובבי טכנולוגיה מבוגרים יותר, שקול את המכשיר הנייד של אפל ניוטון, ואת הדקירה המוקדמת שלו בזיהוי כתב יד. עבור מעריצים צעירים יותר, חוק דורמהל עשוי להסביר את הכישלון של גוגל גלאס, שהגיע עם סטיגמה ושיפוט חברתי אדיר ועבד... כמעט בסדר.
אוזניות, כפי שציין רוי צ'ודהורי, שונות. כל הקרבות שהיו קיימים עליהם כבר פחות או יותר ניצחו. "החברה כבר קיבלה אנשים עם אוזניות", אמר. "... במובן מסוים, יש לשדרג כעת רק האלגוריתמים והחיישנים והחומרה. זה רק צוואר בקבוק טכנולוגי, ולא עוד צוואר בקבוק חברתי ופסיכולוגי".
ההבטחה של דברים לבישים
העובדה שהאוזניות התקבלו מורידה את ההימור, וגורמת לכך שכבר לא חייבת להיות תוצאה בינארית מיידית. גם אם המטרות הגבוהות ביותר שתיאר Roy Choudhury לא יושגו במשך זמן רב, השיפור המצטבר יוסיף שימושיות לגורם צורה מוכח.
"הפרי התלוי גבוה [הם דברים כמו] 'מתנועות השיניים שלי, אני יכול לזהות התקפים' או 'מהתנועות שלי מחוות פנים, אני יכול להבין את מצב הרוח של האדם כך שזה הופך להיות כמו Fitbit למצב הרוח", הוא אמר. "אבל גם אם זה נכשל, זה לא פוגע בצנרת המוצרים. עם זאת, אם הם מצליחים, זה פשוט הפך את המוצר למשהו פנטסטי".
הפוטנציאל למחשוב בר-אזן, מאמין Roy Choudhury, הוא כמעט בלתי מוגבל. "אני חושב שהדרך קדימה היא הרבה מעבר לדיבור", אמר. "הייתי אומר שהדיבור הוא המעגל הפנימי ביותר, שהוא הליבה [של הטכנולוגיה הזו]. מחוץ לאותה אינטראקציה היא אקוסטיקה באופן כללי. ואקוסטיקה חיצונית היא כל מיני חיישנים ויכולות אחרות. אם אתה חושב על איך אנחנו הולכים להתחיל לבנות את הפלטפורמה הזו, הפירות התלויים הנמוכים הם אינטראקציה מבוססת דיבור: 'הגדר טיימר', 'היי סירי, מה מזג האוויר היום?' אבל זה יכול להגיע רחוק, רחוק מעבר לכך."
חוקרים אחרים שעובדים על מחשוב לביש עם רוי צ'ודהורי כוללים ז'יג'יאן יאנג, יו-לין ווי, ג'יי פראקש, ו זיוה לי.
המלצות עורכים
- אפליקציית האייפון של ChatGPT כוללת כעת Bing מובנה
- אפל לא הפכה את סירי לרוצחת ChatGPT ב-WWDC - וזה מפחיד אותי
- תשכחו מ-ChatGPT - Siri ו-Google Assistant עושות את 4 הדברים האלה טוב יותר
- אפל בונה מאמן בריאות בינה מלאכותית עבור Apple Watch, כך נטען בדיווח
- מכשיר בינה מלאכותית מוזר זה עשוי להחליף את הטלפון החכם שלך בעתיד