5 דרכים שבהן A.I. עוזרים יקחו את טכנולוגיית הקול לשלב הבא

תפוח עץ

מאז ש-Siri הופיעה לראשונה ב-iPhone 4s בשנת 2011, העוזרות הקוליות הפכו מגימיק בלתי ניתן לביצוע לבסיס לטכנולוגיית רמקולים חכמים שנמצאת באחד מכל שישה בתים אמריקאים.

תוכן

  • מו' ידע, פחות בעיות
  • יותר (וטוב יותר) התאמה אישית
  • נהיה פרואקטיביים
  • הכל קשור למשוב
  • שיטות אינטראקציה חדשות

"לפני סירי, כשדיברתי על [מה אני עושה] היו מבטים ריקים", תום הבנר, ראש תחום חדשנות ב- ניואנס תקשורת, אשר מפתחת א.י. טכנולוגיית קול, אמר ל-Digital Trends. "אנשים היו אומרים, 'האם אתה בונה את מערכות הטלפון הנוראיות האלה? אני שונא אותך.' זאת הייתה האינטראקציה היחידה של קבוצה אחת של אנשים עם טכנולוגיית קול".

סרטונים מומלצים

זה כבר לא המצב היום. על פי תחזיות eMarketer, כמעט 100 מיליון סמארטפון משתמשים ישתמשו בעוזרות קוליות עד 2020. אבל בעוד א.י. עוזרים הם כבר לא חידוש, אנחנו עדיין בתחילת האבולוציה שלהם. יש עוד דרך ארוכה לפני שהם עומדים במלואם בהבטחה שיש לעוזרים קוליים כקטגוריית מוצר.

הנה חמש דרכים שבהן הטכנולוגיה יכולה להשתפר כדי להפוך אותה לחכמה ויעילה יותר - ולעזור לנו לנהל חיים פרודוקטיביים יותר כתוצאה מכך. קרא להם "תחזיות" או "רשימת משאלות", אלו האתגרים שצריך לפתור.

מו' ידע, פחות בעיות

אלכסה יכול להגיד לך מה מזג האוויר בקואלה לומפור, מלזיה; המספר הכולל של דולר ארה"ב שתקבל עבור 720 ראנד דרום אפריקאי, וכיצד לאיית "דיסטבלישמנטריות". אבל צרכן א.י. עוזרים הם, בעצם, המקבילה הדיגיטלית של אדם עם סט שלם של עדכני אנציקלופדיות. אתה מקבל (בתקווה) את המידע הנכון, אבל אין שם רמת מומחיות פרו-דרגתית.

"האתגר שיש למערכות בבית שלך הוא שיש מגוון כל כך רחב של דברים שהם מנסים לעשות", אמר הבנר ל-Digital Trends.

זה פתרון שקשה לפתור, אבל לעשות זאת יהיה מחליף משחק. Nuance מפתחת מערכות מומחים רבות המכוונות למקרה שימוש ספציפי אחד, כגון עזרה ללקוחות חברות תעופה לענות על שאלות או לרופאים לרשום הערות. פעולה זו לא רק פירושה שמערכות אלו יכולות להתעמק כדי לקבל מידע מפורט יותר, אלא גם פירושה שיותר אינטליגנציה יכולה להידבק. "אנשים התלהבו מאוד ממחשבים שיכולים להבין מילים, אבל זה לא בהכרח משנה אם אתה לא יודע מה לעשות עם המילים האלה", אמר הבנר.

דוגמה אחת שהוא נותן היא של מערכת Nuance שלא רק מבינה מתי רופאים קוראים רשימה של תרופות פוטנציאליות לחולים, אלא גם יכולה לקרוא לעימותים פוטנציאליים. זה הרבה מעבר ליכולות של רוב A.I בדרגת משתמש. עוזרים.

עם זאת, בעל ידע מפורט יותר של תחומים שונים - משהו רמז על ידי Alexa Skills - יכול להיות טרנספורמטיבי. לבקש מהרמקול החכם שלך ייעוץ משפטי או רפואי נשמע, על פניו, מטורף. אבל היו התקדמות יוצאת דופן בתחומים כמו בוטים משפטיים, בעוד שדוח שפורסם לאחרונה מציע שאפל רוצה ש-Siri תהיה מסוגלת שיחות ממוקדות בריאות עם משתמשים עד 2021.

גרפי ידע מומחה עבור A.I. עוזרים הם החומר של חלומות מדע בדיוני כרגע, אם כי א דוח Voicebot.ai האחרון מראה באיזו מהירות מערכי הכישורים של העוזרים הווירטואליים מתרחבים. עם זאת, כאשר מיומנויות יעברו לשטח ההתמחויות, אנו עומדים לקבל פינוק!

יותר (וטוב יותר) התאמה אישית

התאמה אישית של הרמקולים החכמים של היום עדיין בחיתוליה. אתה יכול לשנות את המבטא והמגדר של העוזרות הקוליות, להוסיף או להסיר מיומנויות ולהאכיל אותה בפיסות מידע כמו שמך ומקום העבודה שלך. במקרים מסוימים, אתה יכול להגדיר מספר פרופילים קוליים כך Google Home יזהה את בני הבית האישיים שלך.

Amazon Echo Show

אבל יש עוד דרך ארוכה - אם כי המיץ צריך להיות שווה את הסחיטה. Mattersight Corporation פיתחה את A.I. טכנולוגיית מוקד טלפוני, נקרא ניתוב התנהגותי חזוי, המנתח את דפוסי הדיבור של המתקשרים ומתאים אותם לפעילים אנושיים בעלי סוגי אישיות תואמים. לטענת החברה, התאמה של אדם עם אישיות תואמת תביא לשיחה מוצלחת שנמשכת רק חצי מהזמן, לצד זו של אדם עם סוג אישיות מתנגש.

שימוש בגישה דומה עלול לגרום ל-A.I. עוזרים שמדברים אליכם כמו שאתם אוהבים שיפנו אליכם. זה יכול להיות משהו פשוט כמו התאמת המבטא ועוצמת הקול של האדם איתו הם מדברים. או שהוא יכול לשנות את הדרך שבה הוא מתייחס לרעיונות על ידי שימוש אולי במילים יותר רגשיות עבור משתמשים מסוימים, בהשוואה למידע מפורט יותר צפוף יותר שהוא יכול להשתמש עבור אחרים. אולי אנשים מסוימים רוצים עוזר קולי לשוחח איתו ארוכות, בעוד שאחרים פשוט רוצים שאחד מהם יעביר את המידע הדרוש בצורה הכי תמציתית שאפשר. א.י. עוזרים צריכים להיות מסוגלים לשניהם.

טכנולוגיות כמו גוגל דופלקס להראות עד כמה קולות ושיחות מסונתזים שנוצרו על ידי A.I מדויקים בצורה משכנעת. ככל ש-A.I. עוברים לאזורים מורכבים יותר מאשר לחלוק בקשות שירים וטיימרים לאוכל, צפו לראות את הטכנולוגיה הזו משחקת תפקיד מרכזי.

זה יכול להיעזר בפריצות דרך ביכולת לזהות משתמשים בקול. הבנר מציין כי הטכנולוגיה של Nuance יכולה לזהות משתמשים משנייה בודדת בודדת של אודיו. "זה לקח 10 שניות כדי להבין מי אתה, כדי לקבל אות מדויק", אמר. "הכוח של זה הוא משמעותי." היכולת לזהות משתמשים באמצעות קטע קול קטן פותרת את הבעיה בעיית סיסמה, ופותחת את ההזדמנות להשתמש בעוזרות קוליות לסודיות עדינה יותר מֵידָע.

נהיה פרואקטיביים

עוזר טוב יעשה משהו כשתבקש ממנו. עוזר גדול לא יצטרך לשאול. כרגע, A.I. העוזרים עדיין בשלב הראשון הזה. משתמשים יכולים לקבל את השיר שהם רוצים או את התזכורת שהם צריכים, אבל בדרך כלל רק כאשר זה מתבקש באופן מפורש. ככל שאנשים נעשים יותר נוחים עם עוזרי קול, יש הזדמנות מצוינת עבורם לעבור מעבר להיותם מכשירים תגובתיים גרידא למכשירים פרואקטיביים.

יש שאלות גדולות לגבי האם אנשים רוצים למסור עבודות מסוימות למכונות או לא.

איך היית מרגיש לגבי A.I. עוזר בקבלת החלטות בשמך? אלה יכולים להיות כל דבר, החל מהפעלת התרמוסטט כשמישהו אומר שקר לו או הזמנת ארוחת צהריים מחדש להיפגש כי אתה מאחר, כדי לדחוף אותך לעשות יותר פעילות גופנית או להשתפר בשמירה שלך תלוש משכורת. ככל שיותר ויותר מכשירים חכמים יעשו את דרכם לבית, מספר הדברים שעוזרת קולית יכולה להעלות על הדעת יגדל מאוד.

חלק מזה היא שאלה חברתית על כמה נוח לאנשים לגבי מכונות שמקבלות החלטות מצדם. יש שאלות גדולות לגבי האם אנשים רוצים למסור עבודות מסוימות למכונות או לא. תחשוב על זה כמו לתת את כרטיס האשראי והמפתחות לבית שלך לעוזרת בשר ודם שלך - רק עם זריחה הרבה יותר גדולה של Skynet. החיסרון הוא ויתור על מידה מסוימת של שליטה. היתרון הפוטנציאלי הוא הגדלת הזמן הפנוי שלך. כמובן, יש אתגר טכני גדול...

הכל קשור למשוב

תום הבנר הצביע על אתגר גדול בסוגיית הפרואקטיביות: איך המכונות שלנו יודעות מתי הם עשו את זה נכון? חוזרים לרעיון של הטוב מול. עוזר נהדר, עוזר מעולה עשוי להוציא את כל הקבצים שלך לפני פגישה גדולה, מבלי שתצטרך לבקש. אבל מה אם הם הקבצים הלא נכונים? בעיה גדולה בהכנת A.I. עוזרים פרואקטיביים יותר היא שכרגע יש דרכים מוגבלות לחשוף אם אנחנו מקבלים או לא שהמידע הוא המידע הנכון.

א.י. זה טוב פלפל הרובוט
Tomohiro Ohsumi/Getty Images

"אם אני מבקש את אותו השיר כל יום כשאני נכנס לבית שלי, ואז יום אני נכנס והוא פשוט מתחיל להתנגן, איך הם יודעים שהם הבינו את זה נכון?" אמר הבנר. "אם אני לא מפסיק את זה לשחק, זה אומר שזה נכון? אם אני כן אומר 'עצור', האם זה אומר שזה טעה וזה לא צריך לעשות את זה שוב? מנגנון המשוב הוא אחת הסיבות שאתה לא מקבל מערכות פרואקטיביות יותר."

זה מאתגר עבור מהנדסים להבין. כל מי שאי פעם היה מתמחה שביקש ממנו הדרכה ומשוב על כל משימה בודדת יודע שלפעמים קל יותר לבצע עבודה בעצמך מאשר להאציל אותה. א.י. עוזר נמצא שם כדי להפוך את חייך ללא חיכוכים יותר; לא לתת לך עשרות מיני סקרים בכל יום כדי לאשר אם זה עשה את העבודה שלו כמו שצריך. זה יצטרך להיפתר בצורה שאינה משתקת את הידידותיות למשתמש של המכשירים הללו, ואינה דורשת הרבה הדרכה מראש לפני שהמערכות ילמדו את ההעדפות שלך.

מה התשובה? אני לא בטוח. אבל, כמו שסטיב ג'ובס אמר פעם, זה לא התפקיד של הלקוח להבין את זה.

שיטות אינטראקציה חדשות

יש סצנה ב 2001: אודיסיאה בחלל שבו ה-HAL 9000 הרצחני, באופן מדאיג עדיין ה-A.I הבדיוני המפורסם ביותר. עוזר בהיסטוריה, מגלה שהוא לא משתמש רק במיקרופונים כדי לקבוע מה אומרים לו. כששני אנשי צוות מנסים לבחור מקום לדבר בו הם יודעים ש-HAL לא שומע, HAL מגלה שהוא עדיין יכול להבין אותם, מבוסס על קריאת תנועת השפתיים שלהם.

2001: אודיסיאה בחלל

רגע מפחיד של הסרט? בטוח. דוגמה לאופן שבו A.I. עוזרים יכולים לעבוד בעתיד? אני בטוח!

הרעיון שעוזרי קול צריכים להיות מוגבלים לקול מקטין את המספר האפשרי של דרכים שבהן הם יכולים ליצור איתנו אינטראקציה מועילה. עם עלייתו של זיהוי פנים ו טכנולוגיות למעקב אחר רגשות, מספר הולך וגדל של ביומטריה שנאספו על משתמשים על בסיס קבוע, ואפילו אפשרות של טכנולוגיה לקריאת מחשבות באופק, יש הרבה אותות שונים שיכולים לשמש את A.I. עוזרים להסיק את מסקנותיהם.

הרעיון שבעוד 10 שנים מהיום, נשתמש רק בקול כדי לשלוט ב-A.I. עוזרים זה כמו להסתכל על מחשבים אישיים בתחילת שנות ה-80 ולחשוב שלעולם לא תהיה לנו יותר ממקלדת לרשותנו.

המלצות עורכים

  • חישת רגשות א.י. נמצא כאן, וזה יכול להיות בראיון העבודה הבא שלך
  • הקמפוס החדש של אפל בסיאטל עשוי להיות אומר דברים גדולים עבור סירי, בינה מלאכותית
  • גוגל מצאה דרך להשתמש ב-A.I. כדי להגביר את התועלת של אנרגיית הרוח