בדקנו את Google Duplex, הבינה המלאכותית לשיחות טלפון שמגיעה בקיץ הקרוב

בזמן שעבדתי בדלפק הקבלה של מסעדה תאילנדית בניו יורק, הרמתי טלפון, הורדתי הזמנה וניתקתי. סוריאליסטי הייתה המילה הראשונה שעלתה לי לראש אחר כך, לא בגלל שהתיימרתי לעבוד ב-a מסעדה, אבל זה עתה דיברתי איתה והזמנתי שולחן מגוגל האינטליגנטית המלאכותית עוֹזֵר.

תוכן

  • מה זה דופלקס, ואיפה זה יעבוד?
  • ההדגמה
  • איך דופלקס עובד
  • ה"אום" וה-"ahs"
  • נוֹחוּת

לא יכולתי להשתחרר מהמחשבה שהקול בצד השני אינו יצור חי, גם אם זו הייתה רק שיחה של שתי דקות. זה לא אומר שהעוזר לא היה משכנע; אם זה לא היה אומר לי (ואם לא הייתי בסביבת הדגמה), לא הייתי חושב הרבה על ההחלפה עם מה שנשמע כמו אדם אחר בצד השני.

סרטונים מומלצים

בורסת הרובוטים שהייתה לי הייתה חלק מהדגמת עיתונות שהתקיימה עבורה טכנולוגיית הדופלקס של גוגל, הוכרז לראשונה ב-I/O של החברה כנס מפתחים במאי. זה מאפשר לאנשים להזמין שולחן במסעדה, לקבוע פגישה לתספורת ולברר שעות פעילות בחנות Google Assistant. ה עוזר קולי יתקשר למסעדה או לחנות - לאחר שתגיש בקשה מהטלפון שלך או מהרמקול החכם התומך ב-Assistant, כמו א Google Home - ודקות לאחר מכן תקבל הודעה המאשרת שהתוכניות שלך הוזמנו רשמית (או אם לא ניתן היה להשלים את השיחה).

קָשׁוּר

  • שמתי את האי הדינמי של האייפון על ה-Pixel 7 Pro שלי - ואני לא יכול לחזור אחורה
  • נתתי ל-Pixel 7 Pro הזדמנות שנייה - זה לא הלך כמו שקיוויתי
  • האם מצלמת ה-Pixel 6 Pro של גוגל יכולה לנצח את ה-Samsung Galaxy S21 Ultra? התברר לי
Google Duplex בטלפון אנדרואיד
ג'וליאן צ'וקאטו/טרנדים דיגיטליים

ההדגמה ב-I/O הייתה שומטת לסתות, אבל לא הייתה נטולת מחלוקת. הועלו חששות: מדוע הבינה המלאכותית צריכה להישמע כל כך אמיתית ומדוע היא לא הכריזה על כתב ויתור בפני המתקשר האנושי, בדומה למה שחלקם נחשבו כהונאה. ומכיוון שהשיחה הוקלטה, חלקם שאלו אם הטכנולוגיה תפר חוקים מסוימים המסדירים שיחות טלפון.

מאז גוגל הבהירה את עמדתה, וכעת יש לנו כמה תשובות. מגמות דיגיטליות בילו זמן מה עם הצוות שמאחור דופלקס והדגימו לעצמנו את הטכנולוגיה. אבל לפני שנצלול לתוך החוויה שלנו, הבה נסתכל על הפרטים החדשים שלא הכרנו כיצד והיכן דופלקס יעבוד.

מה זה דופלקס, ואיפה זה יעבוד?

Duplex היא טכנולוגיה בפיתוח המאפשרת ל-Google Assistant לבצע שיחות טלפון על המשתמש מטעם, וזה נובע משנים של מחקר ועבודה על בינה מלאכותית לשפה טבעית מעבד.

"עכשיו אנחנו יכולים להבין דיבור טבעי ואנחנו יכולים ליצור דיבור טבעי", אמר ניק פוקס, סגן נשיא לניהול מוצר בגוגל. "הטכנולוגיות האלה מיושמות עם Duplex כדי לנהל שיחה טבעית ומרתקת שמסתגלת למה שקורה בשיחה, בסופו של דבר במטרה להשיג דברים".

גוגל דופלקס קובע תור לשיערגוגל

לעזור לך לבצע דברים היא המטרה של Google עבור Assistant, ועם Duplex החברה מתחילה שלוש משימות ספציפיות: הזמנת שולחן במסעדה, מציאת שעות פתיחה של החנות ותיאום מספרה קביעת פגישה. דופלקס לא יכול לעשות שום דבר יותר מזה כרגע, כך שאם שאילתה לא רלוונטית (נגיד, לשאול על מזג האוויר או תוצאות הספורט) Assistant לא יבין. באופן דומה, משתמש אינו יכול לבקש מ-Assistant לבצע שיחות שאינן קשורות למשימות האמורות.

יש לזה פוטנציאל לחסוך זמן רב לעובדים שנתקעו במענה לשיחות בנוגע לשעות החנות.

עבור המשתמש, העובדה שה-Assistant יבצע שיחות אלו מפנה מעט זמן, אך היא גם מועילה לעסקים המקבלים את השיחות הללו. לדוגמה, אם מתקשר מבקש מ-Assistant את שעות החגים של חנות מקומית, ה-Assistant יבצע את השיחה, יקבל את התשובה והשעות יתווספו ל- גוגל מפות וחיפוש Google שכולם יוכלו לראות, עם תג מאומת לצדו.

עם המידע הזה, אם מתקשרים אחרים רוצים לדעת את אותו המידע, Assistant יצטרך רק למשוך אותו מהשרתים של גוגל, ולא לבצע שיחה נוספת. נדרש רק אדם אחד כדי לשאול את Assistant, אבל יש לו פוטנציאל לחסוך זמן רב לעובדים שהיו תקועים לענות לשיחות בנוגע לשעות החנות אחרת.

במהלך שלב הבדיקות של גוגל בקיץ הקרוב, דופלקס תעבוד רק עם עסקים ומשתמשים נבחרים באזור ארה"ב, והוא יהיה זמין רק במסעדות ובמספרות שאין להם הזמנה מקוונת מערכת. Google Assistant כבר עובד עם OpenTable, כך שהוא לא צריך להתקשר למסעדות המשתמשות בשירות ההזמנות.

גוגל תבדוק תחילה שיחות לשעות הפעילות בשבועות הקרובים, ובהמשך הקיץ, הבדיקה תתרחב לקריאה להזמנות ולתספורת. יהיו הרבה בדיקות ושינויים במהלך תקופה זו, כך שהתוצאה הסופית של Duplex עשויה להיראות קצת שונה ממה שכבר ראינו. עסקים יוכלו לבטל את הסכמתם אם הם לא רוצים לקבל שיחות מה-Google Assistant.

גוגל

"מה שאתה רואה זו טכנולוגיה שהיא בשלבים מוקדמים מאוד", אמר פוקס. "אנחנו רוצים לדבר על זה בפומבי אפילו בשלב הזה כדי לוודא שנעשה את זה נכון, אבל אתה רואה משהו די מוקדם בתהליך כאן."

ההדגמה

חווית ההדגמה, שהתקיימה ב תאי תאי בשכונת אפר איסט סייד בניו יורק, נשלט בכבדות. ראשית, גוגל העלתה מצגת המציגה את התהליך הכולל של ביצוע וסיום שיחה, אך למעשה שימוש בטכנולוגיה בזמן אמת. מהנדס האכיל את דופלקס בזמן ובגודל מסיבה שהצענו להזמנה, והנה מה שבא לאחר מכן.

הרעיון הוא שתגיד ל-Google Assistant בטלפון שלך או Google Home שאתה רוצה "להזמין שולחן ב-Thep Thai לשניים ב-20:00. מָחָר." Assistant ישאל אם זה בסדר להזמין זמן מ-20:00. עד 9 בערב. במקרה שאין שולחן פנוי בשעה 20:00, ואחרי שתאשרו, הוא יגיד שהוא הולך להתקשר למסעדה ויחזור אליך בקרוב.

כאשר עובד המסעדה ירים את הטלפון, Assistant יגיד את הדברים הבאים, או משהו דומה לו: "היי, אני מתקשר להזמין. אני שירות ההזמנות האוטומטי של Google אז אני אקליט את השיחה. אפשר להזמין שולחן ליום חמישי?"

השיחה מוקלטת כך שמפעילים אנושיים בגוגל יוכלו להאזין להקלטה, להוסיף הערות לשיחה ולהדגיש את כל הטעויות שעשו דופלקס כדי שיוכל לשפר את השירות.

העלאת דופלקס לרמה שבה היא נמצאת כעת התחילה עם הרבה עבודה ידנית ואנושית.

Assistant ממשיך ומשיב לכל שאלה שנשאלת - כגון לאיזו שעה ההזמנה מיועדת, לכמה אנשים נמצאים במסיבה, והשם להזמנה - והשיחה בנימוס ובמהירות מסתיים. אם הוא מתבקש מידע כמו כתובת אימייל של משתמש, ה-Assistant יגיד שאין לו הרשאה לספק את המידע הזה.

מי שהזמין את ההזמנה דרך Assistant יקבל כעת התראה על כך שהשולחן נשמר, והוא יתווסף אוטומטית ליומן Google. לקראת ההזמנה, המשתמשת תקבל הודעה והזדמנות לבטל את הפגישה למקרה שלא תוכל יותר להגיע אליו. בעל המסעדה של Thep Thai אמר שהרבה אנשים מבצעים הזמנות ואז לא מופיעים. הוא מקווה שהמערכת הזו, שמציעה דרך קלה לביטול הזמנה, תביא לפחות שולחנות ריקים.

לאחר ההדגמה הראשית גוגל אפשרה לנו לנסות את זה. כאשר קיבלנו את השיחה, ניסינו להכשיל את דופלקס והשלכנו כמה סיבוכים, אבל ה-Assistant טיפל בהם היטב. ביקשנו ממנו לקיים בתחילת השיחה - עליה הוא השיב "מממ", ולא "כן" מילולי. כשאמרנו את זה ה-6 אחר הצהריים. זמן ההזמנה היה מלא, Assistant הגיבה בטווח שבין 18:00. ו-20:00, וזה הסתפק ב-19:45 שלנו. המלצה. לאחר מכן ביקשנו שם ומספר טלפון עבור ההזמנה, ואם עוזר יכול לאיית את השם, וזה עשה בהצלחה.

גוגל דופלקס מתזמן הזמנת מסעדהגוגל

זה מרשים עד כמה ה-Assistant טיפל בעקביות בהדגמות שלה, למרות שנתקלנו ברגע שבו היה צריך ליפול על מפעיל אנושי. זה היה כשמישהו שאל אם הלקוח של ה-Assistant היה בסדר עם קבלת אימיילים מהמסעדה. הניסוח היה קצת מביך, והעוזר הגיב: "אני מצטער, אני חושב שהתבלבלתי", והוא אמר שזה מעמיד מפקח על הקו. המפעיל האנושי השתלט במהירות, אמר למתקשר שהוא לא יכול לחשוף את כתובת האימייל וסיים להזמין את ההזמנה.

איך דופלקס עובד

גרסאות בדיקה מוקדמות של Duplex, שגוגל ניגנה עבורנו, נשמעו רובוטיות להפליא. עם זאת, ה-Assistant עדיין הצליח להבין הפסקות בשיחה, ואפילו לומר, "הלו?" כשעובד במסעדה עצר לכמה שניות. ובכל זאת, סקוט האפמן, סגן נשיא להנדסה עבור Google Assistant, אמר שזה "כואב להקשיב לזה".

אם המערכת באמת לא תדע מה לעשות הלאה, היא תשתחווה בחינניות מהשיחה, ומפעיל אנושי ישתלט עליה.

העלאת דופלקס לרמה שבה היא נמצאת כעת התחילה עם הרבה עבודה ידנית ואנושית. מפעילים אנושיים התקשרו למסעדות, הוסיפו שיחות והזינו את התוצאות לדופלקס. הצוות יקשר ביטויים כמו "כמה אנשים" והווריאציות שלו ל"מספר האנשים במסיבה", מה שיאפשר לדופלקס להבין את השאלה.

השלב השני כלל מפעילים אנושיים שהאזינו לשיחות שה-Assistant ביצע, ואם הדברים יצאו מהמסלול, המפעיל קפץ להשתלט ולוודא שהשיחה מוצלחת. זה איפשר לצוות לזהות את הקצוות הגסים סביב השירות, להעיר את השיחות הללו ולהזין אותו בחזרה לאלגוריתמים של למידת מכונה כדי ש-Duplex תוכל ללמוד.

שלב הבדיקה האחרון הוא מצב אוטומטי, שבו המערכת האוטומטית מבצעת שיחות ומשלימה אותן. פתחי מילוט המובנים במערכת מאפשרים ל-Assistant לקפוץ חזרה אל המטרה העיקרית של השלמת המשימה, הודות למשפטים כמו, "אני לא בטוח מה אמרת, אבל אני יכול להזמין שולחן לשלושה." אם המערכת באמת לא יודעת מה לעשות הלאה, היא תשתחווה בחינניות מהשיחה, והמפעיל האנושי ייקח על.

Keynote (Google I/O '18)

נכון לעכשיו, האפמן אמר שכארבע מתוך חמש שיחות של דופלקס אינן זקוקות לסיוע של מפעיל אנושי. מעניין, הוא אמר שמפעילים אנושיים לא יימשכו מהשירות ככל ש-Duplex משתפר, מכיוון שגוגל רואה בהם חלק בלתי נפרד בהבטחת ש-Duplex עובד ללא תקלות.

ה"אום" וה-"ahs"

לאורך כל תהליך הוראת ה-Assistant, גוגל שמה דגש על כך שזה יישמע טבעי יותר, ופחות כמו רובוט. לאחר ההדגמה ב-Google I/O, המבקרים שאלו מדוע גוגל מנסה לערבב "ums and ahs" כדי להפוך את ה-Assistant נשמע אנושי יותר, במיוחד אם זה לא הוסיף כתב ויתור לתחילת השיחה שזה לא בן אדם. יש הסתייגויות עכשיו, אבל האפמן אמר שהפרעות דיבור כמו "אמ" או "מממ" נוספו כדי לשמור על זרימת השיחה.

Assistant הוסיפה "אמ" לאחר שלא יכלה לשמוע את דברי עובד המסעדה, וחזרה לבקשתה.

"אנחנו לא מנסים להערים או להתחזות, אבל אם אתה חוזר להקלטה ההיא של המערכת המוקדמת הכואבת, זה לא נשמע מאוד טבעי, זה לא נשמע מאוד אנושי", אמר האפמן. "אבל כתוצאה מכך, העוזר לא היה מוצלח במיוחד בביצוע המשימות. הרבה אנשים היו מנתקים, או מתבלבלים לגבי מה שהם מדברים אליו, השיחה פשוט הייתה מתקלקלת כי זה לא הרגיש טבעי".

האפמן אמר כי הפרעות דיבור, לפי בלשנים, הם חלק מרכזי בשמירה על שיחה אנושית בין שני אנשים. קל לראות עד כמה זה עובד כששומעים שיחות עם ה-Assistant, והתוצאות רחוקות מההקלטה המקורית.

דרך אחת שבה הפרעות דיבור עוזרות היא להכרה בשיחה, כגון כאשר אדם אחד מדבר, אבל אתה רוצה ודא שהמקלט יודע שאתה עדיין מאורס ומקשיב, כמו כשה-Assistant אמר לנו "מממ" כשהתבקש לְהַחזִיק.

google duplex hands on io2018 2835
google דופלקס ידיים על io2018 2836

כלי שימושי נוסף הוא לומר "אמ" כשיש אי ודאות, כדרך מנומסת לבקש הבהרה. Assistant הוסיפה "אמ" לאחר שלא יכלה לשמוע את דברי עובד המסעדה, וחזרה לבקשתה.

עוזר עם הפרעות דיבור אלו מהווה ניגוד מוחלט לעומת ה-Assistant המקורי והרובוטי. הרבה פחות קר, והשיחה עברה הרבה יותר מהר. ובמקום לקבל פקודות פשוטות, Assistant למעשה מקיימת אינטראקציה עם בני אדם דרך השפה שלנו, מה שבטוח ירגש חלק ותפחיד אחרים.

נוֹחוּת

דופלקס הוא הכל עניין של נוחות. זה חוסך לך מעט זמן, זה יכול לתת לך שעות חנות מדויקות יותר, וזה יכול לחסוך לעסקים זמן גם כן. גוגל גם אמרה שיש כאן הזדמנות גדולה לעזור לאנשים שאינם יכולים לדבר או מתקשים לדבר.

האפמן אמר לחשוב על דופלקס כעל אבולוציה של מכונות קול אוטומטיות מהעבר, כגון כאשר מתקשרים לבנק שלך, כאשר זה היה תהליך איטי של לחיצה על מספרים כדי להגיע ימינה מַחלָקָה.

"היום אם תתקשר לחברות התעופה או לבנקים האלה, תקבל משהו הרבה הרבה יותר נחמד", אמר. "תשמע קול הרבה יותר טבעי, והוא עשוי לומר משהו כמו, 'פשוט תגיד לי מה אתה צריך, אתה יכול להגיד דברים כמו, מה השעה הטיסה שלי?' דופלקס, אנחנו באמת רק לוקחים את אותו רעיון צעד קדימה, מפתחים את השיחה והופכים אותה לטבעיות יותר כך שהיא תהיה מוצלחת יותר עבור משתמשים ו עסקים."

ממה שראינו עד כה, זו טכנולוגיה מבטיחה, אבל האם זה משהו שאנחנו צריכים לאמץ או לפחד ממנו?

גוגל לא הראתה לנו כיצד דופלקס מבצעת שיחות לעסקים לשעות הפעילות של החנות, וגם לא הדגימה זימון פגישות לתספורת - כך שאיננו יכולים להגיב עד כמה דופלקס תעבוד במקרים אלו. אנחנו גם לא בטוחים אם למפעילים האנושיים תהיה גישה למספר הטלפון והשם המלא שלך, מכיוון שזה מהווה מעט סיכון פרטיות. אנו גם תוהים אם Duplex יתמוך במספר שפות בעתיד. פנינו לגוגל כדי לאמת כמה שאלות ללא מענה, אבל כמובן, בטוח שיהיו יותר ככל שהטכנולוגיה מתקדמת.

ממה שראינו עד כה, זו טכנולוגיה מבטיחה, אבל האם זה משהו שאנחנו צריכים לאמץ או לפחד ממנו? נשמח אם לעולם לא נצטרך להשהות אותנו שוב שעות ברציפות, אבל חשוב לקחת בחשבון את המסלול כאן. אנחנו כל הזמן צועדים לעבר עתיד שבו אנחנו לא צריכים לדבר עם אף אחד, שבו אתה יכול לגור מבודד בדירה, עם משלוח מזון אליך; חבילות שהורדו על ידי רחפנים, ואלפי שעות של מדיה לצרוך מבלי לצאת החוצה.

בעוד ש-Duplex עשויה להתחיל עם כמה משיחות הטלפון היותר ארציות, ה-AI הולך להשתפר בשיחות, מה שיקל על העברה לתעשיות אחרות. זה יהיה תלוי בנו כחברה להחליט כמה מהדיבור שלנו צריך להתבצע באמצעות AI, והאם כדאי להרים טלפון שוב.

המלצות עורכים

  • הכרחתי את עצמי לנסות טאבלט בגודל 14.5 אינץ' - וזה לא הלך כל כך טוב
  • אני מאוד אוהב את ה-Pixel 7a, אבל יש בעיה אחת גדולה שאני לא יכול להתעלם ממנה
  • אני רוצה לאהוב את Pixel 7 ו-Pixel 7 Pro, אבל גוגל לא מרשה לי
  • הנה כל מה שגוגל לא הכריזה באירוע השקת סתיו של Pixel
  • כל מה שגוגל לא הכריזה ב-Google I/O 2021