لقد اختبرنا Google دوبلكس، وهو نظام الذكاء الاصطناعي للاتصال الهاتفي الذي سيأتي هذا الصيف

أثناء العمل في مكتب الاستقبال في أحد المطاعم التايلاندية في مدينة نيويورك، التقطت الهاتف وسجلت حجزًا وأغلقت الخط. كانت الكلمة السريالية هي الكلمة الأولى التي تبادرت إلى ذهني بعد ذلك، ليس لأنني كنت أتظاهر بالعمل في إحدى الشركات مطعم، ولكنني تحدثت للتو وحجزت طاولة من جوجل الذي يعمل بالذكاء الاصطناعي مساعد.

محتويات

  • ما هو الدوبلكس وأين سيعمل؟
  • العرض التوضيحي
  • طريقة عمل الدوبلكس
  • "أم" و"آه"
  • راحة

لم أستطع التخلص من فكرة أن الصوت على الطرف الآخر لم يكن كائنًا حيًا، حتى لو كانت محادثة مدتها دقيقتين فقط. هذا لا يعني أن المساعد لم يكن مقنعًا؛ إذا لم يخبرني ذلك (وإذا لم أكن في بيئة تجريبية)، فلن أفكر كثيرًا في التبادل مع ما بدا وكأنه إنسان آخر على الطرف الآخر.

مقاطع الفيديو الموصى بها

لقد كان تبادل الروبوتات الذي أجريته جزءًا من العرض الصحفي الذي تم عقده من أجله تقنية جوجل المزدوجة، تم الإعلان عنه لأول مرة في مؤتمر I/O الخاص بالشركة مؤتمر المطورين في مايو. فهو يتيح للأشخاص حجز طاولة في أحد المطاعم، وتحديد موعد لقص الشعر، ومعرفة ساعات عمل المتجر مساعد جوجل. ال مساعد صوت سيتصل بالمطعم أو المتجر - بعد تقديم طلب من هاتفك أو مكبر الصوت الذكي الذي يدعم المساعد، مثل

بيت جوجل - وبعد دقائق ستتلقى إشعارًا يؤكد حجز خططك رسميًا (أو إذا تعذر إكمال المكالمة).

متعلق ب

  • لقد وضعت جزيرة Dynamic Island الخاصة بـ iPhone على هاتف Pixel 7 Pro الخاص بي، ولا يمكنني العودة إليها
  • لقد أعطيت Pixel 7 Pro فرصة ثانية، لكن الأمور لم تسر كما كنت أتمنى
  • هل تستطيع كاميرا Pixel 6 Pro من Google التغلب على Samsung Galaxy S21 Ultra؟ اكتشفت
جوجل دوبلكس على هاتف أندرويد
جوليان شوكاتو / الاتجاهات الرقمية

كان العرض التوضيحي في I/O مذهلاً، لكنه لم يخلو من الجدل. وأثيرت مخاوف: لماذا يحتاج الذكاء الاصطناعي إلى أن يبدو نابضًا بالحياة، ولماذا لم يعلن إخلاء المسؤولية للمتصل البشري، وهو ما يعتبره البعض خداعًا. ولأن المكالمة تم تسجيلها، تساءل البعض عما إذا كانت التكنولوجيا تنتهك بعض القوانين التي تحكم المكالمات الهاتفية.

ومنذ ذلك الوقت أوضحت جوجل موقفها، ولدينا الآن بعض الإجابات. أمضت شركة Digital Trends بعض الوقت مع الفريق في الخلف دوبلكس وعرضنا التكنولوجيا لأنفسنا. ولكن قبل أن نتعمق في تجربتنا، دعونا نلقي نظرة على التفاصيل الجديدة التي اكتشفناها حول كيفية ومكان عمل الدوبلكس.

ما هو الدوبلكس وأين سيعمل؟

دوبلكس هي تقنية قيد التطوير تمكن مساعد جوجل من إجراء مكالمات هاتفية للمستخدم نيابةً عنه، وهو نابع من سنوات من البحث والعمل في مجال الذكاء الاصطناعي للغة الطبيعية يعالج.

وقال نيك فوكس، نائب رئيس إدارة المنتجات في جوجل: "يمكننا الآن فهم الكلام الطبيعي ويمكننا توليد كلام طبيعي". "يتم تطبيق هذه التقنيات مع دوبلكس للحصول على محادثة طبيعية وجذابة تتكيف مع ما يحدث داخل المحادثة، بهدف إنجاز الأمور في النهاية."

جوجل دوبلكس لتحديد موعد للشعرجوجل

إن مساعدتك في إنجاز الأمور هو هدف جوجل بالنسبة للمساعد، ومع دوبلكس بدأت الشركة به ثلاث مهام محددة: حجز طاولة في مطعم، والعثور على ساعات عمل المتجر، وجدولة صالون تصفيف الشعر ميعاد. لا يمكن لـDuplex القيام بأي شيء أكثر من هذا في الوقت الحالي، لذلك إذا لم يكن الاستعلام ذا صلة (على سبيل المثال، السؤال عن الطقس أو النتائج الرياضية) فلن يفهم المساعد. وبالمثل، لا يمكن للمستخدم أن يطلب من المساعد إجراء مكالمات لا علاقة لها بالمهام المذكورة أعلاه.

لديها القدرة على توفير الكثير من الوقت للموظفين العالقين في الرد على المكالمات المتعلقة بساعات العمل في المتجر.

بالنسبة للمستخدم، فإن قيام المساعد بإجراء هذه المكالمات يحرر بعض الوقت، ولكنه يفيد أيضًا الشركات التي تتلقى هذه المكالمات. على سبيل المثال، إذا طلب المتصل من المساعد معرفة ساعات العمل أثناء العطلات في متجر محلي، فسيقوم المساعد بإجراء المكالمة والحصول على الرد، وستتم إضافة الساعات إلى خرائط جوجل وبحث Google ليراها الجميع، مع وجود علامة التحقق بجوارها.

باستخدام هذه المعلومات، إذا أراد المتصلون الآخرون معرفة نفس المعلومات، فلن يحتاج المساعد إلا إلى سحبها من خوادم Google، وعدم إجراء مكالمة أخرى. لا يستغرق الأمر سوى شخص واحد ليسأل المساعد، ولكن لديه القدرة على توفير الكثير من الوقت للموظفين الذين قد يعلقون في الرد على المكالمات المتعلقة بساعات عمل المتجر.

خلال مرحلة اختبار جوجل هذا الصيف، ستعمل خدمة دوبلكس فقط مع شركات ومستخدمين محددين في الولايات المتحدة، وسيكون متاحًا فقط في المطاعم وصالونات تصفيف الشعر التي ليس لديها حجز عبر الإنترنت نظام. مساعد جوجل بالفعل يعمل مع OpenTable، لذلك لا داعي للاتصال بالمطاعم التي تستخدم خدمة الحجز.

وستختبر جوجل المكالمات لساعات العمل أولاً في الأسابيع القليلة المقبلة، وفي وقت لاحق من هذا الصيف، سيتوسع الاختبار ليشمل الاتصال بالحجوزات ومواعيد قص الشعر. سيكون هناك الكثير من الاختبارات والتعديلات خلال هذه الفترة، لذا قد تبدو النتيجة النهائية للدوبلكس مختلفة قليلاً عما رأيناه بالفعل. ستتمكن الشركات من إلغاء الاشتراك إذا كانت لا ترغب في تلقي مكالمات من مساعد Google.

جوجل

وقال فوكس: "ما ترونه هو تكنولوجيا في مراحلها المبكرة للغاية". "نريد أن نتحدث عن ذلك علنًا حتى في هذه المرحلة للتأكد من أننا على صواب، لكنك ترى شيئًا مبكرًا جدًا في العملية هنا."

العرض التوضيحي

التجربة التجريبية التي جرت في ثيب التايلاندية في حي أبر إيست سايد بمدينة نيويورك، تمت السيطرة عليه بشدة. أولاً، قدمت جوجل عرضًا تقديميًا يوضح العملية الشاملة لإجراء المكالمة وإنهائها، ولكن في الواقع استخدام التكنولوجيا في الوقت الفعلي. قام أحد المهندسين بتزويد الدوبلكس بالوقت وحجم الحفلة اللذين اقترحناهما للحجز، وإليكم ما تبع ذلك.

الفكرة هي أن تخبر مساعد Google على هاتفك أو بيت جوجل أنك تريد "حجز طاولة في Thep Thai لشخصين في الساعة 8 مساءً. غداً." سيسألك المساعد عما إذا كان من الممكن حجز موعد من الساعة 8 مساءً. حتى الساعة 9 مساءً. في حالة عدم توفر طاولة في الساعة 8 مساءً، وبعد التأكيد، سيتصل بالمطعم وسيعود إليك قريباً.

عندما يلتقط موظف المطعم الهاتف، سيقول المساعد ما يلي، أو شيء مشابه له: "مرحبًا، أنا أتصل لإجراء حجز. أنا خدمة الحجز الآلي من Google، لذا سأقوم بتسجيل المكالمة. هل يمكنني حجز طاولة ليوم الخميس؟

يتم تسجيل المكالمة حتى يتمكن العاملون البشريون في Google من الاستماع إلى التسجيل وإضافة تعليقات توضيحية للمحادثة وتسليط الضوء على أي أخطاء ارتكبها دوبلكس حتى يتمكن من تحسين الخدمة.

الوصول بالدوبلكس إلى المستوى الذي بدأ به الآن بالكثير من العمل اليدوي والبشري.

يستمر المساعد في الرد على كل سؤال يتم طرحه - مثل موعد الحجز وكم عدده الناس في الحفلة، واسم الحجز - والمحادثة بأدب وسرعة ينتهي. إذا طُلب منك معلومات مثل عنوان البريد الإلكتروني للمستخدم، فسيقول المساعد إنه ليس لديه إذن بتقديم هذه المعلومات.

سيتلقى الآن الشخص الذي حجز الحجز من خلال المساعد إشعارًا يفيد بحجز الطاولة، وستتم إضافته تلقائيًا إلى تقويم Google. قبل الحجز، سيحصل المستخدم على إشعار وفرصة لإلغاء الموعد في حالة عدم قدرته على القيام بذلك. قال صاحب مطعم Thep Thai إن الكثير من الأشخاص يقومون بالحجز ثم لا يحضرون. ويأمل أن يؤدي هذا النظام، الذي يوفر طريقة سهلة لإلغاء الحجز، إلى تقليل عدد الطاولات الفارغة.

بعد العرض التجريبي الرئيسي، سمحت لنا Google بتجربته. عندما تلقينا المكالمة، حاولنا تعطيل خدمة الدوبلكس وأحدثنا بعض التعقيدات، لكن المساعد تعامل معها جيدًا. لقد طلبنا منه الانتظار في بداية المحادثة، فأجاب بـ "mhmm"، بدلاً من "نعم" لفظيًا. عندما قلنا لها 6 مساءً. كان وقت الحجز ممتلئًا، استجاب المساعد بنطاق يتراوح بين الساعة 6 مساءً. و 8 مساءً، واستقرت الساعة 7:45 مساءً. توصية. ثم طلبنا اسمًا ورقم هاتف للحجز، وإذا كان بإمكان المساعد تهجئة الاسم، وهو ما فعله بنجاح.

جوجل دوبلكس جدولة حجز المطعمجوجل

من المثير للإعجاب مدى نجاح المساعد في التعامل مع العروض التوضيحية، على الرغم من أننا واجهنا لحظة احتاج فيها إلى الاعتماد على عامل بشري. كان ذلك عندما سأل أحد الأشخاص عما إذا كان عميل المساعد موافقًا على تلقي رسائل البريد الإلكتروني من المطعم. كانت الصياغة محرجة بعض الشيء، ورد المساعد قائلاً: "أنا آسف، أعتقد أنني كنت في حيرة من أمري"، وقال إن ذلك يضع المشرف على المحك. تولى العامل البشري المهمة بسرعة، وأخبر المتصل أنه لا يمكنه الكشف عن عنوان البريد الإلكتروني، وأنهى الحجز.

طريقة عمل الدوبلكس

بدت الإصدارات التجريبية المبكرة من الدوبلكس، والتي شغلتها جوجل لنا، آلية بشكل لا يصدق. ومع ذلك، ظل المساعد قادرًا على فهم فترات التوقف المؤقت في المحادثة، وحتى قول "مرحبًا؟" عندما توقف أحد موظفي المطعم لبضع ثوان. ومع ذلك، قال سكوت هوفمان، نائب رئيس قسم الهندسة في Google Assistant، إنه "كان من المؤلم الاستماع إليها".

إذا كان النظام لا يعرف حقًا ما يجب فعله بعد ذلك، فسوف ينسحب من المكالمة برشاقة، وسيتولى المشغل البشري المهمة.

الوصول بالدوبلكس إلى المستوى الذي بدأ به الآن بالكثير من العمل اليدوي والبشري. أجرى المشغلون البشريون مكالمات للمطاعم، وقاموا بتعليق المحادثات، ثم قاموا بإدخال النتائج إلى دوبلكس. سيقوم الفريق بربط عبارات مثل "كم عدد الأشخاص" وأشكالها المختلفة بـ "عدد الأشخاص في المجموعة"، مما يسمح لدوبلكس بفهم السؤال.

تضمنت المرحلة الثانية استماع المشغلين البشريين إلى المكالمات التي أجراها المساعد، وإذا خرجت الأمور عن المسار الصحيح، يتدخل المشغل لتولي المهمة والتأكد من نجاح المكالمة. وقد سمح ذلك للفريق بتحديد الجوانب الصعبة حول الخدمة، والتعليق على تلك المحادثات، وإدخالها مرة أخرى في خوارزميات التعلم الآلي حتى يتمكن دوبلكس من التعلم.

مرحلة الاختبار النهائية هي الوضع الآلي، حيث يقوم النظام الآلي بإجراء المكالمات وإكمالها. تسمح فتحات الهروب المضمنة في النظام للمساعد بالعودة إلى الهدف الرئيسي المتمثل في إكمال المهمة، وذلك بفضل جمل مثل، "لست متأكدًا مما قلته، "ولكن هل يمكنني حجز طاولة لثلاثة أشخاص." إذا كان النظام لا يعرف حقًا ما يجب فعله بعد ذلك، فسوف ينسحب من المحادثة برشاقة، وسيتولى المشغل البشري المهمة زيادة.

الكلمة الرئيسية (Google I/O '18)

وفي الوقت الحالي، قال هوفمان إن حوالي أربع من أصل خمس مكالمات تجريها شركة دوبلكس لا تحتاج إلى مساعدة عامل بشري. ومن المثير للاهتمام أنه قال إن المشغلين البشريين لن يتم سحبهم من الخدمة مع تحسن خدمة الدوبلكس، حيث تعتبرهم جوجل جزءًا لا يتجزأ من ضمان عمل الدوبلكس دون أي عوائق.

"أم" و"آه"

طوال عملية تدريس المساعد، ركزت Google على جعله يبدو أكثر طبيعية، وأقل شبهًا بالروبوت. بعد العرض التوضيحي في Google I/O، تساءل النقاد عن سبب محاولة Google الخلط بين "ums وahs" لإنشاء المساعد يبدو أكثر إنسانية، خاصة إذا لم تتم إضافة إخلاء المسؤولية في بداية المكالمة بأنه ليس إنسانًا. توجد الآن إخلاءات للمسؤولية، لكن هوفمان قال إن اختلالات طلاقة الكلام مثل "um" أو "mhm" تمت إضافتها للحفاظ على استمرار تدفق المحادثة.

أضاف المساعد "أم" بعد أن لم يتمكن من سماع ما قاله موظف المطعم، وتابع طلبه مرة أخرى.

وقال هوفمان: "نحن لا نحاول الخداع أو انتحال الشخصية، ولكن إذا عدت إلى هذا التسجيل لهذا النظام المبكر المؤلم، فلن يبدو الأمر طبيعيًا جدًا، ولم يبدو إنسانيًا للغاية". "ولكن نتيجة لذلك، لم يكن المساعد ناجحًا جدًا في إكمال المهام. كان الكثير من الناس يغلقون الهاتف، أو يشعرون بالارتباك بشأن ما كانوا يتحدثون إليه، وكانت المحادثة تتعطل لأنها لم تكن طبيعية.

وقال هوفمان اختلالات في طلاقة الكلام، وفقا ل اللغويين، هي جزء أساسي من استمرار المحادثة الإنسانية بين شخصين. من السهل معرفة مدى نجاح ذلك عند سماع المحادثات مع المساعد، وتكون النتائج بعيدة عن التسجيل الأصلي.

إحدى الطرق التي تساعد بها اختلالات طلاقة الكلام هي الاعتراف بالمحادثة، كما هو الحال عندما يتحدث شخص واحد، لكنك تريد ذلك تأكد من أن المتلقي يعرف أنك لا تزال منخرطًا وتستمع، كما هو الحال عندما قال لنا المساعد "mhmm" عندما طُلب منه ذلك يمسك.

جوجل دوبلكس الأيدي على io2018 2835
أيدي جوجل المزدوجة على io2018 2836

هناك أداة أخرى مفيدة وهي قول "مم" عندما يكون هناك شك، كطريقة مهذبة لطلب التوضيح. أضاف المساعد "أم" بعد أن لم يتمكن من سماع ما قاله موظف المطعم، وتابع طلبه مرة أخرى.

يعد المساعد الذي يعاني من عدم طلاقة الكلام هذه تناقضًا صارخًا مع المساعد الآلي الأصلي. كان الجو أقل برودة بكثير، وانتقلت المحادثة بسرعة أكبر. وبدلاً من قبول أوامر بسيطة، يتفاعل المساعد فعليًا مع البشر من خلال لغتنا، وهو ما سيثير بالتأكيد إثارة البعض بينما يخيف الآخرين.

راحة

الدوبلكس هو كل شيء عن الراحة. إنه يوفر عليك القليل من الوقت، ويمكن أن يوفر لك ساعات عمل أكثر دقة في المتجر، كما يمكنه توفير وقت الشركات أيضًا. قالت Google أيضًا أن هناك فرصة كبيرة هنا لمساعدة الأشخاص الذين لا يستطيعون التحدث أو لديهم صعوبة في التحدث.

قال هوفمان إن التفكير في الدوبلكس هو تطور لآلات الصوت الآلية من الماضي، مثل عند الاتصال بالبنك الذي تتعامل معه، عندما كانت عملية الضغط على الأرقام للوصول إلى اليمين بطيئة قسم.

وقال: "اليوم، إذا اتصلت بشركات الطيران أو البنوك تلك، فسوف تحصل على شيء أفضل بكثير". "سوف تسمع صوتًا طبيعيًا أكثر بكثير، وقد يقول شيئًا مثل، "أخبرني فقط بما تحتاجه، يمكنك أن تقول أشياء مثل، ما هو موعد رحلتي؟" دوبلكس، نحن في الواقع نأخذ نفس الفكرة خطوة أخرى إلى الأمام، حيث نعمل على تطوير المحادثة وجعلها أكثر طبيعية بحيث تكون أكثر نجاحًا للمستخدمين و الأعمال."

ومما رأيناه حتى الآن، فهي تكنولوجيا واعدة، ولكن هل ينبغي لنا أن نتقبلها أم نخاف منها؟

لم توضح لنا جوجل كيف تقوم شركة الدوبلكس بإجراء مكالمات للشركات بشأن ساعات العمل في المتجر، كما أنها لم تعرض جدولة مواعيد لقص الشعر - لذلك لا يمكننا التعليق على مدى نجاح خدمة الدوبلكس في هذه الحالات. نحن أيضًا غير متأكدين مما إذا كان المشغلون البشريون سيتمكنون من الوصول إلى رقم هاتفك واسمك الكامل، لأن ذلك يشكل خطرًا على الخصوصية. نتساءل أيضًا عما إذا كان الدوبلكس سيدعم لغات متعددة في المستقبل. لقد تواصلنا مع Google للتحقق من بعض الأسئلة التي لم تتم الإجابة عليها، ولكن بالطبع، من المؤكد أنه سيكون هناك المزيد مع تقدم التكنولوجيا.

ومما رأيناه حتى الآن، فهي تكنولوجيا واعدة، ولكن هل ينبغي لنا أن نتقبلها أم نخاف منها؟ سنكون سعداء إذا لم نضطر أبدًا إلى التوقف لساعات متواصلة مرة أخرى، ولكن من المهم التفكير في المسار هنا. نحن نتجه باستمرار نحو مستقبل لا نحتاج فيه إلى التحدث إلى أي شخص، حيث يمكنك العيش منعزلاً في شقة، مع توصيل الطعام إليك؛ يتم إسقاط الطرود بواسطة طائرات بدون طيار، وآلاف الساعات من الوسائط للاستهلاك دون الحاجة إلى الخروج من المنزل.

في حين أن دوبلكس قد يبدأ ببعض المكالمات الهاتفية العادية، فإن الذكاء الاصطناعي سوف يتحسن في المحادثات، مما يجعل من السهل الانتقال إلى الصناعات الأخرى. سيكون الأمر متروكًا لنا كمجتمع لتحديد مقدار حديثنا الذي يجب أن يتم من خلال الذكاء الاصطناعي، وما إذا كان الأمر يستحق فتح الهاتف مرة أخرى.

توصيات المحررين

  • لقد جعلت نفسي أجرب جهازًا لوحيًا مقاس 14.5 بوصة، ولم يسير الأمر على ما يرام
  • أنا حقًا أحب هاتف Pixel 7a، ولكن هناك مشكلة واحدة كبيرة لا يمكنني تجاهلها
  • أريد أن أحب هاتفي Pixel 7 وPixel 7 Pro، لكن Google لن تسمح لي بذلك
  • إليك كل ما لم تعلن عنه Google في حدث Pixel Fall Launch
  • كل ما لم تعلن عنه Google في Google I/O 2021