Мы протестировали Google Duplex, искусственный интеллект для телефонных звонков, который появится этим летом

Работая на стойке регистрации тайского ресторана в Нью-Йорке, я взял трубку, забронировал номер и повесил трубку. «Сюрреалистический» было первым словом, которое пришло мне на ум, и не потому, что я притворялся, что работаю в ресторан, но с которым я только что разговаривал и забронировал столик у Google с искусственным интеллектом. Помощник.

Содержание

  • Что такое дуплекс и где он будет работать?
  • Демо
  • Как работает дуплекс
  • «ум» и «ах»
  • Удобство

Я не мог отделаться от мысли, что голос на другом конце провода не был живым существом, даже если это был всего лишь двухминутный разговор. Это не значит, что Ассистент не был убедителен; если бы он мне не сказал (и если бы я не был в демонстрационной среде), я бы не особо задумывался об обмене информацией с кем-то, что звучало как другой человек на другом конце провода.

Рекомендуемые видео

Обмен роботами, который у меня был, был частью пресс-демонстрации, проведенной для Технология Google Duplex, впервые объявлено на I/O компании конференция разработчиков в мае

. Оно позволяет людям забронировать столик в ресторане, записаться на стрижку и узнать часы работы магазина через Google Ассистент. голосовой помощник позвонит в ресторан или магазин — после того, как вы сделаете запрос со своего телефона или умной колонки с поддержкой Ассистента, например Главная страница Google — и через несколько минут вы получите уведомление, подтверждающее, что ваши планы официально забронированы (или если звонок не удалось завершить).

Связанный

  • Я установил Dynamic Island от iPhone на свой Pixel 7 Pro — и не могу вернуться назад
  • Я дал Pixel 7 Pro второй шанс — все пошло не так, как я надеялся
  • Сможет ли камера Google Pixel 6 Pro превзойти Samsung Galaxy S21 Ultra? я выяснил
Google Duplex на телефоне Android
Джулиан Чоккатту/Digital Trends

Демонстрация на I/O была потрясающей, но не обошлась без споров. Были высказаны опасения: почему ИИ должен был звучать так реалистично и почему он не объявил об отказе от ответственности звонившему человеку, что некоторые считали обманом. А поскольку разговор был записан, некоторые задавались вопросом, не нарушит ли эта технология определенные законы, регулирующие телефонные звонки.

С тех пор Google уточнил свою позицию, и теперь у нас есть некоторые ответы. Компания Digital Trends провела некоторое время с командой, стоящей за проектом. Дуплекс и продемонстрировали технологию для себя. Но прежде чем мы углубимся в наш опыт, давайте взглянем на новые детали, которые мы обнаружили, о том, как и где будет работать Duplex.

Что такое дуплекс и где он будет работать?

Duplex — это разрабатываемая технология, позволяющая Google Assistant совершать телефонные звонки на телефоне пользователя. имени, и это связано с многолетними исследованиями и работой над искусственным интеллектом для естественного языка. обработка.

«Теперь мы можем понимать естественную речь и генерировать естественную речь», — сказал Ник Фокс, вице-президент по управлению продуктами Google. «Эти технологии применяются в Duplex, чтобы вести естественный, увлекательный разговор, который адаптируется к тому, что происходит в ходе разговора, и в конечном итоге с целью добиться цели».

Google Duplex назначает встречу с парикмахеромGoogle

Цель Google для Ассистента — помочь вам добиться цели, а с Duplex компания начинает с три конкретные задачи: забронировать столик в ресторане, узнать часы работы магазина и запланировать посещение парикмахерской. встреча. В данный момент Duplex не может делать ничего большего, поэтому, если запрос неуместен (скажем, вопрос о погоде или спортивных результатах), Ассистент не поймет. Аналогично, пользователь не может попросить Ассистента совершать звонки, не связанные с вышеупомянутыми задачами.

Это может сэкономить много времени сотрудникам, отвечающим на звонки о часах работы магазина.

Для пользователя выполнение этих звонков с помощью Ассистента освобождает немного времени, но это также приносит пользу компаниям, которые принимают эти звонки. Например, если звонящий спрашивает Ассистента о часах работы местного магазина в праздничные дни, Ассистент позвонит, получит ответ, и часы будут добавлены в список. Карты Гугл и Google Search на всеобщее обозрение с подтвержденным тегом рядом с ним.

Благодаря этой информации, если другие абоненты захотят узнать ту же информацию, Помощнику нужно будет только получить ее с серверов Google, а не совершать еще один звонок. Чтобы задать вопрос Ассистенту, достаточно одного человека, но это может сэкономить много времени сотрудникам, которым в противном случае пришлось бы отвечать на звонки о часах работы магазина.

Этим летом на этапе тестирования Google Duplex будет работать только с избранными компаниями и пользователями в регионе. США, и он будет доступен только в ресторанах и парикмахерских, в которых нет онлайн-бронирования. система. Google Ассистент уже работает с OpenTable, поэтому не нужно звонить в рестораны, пользующиеся сервисом бронирования.

В ближайшие несколько недель Google протестирует звонки в рабочие часы, а позднее этим летом тест расширится до звонков для бронирования и записи на стрижку. В течение этого периода будет много тестов и доработок, поэтому конечный результат Duplex может немного отличаться от того, что мы уже видели. Компании смогут отказаться, если они не хотят получать звонки от Google Assistant.

Google

«То, что вы видите, — это технология, которая находится на очень ранней стадии», — сказал Фокс. «Мы хотим говорить об этом публично даже на этом этапе, чтобы убедиться, что мы все делаем правильно, но здесь вы видите кое-что довольно раннее».

Демо

Демонстрационный опыт, который состоялся в Тхеп Тай в районе Верхний Ист-Сайд Нью-Йорка, находился под строгим контролем. Сначала Google представил презентацию, демонстрирующую общий процесс совершения и завершения звонка, но на самом деле использующую эту технологию в режиме реального времени. Инженер сообщил Duplex время и размер вечеринки, которые мы предложили для бронирования, и вот что последовало.

Идея состоит в том, что вы скажете Google Assistant на своем телефоне или Главная страница Google что вы хотите «забронировать столик в Thep Thai на двоих на 8 часов вечера». завтра." Ассистент спросит, можно ли забронировать время с 20:00. до 9 вечера. в случае, если в 8 часов вечера не будет свободного столика, и после вашего подтверждения он сообщит, что позвонит в ресторан и свяжется с вами скоро.

Когда сотрудник ресторана поднимет трубку, Ассистент скажет следующее или что-то в этом роде: «Привет, я звоню, чтобы забронировать столик. Я работаю в службе автоматического бронирования Google, поэтому запишу звонок. Могу ли я забронировать столик на четверг?»

Разговор записывается, чтобы операторы Google могли прослушать запись, комментировать разговор и выделить любые ошибки, допущенные Duplex, чтобы улучшить сервис.

Доведение Duplex до того уровня, на котором он находится сейчас, началось с большого количества ручной и человеческой работы.

Ассистент отвечает на каждый заданный вопрос, например, на какое время забронировано место, на сколько часов. люди в тусовке, и имя для брони — и разговор вежливо и оперативно заканчивается. Если у него запросят такую ​​информацию, как адрес электронной почты пользователя, Помощник сообщит, что у него нет разрешения на предоставление этой информации.

Человек, забронировавший бронирование через Ассистента, теперь получит уведомление о том, что столик зарезервирован, и он будет автоматически добавлен в Календарь Google. Перед бронированием пользователь получит уведомление и возможность отменить встречу, если он больше не сможет на нее прийти. Владелец ресторана Thep Thai рассказал, что многие люди делают предварительные заказы, а потом не приходят. Он надеется, что эта система, предлагающая простой способ отмены бронирования, будет означать меньше пустых столов.

После основной демонстрации Google разрешил нам попробовать. Когда мы ответили на звонок, мы попытались отключить Duplex и создать некоторые сложности, но Assistant с ними справился хорошо. Мы попросили его подождать в начале разговора, на что он ответил «мммм», а не устным «да». Когда мы сказали это, 6 вечера. время бронирования было занято, Ассистент ответил, указав диапазон от 18:00 до 18:00. и 8 вечера, и это остановилось на наши 19:45. рекомендация. Затем мы попросили указать имя и номер телефона для бронирования, а также узнать, сможет ли Ассистент произнести это имя, что он и сделал успешно.

Google Duplex планирует резервирование столика в ресторанеGoogle

Впечатляет, насколько хорошо Assistant справлялся со своими демонстрациями, хотя мы столкнулись с моментом, когда ему пришлось прибегнуть к помощи человека-оператора. Это произошло, когда кто-то спросил, согласен ли клиент Assistant получать электронные письма из ресторана. Формулировка была немного неловкой, и Ассистент ответил: «Извините, кажется, я запутался», и сказал, что это ставит на линию руководителя. Человек-оператор быстро взял на себя управление, сообщил звонившему, что не может раскрыть адрес электронной почты, и завершил бронирование.

Как работает дуплекс

Ранние тестовые версии Duplex, которые нам показал Google, звучали невероятно роботизированно. Однако Ассистент все же смог понять паузы в разговоре и даже сказать «привет?» когда сотрудник ресторана остановился на несколько секунд. Тем не менее, Скотт Хаффман, вице-президент по разработке Google Assistant, сказал, что «больно это слушать».

Если система действительно не знает, что делать дальше, она изящно прервет вызов, и управление возьмет на себя человек-оператор.

Доведение Duplex до того уровня, на котором он находится сейчас, началось с большого количества ручной и человеческой работы. Операторы звонили в рестораны, комментировали разговоры и передавали результаты в Duplex. Команда связала такие фразы, как «сколько человек» и его вариации, с «количеством людей в группе», что позволило Duplex понять вопрос.

На втором этапе операторы-люди прослушивали звонки, сделанные Помощником, и, если что-то пойдет не так, оператор вмешивался, чтобы убедиться, что звонок прошел успешно. Это позволило команде выявить острые углы в работе сервиса, аннотировать эти разговоры и передать их обратно в алгоритмы машинного обучения, чтобы Duplex мог учиться.

Завершающим этапом тестирования является автоматизированный режим, при котором автоматизированная система совершает звонки и завершает их. Аварийные люки, встроенные в систему, позволяют Помощнику вернуться к ключевой цели выполнения задачи благодаря таким предложениям, как «Я не уверен, что вы сказали», но могу ли я забронировать столик на троих? Если система действительно не знает, что делать дальше, она изящно отключится от разговора, и человек-оператор возьмет на себя управление. над.

Keynote (Google I/O '18)

На данный момент Хаффман сообщил, что около четырех из пяти звонков, совершаемых Duplex, не нуждаются в помощи человека-оператора. Интересно, что он сказал, что люди-операторы не будут отстранены от сервиса по мере улучшения Duplex, поскольку Google рассматривает их как неотъемлемую часть обеспечения бесперебойной работы Duplex.

«ум» и «ах»

В процессе обучения Ассистенту Google делал упор на то, чтобы его звучание было более естественным и менее похожим на робота. После демонстрации на Google I/O критики спросили, почему Google пытается смешать «хм и ах», чтобы сделать Assistant звучать более по-человечески, особенно если в начале звонка не добавляется оговорка о том, что это не человек. Сейчас есть заявления об отказе от ответственности, но Хаффман сказала, что речевые нарушения, такие как «хм» или «ммм», были добавлены, чтобы поддерживать поток разговора.

Ассистент добавил «хм» после того, как не услышал, что сказал сотрудник ресторана, и снова выполнил свой запрос.

«Мы не пытаемся обмануть или выдать себя за другого, но если вы вернетесь к той записи той болезненной ранней системы, она звучала не очень естественно, не очень по-человечески», — сказал Хаффман. «Но в результате этого Ассистент не очень успешно справился с поставленными задачами. Многие люди вешали трубку или не понимали, о чем они говорят, разговор просто прерывался, потому что это казалось неестественным».

По словам Хаффмана, у него были проблемы с речью. лингвисты, являются ключевой частью поддержания человеческого разговора между двумя людьми. Легко увидеть, насколько хорошо это работает, слушая разговоры с Ассистентом, и результаты далеки от оригинальной записи.

Одним из способов помощи при затруднении речи является признание в разговоре, например, когда один человек говорит, но вы хотите убедитесь, что получатель знает, что вы все еще заняты и слушаете, например, когда Ассистент сказал нам «ммм», когда его попросили держать.

Google Duplex на io2018 2835
Google Duplex на io2018 2836

Еще один полезный инструмент — сказать «хм», когда есть неуверенность, как вежливый способ попросить разъяснений. Ассистент добавил «хм» после того, как не услышал, что сказал сотрудник ресторана, и снова выполнил свой запрос.

Ассистент с такими нарушениями речи резко контрастирует с оригинальным роботом-ассистентом. Сейчас гораздо менее холодно, и разговор пошёл гораздо быстрее. И вместо того, чтобы принимать простые команды, Ассистент на самом деле взаимодействует с людьми посредством нашего языка, что наверняка взволнует одних и напугает других.

Удобство

Дуплекс – это удобство. Это сэкономит вам немного времени, может дать вам более точные часы работы магазина, а также сэкономить время бизнеса. Google также заявил, что здесь есть большая возможность помочь людям, которые не могут говорить или имеют проблемы с речью.

Хаффман сказал, что Duplex следует рассматривать как эволюцию автоматических голосовых машин прошлого, таких как при звонке в банк, когда процесс нажатия цифр был медленным, чтобы попасть вправо отделение.

«Сегодня, если вы позвоните в эти авиакомпании или банки, вы получите нечто гораздо более приятное», — сказал он. «Вы услышите гораздо более естественный голос, и он может сказать что-то вроде: «Просто скажи мне, что тебе нужно, ты можешь сказать что-то вроде: во сколько мой рейс?» Duplex, мы на самом деле просто развиваем ту же идею на шаг дальше, развивая разговор и делая его более естественным, чтобы он был более успешным для пользователей и предприятия».

Судя по тому, что мы видели до сих пор, это многообещающая технология, но стоит ли нам ее принимать или бояться?

Google не показал нам, как Duplex звонит предприятиям и уточняет часы работы магазинов, а также не продемонстрировал планирование записи на стрижку, поэтому мы не можем комментировать, насколько хорошо Duplex будет работать в этих случаях. Мы также не уверены, будут ли операторы-люди иметь доступ к вашему номеру телефона и полному имени, поскольку это представляет некоторый риск для конфиденциальности. Нам также интересно, будет ли Duplex поддерживать несколько языков в будущем. Мы обратились к Google, чтобы проверить некоторые оставшиеся без ответа вопросы, но, конечно, по мере развития технологий их будет больше.

Судя по тому, что мы видели до сих пор, это многообещающая технология, но стоит ли нам ее принимать или бояться? Мы будем счастливы, если нам больше никогда не придется задерживаться на несколько часов, но здесь важно учитывать траекторию. Мы постоянно приближаемся к будущему, в котором нам не нужно будет ни с кем разговаривать, где вы сможете жить изолированно в квартире с доставленной вам едой; посылки, доставляемые дронами, и тысячи часов медиа, которые можно потреблять, даже не выходя на улицу.

Хотя Duplex может начинаться с некоторых более обыденных телефонных звонков, ИИ станет лучше вести разговоры, что облегчит его перенос в другие отрасли. Нам как обществу предстоит решить, какая часть наших разговоров должна вестись через ИИ и стоит ли снова брать трубку.

Рекомендации редакции

  • Заставил себя попробовать 14,5-дюймовый планшет — и получилось не очень
  • Мне очень нравится Pixel 7a, но есть одна большая проблема, которую я не могу игнорировать.
  • Я хочу полюбить Pixel 7 и Pixel 7 Pro, но Google мне не позволяет
  • Вот все, что Google не анонсировал на мероприятии Pixel Fall Launch
  • Все, что Google не анонсировал на Google I/O 2021