Ми протестували Google Duplex, штучний інтелект для телефонних дзвінків, який з’явиться цього літа

Працюючи на стійці реєстрації тайського ресторану в Нью-Йорку, я взяв слухавку, забронював номер і поклав трубку. Сюрреалістичне було першим словом, яке спало на думку згодом, не тому, що я вдавав, що працюю в але я щойно розмовляв і забронював столик у Google зі штучним інтелектом помічник.

Зміст

  • Що таке Duplex і де він буде працювати?
  • Демо
  • Як працює дуплекс
  • «Гм» і «ах»
  • зручність

Я не міг позбутися думки, що голос на іншому кінці не був живою істотою, навіть якщо це була лише двохвилинна розмова. Це не означає, що Помічник не був переконливим; якби він мені не сказав (і якби я не був у демонстраційному середовищі), я б не замислювався про обмін з тим, що звучало як інша людина на іншому кінці.

Рекомендовані відео

Обмін роботами, який я мав, був частиною демонстрації для преси Технологія Google Duplex, вперше оголошений на I/O компанії конференція розробників у травні. Це дозволяє людям забронювати столик у ресторані, записатися на стрижку та дізнатися години роботи магазину Google Assistant. The

голосовий помічник зателефонує до ресторану чи магазину — після того, як ви зробите запит зі свого телефону чи розумного динаміка з підтримкою Асистента, наприклад Google Home — і через кілька хвилин ви отримаєте сповіщення про те, що ваші плани офіційно заброньовано (або якщо дзвінок не вдалося здійснити).

Пов'язані

  • Я поставив динамічний острів iPhone на свій Pixel 7 Pro — і не можу повернутися
  • Я дав Pixel 7 Pro другий шанс — все пішло не так, як я сподівався
  • Чи зможе камера Google Pixel 6 Pro перемогти Samsung Galaxy S21 Ultra? я дізнався
Google Duplex на телефоні Android
Джуліан Чоккатту/Цифрові тенденції

Демонстрація на I/O була вражаючою, але не обійшлася без суперечок. Були висловлені занепокоєння: чому штучному інтелекту потрібно було звучати так реалістично і чому він не оголосив застереження людині, що телефонує, що дехто вважав обманом. І оскільки дзвінок був записаний, дехто сумнівався, чи порушує технологія певні закони, що регулюють телефонні дзвінки.

З того часу Google уточнив свою позицію, і тепер ми маємо деякі відповіді. Digital Trends провели деякий час з командою позаду Дуплекс і продемонстрували технологію для себе. Але перш ніж ми заглибимося в наш досвід, давайте подивимося на нові деталі, які ми не повідомили про те, як і де працюватиме Duplex.

Що таке Duplex і де він буде працювати?

Duplex — це технологія, що розробляється, яка дозволяє Google Assistant здійснювати телефонні дзвінки користувачам від імені, і це випливає з років досліджень і роботи над штучним інтелектом для природної мови обробки.

«Тепер ми можемо розуміти природне мовлення та створювати природне мовлення», — сказав Нік Фокс, віце-президент із управління продуктами Google. «Ці технології застосовуються з Duplex, щоб вести природну, захоплюючу розмову, яка адаптується до того, що відбувається в розмові, зрештою з метою досягнення результату».

Google Duplex записується на перукарнюGoogle

Мета Google для Assistant – допомогти вам виконувати завдання, і компанія починає з Duplex три конкретні завдання: бронювання столика в ресторані, визначення годин роботи магазину та розклад перукарні призначення. Наразі Duplex не може робити нічого більше, тому якщо запит недоречний (скажімо, запитання про погоду чи спортивні результати), Асистент не зрозуміє. Так само користувач не може попросити Асистента здійснювати дзвінки, не пов’язані з вищезазначеними завданнями.

Це може заощадити багато часу для співробітників, які застрягли, відповідаючи на дзвінки про години роботи магазину.

Для користувача те, що Асистент здійснює ці дзвінки, звільняє трохи часу, але це також приносить користь компаніям, які приймають ці дзвінки. Наприклад, якщо абонент запитує в Помічника години роботи місцевого магазину у святкові дні, Помічник здійснить дзвінок, отримає відповідь, а години буде додано до Гугл-мапи і пошук у Google для всіх, з перевіреним тегом поруч.

Маючи цю інформацію, якщо інші абоненти хочуть знати таку саму інформацію, Асистенту потрібно буде лише отримати її з серверів Google, а не здійснювати інший виклик. Лише одній особі потрібно запитати в Асистента, але це може заощадити багато часу для співробітників, які б застрягли, відповідаючи на дзвінки про години роботи магазину.

Під час фази тестування Google цього літа Duplex працюватиме лише з вибраними компаніями та користувачами в США, і він буде доступний лише в ресторанах і перукарнях, які не мають онлайн-бронювання система. Google Assistant вже працює з OpenTable, тому не потрібно дзвонити в ресторани, які користуються службою бронювання.

Google спочатку перевірить дзвінки в робочий час протягом наступних кількох тижнів, а пізніше цього літа тест розшириться на дзвінки для бронювання та запису на стрижку. Протягом цього періоду буде багато тестувань і налаштувань, тому кінцевий результат Duplex може дещо відрізнятися від того, що ми вже бачили. Компанії зможуть відмовитися, якщо не хочуть отримувати дзвінки від Google Assistant.

Google

«Те, що ви бачите, — це технологія, яка знаходиться на дуже ранніх стадіях», — сказав Фокс. «Ми хочемо поговорити про це публічно навіть на цьому етапі, щоб переконатися, що ми все зробимо правильно, але ви бачите щось на досить ранньому етапі процесу».

Демо

Демо-досвід, який відбувся в Thep Thai у районі Верхній Іст-Сайд у Нью-Йорку, перебував під жорстким контролем. По-перше, Google показала презентацію, яка показує загальний процес здійснення та завершення виклику, але фактично використовує технологію в режимі реального часу. Інженер надав Duplex час і розмір групи, які ми запропонували для бронювання, і ось що послідувало.

Ідея полягає в тому, щоб ви повідомили Google Assistant на своєму телефоні або Google Home що ви хочете «забронювати столик у Thep Thai на двох на 20:00. завтра». Асистент запитає, чи можна забронювати час з 20:00. до 9 вечора якщо о 20:00 немає вільних столиків, і після вашого підтвердження він скаже, що зателефонує в ресторан і зв’яжеться з вами скоро.

Коли працівник ресторану бере слухавку, Асистент скаже наступне або щось подібне: «Привіт, я телефоную, щоб забронювати номер. Я автоматизована служба бронювання Google, тому я запишу дзвінок. Чи можу я забронювати столик на четвер?»

Дзвінок записується, щоб люди-оператори в Google могли прослухати запис, додати коментарі до розмови та виділити будь-які помилки, зроблені Duplex, щоб покращити сервіс.

Доведення Duplex до нинішнього рівня почалося з великої кількості ручної та людської праці.

Помічник продовжує відповідати на кожне поставлене запитання — наприклад, на який час бронювання, на скільки люди в тусовці, а ім'я для бронювання — і розмова ввічливо і оперативно закінчується. Якщо запитати інформацію, як-от адресу електронної пошти користувача, Асистент скаже, що не має дозволу надавати цю інформацію.

Людина, яка забронювала столик через Асистента, тепер отримає сповіщення про те, що столик зарезервовано, і він автоматично додасться до календаря Google. Перед бронюванням користувач отримає сповіщення та можливість скасувати зустріч, якщо вона більше не зможе прийти. Власник ресторану Thep Thai сказав, що багато людей роблять бронювання, а потім не з’являються. Він сподівається, що ця система, яка пропонує простий спосіб скасувати бронювання, означатиме менше порожніх столиків.

Після основної демонстрації Google дозволив нам спробувати. Коли ми відповіли на дзвінок, ми спробували вивести з ладу Duplex і спричинили певні ускладнення, але Асистент добре впорався з ними. Ми попросили його затриматися на початку розмови, на що він відповів «мммм», а не словесним «так». Коли ми сказали це 6 вечора Час бронювання вичерпався, Асистент відповів із діапазоном між 18:00. і 20:00, а наш 7:45 вечора. рекомендація. Потім ми попросили вказати ім’я та номер телефону для бронювання, а також запитали, чи може Асистент написати ім’я, що він успішно зробив.

Google Duplex планує бронювання ресторануGoogle

Вражає, наскільки добре Assistant справлявся зі своїми демонстраціями, хоча ми стикалися з моментом, коли йому доводилося повертатися до людини-оператора. Це було тоді, коли хтось запитав, чи погоджується клієнт Асистента отримувати електронні листи від ресторану. Фраза була трохи незграбною, і помічник відповів: «Вибачте, я, здається, заплутався», і сказав, що це підключає супервайзера. Людина-оператор швидко взяв на себе роботу, сказав абоненту, що не може відкрити адресу електронної пошти, і завершив бронювання.

Як працює дуплекс

Ранні тестові версії Duplex, які Google відтворив для нас, звучали неймовірно роботизовано. Однак Асистент усе ще зміг зрозуміти паузи в розмові та навіть сказати «привіт?» коли працівник ресторану зробив паузу на кілька секунд. Тим не менш, Скотт Хаффман, віце-президент із розробки Google Assistant, сказав, що «це боляче слухати».

Якщо система дійсно не знає, що робити далі, вона витончено вклониться від дзвінка, і оператор візьме його на себе.

Доведення Duplex до нинішнього рівня почалося з великої кількості ручної та людської праці. Люди-оператори дзвонили в ресторани, коментували розмови та передавали результати в Duplex. Команда пов’язувала такі фрази, як «скільки людей» та їх варіації, із «кількістю людей у ​​групі», щоб Duplex міг зрозуміти запитання.

На другому етапі люди-оператори прослуховували виклики, зроблені Асистентом, і якщо щось йшло з плану, оператор переходив на себе, щоб переконатися, що дзвінок успішний. Це дозволило команді виявити шорсткості навколо служби, примітити ці розмови та повернути це в алгоритми машинного навчання, щоб Duplex міг навчатися.

Завершальним етапом тестування є автоматизований режим, коли автоматизована система розміщує дзвінки та завершує їх. Вбудовані в систему аварійні люки дозволяють Асистенту повернутися до основної мети виконання завдання завдяки таким реченням, як: «Я не впевнений, що ви сказали, але чи можу я забронювати столик на трьох». Якщо система дійсно не знає, що робити далі, вона витончено вклониться від розмови, а людина-оператор візьме закінчено.

Keynote (Google I/O '18)

На даний момент Хаффман сказав, що приблизно чотири з п'яти дзвінків, зроблених Duplex, не потребують допомоги людини-оператора. Цікаво, що він сказав, що людей-операторів не відлучать від служби, оскільки Duplex стає кращим, оскільки Google вважає їх невід’ємною частиною забезпечення безперебійної роботи Duplex.

«Гм» і «ах»

Під час навчання Асистента Google наголошував на тому, щоб він звучав природніше і не нагадував робота. Після демонстрації на Google I/O критики запитали, чому Google намагається змішувати "мм і ах", щоб створити Асистента звучало більш людяно, особливо якщо на початку дзвінка не додавалося повідомлення про те, що це не людина. Зараз є застереження, але Хаффман сказав, що розбіжності в мовленні, як-от «гм» ​​або «ммм», додано, щоб підтримувати потік розмови.

Помічник додав «мм», коли не зміг розчути, що сказав працівник ресторану, і знову відповів на його запит.

«Ми не намагаємося обдурити чи видати себе за іншу особу, але якщо ви повернетесь до того запису тієї ранньої ранньої системи, яка болить, це звучить не дуже природно, це звучить не дуже по-людськи», — сказав Хаффман. «Але в результаті цього Помічник не дуже успішно виконував завдання. Багато людей клали слухавку або заплуталися в тому, з ким вони розмовляли, розмова просто переривалася, тому що це було неприродно».

Згідно з Хаффманом, нерівність мови лінгвісти, є ключовою частиною підтримки спілкування між двома людьми. Легко побачити, наскільки добре це працює, почувши розмови з Асистентом, і результати далекі від оригінального запису.

Один із способів усунення розбіжностей у мовленні – підтвердження розмови, наприклад, коли говорить одна особа, але ви хочете переконайтеся, що одержувач знає, що ви все ще задіяні та слухаєте, наприклад, коли Асистент сказав нам «мммм», коли його попросили утримувати.

google duplex використовує io2018 2835
google duplex використовує io2018 2836

Іншим корисним інструментом є сказати «гм», коли є невизначеність, як ввічливий спосіб попросити роз’яснення. Помічник додав «мм», коли не зміг розчути, що сказав працівник ресторану, і знову відповів на його запит.

Помічник із такими розладами мовлення є різким контрастом із оригінальним роботизованим Помічником. Набагато менш холодно, і розмова пішла набагато швидше. І замість того, щоб приймати прості команди, Помічник насправді взаємодіє з людьми за допомогою нашої мови, яка, безсумнівно, схвилює одних і лякає інших.

зручність

Дуплекс – це зручність. Це заощаджує ваш час, може надати точніші години роботи магазину, а також може заощадити час компаніям. Google також сказав, що тут є велика можливість допомогти людям, які не можуть розмовляти або мають проблеми з розмовою.

Хаффман сказав думати про Duplex як про еволюцію автоматизованих голосових апаратів минулого, таких як під час дзвінка в банк, коли це був повільний процес натискання цифр, щоб перейти вправо відділ.

«Сьогодні, якщо ви подзвоните в ці авіакомпанії чи банки, ви отримаєте щось набагато, набагато приємніше», — сказав він. «Ви почуєте голос, який звучить набагато природніше, і він може сказати щось на кшталт: «Просто скажіть мені, що вам потрібно, ви можете сказати щось на зразок, о котрій годині мій рейс?» Duplex, ми просто розвиваємо цю ідею на крок далі, розвиваємо розмову та робимо її більш природною, щоб вона була більш успішною для користувачів і підприємства».

З того, що ми бачили досі, це багатообіцяюча технологія, але чи варто нам її приймати чи боятися?

Google не показав нам, як Duplex здійснює дзвінки в компанії щодо розкладу роботи магазину, а також не продемонстрував планування стрижок, тому ми не можемо коментувати, наскільки добре Duplex працюватиме в цих випадках. Ми також не впевнені, чи матимуть люди-оператори доступ до вашого номера телефону та повного імені, оскільки це створює певний ризик для конфіденційності. Нам також цікаво, чи буде Duplex підтримувати кілька мов у майбутньому. Ми звернулися до Google, щоб перевірити деякі запитання без відповіді, але, звичайно, їх буде більше з розвитком технологій.

З того, що ми бачили досі, це багатообіцяюча технологія, але чи варто нам її приймати чи боятися? Ми будемо щасливі, якщо нам більше ніколи не доведеться перебувати в очікуванні годинами поспіль, але тут важливо враховувати траєкторію. Ми постійно крокуємо до майбутнього, де нам не потрібно ні з ким розмовляти, де ви можете жити ізольовано в квартирі, з доставкою їжі; пакунки, які доставляють дрони, і тисячі годин медіафайлів, які можна споживати, навіть не виходячи на вулицю.

Хоча Duplex може починатися з деяких більш звичайних телефонних дзвінків, штучний інтелект стане кращим у розмовах, що полегшить його перенесення в інші галузі. Ми як суспільство будемо вирішувати, яка частина наших розмов має відбуватися через штучний інтелект і чи варто знову брати трубку.

Рекомендації редакції

  • Я змусив себе спробувати 14,5-дюймовий планшет — і він пішов не дуже добре
  • Мені дуже подобається Pixel 7a, але є одна велика проблема, яку я не можу ігнорувати
  • Мені подобаються Pixel 7 і Pixel 7 Pro, але Google не дозволяє
  • Ось усе, що Google не анонсувала на заході Pixel Fall Launch
  • Все, що Google не анонсувала на Google I/O 2021