Тествахме Google Duplex, AI за телефонни обаждания, който идва това лято

Докато работех на рецепцията на тайландски ресторант в Ню Йорк, вдигнах телефона, записах резервация и затворих. Сюрреалистично беше първата дума, която ми дойде на ум след това, не защото се преструвах, че работя в ресторант, но току-що говорих и резервирах маса от изкуствено интелигентния Google Помощник.

Съдържание

  • Какво е Duplex и къде ще работи?
  • Демото
  • Как работи Duplex
  • „Ъм“ и „ах“
  • Удобство

Не можех да се отърся от мисълта, че гласът от другата страна не е живо същество, дори и да беше само двуминутен разговор. Това не означава, че Асистентът не беше убедителен; ако не ми каза (и ако не бях в демо среда), нямаше да мисля много за обмена с това, което звучеше като друг човек от другата страна.

Препоръчани видеоклипове

Размяната на роботи, която имах, беше част от демонстрация в пресата, за която се проведе Дуплексната технология на Google, обявен за първи път на I/O на компанията конференция за разработчици през май. Тя позволява на хората да резервират маса в ресторант, да насрочат час за прическа и да разберат работното време на магазина

Google Assistant. The гласов асистент ще се обади в ресторанта или магазина - след като направите заявка от телефона си или интелигентен високоговорител с активиран асистент, като Начална страница на Google — и минути по-късно ще получите известие, потвърждаващо, че вашите планове са официално резервирани (или ако разговорът не може да бъде завършен).

Свързани

  • Сложих Dynamic Island на iPhone на моя Pixel 7 Pro — и не мога да се върна
  • Дадох втори шанс на Pixel 7 Pro – не се получи както се надявах
  • Може ли камерата Pixel 6 Pro на Google да победи Samsung Galaxy S21 Ultra? аз разбрах
Google Duplex на телефон с Android
Джулиан Чоккату/Дигитални тенденции

Демонстрацията на I/O беше поразителна, но не мина без противоречия. Бяха повдигнати опасения: защо AI трябваше да звучи толкова реалистично и защо не обяви отказ от отговорност на обаждащия се човек, което се равняваше на това, което някои смятаха за измама. И тъй като разговорът беше записан, някои се запитаха дали технологията би нарушила определени закони, регулиращи телефонните разговори.

Оттогава Google изясни позицията си и сега имаме някои отговори. Digital Trends прекара известно време с екипа зад него Дуплекс и демонстрирахме технологията за себе си. Но преди да се потопим в нашия опит, нека да разгледаме новите подробности, които не разкрихме за това как и къде ще работи Duplex.

Какво е Duplex и къде ще работи?

Duplex е технология в процес на разработка, която позволява на Google Assistant да извършва телефонни обаждания на потребителя от името и произтича от години на изследване и работа в областта на изкуствения интелект за естествен език обработка.

„Вече можем да разбираме естествената реч и можем да генерираме естествена реч“, каза Ник Фокс, вицепрезидент по управление на продукти в Google. „Тези технологии се прилагат с Duplex, за да има естествен, ангажиращ разговор, който се адаптира към случващото се в разговора, в крайна сметка с цел нещата да бъдат свършени.“

Google Duplex насрочване на час за фризьорствоGoogle

Да ви помага да вършите нещата е целта на Google за Assistant, а с Duplex компанията започва три конкретни задачи: резервиране на маса в ресторант, намиране на работното време на магазина и насрочване на фризьорски салон назначаване. Duplex не може да направи нищо повече от това в момента, така че ако дадено запитване не е уместно (да речем, питане за времето или спортни резултати), Асистентът няма да разбере. По същия начин потребителят не може да поиска от Асистента да извършва повиквания, несвързани с гореспоменатите задачи.

Има потенциала да спести много време на служителите, заседнали да отговарят на обаждания относно работното време на магазина.

За потребителя това, че Асистентът извършва тези обаждания, освобождава малко време, но също така е от полза за фирмите, които получават тези обаждания. Например, ако обаждащ се попита Асистент за празничното работно време на местен магазин, Асистентът ще се обади, ще получи отговор и часовете ще бъдат добавени към Google Maps и Google Търсене за всички, с потвърден етикет до него.

С тази информация, ако други обаждащи се искат да знаят същата информация, Assistant ще трябва само да я изтегли от сървърите на Google, а не да прави друго обаждане. Необходим е само един човек, който да попита Асистент, но има потенциала да спести много време на служителите, които в противен случай биха били блокирани да отговарят на обаждания относно работното време на магазина.

По време на фазата на тестване на Google това лято, Duplex ще работи само с избрани фирми и потребители в САЩ и ще се предлага само в ресторанти и фризьорски салони, които нямат онлайн резервация система. Google Assistant вече работи с OpenTable, така че не е необходимо да се обажда на ресторанти, които използват услугата за резервации.

Google ще тества обажданията за работно време първо през следващите няколко седмици, а по-късно това лято тестът ще се разшири до обаждания за резервации и срещи за прическа. През този период ще има много тестове и настройки, така че крайният резултат от Duplex може да изглежда малко по-различен от това, което вече сме виждали. Бизнесите ще могат да се откажат, ако не искат да получават обаждания от Google Assistant.

Google

„Това, което виждате, е технология, която е на много ранен етап“, каза Фокс. „Искаме да говорим за това публично дори на този етап, за да сме сигурни, че го правим правилно, но виждате нещо доста рано в процеса тук.“

Демото

Демо опитът, който се проведе в Thep Thai в квартал Upper East Side на Ню Йорк, беше силно контролиран. Първо, Google направи презентация, показваща цялостния процес на провеждане и прекратяване на разговор, но всъщност използвайки технологията в реално време. Инженер предостави на Duplex време и размер на групата, които предложихме за резервация, и ето какво последва.

Идеята е да кажете на Google Assistant на телефона си или Начална страница на Google че искате да „резервирате маса в Thep Thai за двама в 20:00 ч. утре.” Асистентът ще попита дали е добре да резервирате час от 20:00 ч. до 21:00ч. в случай че няма свободна маса в 20:00 и след като потвърдите, ще каже, че ще се обади в ресторанта и ще се свърже с вас скоро.

Когато служителят на ресторанта вдигне телефона, Асистентът ще каже следното или нещо подобно: „Здравейте, обаждам се, за да направя резервация. Аз съм услугата за автоматизирани резервации на Google, така че ще запиша обаждането. Мога ли да резервирам маса за четвъртък?“

Обаждането се записва, така че човешките оператори в Google да могат да прослушат записа, да коментират разговора и да подчертаят всички грешки, допуснати от Duplex, за да може да подобри услугата.

Достигането на Duplex до нивото, на което е сега, започна с много ръчна и човешка работа.

Асистентът продължава да отговаря на всеки зададен въпрос - като например за кое време е резервацията, колко хората са в партито, а името за резервацията — и разговорът учтиво и бързо завършва. Ако бъде поискана информация като имейл адрес на потребител, Асистентът ще каже, че няма разрешение да предостави тази информация.

Човекът, който е резервирал резервацията чрез Асистент, сега ще получи известие, че масата е резервирана, и тя автоматично ще бъде добавена към Google Calendar. Преди резервацията потребителят ще получи известие и възможност да отмени срещата, в случай че вече не може да я направи. Собственикът на ресторант Thep Thai каза, че много хора правят резервации и след това не се появяват. Той се надява, че тази система, която предлага лесен начин за анулиране на резервация, ще означава по-малко празни маси.

След основната демонстрация Google ни позволи да го изпробваме. Когато приехме обаждането, се опитахме да прекъснем Duplex и създадохме някои усложнения, но Асистентът се справи добре с тях. Помолихме го да задържи в началото на разговора – на което той отговори „мммм“, а не устно „да“. Когато го казахме 6 следобед времето за резервация изтече, асистентът отговори с диапазон между 18:00 ч. и 20:00, и се уреди за нашите 19:45. препоръка. След това поискахме име и телефонен номер за резервацията и дали Асистент може да изпише името, което направи успешно.

Google Duplex насрочва резервация за ресторантGoogle

Впечатляващо е колко последователно добре Assistant се справяше със своите демонстрации, въпреки че се натъкнахме на момент, когато трябваше да се върне към човешки оператор. Беше, когато някой попита дали клиентът на Асистента е добре да получава имейли от ресторанта. Фразата беше малко неудобна и Асистентът отговори с „Съжалявам, мисля, че се обърках“ и каза, че поставя супервайзер на линия. Човекът-оператор бързо пое, каза на обаждащия се, че не може да разкрие имейл адреса, и завърши резервацията.

Как работи Duplex

Ранните тестови версии на Duplex, които Google пусна за нас, звучаха невероятно роботизирани. Въпреки това, Асистентът все още успя да разбере паузите в разговора и дори да каже „здравей?“ когато служител на ресторант спря за няколко секунди. Все пак Скот Хъфман, вицепрезидент по инженеринга за Google Assistant, каза, че е „болезнено да го слушам“.

Ако системата наистина не знае какво да прави по-нататък, тя грациозно ще се откаже от обаждането и човешки оператор ще поеме.

Достигането на Duplex до нивото, на което е сега, започна с много ръчна и човешка работа. Човешки оператори се обаждаха на ресторанти, коментираха разговори и подадоха резултатите в Duplex. Екипът би свързал фрази като „колко души“ и техните вариации с „брой хора в групата“, позволявайки на Duplex да разбере въпроса.

Вторият етап включва човешки оператори, които слушат обажданията, направени от Асистента, и ако нещата се разминат, операторът се включва, за да поеме и да се увери, че обаждането е успешно. Това позволи на екипа да идентифицира грубите ъгли около услугата, да коментира тези разговори и да ги върне обратно в алгоритмите за машинно обучение, така че Duplex да може да се учи.

Последният етап на тестване е автоматизиран режим, при който автоматизираната система извършва повиквания и ги завършва. Аварийните люкове, вградени в системата, позволяват на Асистента да се върне към ключовата цел за изпълнение на задачата, благодарение на изречения като: „Не съм сигурен какво каза, но мога ли да резервирам маса за трима. Ако системата наистина не знае какво да прави след това, тя грациозно ще се отклони от разговора и човешкият оператор ще предприеме над.

Keynote (Google I/O '18)

В момента Хъфман каза, че около четири от пет обаждания, направени от Duplex, не се нуждаят от помощта на човешки оператор. Интересното е, че той каза, че човешките оператори няма да бъдат изтеглени от услугата, тъй като Duplex се подобрява, тъй като Google ги вижда като неразделна част от осигуряването на Duplex да работи без проблеми.

„Ъм“ и „ах“

По време на процеса на преподаване на Асистент Google постави акцент върху това да звучи по-естествено и по-малко като робот. След демонстрацията на Google I/O, критиците попитаха защо Google се опитва да смеси „хм и ах“, за да направи асистента звучи по-човешки, особено ако не добави отказ от отговорност в началото на разговора, че не е човек. Вече има откази от отговорност, но Хъфман каза, че са добавени неточности в речта като „хм“ или „ммм“, за да поддържат потока на разговора.

Асистентът добави „хм“, след като не можа да чуе какво е казал служителят на ресторанта, и последва отново заявката му.

„Ние не се опитваме да заблуждаваме или да се представяме, но ако се върнете към онзи запис на тази болезнена ранна система, не звучи много естествено, не звучи много човешко“, каза Хъфман. „Но в резултат на това Асистентът не беше много успешен при изпълнението на задачите. Много хора щяха да затворят или да се объркат с какво говорят, разговорът просто прекъсна, защото не се чувстваше естествено.“

Хъфман каза, че речта се разминава, според лингвисти, са ключова част от поддържането на човешки разговор между двама души. Лесно е да видите колко добре работи това, когато чувате разговори с Асистента, а резултатите са далеч от оригиналния запис.

Един от начините за подпомагане на разминаванията в речта е потвърждението при разговор, например когато един човек говори, но вие искате уверете се, че приемникът знае, че все още сте ангажирани и слушате, както когато Асистентът ни каза „мммм“, когато беше помолен да задръжте.

google duplex използва io2018 2835
google duplex използва io2018 2836

Друг полезен инструмент е да кажете „хм“, когато има несигурност, като учтив начин да поискате разяснение. Асистентът добави „хм“, след като не можа да чуе какво е казал служителят на ресторанта, и последва отново заявката му.

Асистентът с тези говорни дисфункции е ярък контраст с оригиналния роботизиран Асистент. Много по-малко е студено и разговорът се разви много по-бързо. И вместо да приема прости команди, Асистентът всъщност взаимодейства с хората чрез нашия език, което със сигурност ще развълнува някои, докато плаши други.

Удобство

Duplex е всичко за удобство. Спестява ви малко време, може да ви даде по-точно работно време на магазина и може да спести време и на бизнеса. Google също каза, че тук има голяма възможност да се помогне на хора, които не могат да говорят или имат проблеми с говоренето.

Хъфман каза да мислим за Duplex като еволюция на автоматизирани гласови машини от миналото, като напр. когато се обаждате на банката си, когато беше бавен процес на натискане на цифри, за да стигнете надясно отдел.

„Днес, ако се обадите на тези авиокомпании или банки, ще получите нещо много, много по-хубаво“, каза той. „Ще чуете много по-естествено звучащ глас и може да каже нещо като „Просто ми кажете от какво имате нужда, можете да кажете неща като колко часа е полета ми?“ В Duplex, ние наистина просто развиваме същата идея една крачка напред, развивайки разговора и го правейки по-естествен, така че да е по-успешен за потребителите и бизнеси.”

От това, което видяхме досега, това е обещаваща технология, но дали е нещо, което трябва да прегърнем или трябва да се страхуваме?

Google не ни показа как Duplex извършва обаждания до фирми за работното време на магазина, нито демонстрира насрочване на срещи за подстригване – така че не можем да коментираме колко добре ще работи Duplex в тези случаи. Също така не сме сигурни дали човешките оператори ще имат достъп до вашия телефонен номер и пълно име, тъй като това представлява известен риск за поверителността. Също така се чудим дали Duplex ще поддържа множество езици в бъдеще. Свързахме се с Google, за да проверим някои въпроси без отговор, но разбира се, със сигурност ще има още с напредването на технологията.

От това, което видяхме досега, това е обещаваща технология, но дали е нещо, което трябва да прегърнем или трябва да се страхуваме? Ще се радваме, ако никога повече не ни се наложи да бъдем задържани с часове, но тук е важно да вземем предвид траекторията. Непрекъснато се приближаваме към бъдеще, в което няма нужда да говорим с никого, където можете да живеете изолирани в апартамент, с храна, доставяна до вас; пакети, оставени от дронове, и хиляди часове медия за консумация, без изобщо да се налага да излизате навън.

Докато Duplex може да започне с някои от по-обикновените телефонни разговори, AI ще стане по-добър в разговорите, което ще улесни пренасянето към други индустрии. От нас като общество ще зависи каква част от говоренето ни трябва да става чрез AI и дали си струва да вдигнем телефона отново.

Препоръки на редакторите

  • Накарах се да опитам 14,5-инчов таблет - и не мина много добре
  • Наистина харесвам Pixel 7a, но има един голям проблем, който не мога да пренебрегна
  • Искам да харесам Pixel 7 и Pixel 7 Pro, но Google не ми позволява
  • Ето всичко, което Google не обяви на събитието Pixel Fall Launch
  • Всичко, което Google не обяви на Google I/O 2021