Testovali sme Google Duplex, umelú inteligenciu na telefonovanie, ktorá príde toto leto

Počas práce na recepcii thajskej reštaurácie v New Yorku som zdvihol telefón, stiahol rezerváciu a zložil. Surreal bolo prvé slovo, ktoré ma potom napadlo, nie preto, že som predstieral, že pracujem v a reštaurácia, ale že som práve hovoril a rezervoval si stôl od umelo inteligentného Googlu asistent.

Obsah

  • Čo je to Duplex a kde bude fungovať?
  • Demo
  • Ako funguje Duplex
  • „ums“ a „ahs“
  • Pohodlie

Nemohol som sa zbaviť myšlienky, že hlas na druhom konci nie je živá bytosť, aj keď to bol len dvojminútový rozhovor. To neznamená, že asistent nebol presvedčivý; keby mi to nepovedalo (a keby som nebol v demo prostredí), veľmi by som nepremýšľal o výmene s tým, čo znelo ako iný človek na druhom konci.

Odporúčané videá

Výmena robotov, ktorú som mal, bola súčasťou tlačovej demonštrácie Technológia Duplex spoločnosti Google, prvýkrát oznámené na I/O spoločnosti vývojárska konferencia v máji. Umožňuje ľuďom rezervovať si stôl v reštaurácii, naplánovať si stretnutie s účesom a zistiť otváracie hodiny predajne Google Assistant

. The hlasový asistent zavolá do reštaurácie alebo obchodu – po zadaní požiadavky z telefónu alebo inteligentného reproduktora s podporou Asistenta, ako napr Domovská stránka Google — a o pár minút neskôr dostanete oznámenie potvrdzujúce, že vaše plány sú oficiálne rezervované (alebo ak sa hovor nepodarilo dokončiť).

Súvisiace

  • Na svoj Pixel 7 Pro som vložil dynamický ostrov iPhone – a nemôžem sa vrátiť
  • Dal som Pixel 7 Pro druhú šancu – nevyšlo to tak, ako som dúfal
  • Dokáže fotoaparát Pixel 6 Pro od Googlu poraziť Samsung Galaxy S21 Ultra? som zistil
Google Duplex na telefóne s Androidom
Julian Chokkattu/Digitálne trendy

Demo na I/O bolo ohromujúce, ale nebolo bez kontroverzií. Objavili sa obavy: Prečo musela AI znieť tak realisticky a prečo neoznámila ľudskému volajúcemu odmietnutie zodpovednosti, čo by sa rovnalo tomu, čo niektorí považovali za podvod. A keďže bol hovor nahraný, niektorí sa pýtali, či technológia neporušuje niektoré zákony upravujúce telefonické hovory.

Odvtedy Google objasnil svoju pozíciu a teraz máme niekoľko odpovedí. Digital Trends strávil nejaký čas s tímom v pozadí Duplex a demonštrovali sme túto technológiu pre seba. Ale predtým, ako sa ponoríme do našich skúseností, pozrime sa na nové podrobnosti o tom, ako a kde bude Duplex fungovať.

Čo je to Duplex a kde bude fungovať?

Duplex je technológia vo vývoji, ktorá umožňuje Asistentovi Google telefonovať na používateľov a vychádza z rokov výskumu a práce v oblasti umelej inteligencie pre prirodzený jazyk spracovanie.

„Teraz rozumieme prirodzenej reči a dokážeme generovať prirodzenú reč,“ povedal Nick Fox, viceprezident produktového manažmentu v spoločnosti Google. "Tieto technológie sa používajú s Duplexom, aby sme mali prirodzenú, pútavú konverzáciu, ktorá sa prispôsobuje tomu, čo sa deje v rámci konverzácie, v konečnom dôsledku s cieľom dosiahnuť veci."

Google Duplex naplánovanie kaderníckeho stretnutiaGoogle

Pomôcť vám robiť veci je cieľom Googlu pre Asistenta a s Duplexom spoločnosť začína tri konkrétne úlohy: Rezervácia stola v reštaurácii, nájdenie otváracích hodín predajne a naplánovanie kaderníctva vymenovanie. Duplex momentálne nemôže robiť nič viac ako toto, takže ak otázka nie je relevantná (povedzme, pýta sa na počasie alebo športové výsledky), Asistent nebude rozumieť. Podobne používateľ nemôže požiadať Asistenta o uskutočnenie hovorov, ktoré nesúvisia s vyššie uvedenými úlohami.

Má potenciál ušetriť veľa času zamestnancom pri odpovedaní na hovory o otváracích hodinách predajne.

Používateľovi to, že Asistent uskutoční tieto hovory, ušetrí trochu času, no prospeje aj firmám, ktoré tieto hovory prijímajú. Ak sa napríklad volajúci spýta Asistenta na otváracie hodiny miestneho obchodu počas sviatkov, Asistent zavolá, dostane odpoveď a hodiny sa pridajú k Google Mapy a Vyhľadávanie Google pre všetkých na zobrazenie s overenou značkou vedľa nej.

S týmito informáciami, ak chcú ostatní volajúci vedieť rovnaké informácie, Asistent ich bude musieť stiahnuť zo serverov Google a nie uskutočniť ďalší hovor. Spýtať sa asistenta stačí len jedna osoba, ale má potenciál ušetriť veľa času zamestnancom, ktorí by inak zostali pri odpovedaní na hovory o otváracích hodinách predajne.

Počas testovacej fázy Google toto leto bude Duplex fungovať iba s vybranými firmami a používateľmi v USA a bude k dispozícii iba v reštauráciách a kaderníckych salónoch, ktoré nemajú online rezerváciu systém. Asistent Google už pracuje s OpenTable, takže nemusí volať do reštaurácií, ktoré využívajú službu rezervácie.

Google otestuje hovory na pracovné hodiny najskôr v priebehu niekoľkých nasledujúcich týždňov a neskôr v lete sa test rozšíri na volania na rezervácie a stretnutia so strihaním. Počas tohto obdobia sa bude veľa testovať a vylepšovať, takže konečný výsledok Duplex môže vyzerať trochu inak, ako sme už videli. Firmy sa budú môcť odhlásiť, ak nechcú prijímať hovory od Asistenta Google.

Google

"To, čo vidíte, je technológia, ktorá je vo veľmi ranom štádiu," povedal Fox. "Chceme o tom verejne hovoriť aj v tejto fáze, aby sme sa uistili, že to robíme správne, ale tu vidíte niečo pomerne skoro."

Demo

Demo zážitok, ktorý sa konal o Thep Thai v štvrti Upper East Side v New Yorku, bola pod prísnou kontrolou. Po prvé, Google predstavil prezentáciu, ktorá ukazuje celkový proces uskutočňovania a ukončenia hovoru, ale v skutočnosti používa technológiu v reálnom čase. Inžinier nakŕmil Duplex čas a veľkosť party, ktoré sme navrhli na rezerváciu, a tu je to, čo nasledovalo.

Ide o to, že by ste to povedali Asistentovi Google na svojom telefóne alebo Domovská stránka Google že si chcete „rezervovať stôl v Thep Thai pre dvoch o 20:00. zajtra.” Asistent sa opýta, či je v poriadku rezervovať si čas od 20:00. do 21:00 hod. v prípade, že o 20:00 nie je k dispozícii žiadny stôl a po potvrdení sa ozve, že zavolá do reštaurácie a ozve sa vám čoskoro.

Keď zamestnanec reštaurácie zdvihne telefón, Asistent povie nasledovné alebo niečo podobné: „Ahoj, volám, aby som urobil rezerváciu. Som automatická rezervačná služba Google, takže hovor nahrám. Môžem si rezervovať stôl na štvrtok?"

Hovor sa nahráva, aby si ľudskí operátori v Google mohli vypočuť nahrávku, komentovať konverzáciu a upozorniť na chyby, ktorých sa spoločnosť Duplex dopustila, aby mohla službu vylepšiť.

Dostať Duplex na úroveň, na ktorej je teraz, začalo množstvom manuálnej a ľudskej práce.

Asistent ďalej odpovedá na každú položenú otázku – napríklad na aký čas je rezervácia a na koľko ľudia sú v partii a meno rezervácie – a konverzácia zdvorilo a promptne končí. Ak sa zobrazí žiadosť o informácie, ako je e-mailová adresa používateľa, Asistent povie, že nemá povolenie na poskytovanie týchto informácií.

Osoba, ktorá si rezervovala rezerváciu cez Asistenta, teraz dostane upozornenie, že stôl je rezervovaný, a automaticky sa pridá do Kalendára Google. Pred rezerváciou dostane užívateľ upozornenie a možnosť zrušiť schôdzku v prípade, že ju už nemôže uskutočniť. Majiteľ reštaurácie Thep Thai povedal, že veľa ľudí si robí rezervácie a potom sa neukáže. Dúfa, že tento systém, ktorý ponúka jednoduchý spôsob zrušenia rezervácie, bude znamenať menej prázdnych stolov.

Po hlavnej ukážke nám to Google umožnil vyskúšať. Keď sme hovor prijali, pokúsili sme sa spustiť Duplex a spôsobili nejaké komplikácie, ale asistent ich zvládol dobre. Požiadali sme ho, aby vydržal na začiatku rozhovoru – na ktorý odpovedal skôr „mhmm“ než slovným „áno“. Keď sme to povedali 6 popoludnie. čas rezervácie bol plný, Asistent odpovedal s rozsahom medzi 18:00. a 20:00 a ustálilo sa to na našich 19:45. odporúčanie. Potom sme požiadali o meno a telefónne číslo pre rezerváciu a či Asistent vedel vyhláskovať meno, čo úspešne urobil.

Google Duplex plánuje rezerváciu reštaurácieGoogle

Je pôsobivé, ako dôsledne Asistent zvládal svoje ukážky, aj keď sme narazili na moment, keď sa musel vrátiť k ľudskému operátorovi. Bolo to, keď sa niekto spýtal, či klient asistenta súhlasí s prijímaním e-mailov z reštaurácie. Fráza bola trochu nepríjemná a Asistent odpovedal: „Prepáčte, myslím, že som sa pomýlil,“ a povedal, že to dáva do hry nadriadeného. Ľudský operátor to rýchlo prevzal, povedal volajúcemu, že nemôže odhaliť e-mailovú adresu, a dokončil rezerváciu.

Ako funguje Duplex

Skoré testovacie verzie Duplex, ktoré nám hral Google, zneli neskutočne roboticky. Asistent však stále dokázal porozumieť prestávkam v konverzácii a dokonca povedať „ahoj?“ keď sa zamestnanec reštaurácie na pár sekúnd odmlčal. Napriek tomu Scott Huffman, viceprezident inžinierstva pre Google Assistant, povedal, že je „bolestivé to počúvať“.

Ak systém naozaj nevie, čo má robiť ďalej, elegantne sa odkloní od hovoru a prevezme ho ľudský operátor.

Dostať Duplex na úroveň, na ktorej je teraz, začalo množstvom manuálnej a ľudskej práce. Ľudskí operátori uskutočňovali hovory do reštaurácií, komentovali konverzácie a odosielali výsledky do Duplexu. Tím by prepojil frázy ako „koľko ľudí“ a ich variácie na „počet ľudí v párty“, čo by umožnilo spoločnosti Duplex pochopiť otázku.

Druhá fáza zahŕňala ľudských operátorov, ktorí počúvali hovory uskutočnené Asistentom, a ak sa veci pokazili, operátor skočil, aby prevzal kontrolu a uistil sa, že je hovor úspešný. To umožnilo tímu identifikovať drsné okraje okolo služby, komentovať tieto konverzácie a vložiť ich späť do algoritmov strojového učenia, aby sa Duplex mohol učiť.

Poslednou fázou testovania je automatizovaný režim, v ktorom automatizovaný systém uskutočňuje hovory a dokončuje ich. Únikové poklopy zabudované v systéme umožňujú Asistentovi skočiť späť ku kľúčovému cieľu, ktorým je dokončenie úlohy, vďaka vetám ako: „Nie som si istý, čo ste povedali, ale môžem si rezervovať stôl pre troch.” Ak systém naozaj nevie, čo má robiť ďalej, elegantne sa odkloní od konverzácie a ľudský operátor to vezme cez.

Hlavná poznámka (Google I/O '18)

V súčasnosti Huffman uviedol, že asi štyri z piatich hovorov uskutočnených spoločnosťou Duplex nepotrebujú asistenciu ľudského operátora. Zaujímavé je, že povedal, že ľudskí operátori nebudú zo služby vyradení, keď sa Duplex bude zlepšovať, pretože Google ich považuje za neoddeliteľnú súčasť pri zabezpečovaní bezproblémového fungovania Duplexu.

„ums“ a „ahs“

Počas procesu výučby asistenta Google kládol dôraz na to, aby to znelo prirodzenejšie a menej ako robot. Po demonštrácii na Google I/O sa kritici pýtali, prečo sa Google pokúša miešať „ums a ahs“, aby vytvoril Asistenta znie ľudskejšie, najmä ak na začiatok hovoru nepridalo vyhlásenie, že to nebol človek. Teraz existujú vyhlásenia o vylúčení zodpovednosti, ale Huffman povedal, že na udržanie toku konverzácie boli pridané poruchy reči ako „um“ alebo „mhm“.

Keď asistentka nepočula, čo hovorí zamestnanec reštaurácie, pridala „ehm“ a znova odpovedala na svoju požiadavku.

"Nepokúšame sa oklamať alebo napodobňovať, ale ak sa vrátite k tej nahrávke toho bolestivého raného systému, neznelo to veľmi prirodzene, neznelo to veľmi ľudsky," povedal Huffman. „V dôsledku toho však Asistent nebol veľmi úspešný pri plnení úloh. Mnoho ľudí by zavesilo alebo boli zmätení, o čom hovorili, konverzácia by sa jednoducho prerušila, pretože to nebolo prirodzené.“

Huffman povedal, že reč je narušená lingvisti, sú kľúčovou súčasťou udržiavania ľudskej konverzácie medzi dvoma ľuďmi. Pri počúvaní konverzácií s Asistentom je ľahké vidieť, ako to funguje, a výsledky sú ďaleko od pôvodnej nahrávky.

Jedným zo spôsobov, ako poruchy reči pomáhajú, je konverzačné uznanie, napríklad keď jedna osoba hovorí, ale vy chcete uistite sa, že prijímač vie, že ste stále zapojený a počúvate, ako keď nám Asistent povedal „mhmm“, keď bol požiadaný držať.

google duplex hands on io2018 2835
google duplex hands on io2018 2836

Ďalším užitočným nástrojom je povedať „hm“, keď existuje neistota, ako zdvorilý spôsob, ako požiadať o vysvetlenie. Keď asistentka nepočula, čo hovorí zamestnanec reštaurácie, pridala „ehm“ a znova odpovedala na svoju požiadavku.

Asistent s týmito poruchami reči je v ostrom kontraste oproti pôvodnému, robotickému asistentovi. Je oveľa menej chladno a konverzácia prebiehala oveľa rýchlejšie. A namiesto toho, aby prijímal jednoduché príkazy, Asistent v skutočnosti komunikuje s ľuďmi prostredníctvom nášho jazyka, čo niektorých určite vzruší a iných vystraší.

Pohodlie

Duplex je predovšetkým o pohodlí. Šetrí vám to trochu času, môže vám poskytnúť presnejšie otváracie hodiny a môže to ušetriť čas aj firmám. Google tiež uviedol, že je tu veľká príležitosť pomôcť ľuďom, ktorí nevedia hovoriť alebo majú problémy s rozprávaním.

Huffman povedal o Duplexe uvažovať ako o evolúcii automatických hlasových strojov z minulosti, ako napr pri volaní do vašej banky, keď išlo o pomalý proces stláčania čísel, aby ste sa dostali doprava oddelenie.

„Ak dnes zavoláte týmto aerolíniám alebo bankám, dostanete niečo oveľa, oveľa krajšie,“ povedal. „Budete počuť oveľa prirodzenejšie znejúci hlas a môže znieť niečo ako: ‚Povedz mi, čo potrebuješ, môžeš povedať veci ako, koľko je hodín môjho letu?‘ Duplex, v skutočnosti len posúvame tú istú myšlienku o krok ďalej, rozvíjame konverzáciu a robíme ju prirodzenejšou, aby bola úspešnejšia pre používateľov a podniky.“

Z toho, čo sme doteraz videli, je to sľubná technológia, ale je to niečo, čo by sme mali prijať alebo sa čoho báť?

Spoločnosť Google nám neukázala, ako Duplex telefonuje do firiem počas otváracích hodín predajne, ani neukázala plánovanie schôdzok o strihaní – takže nemôžeme komentovať, ako dobre by Duplex v týchto prípadoch fungoval. Nie sme si istí, či budú mať ľudskí operátori prístup k vášmu telefónnemu číslu a celému menu, pretože to predstavuje určité riziko pre súkromie. Zaujímalo by nás tiež, či bude Duplex v budúcnosti podporovať viacero jazykov. Oslovili sme Google, aby sme overili niektoré nezodpovedané otázky, no s postupujúcim vývojom technológie ich bude samozrejme pribúdať.

Z toho, čo sme doteraz videli, je to sľubná technológia, ale je to niečo, čo by sme mali prijať alebo sa čoho báť? Budeme radi, ak už nikdy nebudeme musieť byť pozastavení na celé hodiny, ale je dôležité vziať do úvahy trajektóriu. Neustále kráčame smerom k budúcnosti, kde sa nemusíme s nikým rozprávať, kde môžete žiť izolovane v byte a jedlo vám bude doručené; balíky vykladané dronmi a tisíce hodín médií na konzumáciu bez toho, aby ste museli vyjsť von.

Zatiaľ čo Duplex môže začať s niektorými všednejšími telefónnymi hovormi, AI sa bude zlepšovať v konverzáciách, čo uľahčí prenos do iných odvetví. Bude na nás ako na spoločnosti, aby sme sa rozhodli, koľko z našich rozhovorov by sa malo uskutočniť prostredníctvom AI a či sa oplatí znova zdvihnúť telefón.

Odporúčania redaktorov

  • Prinútil som sa vyskúšať 14,5-palcový tablet – a nešlo to veľmi dobre
  • Naozaj sa mi páči Pixel 7a, ale je tu jeden veľký problém, ktorý nemôžem ignorovať
  • Chcem milovať Pixel 7 a Pixel 7 Pro, ale Google mi to nedovolí
  • Tu je všetko, čo Google neoznámil na podujatí Pixel Fall Launch
  • Všetko, čo Google neoznámil na Google I/O 2021