Když jsem pracoval na recepci thajské restaurace v New Yorku, zvedl jsem telefon, zrušil rezervaci a zavěsil. Surreal bylo první slovo, které mě potom napadlo, ne proto, že bych předstíral, že pracuji v a restauraci, ale že jsem právě mluvil a rezervoval si stůl od uměle inteligentního Googlu Asistent.
Obsah
- Co je to Duplex a kde bude fungovat?
- Demo
- Jak funguje Duplex
- „ums“ a „ahs“
- Pohodlí
Nemohl jsem se zbavit myšlenky, že hlas na druhém konci není živá bytost, i když to byl jen dvouminutový rozhovor. To neznamená, že Asistent nebyl přesvědčivý; kdyby mi to neřeklo (a kdybych nebyl v demo prostředí), moc bych o výměně nepřemýšlel s tím, co znělo jako jiný člověk na druhém konci.
Doporučená videa
Výměna robotů, kterou jsem měl, byla součástí tiskového dema Technologie Google Duplex, poprvé oznámeno na I/O společnosti vývojářská konference v květnu. Umožňuje lidem zarezervovat si stůl v restauraci, naplánovat si schůzku s účesem a zjistit otevírací dobu prodejny Google Assistant. The hlasový asistent
zavolá do restaurace nebo obchodu – poté, co zadáte požadavek z telefonu nebo chytrého reproduktoru s Asistentem, např Domovská stránka Google — a o pár minut později dostanete oznámení potvrzující, že vaše plány jsou oficiálně rezervovány (nebo pokud hovor nelze dokončit).Příbuzný
- Na svůj Pixel 7 Pro jsem vložil Dynamic Island z iPhonu – a nemůžu se vrátit
- Dal jsem Pixelu 7 Pro druhou šanci – nevyšlo to, jak jsem doufal
- Dokáže fotoaparát Pixel 6 Pro od Googlu porazit Samsung Galaxy S21 Ultra? zjistil jsem
Demo na I/O bylo ohromující, ale neobešlo se bez kontroverze. Byly vzneseny obavy: Proč musela AI znít tak živě a proč neoznámila lidskému volajícímu prohlášení, které by se rovnalo tomu, co někteří považovali za podvod. A protože byl hovor nahrán, někteří se ptali, zda tato technologie neporušuje určité zákony upravující telefonní hovory.
Od té doby Google vyjasnil svůj postoj a nyní máme několik odpovědí. Digital Trends strávili nějaký čas s týmem v pozadí Duplex a předvedli jsme si technologii pro sebe. Než se však ponoříme do našich zkušeností, podívejme se na nové podrobnosti, které jsme nezjistili o tom, jak a kde bude Duplex fungovat.
Co je to Duplex a kde bude fungovat?
Duplex je technologie ve vývoji, která umožňuje Asistentovi Google uskutečňovat telefonní hovory na uživatele a vychází z let výzkumu a práce v oblasti umělé inteligence pro přirozený jazyk zpracovává se.
„Nyní rozumíme přirozené řeči a dokážeme generovat přirozenou řeč,“ řekl Nick Fox, viceprezident produktového managementu společnosti Google. "Tyto technologie se používají s Duplexem k přirozené, poutavé konverzaci, která se přizpůsobuje tomu, co se děje v rámci konverzace, v konečném důsledku s cílem dotáhnout věci do konce."
Pomáhat vám dělat věci je cílem Google pro Asistenta a s Duplexem společnost začíná tři konkrétní úkoly: Rezervace stolu v restauraci, vyhledání otevírací doby prodejny a naplánování kadeřnictví jmenování. Duplex v tuto chvíli nemůže dělat nic víc než toto, takže pokud dotaz není relevantní (řekněme dotaz na počasí nebo sportovní výsledky), Asistent nebude rozumět. Stejně tak uživatel nemůže požádat Asistenta o volání, které nesouvisí s výše uvedenými úkoly.
Má potenciál ušetřit spoustu času zaměstnancům, kteří uvízli při odpovídání na hovory o otevírací době prodejny.
Pro uživatele to, že Asistent tyto hovory uskutečňuje, uvolní trochu času, ale prospěje to také firmám, které tyto hovory přijímají. Pokud se například volající zeptá Asistenta na sváteční otevírací dobu místního obchodu, Asistent zavolá, dostane odpověď a otevírací doba bude přidána do Google mapy a Vyhledávání Google pro všechny k zobrazení s ověřenou značkou vedle ní.
Pokud by ostatní volající chtěli znát stejné informace, Asistent by je s těmito informacemi musel pouze stáhnout ze serverů Google a nezavolat další hovor. Zeptání se asistenta vyžaduje pouze jednu osobu, ale má potenciál ušetřit spoustu času zaměstnancům, kteří by jinak museli odpovídat na hovory o otevírací době prodejny.
Během testovací fáze Google letos v létě bude Duplex fungovat pouze s vybranými firmami a uživateli v USA a bude k dispozici pouze v restauracích a kadeřnických salonech, které nemají online rezervaci Systém. Google Assistant již pracuje s OpenTable, takže nemusí volat do restaurací, které využívají rezervační službu.
Google otestuje hovory na pracovní dobu nejprve v příštích několika týdnech a později v létě se test rozšíří na volání po rezervaci a schůzky se stříháním vlasů. Během tohoto období bude probíhat spousta testování a ladění, takže konečný výsledek Duplexu může vypadat trochu jinak, než jsme již viděli. Firmy se budou moci odhlásit, pokud nebudou chtít přijímat hovory od Asistenta Google.
"To, co vidíte, je technologie, která je ve velmi raném stádiu," řekl Fox. "Chceme o tom veřejně mluvit i v této fázi, abychom se ujistili, že to máme správně, ale tady vidíte něco docela brzy."
Demo
Demonstrační zkušenost, která se konala v Thajské Thep ve čtvrti Upper East Side v New Yorku, byla silně kontrolována. Nejprve Google představil prezentaci, která ukazuje celkový proces uskutečnění a ukončení hovoru, ale ve skutečnosti používá technologii v reálném čase. Technik nakrmil Duplex čas a velikost party, které jsme navrhli pro rezervaci, a tady je to, co následovalo.
Jde o to, že byste to řekli Asistentovi Google na svém telefonu nebo Domovská stránka Google že si chcete „zarezervovat stůl v Thep Thai pro dva na 20:00. zítra." Asistent se zeptá, zda je v pořádku rezervovat čas od 20:00. do 21:00 v případě, že ve 20:00 není k dispozici žádný stůl, a po potvrzení se oznámí, že zavolá do restaurace a ozve se vám již brzy.
Když zaměstnanec restaurace zvedne telefon, asistent řekne následující nebo něco podobného: „Ahoj, volám kvůli rezervaci. Jsem automatická rezervační služba Google, takže hovor nahrávám. Můžu si zarezervovat stůl na čtvrtek?"
Hovor je nahráván, aby si lidští operátoři ve společnosti Google mohli nahrávku poslechnout, komentovat konverzaci a upozornit na chyby, kterých se Duplex dopustil, aby mohl službu vylepšit.
Dostat Duplex na úroveň, kde je nyní, začalo spoustou manuální a lidské práce.
Asistent dále odpovídá na každou položenou otázku – například na kolik je rezervace a na kolik lidé jsou ve skupině a jméno rezervace - a konverzace zdvořile a rychle končí. Pokud bude požádán o informace, jako je e-mailová adresa uživatele, Asistent řekne, že nemá oprávnění tyto informace poskytnout.
Osoba, která zarezervovala rezervaci prostřednictvím Asistenta, nyní obdrží oznámení, že stůl byl rezervován, a bude automaticky přidán do Kalendáře Google. Před rezervací obdrží uživatel upozornění a možnost zrušit schůzku v případě, že ji již nemůže uskutečnit. Majitel restaurace Thep Thai řekl, že spousta lidí dělá rezervace a pak se neukáže. Doufá, že tento systém, který nabízí snadný způsob zrušení rezervace, bude znamenat méně prázdných stolů.
Po hlavním demu nám Google umožnil to vyzkoušet. Když jsme hovor přijali, pokusili jsme se Duplex podrazit a způsobili nějaké komplikace, ale asistent je zvládl dobře. Požádali jsme ho, aby vydržel na začátku konverzace – na což odpověděl „mhmm“, spíše než slovní „ano“. Když jsme to řekli 6 odpoledne Čas rezervace byl plný, Asistent reagoval s rozsahem mezi 18:00. a 20:00 a vyrovnalo se to na našich 19:45. doporučení. Poté jsme požádali o jméno a telefonní číslo pro rezervaci a zda Asistent dokázal napsat jméno, což úspěšně udělal.
Je působivé, jak důsledně Asistent zvládal své ukázky, i když jsme se setkali s okamžikem, kdy se potřeboval obrátit na lidského operátora. Bylo to, když se někdo zeptal, zda je klient Asistenta v pořádku s přijímáním e-mailů z restaurace. Fráze byla trochu trapná a Asistent odpověděl: „Omlouvám se, myslím, že jsem se zmátl,“ a řekl, že to nastavuje nadřízeného. Lidský operátor to rychle převzal, řekl volajícímu, že nemůže prozradit e-mailovou adresu, a dokončil rezervaci.
Jak funguje Duplex
Rané testovací verze Duplexu, které nám Google přehrál, zněly neuvěřitelně roboticky. Asistent však stále chápal pauzy v konverzaci a dokonce řekl „ahoj?“ když se zaměstnanec restaurace na pár sekund odmlčel. Přesto Scott Huffman, viceprezident inženýrství pro Google Assistant, řekl, že je „bolestné to poslouchat“.
Pokud systém opravdu neví, co dělat dál, ladně se z hovoru ukloní a řízení převezme lidský operátor.
Dostat Duplex na úroveň, kde je nyní, začalo spoustou manuální a lidské práce. Lidští operátoři uskutečňovali hovory do restaurací, komentovali konverzace a vkládali výsledky do Duplexu. Tým by propojil fráze jako „kolik lidí“ a jejich variace na „počet lidí ve skupině“, což by Duplexu umožnilo porozumět otázce.
Druhá fáze zahrnovala lidské operátory naslouchající hovorům uskutečněným asistentem, a pokud se věci nepovedly, operátor skočil, aby převzal řízení a ujistil se, že je hovor úspěšný. To umožnilo týmu identifikovat drsné okraje kolem služby, komentovat tyto konverzace a vkládat je zpět do algoritmů strojového učení, aby se Duplex mohl učit.
Poslední fází testování je automatický režim, kdy automatizovaný systém zadává hovory a dokončuje je. Únikové poklopy zabudované do systému umožňují Asistentovi skočit zpět ke klíčovému cíli, kterým je dokončení úkolu, díky větám jako: „Nejsem si jistý, co jsi řekl, ale můžu si zarezervovat stůl pro tři?" Pokud systém opravdu neví, co má dělat dál, elegantně se odkloní od konverzace a lidský operátor to vezme přes.
Keynote (Google I/O '18)
V tuto chvíli Huffman řekl, že asi čtyři z pěti hovorů uskutečněných společností Duplex nepotřebují asistenci lidského operátora. Je zajímavé, že řekl, že lidští operátoři nebudou ze služby staženi, když se Duplex bude zlepšovat, protože Google je považuje za nedílnou součást zajištění toho, aby Duplex fungoval bez problémů.
„ums“ a „ahs“
Během procesu výuky Asistenta Google kladl důraz na to, aby to znělo přirozeněji a méně jako robot. Po demu na Google I/O se kritici ptali, proč se Google pokouší zakomponovat „ums a ahs“, aby vytvořil Asistenta znělo lidštěji, zvláště pokud na začátek hovoru nebylo přidáno prohlášení, že to nebyl člověk. Nyní existují prohlášení o vyloučení odpovědnosti, ale Huffman řekl, že byly přidány neplynulosti řeči jako „um“ nebo „mhm“, aby se tok konverzace udržel.
Asistent přidal „ehm“ poté, co neslyšel, co zaměstnanec restaurace řekl, a znovu odpověděl na svůj požadavek.
"Nepokoušíme se podvádět nebo se vydávat za identitu, ale pokud se vrátíte k té nahrávce toho bolestivého raného systému, neznělo to moc přirozeně, neznělo to moc lidsky," řekl Huffman. „Důsledkem toho však bylo, že Asistent nebyl při plnění úkolů příliš úspěšný. Spousta lidí by zavěsila nebo byli zmatení z toho, o čem mluvili, konverzace by se prostě zhroutila, protože to nebylo přirozené."
Huffman řekl, že dochází k poruchám řeči lingvisté, jsou klíčovou součástí udržení lidské konverzace mezi dvěma lidmi. Při poslechu konverzací s Asistentem je snadné vidět, jak dobře to funguje, a výsledky jsou daleko od původní nahrávky.
Jedním ze způsobů, jak poruchy řeči pomáhají, je konverzační uznání, například když jedna osoba mluví, ale vy chcete ujistěte se, že přijímač ví, že jste stále zapojeni a posloucháte, jako když nám Asistent řekl „mhmm“, když byl požádán držet.
Dalším užitečným nástrojem je říkat „hm“, když existuje nejistota, jako zdvořilý způsob, jak požádat o vysvětlení. Asistent přidal „ehm“ poté, co neslyšel, co zaměstnanec restaurace řekl, a znovu odpověděl na svůj požadavek.
Asistent s těmito poruchami řeči je v ostrém kontrastu oproti původnímu, robotickému asistentovi. Je mnohem méně chladno a konverzace probíhala mnohem rychleji. A spíše než přijímání jednoduchých příkazů, asistent ve skutečnosti komunikuje s lidmi prostřednictvím našeho jazyka, což některé jistě vzruší a jiné vyděsí.
Pohodlí
Duplex je především o pohodlí. Ušetří vám to trochu času, může vám to poskytnout přesnější otevírací dobu a také to může ušetřit čas podnikům. Google také uvedl, že je zde velká příležitost pomoci lidem, kteří nemohou mluvit nebo mají problémy s mluvením.
Huffman řekl, že Duplex je třeba považovat za evoluci automatických hlasových strojů z minulosti, jako je např při volání do vaší banky, kdy to byl pomalý proces mačkání čísel, abyste se dostali doprava oddělení.
„Když dnes zavoláte těm aerolinkám nebo bankám, dostanete něco mnohem, mnohem hezčího,“ řekl. „Uslyšíte mnohem přirozeněji znějící hlas a může znít něco jako: ‚Řekni mi, co potřebuješ, můžeš říkat věci jako, kolik hodin mám let?‘ Duplex, ve skutečnosti jen posouváme stejnou myšlenku o krok dále, rozvíjíme konverzaci a činíme ji přirozenější, aby byla pro uživatele a uživatele úspěšnější podniky.”
Z toho, co jsme dosud viděli, je to slibná technologie, ale je to něco, čeho bychom se měli držet, nebo se čeho bát?
Google nám neukázal, jak Duplex telefonuje do firem na otevírací dobu prodejen, ani neukázal plánování schůzek se stříháním – takže nemůžeme komentovat, jak dobře by Duplex v těchto případech fungoval. Také si nejsme jisti, zda budou mít lidští operátoři přístup k vašemu telefonnímu číslu a celému jménu, protože to představuje určité riziko pro soukromí. Také by nás zajímalo, zda bude Duplex v budoucnu podporovat více jazyků. Oslovili jsme Google, abychom ověřili některé nezodpovězené otázky, ale s postupem technologie jich bude samozřejmě přibývat.
Z toho, co jsme dosud viděli, je to slibná technologie, ale je to něco, čeho bychom se měli držet, nebo se čeho bát? Budeme rádi, když už nikdy nebudeme muset být pozastaveni na celé hodiny, ale je důležité vzít v úvahu trajektorii. Neustále směřujeme k budoucnosti, kde nebudeme muset s nikým mluvit, kde můžete žít izolovaně v bytě a jídlo vám bude doručováno; balíčky shazované drony a tisíce hodin médií ke konzumaci, aniž byste museli vyjít ven.
Zatímco Duplex může začít s některými obyčejnějšími telefonními hovory, AI se bude zlepšovat v konverzacích, což usnadní přenos do jiných odvětví. Bude na nás jako na společnosti, abychom se rozhodli, kolik z našich hovorů by se mělo odehrávat prostřednictvím umělé inteligence a zda stojí za to znovu zvednout telefon.
Doporučení redakce
- Přinutil jsem se vyzkoušet 14,5palcový tablet – a nedopadlo to dobře
- Pixel 7a se mi opravdu líbí, ale je tu jeden velký problém, který nemohu ignorovat
- Chci milovat Pixel 7 a Pixel 7 Pro, ale Google mi to nedovolí
- Zde je vše, co Google neoznámil na akci Pixel Fall Launch
- Vše, co Google neoznámil na Google I/O 2021