Teszteltük a Google Duplexet, az idén nyáron megjelenő telefonhívásos AI-t

Miközben egy New York-i thai étterem recepcióján dolgoztam, felvettem a telefont, levettem a foglalást, és leraktam. A szürreális volt az első szó, ami utána eszembe jutott, nem azért, mert úgy tettem, mintha az a étteremben, de most beszéltem és foglaltam asztalt a mesterségesen intelligens Google-tól Helyettes.

Tartalom

  • Mi az a Duplex, és hol fog működni?
  • A demó
  • Hogyan működik a Duplex
  • Az „ums” és „ahs”
  • Kényelem

Nem tudtam elhessegetni a gondolatot, hogy a hang a másik végén nem egy élőlény, még ha csak kétperces beszélgetésről is van szó. Ez nem azt jelenti, hogy az asszisztens nem volt meggyőző; ha nem mondaná meg nekem (és ha nem demókörnyezetben lennék), akkor nem sokat gondolkodtam volna azon, hogy a másik végén egy másik embernek hangzott el a csere.

Ajánlott videók

A robotbörze egy sajtóbemutató része volt A Google Duplex technológiája, először a cég I/O-ján jelentették be fejlesztői konferencia májusban. Lehetővé teszi az embereknek asztalt foglalni egy étteremben, időpontot egyeztetni a fodrászattal, és megtudni a bolt nyitvatartási idejét

Google Asszisztens. A hangsegéd felhívja az éttermet vagy az üzletet – miután kérést küld telefonjáról vagy az Asszisztens-kompatibilis okoshangszóróról, például Google főoldal – és percekkel később értesítést kap arról, hogy tervei hivatalosan lefoglaltak (vagy ha a hívást nem sikerült befejezni).

Összefüggő

  • Feltettem az iPhone Dynamic Island-et a Pixel 7 Pro-ra – és nem tudok visszamenni
  • Adtam egy második esélyt a Pixel 7 Pro-nak – nem úgy sikerült, ahogy reméltem
  • A Google Pixel 6 Pro kamerája legyőzheti a Samsung Galaxy S21 Ultra-t? kitaláltam
Google Duplex Android telefonon
Julian Chokkattu/Digitális trendek

Az I/O bemutatója döbbenetes volt, de nem volt ellentmondásmentes. Aggodalmak merültek fel: Miért kellett az AI-nak olyan élethűen hangzani, és miért nem jelentett be felelősséget kizáró nyilatkozatot az emberi hívónak, ami egyesek megtévesztésnek tartották. És mivel a hívást rögzítették, néhányan megkérdőjelezték, hogy a technológia sért-e bizonyos telefonhívásokra vonatkozó törvényeket.

Azóta a Google tisztázta álláspontját, és most már van néhány válaszunk. A Digital Trends eltöltött egy kis időt a csapattal a háta mögött Duplex és demóztuk magunknak a technológiát. Mielőtt azonban belevetnénk magunkat tapasztalatainkba, vessünk egy pillantást az eddig feltárt új részletekre, hogy hogyan és hol fog működni a Duplex.

Mi az a Duplex, és hol fog működni?

A Duplex egy fejlesztés alatt álló technológia, amely lehetővé teszi a Google Assistant számára, hogy telefonhívásokat kezdeményezzen a felhasználóval nevében, és a természetes nyelv mesterséges intelligenciájával kapcsolatos több éves kutatásból és munkából ered feldolgozás.

„Most már megértjük a természetes beszédet, és képesek vagyunk természetes beszédet generálni” – mondta Nick Fox, a Google termékmenedzsmentért felelős alelnöke. „Ezeket a technológiákat a Duplex-szel alkalmazzák, hogy természetes, vonzó beszélgetést folytassunk, amely alkalmazkodik a beszélgetésen belüli eseményekhez, végső soron azzal a céllal, hogy a dolgokat elvégezzük.”

A Google Duplex hajra időpontot egyeztetGoogle

A Google célja az Asszisztens számára, hogy segítsen elintézni a dolgokat, és a Duplex-szel a vállalat a legelején indul három konkrét feladat: Asztalfoglalás egy étteremben, nyitvatartási idő megállapítása és fodrászszalon ütemezése időpont egyeztetés. A Duplex jelenleg ennél többet nem tud, ezért ha egy lekérdezés nem releváns (például az időjárásról vagy a sporteredményekről), az asszisztens nem fogja megérteni. Hasonlóképpen, a felhasználó nem kérheti meg a Segédtől olyan hívásokat, amelyek nem kapcsolódnak a fent említett feladatokhoz.

Rengeteg időt takaríthat meg az alkalmazottak számára, akik elakadtak a bolti nyitvatartással kapcsolatos hívások fogadásában.

A felhasználó számára, ha az Asszisztens kezdeményezi ezeket a hívásokat, egy kis időt szabadít fel, de a hívásokat fogadó vállalkozások számára is előnyös. Ha például egy hívó megkérdezi a Segédtől egy helyi üzlet ünnepi nyitvatartási idejét, a Segéd felhívja, megkapja a választ, és az órák hozzáadódnak Google térkép és a Google Keresés, amely mellett egy ellenőrzött címke található.

Ezzel az információval, ha a többi hívó ugyanazt az információt szeretné tudni, a Segédnek csak a Google szervereiről kell lekérnie azokat, és nem kell újabb hívást kezdeményeznie. Csak egy emberre van szükség ahhoz, hogy megkérdezze az Asszisztenst, de sok időt takaríthat meg azon alkalmazottak számára, akik máskülönben elakadnának a bolti nyitvatartással kapcsolatos hívások fogadásában.

A Google nyári tesztelési szakaszában a Duplex csak kiválasztott vállalkozásokkal és felhasználókkal fog működni Amerikai Egyesült Államokban, és csak olyan éttermekben és fodrászszalonokban lesz elérhető, amelyek nem rendelkeznek online foglalással rendszer. A Google Asszisztens már működik az OpenTable-lel, így nem kell felhívnia a foglalási szolgáltatást használó éttermeket.

A Google először a következő hetekben teszteli a munkaidőben történő hívásokat, majd nyáron a teszt kiterjeszti a foglalásokra és a fodrász időpontokra való felhívásra is. Ebben az időszakban rengeteg tesztelés és finomítás lesz, így a Duplex végeredménye kissé eltérhet attól, amit már láttunk. A vállalkozások leiratkozhatnak, ha nem akarnak hívásokat fogadni a Google Asszisztenstől.

Google

„Amit látsz, az egy nagyon korai stádiumban lévő technológia” – mondta Fox. "Szeretnénk még ebben a szakaszban nyilvánosan beszélni róla, hogy megbizonyosodjunk arról, hogy helyesen járunk el, de itt valami egészen korai folyamatot látunk."

A demó

A bemutató élmény, amelyre a Thep Thai New York City Upper East Side negyedében erősen ellenőrizték. Először a Google prezentációt készített, amely bemutatja a hívások kezdeményezésének és befejezésének általános folyamatát, de valójában valós időben használja a technológiát. Egy mérnök megadta a Duplexnek az általunk javasolt időpontot és létszámot a foglaláshoz, és ez következett.

Az ötlet az, hogy elmondja a Google Asszisztensnek a telefonján vagy Google főoldal hogy szeretne „20 órakor asztalt foglalni a Thep Thaiban kettőre. holnap." Az asszisztens megkérdezi, hogy szabad-e időpontot foglalni 20 órától. 21 óráig. ha nincs szabad asztal este 8-kor, és a megerősítést követően azt fogja mondani, hogy felhívja az éttermet, és felveszi Önnel a kapcsolatot. hamar.

Amikor az étterem alkalmazottja felveszi a telefont, az Asszisztens a következőket mondja, vagy valami hasonlót: „Szia, foglalás céljából hívlak. A Google automatizált foglalási szolgáltatása vagyok, így rögzítem a hívást. Foglalhatok asztalt csütörtökre?”

A hívást rögzítik, hogy a Google emberi operátorai visszahallgathassák a felvételt, megjegyzésekkel láthassák el a beszélgetést, és kiemeljék a Duplex által elkövetett hibákat, így jobbá teheti a szolgáltatást.

A Duplex elérése arra a szintre, ahol most van, sok kézi és emberi munkával kezdődött.

Az asszisztens továbbra is válaszol minden feltett kérdésre – például, hogy mennyi időre szól a foglalás, hányra az emberek a buliban vannak, és a foglalás neve – és a beszélgetés udvariasan és gyorsan véget ér. Ha olyan információkat kérnek tőle, mint például egy felhasználó e-mail-címe, a Segéd azt mondja, hogy nincs engedélye ezen adatok megadására.

Az a személy, aki az Asszisztensen keresztül foglalta le a foglalást, most értesítést kap arról, hogy az asztal le van foglalva, és az asztal automatikusan felkerül a Google Naptárba. A foglalás előtt a felhasználó értesítést kap, és lehetőséget kap az időpont lemondására, ha már nem tud eljönni. A Thep Thai éttermének tulajdonosa azt mondta, hogy sokan foglalnak helyet, aztán nem jelennek meg. Reméli, hogy ez a rendszer, amely egyszerű módot kínál a foglalás lemondására, kevesebb üres asztalt jelent majd.

A fő bemutató után a Google megengedte, hogy kipróbáljuk. Amikor felvettük a hívást, megpróbáltuk megzavarni a Duplexet, és némi bonyodalmat okoztunk, de az asszisztens jól kezelte őket. Megkértük, hogy tartsa meg a beszélgetés elején – mire az „mhmm”-t válaszolt, nem pedig szóbeli „igen”-t. Amikor elmondtuk a 6 délután. A foglalási idő betelt, az asszisztens 18 óra közötti tartományban válaszolt. és 20:00, és ez beállt a mi 19:45-re. ajánlást. Ezután kértünk egy nevet és telefonszámot a foglaláshoz, és azt, hogy az asszisztens le tudja-e írni a nevet, amit sikeresen meg is tett.

A Google Duplex éttermi foglalást ütemezGoogle

Lenyűgöző, hogy az Assistant milyen következetesen kezelte a demóit, bár találkoztunk olyan pillanattal, amikor vissza kellett esnie egy emberi kezelőnek. Akkor történt, amikor valaki megkérdezte, hogy az Asszisztens ügyfele rendben van-e azzal, hogy e-maileket kap az étteremtől. A megfogalmazás kissé kínos volt, és az asszisztens így válaszolt: „Sajnálom, azt hiszem, összezavarodtam”, és azt mondta, hogy ez egy felügyelőt tesz a sorba. Az emberi operátor gyorsan átvette az irányítást, közölte a hívóval, hogy nem tudja felfedni az e-mail címet, és befejezte a foglalás lefoglalását.

Hogyan működik a Duplex

A Duplex korai tesztverziói, amelyeket a Google játszott le nekünk, hihetetlenül robotikusan hangzottak. Az asszisztens azonban még mindig képes volt megérteni a beszélgetés szüneteit, és még azt is meg tudta mondani, hogy „hello?” amikor egy étterem alkalmazottja megállt néhány másodpercre. Ennek ellenére Scott Huffman, a Google Assistant tervezési részlegének alelnöke azt mondta, hogy „fájdalmas volt hallgatni”.

Ha a rendszer valóban nem tudja, hogy mit tegyen, akkor kecsesen meghajol a hívás előtt, és egy emberi kezelő veszi át a vezetést.

A Duplex elérése arra a szintre, ahol most van, sok kézi és emberi munkával kezdődött. Az emberi operátorok hívásokat intéztek éttermekbe, megjegyzéseket írtak a beszélgetésekhez, és az eredményeket betáplálták a Duplexbe. A csapat összekapcsolja az olyan kifejezéseket, mint a „hány ember” és annak változatai a „párban lévő emberek száma”, lehetővé téve a Duplexnek, hogy megértse a kérdést.

A második szakaszban az emberi operátorok figyelték az asszisztens által kezdeményezett hívásokat, és ha a dolgok eltérnek a pályáról, a kezelő ugrott be, hogy átvegye az irányítást és megbizonyosodjon a hívás sikerességéről. Ez lehetővé tette a csapat számára, hogy azonosítsa a szolgáltatás körüli durva peremeket, megjegyzéseket fűzzen ezekhez a beszélgetésekhez, és visszatáplálja azokat a gépi tanulási algoritmusokba, hogy a Duplex tanulhasson.

Az utolsó tesztelési szakasz az automatizált mód, ahol az automatizált rendszer hívásokat kezdeményez és teljesíti. A rendszerbe épített menekülőnyílások lehetővé teszik az Asszisztens számára, hogy visszaugorjon a fő célhoz, a feladat elvégzéséhez, köszönhetően a következő mondatoknak: „Nem tudom, mit mondtál, de tudok asztalt foglalni három személyre? Ha a rendszer valóban nem tudja, mit tegyen, akkor kecsesen kibújik a beszélgetésből, és az emberi kezelő megteszi. felett.

Keynote (Google I/O '18)

Huffman jelenleg azt mondta, hogy a Duplex által kezdeményezett öt hívásból körülbelül négyben nincs szükség emberi kezelő segítségére. Érdekes módon elmondta, hogy az emberi operátorokat nem fogják kivonni a szolgáltatásból, ahogy a Duplex egyre jobb lesz, mivel a Google a Duplex zökkenőmentes működésének szerves részének tekinti őket.

Az „ums” és „ahs”

Az Asszisztens tanítási folyamata során a Google hangsúlyt fektetett arra, hogy természetesebb hangzású, és kevésbé robotszerű hangzású legyen. A Google I/O bemutatója után a kritikusok azt kérdezték, hogy a Google miért próbálja az „ums és ahs” összekeverését az asszisztens létrehozásához emberibbnek hangzik, különösen, ha a hívás elejéhez nem tette hozzá a felelősség kizárását, hogy nem ember. Jelenleg vannak felelősségkizárások, de Huffman azt mondta, hogy a beszédzavarokat, például „um” vagy „mhm” adták hozzá, hogy fenntartsák a beszélgetés folyamatát.

Az asszisztens egy „hm” szót adott hozzá, miután nem hallotta, mit mond az étterem alkalmazottja, és ismét követte a kérését.

„Nem próbálunk becsapni vagy megszemélyesíteni, de ha visszatérünk annak a fájdalmas korai rendszernek a felvételéhez, nem hangzott túl természetesnek, nem hangzott túl emberileg” – mondta Huffman. „De ennek következtében az asszisztens nem volt túl sikeres a feladatok elvégzésében. Sokan leteszik a telefont, vagy összezavarodtak attól, hogy miről beszélnek, a beszélgetés egyszerűen megszakadt, mert nem volt természetes.”

Huffman szerint beszédzavarok vannak nyelvészek, kulcsfontosságú részei annak, hogy két ember között folytassuk az emberi beszélgetést. Az Asszisztenssel folytatott beszélgetések során könnyen belátható, hogy ez mennyire jól működik, és az eredmények messze eltérnek az eredeti felvételtől.

A beszédzavarok egyik módja a társalgási nyugtázás, például amikor egy személy beszél, de te akarsz győződjön meg róla, hogy a vevő tudja, hogy még mindig elkötelezett és hallgat, például amikor a Segéd azt mondta nekünk, hogy „mhmm”, amikor arra kérték tart.

A google duplex kézben tartja az io2018 2835-öt
A google duplex kézben tartja az io2018 2836-ot

Egy másik hasznos eszköz a „hm” mondás, amikor bizonytalanság van, udvarias módja annak, hogy felvilágosítást kérjünk. Az asszisztens egy „hm” szót adott hozzá, miután nem hallotta, mit mond az étterem alkalmazottja, és ismét követte a kérését.

Az ezekkel a beszédzavarokkal küzdő Asszisztens éles ellentétben áll az eredeti, robotizált Asszisztenssel. Sokkal kevésbé hideg van, és a beszélgetés sokkal gyorsabban zajlott. Ahelyett, hogy egyszerű parancsokat fogadna el, az Asszisztens valójában a nyelvünkön keresztül kommunikál az emberekkel, ami bizonyosan izgat egyeseket, míg másokat megijeszt.

Kényelem

A duplex a kényelemről szól. Ezzel egy kis időt takaríthat meg, pontosabb nyitvatartást adhat a boltoknak, és időt takaríthat meg a vállalkozások számára. A Google azt is elmondta, hogy itt nagy lehetőség kínálkozik arra, hogy segítsen azoknak, akik nem tudnak beszélni, vagy akiknek beszédproblémája van.

Huffman azt mondta, hogy a Duplexre úgy gondoljon, mint a múltból származó automatizált hanggépek evolúciójára, mint pl amikor felhívta a bankot, amikor lassú volt a számok lenyomása, hogy jobbra jusson osztály.

„Ma, ha felhívja azokat a légitársaságokat vagy bankokat, valami sokkal, de sokkal szebbet kap” – mondta. „Sokkal természetesebb hangot fog hallani, és valami ilyesmit fog hallani: „Csak mondd meg, mire van szükséged, mondhatsz olyanokat, mint: hány óra a repülésem?” Duplex, valójában csak egy lépéssel továbbvisszük ugyanezt az ötletet, továbbfejlesztjük a beszélgetést, és természetesebbé tesszük, hogy az sikeresebb legyen a felhasználók és vállalkozások.”

Az eddig látottak alapján ígéretes technológia, de érdemes-e elfogadnunk, vagy félnünk kell tőle?

A Google nem mutatta be nekünk, hogy a Duplex hogyan hívja fel a vállalkozásokat az üzletek nyitvatartási idejében, és nem mutatta be a hajvágási időpontok ütemezését sem – így nem tudunk nyilatkozni arról, hogy a Duplex milyen jól működne ezekben az esetekben. Abban sem vagyunk biztosak, hogy az emberi szolgáltatók hozzáférhetnek-e telefonszámához és teljes nevéhez, mivel ez egy kis adatvédelmi kockázatot jelent. Arra is kíváncsiak vagyunk, hogy a Duplex a jövőben több nyelvet is támogatna-e. Megkerestük a Google-t, hogy ellenőrizzünk néhány megválaszolatlan kérdést, de természetesen a technológia fejlődésével egyre több lesz.

Az eddig látottak alapján ígéretes technológia, de érdemes-e elfogadnunk, vagy félnünk kell tőle? Örülünk, ha soha többé nem kell órákig tartóztatni minket, de itt fontos figyelembe venni a pályát. Folyamatosan egy olyan jövő felé haladunk, ahol nem kell beszélnünk senkivel, ahol elzártan élhetsz egy lakásban, ételt szállítanak neked; drónok által leadott csomagok, és több ezer órányi média fogyasztható anélkül, hogy ki kellene lépnie a szabadba.

Míg a Duplex a hétköznapibb telefonhívásokkal kezdődik, a mesterséges intelligencia egyre jobb lesz a beszélgetésekben, így könnyen áthelyezhető más iparágakra. Rajtunk, mint társadalomon múlik majd eldönteni, hogy a beszédünk mennyit folyjon mesterséges intelligencia segítségével, és hogy érdemes-e újra felvenni a telefont.

Szerkesztői ajánlások

  • Kipróbáltam magam egy 14,5 hüvelykes táblagéppel – és nem ment túl jól
  • Nagyon szeretem a Pixel 7a-t, de van egy nagy probléma, amelyet nem hagyhatok figyelmen kívül
  • Szeretném szeretni a Pixel 7-et és a Pixel 7 Pro-t, de a Google nem engedi
  • Itt van minden, amit a Google nem jelentett be a Pixel Fall Launch eseményen
  • Minden, amit a Google nem jelentett be a 2021-es Google I/O rendezvényen