Preizkusili smo Google Duplex, umetno inteligenco za telefoniranje, ki bo na voljo to poletje

click fraud protection

Ko sem delal na recepciji tajske restavracije v New Yorku, sem dvignil slušalko, vzel rezervacijo in odložil slušalko. Nadrealno je bila prva beseda, ki mi je pozneje prišla na misel, ne zato, ker sem se pretvarjal, da delam pri restavracijo, ampak da sem pravkar govoril in rezerviral mizo pri umetno inteligentnem Googlu Pomočnik.

Vsebina

  • Kaj je Duplex in kje bo deloval?
  • Demo
  • Kako deluje Duplex
  • "ums" in "ahs"
  • Udobje

Nisem se mogla otresti misli, da glas na drugi strani ni živo bitje, četudi je šlo le za dvominutni pogovor. To ne pomeni, da pomočnik ni bil prepričljiv; če mi ne bi povedal (in če ne bi bil v demo okolju), ne bi veliko razmišljal o izmenjavi z nečim, kar je zvenelo kot drug človek na drugi strani.

Priporočeni videoposnetki

Izmenjava robotov, ki sem jo imel, je bila del predstavitve za javnost Googlova tehnologija Duplex, ki je bil prvič objavljen na I/O podjetja maja na konferenci za razvijalce. Ljudem omogoča, da rezervirajo mizo v restavraciji, načrtujejo termin za striženje in izvejo delovni čas trgovine

Google Assistant. The glasovni pomočnik bo poklical restavracijo ali trgovino – potem ko boste iz telefona ali pametnega zvočnika, ki podpira pomočnika, dali zahtevo, kot Googlova domača stran — in nekaj minut kasneje boste prejeli obvestilo, ki potrjuje, da so vaši načrti uradno rezervirani (ali če klica ni bilo mogoče dokončati).

Povezano

  • Na svoj Pixel 7 Pro sem namestil iPhonov Dynamic Island — in ne morem nazaj
  • Pixel 7 Pro sem dal drugo priložnost – ni šlo, kot sem upal
  • Ali lahko Googlova kamera Pixel 6 Pro premaga Samsung Galaxy S21 Ultra? ugotovil sem
Google Duplex na telefonu Android
Julian Chokkattu/Digitalni trendi

Predstavitev na I/O je bila osupljiva, vendar ni bila brez polemik. Izraženi so bili pomisleki: zakaj je morala umetna inteligenca zveneti tako resnično in zakaj klicatelju ni objavila izjave o zavrnitvi odgovornosti, kar je po mnenju nekaterih zavajanje. In ker je bil klic posnet, so se nekateri spraševali, ali bi tehnologija kršila nekatere zakone, ki urejajo telefonske klice.

Od takrat je Google pojasnil svoje stališče in zdaj imamo nekaj odgovorov. Digital Trends je preživel nekaj časa z ekipo zadaj Duplex in sami predstavili tehnologijo. Toda preden se poglobimo v naše izkušnje, si poglejmo nove podrobnosti, ki jih nismo odkrili o tem, kako in kje bo Duplex deloval.

Kaj je Duplex in kje bo deloval?

Duplex je tehnologija v razvoju, ki omogoča Googlovemu pomočniku telefoniranje uporabnikovih in izhaja iz dolgoletnih raziskav in dela na področju umetne inteligence za naravni jezik obravnavati.

"Zdaj lahko razumemo naravni govor in lahko ustvarimo naravni govor," je dejal Nick Fox, podpredsednik oddelka za upravljanje izdelkov pri Googlu. "Te tehnologije se uporabljajo z Duplexom za naraven, privlačen pogovor, ki se prilagaja dogajanju v pogovoru, na koncu s ciljem, da se stvari opravijo."

Google Duplex naročanje frizerskega terminaGoogle

Googlov cilj za pomočnika je, da vam pomaga pri opravljanju stvari, in podjetje začenja z Duplexom tri specifične naloge: rezervacija mize v restavraciji, iskanje delovnega časa trgovine in načrtovanje frizerskega salona imenovanje. Duplex trenutno ne more storiti ničesar več od tega, zato pomočnik ne bo razumel, če poizvedba ni ustrezna (na primer spraševanje o vremenu ali športnih rezultatih). Podobno uporabnik od Pomočnika ne more zahtevati klicev, ki niso povezani s prej omenjenimi opravili.

Lahko prihrani veliko časa zaposlenim, ki obtičijo pri odgovarjanju na klice glede delovnega časa trgovine.

Uporabnik s tem, da Pomočnik opravlja te klice, sprosti nekaj časa, koristi pa tudi podjetjem, ki sprejemajo te klice. Na primer, če klicatelj vpraša Pomočnika za praznični delovni čas lokalne trgovine, bo Pomočnik opravil klic, prejel odgovor in delovni čas bo dodan v Google zemljevidi in Google Iskanje za vse, s preverjeno oznako zraven.

S temi informacijami bi jih moral Pomočnik, če želijo drugi klicatelji izvedeti iste informacije, le potegniti iz Googlovih strežnikov in ne opraviti drugega klica. Potrebuje le eno osebo, da vpraša Pomočnika, vendar lahko prihrani veliko časa zaposlenim, ki bi sicer obtičali pri odgovarjanju na klice o delovnem času trgovine.

Med Googlovo testno fazo to poletje bo Duplex deloval samo z izbranimi podjetji in uporabniki v ZDA, na voljo pa bo le v restavracijah in frizerskih salonih, ki nimajo spletne rezervacije sistem. Google Assistant že deluje z OpenTable, zato mu ni treba klicati restavracij, ki uporabljajo storitev rezervacije.

Google bo v naslednjih nekaj tednih najprej testiral klice za delovni čas, kasneje to poletje pa se bo test razširil na klice za rezervacije in termine za striženje. V tem obdobju bo veliko testiranja in prilagajanja, zato bo končni rezultat Duplexa morda nekoliko drugačen od tistega, kar smo že videli. Podjetja se bodo lahko odjavila, če ne bodo želela prejemati klicev Googlovega pomočnika.

Google

"To, kar vidite, je tehnologija, ki je v zelo zgodnji fazi," je dejal Fox. "Želimo javno govoriti o tem celo na tej stopnji, da se prepričamo, da je vse pravilno, vendar tukaj vidite nekaj precej zgodaj v procesu."

Demo

Demo izkušnja, ki je potekala ob Thep Thai v soseski Upper East Side v New Yorku, je bil močno nadzorovan. Najprej je Google pripravil predstavitev, ki prikazuje celoten postopek vzpostavljanja in zaključevanja klica, vendar dejansko uporabo tehnologije v realnem času. Inženir je Duplexu posredoval čas in velikost zabave, ki smo ju predlagali za rezervacijo, in to je, kar je sledilo.

Ideja je, da bi Googlovemu pomočniku v telefonu povedali oz Googlova domača stran da želite »rezervirati mizo v Thep Thai za dve osebi ob 20. uri. jutri.” Pomočnik bo vprašal, ali lahko rezervirate čas od 20. ure dalje. do 21. ure v primeru, da ob 20. uri ni proste mize, in ko potrdite, bo sporočilo, da bo poklicalo restavracijo in vam odgovorilo kmalu.

Ko uslužbenec restavracije dvigne slušalko, bo pomočnik rekel naslednje ali nekaj podobnega: »Živjo, kličem, da naredim rezervacijo. Sem Googlova storitev za samodejno rezervacijo, zato bom posnel klic. Ali lahko rezerviram mizo za četrtek?«

Klic se snema, tako da lahko človeški operaterji pri Googlu poslušajo posnetek, komentirajo pogovor in poudarijo vse napake, ki jih je naredil Duplex, da lahko izboljša storitev.

Spraviti Duplex na raven, na kateri je zdaj, se je začelo z veliko ročnega in človeškega dela.

Pomočnik nato odgovori na vsako zastavljeno vprašanje - na primer, za kateri čas je rezervacija, koliko ljudje so na zabavi in ​​ime za rezervacijo — in pogovor vljudno in hitro konča. Če se od njega zahteva podatek, kot je e-poštni naslov uporabnika, bo pomočnik rekel, da nima dovoljenja za posredovanje teh podatkov.

Oseba, ki je rezervirala rezervacijo prek pomočnika, bo zdaj prejela obvestilo, da je miza rezervirana, in bo samodejno dodana v Google Koledar. Uporabnica bo pred rezervacijo prejela obvestilo in možnost odpovedi termina v primeru, da nanj ne more več priti. Lastnik restavracije Thep Thai je rekel, da veliko ljudi naredi rezervacije in se potem ne prikažejo. Upa, da bo ta sistem, ki omogoča enostaven način preklica rezervacije, pomenil manj praznih miz.

Po glavni predstavitvi nam je Google dovolil, da ga preizkusimo. Ko smo sprejeli klic, smo poskušali sprožiti Duplex in povzročili nekaj zapletov, vendar jih je pomočnik dobro rešil. Na začetku pogovora smo ga prosili, naj zadrži - na kar je odgovoril "mhmm" in ne z besednim "da". Ko smo povedali 6 popoldne čas za rezervacijo je bil poln, pomočnik je odgovoril z razponom med 18. uro. in 20. uri, pri nas pa se je ustalila 19.45. priporočilo. Nato smo prosili za ime in telefonsko številko za rezervacijo ter ali lahko pomočnik črkuje ime, kar je uspešno storil.

Google Duplex načrtuje rezervacijo restavracijeGoogle

Impresivno je, kako dosledno dobro je Assistant obravnaval svoje predstavitve, čeprav smo naleteli na trenutek, ko se je moral vrniti k človeškemu operaterju. Bilo je takrat, ko je nekdo vprašal, ali se stranka pomočnika strinja s prejemanjem e-poštnih sporočil iz restavracije. Besedilo je bilo nekoliko nerodno in pomočnik se je odzval z: »Oprosti, mislim, da sem se zmedel,« in pisalo je, da postavlja nadzornika na linijo. Človeški operater je hitro prevzel, klicatelju povedal, da ne more razkriti e-poštnega naslova, in končal rezervacijo.

Kako deluje Duplex

Zgodnje testne različice Duplexa, ki nam jih je predvajal Google, so zvenele neverjetno robotsko. Vendar pa je pomočnik še vedno lahko razumel premore v pogovoru in celo rekel »zdravo?« ko se je uslužbenec restavracije za nekaj sekund ustavil. Kljub temu je Scott Huffman, podpredsednik inženiringa za Google Assistant, dejal, da je "boleče to poslušati."

Če sistem res ne ve, kaj storiti naprej, se bo elegantno uklonil klicu in človeški operater bo prevzel.

Spraviti Duplex na raven, na kateri je zdaj, se je začelo z veliko ročnega in človeškega dela. Človeški operaterji so klicali restavracije, komentirali pogovore in vnašali rezultate v Duplex. Ekipa bi besedne zveze, kot je "koliko ljudi" in njegove različice, povezala s "številom ljudi v zabavi", kar bi Duplexu omogočilo, da razume vprašanje.

Druga stopnja je vključevala človeške operaterje, ki so poslušali klice, ki jih je opravil pomočnik, in če stvari zaidejo iz tira, je operater vskočil, da bi prevzel in poskrbel, da je klic uspešen. To je ekipi omogočilo, da je prepoznala grobe robove storitve, komentirala te pogovore in jih vnesla nazaj v algoritme strojnega učenja, da se je Duplex lahko učil.

Končna faza testiranja je avtomatiziran način, kjer avtomatizirani sistem opravi klice in jih zaključi. Zaščitne lopute, vgrajene v sistem, omogočajo Pomočniku, da skoči nazaj na ključni cilj dokončanja naloge, zahvaljujoč stavkom, kot so: »Nisem prepričan, kaj ste rekli, a lahko rezerviram mizo za tri.” Če sistem res ne ve, kaj naj naredi naprej, se bo elegantno uklonil pogovoru in človeški operater bo ukrepal čez.

Keynote (Google I/O '18)

Huffman trenutno pravi, da približno štirje od petih klicev, ki jih opravi Duplex, ne potrebujejo pomoči človeškega operaterja. Zanimivo je, da je dejal, da človeški operaterji ne bodo umaknjeni iz storitve, ko bo Duplex boljši, saj jih Google vidi kot sestavni del zagotavljanja brezhibnega delovanja Duplexa.

"ums" in "ahs"

Skozi celoten proces poučevanja Assistant-a je Google poudarjal, da bo zvenel bolj naravno in manj kot robot. Po predstavitvi na Google I/O so kritiki spraševali, zakaj Google poskuša mešati "ums in ahs", da bi ustvaril pomočnika zveni bolj človeško, še posebej, če na začetku klica ni dodal izjave o omejitvi odgovornosti, da ni človek. Zdaj obstajajo izjave o zavrnitvi odgovornosti, vendar je Huffman dejal, da so bile dodane govorne motnje, kot sta »hm« ali »mhm«, da bi ohranili tok pogovora.

Pomočnik je dodal »hm«, potem ko ni mogel slišati, kaj je rekel uslužbenec restavracije, in je znova nadaljeval z zahtevo.

"Ne poskušamo pretentati ali se predstavljati, a če se vrnete k tistemu posnetku tega bolečega zgodnjega sistema, ni zvenelo zelo naravno, ni zvenelo zelo človeško," je dejal Huffman. »Toda zaradi tega pomočnik ni bil zelo uspešen pri izpolnjevanju nalog. Veliko ljudi bi odložilo slušalko ali se zmedlo, s kom se pogovarjajo, pogovor bi se preprosto prekinil, ker se ni zdel naraven.«

Huffman je dejal, da govorne motnje, glede na jezikoslovci, so ključni del ohranjanja človeškega pogovora med dvema osebama. Preprosto je videti, kako dobro to deluje, ko poslušate pogovore s Pomočnikom, rezultati pa so daleč od izvirnega posnetka.

Eden od načinov za pomoč pri motnjah govora je pogovorna potrditev, na primer ko govori ena oseba, vendar želite poskrbite, da sprejemnik ve, da ste še vedno vključeni in poslušate, na primer, ko nam je Pomočnik rekel »mhmm«, ko je bil pozvan, naj drži.

google duplex uporablja io2018 2835
google duplex uporablja io2018 2836

Še eno uporabno orodje je reči »hm«, ko obstaja negotovost, kot vljuden način zaprositi za pojasnilo. Pomočnik je dodal »hm«, potem ko ni mogel slišati, kaj je rekel uslužbenec restavracije, in je znova nadaljeval z zahtevo.

Pomočnik s temi govornimi motnjami je oster kontrast v primerjavi s prvotnim, robotiziranim Pomočnikom. Precej manj je hladno in pogovor je potekal veliko hitreje. In namesto da sprejema preproste ukaze, Pomočnik dejansko komunicira z ljudmi prek našega jezika, kar bo nekatere zagotovo navdušilo, druge pa prestrašilo.

Udobje

Duplex je namenjen udobju. Prihrani vam malo časa, lahko vam zagotovi natančnejši delovni čas trgovin in lahko tudi podjetjem prihrani čas. Google je tudi dejal, da je tukaj velika priložnost za pomoč ljudem, ki ne morejo govoriti ali imajo težave z govorom.

Huffman je dejal, da je Duplex evolucija avtomatiziranih glasovnih naprav iz preteklosti, kot je npr. ko kličete svojo banko, ko je šlo za počasen postopek pritiskanja številk, da pridete na desno oddelek.

"Če danes pokličete te letalske družbe ali banke, boste dobili nekaj veliko, veliko lepšega," je dejal. »Slišali boste veliko bolj naraven glas in morda bo rekel nekaj takega: 'Samo povej mi, kaj potrebuješ, lahko rečeš stvari, kot je, kdaj je moj let?' Duplex, v resnici gremo to isto idejo korak naprej, razvijamo pogovor in ga naredimo bolj naravnega, tako da je uspešnejši za uporabnike in podjetja."

Glede na to, kar smo videli do zdaj, je to obetavna tehnologija, toda ali je to nekaj, kar bi morali sprejeti ali se bati?

Google nam ni pokazal, kako Duplex kliče podjetja za delovni čas trgovin, niti ni predstavil načrtovanja sestankov za striženje - zato ne moremo komentirati, kako dobro bi Duplex deloval v teh primerih. Prav tako nismo prepričani, ali bodo imeli operaterji dostop do vaše telefonske številke in polnega imena, saj to predstavlja majhno tveganje za zasebnost. Sprašujemo se tudi, ali bo Duplex v prihodnosti podpiral več jezikov. Obrnili smo se na Google, da bi preverili nekaj neodgovorjenih vprašanj, seveda pa jih bo z napredkom tehnologije zagotovo še več.

Glede na to, kar smo videli do zdaj, je to obetavna tehnologija, toda ali je to nekaj, kar bi morali sprejeti ali se bati? Veseli bomo, če nam nikoli več ne bo treba več ur na čakanju, vendar je tukaj pomembno upoštevati pot. Nenehno se bližamo prihodnosti, kjer se nam ni treba z nikomer pogovarjati, kjer lahko živiš izoliran v stanovanju, s hrano, ki ti jo dostavljajo; paketi, ki jih odložijo droni, in na tisoče ur medijev, ki jih je treba porabiti, ne da bi morali stopiti ven.

Medtem ko se Duplex morda začne z nekaterimi bolj vsakdanjimi telefonskimi klici, bo AI postal boljši pri pogovorih, kar bo olajšalo prenos v druge industrije. Na nas kot družbi je, da se odločimo, koliko našega govorjenja bo potekalo prek umetne inteligence in ali je vredno ponovno dvigniti telefon.

Priporočila urednikov

  • Prisilil sem se poskusiti 14,5-palčno tablico - in ni šlo najbolje
  • Pixel 7a mi je zelo všeč, vendar obstaja ena velika težava, ki je ne morem prezreti
  • Rad bi oboževal Pixel 7 in Pixel 7 Pro, vendar mi Google tega ne dovoli
  • Tukaj je vse, česar Google ni objavil na dogodku Pixel Fall Launch
  • Vse, česar Google ni objavil na Google I/O 2021