Abbiamo testato Google Duplex, l'intelligenza artificiale per le telefonate in arrivo quest'estate

Mentre lavoravo alla reception di un ristorante tailandese di New York, ho preso il telefono, ho preso una prenotazione e ho riattaccato. Surreale è stata la prima parola che mi è venuta in mente dopo, non perché fingessi di lavorare ad un ristorante, ma con cui ho appena parlato e ho prenotato un tavolo da Google, artificialmente intelligente Assistente.

Contenuti

  • Cos'è Duplex e dove funzionerà?
  • La dimostrazione
  • Come funziona il duplex
  • Gli “um” e gli “ah”
  • Convenienza

Non riuscivo a scacciare il pensiero che la voce dall'altra parte non fosse un essere vivente, anche se si trattava di una conversazione di soli due minuti. Questo non vuol dire che l'Assistente non sia stato convincente; se non me lo avesse detto (e se non fossi stato in un ambiente demo), non avrei pensato molto allo scambio con quello che sembrava un altro essere umano dall'altra parte.

Video consigliati

Lo scambio di robot che ho avuto faceva parte di una dimostrazione per la stampa tenutasi La tecnologia Duplex di Google, annunciato per la prima volta all'I/O dell'azienda

conferenza degli sviluppatori a maggio. Consente alle persone di prenotare un tavolo in un ristorante, fissare un appuntamento per il taglio dei capelli e scoprire gli orari del negozio Assistente Google. IL assistente vocale chiamerà il ristorante o il negozio dopo aver effettuato una richiesta dal telefono o dall'altoparlante intelligente con l'assistente abilitato, ad esempio a Google Home - e pochi minuti dopo riceverai una notifica che conferma che i tuoi piani sono ufficialmente prenotati (o se non è stato possibile completare la chiamata).

Imparentato

  • Ho inserito Dynamic Island dell'iPhone sul mio Pixel 7 Pro e non posso tornare indietro
  • Ho dato una seconda possibilità a Pixel 7 Pro: non è andata come speravo
  • La fotocamera Pixel 6 Pro di Google può battere il Samsung Galaxy S21 Ultra? ho scoperto
Google Duplex su un telefono Android
Julian Chokkattu/Tendenze digitali

La demo all'I/O è stata sbalorditiva, ma non è stata priva di controversie. Sono state sollevate preoccupazioni: perché l’intelligenza artificiale aveva bisogno di sembrare così realistica e perché non annunciava un disclaimer al chiamante umano, equivalente a quello che alcuni consideravano un inganno. E poiché la chiamata è stata registrata, alcuni si sono chiesti se la tecnologia avrebbe violato alcune leggi che regolano le telefonate.

Da quel momento Google ha chiarito la sua posizione e ora abbiamo alcune risposte. Digital Trends ha trascorso del tempo con il team dietro Duplex e abbiamo dimostrato la tecnologia per noi stessi. Ma prima di immergerci nella nostra esperienza, diamo un’occhiata ai nuovi dettagli che non abbiamo scoperto su come e dove funzionerà Duplex.

Cos'è Duplex e dove funzionerà?

Duplex è una tecnologia in fase di sviluppo che consente all'Assistente Google di effettuare chiamate telefoniche sull'utente nome, e deriva da anni di ricerca e lavoro sull'intelligenza artificiale per il linguaggio naturale in lavorazione.

"Ora possiamo comprendere il linguaggio naturale e possiamo generare un linguaggio naturale", ha affermato Nick Fox, vicepresidente del Product Management di Google. "Tali tecnologie vengono applicate con Duplex per avere una conversazione naturale e coinvolgente che si adatta a ciò che accade all'interno della conversazione, in definitiva con l'obiettivo di portare a termine le cose."

Google Duplex fissa un appuntamento dal parrucchiereGoogle

Aiutarti a fare le cose è l'obiettivo di Google per Assistant e con Duplex l'azienda sta iniziando tre compiti specifici: prenotare un tavolo in un ristorante, trovare gli orari del negozio e programmare un parrucchiere appuntamento. Duplex non può fare altro che questo al momento, quindi se una query non è pertinente (ad esempio, chiedere informazioni sul tempo o sui risultati sportivi) l'assistente non capirà. Allo stesso modo, un utente non può chiedere all'Assistente di effettuare chiamate non correlate alle attività sopra menzionate.

Ha il potenziale per far risparmiare molto tempo ai dipendenti bloccati a rispondere alle chiamate sugli orari di negozio.

Per l'utente, il fatto che l'Assistente effettui queste chiamate fa risparmiare un po' di tempo, ma avvantaggia anche le aziende che ricevono queste chiamate. Ad esempio, se un chiamante chiede all'assistente gli orari festivi di un negozio locale, l'assistente effettuerà la chiamata, riceverà la risposta e gli orari verranno aggiunti a Google Maps e Ricerca Google affinché tutti possano vederli, con un tag verificato accanto.

Con queste informazioni, se altri chiamanti volessero conoscere le stesse informazioni, l'Assistente dovrebbe solo estrarle dai server di Google e non effettuare un'altra chiamata. Basta una sola persona per chiedere all'Assistente, ma ha il potenziale per far risparmiare molto tempo ai dipendenti che altrimenti sarebbero costretti a rispondere alle chiamate sugli orari di negozio.

Durante la fase di test di Google questa estate, Duplex funzionerà solo con aziende e utenti selezionati Stati Uniti e sarà disponibile solo presso ristoranti e parrucchieri che non dispongono di una prenotazione online sistema. Già l'Assistente Google funziona con OpenTable, quindi non è necessario chiamare i ristoranti che utilizzano il servizio di prenotazione.

Google testerà prima le chiamate per l'orario lavorativo nelle prossime settimane e, più tardi quest'estate, il test si espanderà alle chiamate per prenotazioni e agli appuntamenti per il taglio dei capelli. Ci saranno molti test e modifiche durante questo periodo, quindi il risultato finale di Duplex potrebbe apparire leggermente diverso da quello che abbiamo già visto. Le aziende potranno rinunciare se non desiderano ricevere chiamate dall'Assistente Google.

Google

“Quello che stai vedendo è una tecnologia che è nelle sue fasi iniziali”, ha detto Fox. "Vogliamo parlarne pubblicamente anche in questa fase per essere sicuri di farlo bene, ma qui stai vedendo qualcosa abbastanza presto nel processo."

La dimostrazione

L'esperienza demo, che ha avuto luogo presso Il tailandese nel quartiere dell'Upper East Side di New York City, era pesantemente controllato. Innanzitutto, Google ha organizzato una presentazione che mostrava il processo complessivo per effettuare e terminare una chiamata, ma utilizzando effettivamente la tecnologia in tempo reale. Un ingegnere ha fornito a Duplex l'orario e le dimensioni del gruppo che abbiamo suggerito per la prenotazione, ed ecco cosa è seguito.

L'idea è che lo diresti all'Assistente Google sul tuo telefono o Google Home che vuoi “prenotare un tavolo al Thep Thai per due alle 20:00”. Domani." L'assistente chiederà se è possibile prenotare un orario dalle 20:00 alle 20:00. alle 21:00 nel caso in cui non ci fosse un tavolo disponibile alle 20:00, e dopo la tua conferma, ti dirà che chiamerà il ristorante e ti ricontatterà Presto.

Quando il dipendente del ristorante prende il telefono, l'assistente dirà quanto segue, o qualcosa di simile: "Ciao, sto chiamando per effettuare una prenotazione. Sono il servizio di prenotazione automatizzata di Google, quindi registrerò la chiamata. Posso prenotare un tavolo per giovedì?"

La chiamata viene registrata in modo che gli operatori umani di Google possano riascoltare la registrazione, annotare la conversazione ed evidenziare eventuali errori commessi da Duplex in modo da poter migliorare il servizio.

Portare Duplex al livello in cui si trova ora è iniziato con molto lavoro manuale e umano.

L'assistente continua a rispondere a ogni domanda posta, ad esempio a che ora è la prenotazione e quante le persone sono presenti nel gruppo e il nome per la prenotazione — e la conversazione è educata e tempestiva finisce. Se vengono richieste informazioni come l'indirizzo email di un utente, l'Assistente dirà che non è autorizzato a fornire tali informazioni.

La persona che ha effettuato la prenotazione tramite l'Assistente riceverà ora una notifica che informa che il tavolo è stato prenotato e verrà automaticamente aggiunta a Google Calendar. Prima della prenotazione, l'utente riceverà una notifica e la possibilità di annullare l'appuntamento nel caso in cui non possa più parteciparvi. Il proprietario del ristorante Thep Thai ha detto che molte persone effettuano prenotazioni e poi non si presentano. Spera che questo sistema, che offre un modo semplice per cancellare una prenotazione, significherà meno tavoli vuoti.

Dopo la demo principale, Google ci ha permesso di provarlo. Quando abbiamo risposto alla chiamata, abbiamo provato a far inciampare Duplex e abbiamo introdotto alcune complicazioni, ma l'Assistente le ha gestite bene. Gli abbiamo chiesto di restare all'inizio della conversazione, alla quale ha risposto "mhmm" anziché un "sì" verbale. Quando l'abbiamo detto alle 6 p.m. il tempo di prenotazione era esaurito, l'Assistente ha risposto con un intervallo compreso tra le 18:00 e le 18:00. e le 20:00, e si è deciso per le 19:45. raccomandazione. Abbiamo quindi chiesto un nome e un numero di telefono per la prenotazione e se l'Assistente potesse scrivere il nome, cosa che ha fatto con successo.

Google Duplex pianifica la prenotazione di un ristoranteGoogle

È impressionante il modo in cui Assistant ha gestito le sue demo in modo coerente, anche se abbiamo riscontrato un momento in cui ha dovuto ricorrere a un operatore umano. È stato quando qualcuno ha chiesto se il cliente dell'Assistente era d'accordo nel ricevere e-mail dal ristorante. La frase era un po' imbarazzante e l'Assistente ha risposto: "Mi dispiace, penso di essermi confuso" e ha detto che stava mettendo in linea un supervisore. L'operatore umano ha preso rapidamente il comando, ha detto al chiamante che non poteva rivelare l'indirizzo e-mail e ha terminato la prenotazione.

Come funziona il duplex

Le prime versioni di prova di Duplex, che Google ha giocato per noi, sembravano incredibilmente robotiche. Tuttavia, l'Assistente è stato comunque in grado di comprendere le pause nella conversazione e persino di dire "ciao?" quando un impiegato del ristorante fece una pausa per alcuni secondi. Tuttavia, Scott Huffman, vicepresidente di Engineering per Google Assistant, ha affermato che è “doloroso ascoltarlo”.

Se il sistema davvero non sa cosa fare dopo, si ritirerà con grazia dalla chiamata e un operatore umano prenderà il sopravvento.

Portare Duplex al livello in cui si trova ora è iniziato con molto lavoro manuale e umano. Gli operatori umani hanno effettuato chiamate ai ristoranti, annotato le conversazioni e inserito i risultati in Duplex. Il team collegherebbe frasi come “quante persone” e le sue varianti a “numero di persone nel gruppo”, consentendo a Duplex di comprendere la domanda.

La seconda fase prevedeva che gli operatori umani ascoltassero le chiamate effettuate dall'Assistente e, se le cose andavano fuori strada, l'operatore interveniva per prendere il controllo e assicurarsi che la chiamata andasse a buon fine. Ciò ha consentito al team di identificare gli aspetti critici del servizio, annotare tali conversazioni e reinserirle negli algoritmi di apprendimento automatico in modo che Duplex potesse apprendere.

La fase finale del test è la modalità automatizzata, in cui il sistema automatizzato effettua le chiamate e le completa. Le porte di fuga integrate nel sistema consentono all'Assistente di tornare all'obiettivo principale del completamento dell'attività, grazie a frasi come "Non sono sicuro di quello che hai detto, ma posso prenotare un tavolo per tre?" Se il sistema davvero non sa cosa fare dopo, si ritirerà con garbo dalla conversazione e l’operatore umano prenderà il suo posto. Sopra.

Nota principale (Google I/O '18)

Al momento, Huffman ha affermato che circa quattro chiamate su cinque effettuate da Duplex non necessitano dell'assistenza di un operatore umano. È interessante notare che ha affermato che gli operatori umani non verranno allontanati dal servizio man mano che Duplex migliora, poiché Google li vede come parte integrante nel garantire che Duplex funzioni senza intoppi.

Gli “um” e gli “ah”

Durante tutto il processo di insegnamento dell'Assistente, Google ha posto l'accento sul renderlo più naturale e meno simile a un robot. Dopo la demo al Google I/O, i critici hanno chiesto perché Google stia cercando di mescolare "um e ah" per rendere l'Assistente sembra più umano, soprattutto se non aggiungeva una dichiarazione di non responsabilità all'inizio della chiamata che diceva che non era un essere umano. Ora ci sono delle dichiarazioni di non responsabilità, ma Huffman ha detto che le disfluenze del linguaggio come "um" o "mhm" sono state aggiunte per mantenere vivo il flusso della conversazione.

L'assistente ha aggiunto un "um" dopo che non è riuscito a sentire ciò che ha detto il dipendente del ristorante e ha risposto nuovamente alla sua richiesta.

"Non stiamo cercando di ingannare o impersonare, ma se torni a quella registrazione di quel doloroso sistema iniziale, non suonava molto naturale, non suonava molto umano", ha detto Huffman. “Ma di conseguenza, l’Assistente non è riuscito a completare i compiti. Molte persone riattaccavano o si confondevano su ciò con cui stavano parlando, la conversazione si interrompeva semplicemente perché non sembrava naturale.

Huffman ha detto disfluenze del linguaggio, secondo linguisti, sono una parte fondamentale per mantenere viva la conversazione umana tra due persone. È facile vedere come funziona bene quando si ascoltano le conversazioni con l'Assistente e i risultati sono lontani dalla registrazione originale.

Un modo in cui le disfluenze del linguaggio aiutano è il riconoscimento della conversazione, ad esempio quando una persona sta parlando, ma tu vuoi assicurati che il destinatario sappia che sei ancora impegnato e in ascolto, come quando l'assistente ci ha detto "mhmm" quando gli è stato chiesto di farlo Presa.

google duplex mette le mani su io2018 2835
google duplex mette le mani su io2018 2836

Un altro strumento utile è dire “um” quando c’è incertezza, come un modo educato per chiedere chiarimenti. L'assistente ha aggiunto un "um" dopo che non è riuscito a sentire ciò che ha detto il dipendente del ristorante e ha risposto nuovamente alla sua richiesta.

L'Assistente con queste disfluenze del linguaggio è in netto contrasto rispetto all'Assistente robotico originale. Fa molto meno freddo e la conversazione si è svolta molto più rapidamente. E invece di accettare semplici comandi, l'Assistente interagisce effettivamente con gli umani attraverso il nostro linguaggio, il che sicuramente entusiasmerà alcuni mentre spaventerà altri.

Convenienza

Il duplex è tutta una questione di comodità. Ti fa risparmiare un po' di tempo, può darti orari di negozio più accurati e può anche far risparmiare tempo alle aziende. Google ha anche affermato che qui c’è una grande opportunità per aiutare le persone che non possono parlare o hanno difficoltà a parlare.

Huffman ha detto di pensare a Duplex come a un'evoluzione delle macchine vocali automatizzate del passato, come ad esempio quando chiami la tua banca, quando era un processo lento premere i numeri per arrivare a destra Dipartimento.

“Oggi se chiami quelle compagnie aeree o quelle banche, otterrai qualcosa di molto, molto più carino”, ha detto. "Sentirai una voce dal suono molto più naturale e potrebbe dire qualcosa del tipo: 'Dimmi solo di cosa hai bisogno, puoi dire cose come, a che ora è il mio volo?' Duplex, stiamo semplicemente portando la stessa idea un ulteriore passo avanti, evolvendo la conversazione e rendendola più naturale in modo che abbia più successo per gli utenti e imprese”.

Da quello che abbiamo visto finora, è una tecnologia promettente, ma è qualcosa che dovremmo abbracciare o temere?

Google non ci ha mostrato come Duplex effettua chiamate alle aziende durante gli orari di negozio, né ha dimostrato la pianificazione degli appuntamenti per il taglio dei capelli, quindi non possiamo commentare come funzionerebbe Duplex in questi casi. Inoltre, non siamo sicuri che gli operatori umani avranno accesso al tuo numero di telefono e al tuo nome completo, poiché ciò rappresenta un rischio per la privacy. Ci chiediamo anche se Duplex supporterà più lingue in futuro. Abbiamo contattato Google per verificare alcune domande senza risposta, ma ovviamente ce ne saranno sicuramente altre man mano che la tecnologia avanza.

Da quello che abbiamo visto finora, è una tecnologia promettente, ma è qualcosa che dovremmo abbracciare o temere? Saremo felici se non dovessimo mai più essere messi in attesa per ore di seguito, ma è importante considerare la traiettoria qui. Ci muoviamo costantemente verso un futuro in cui non abbiamo bisogno di parlare con nessuno, dove puoi vivere isolato in un appartamento, con il cibo che ti viene consegnato; pacchi consegnati dai droni e migliaia di ore di contenuti multimediali da consumare senza dover mai uscire.

Sebbene Duplex possa iniziare con alcune delle telefonate più banali, l'intelligenza artificiale migliorerà nelle conversazioni, facilitandone il trasferimento in altri settori. Spetterà a noi come società decidere quanto del nostro parlare dovrebbe essere fatto attraverso l’intelligenza artificiale e se vale la pena prendere di nuovo in mano il telefono.

Raccomandazioni degli editori

  • Mi sono costretto a provare un tablet da 14,5 pollici e non è andata molto bene
  • Mi piace molto il Pixel 7a, ma c'è un grosso problema che non posso ignorare
  • Voglio amare Pixel 7 e Pixel 7 Pro, ma Google non me lo permette
  • Ecco tutto ciò che Google non ha annunciato all'evento Pixel Fall Launch
  • Tutto ciò che Google non ha annunciato al Google I/O 2021