Als ich an der Rezeption eines thailändischen Restaurants in New York City arbeitete, nahm ich den Hörer ab, nahm eine Reservierung entgegen und legte auf. Surreal war das erste Wort, das mir danach in den Sinn kam, nicht weil ich vorgab, bei einem zu arbeiten Restaurant, aber ich habe gerade mit dem künstlich intelligenten Google gesprochen und einen Tisch reserviert Assistent.
Inhalt
- Was ist Duplex und wo wird es funktionieren?
- Die Demo
- So funktioniert Duplex
- Die „ums“ und „ahs“
- Bequemlichkeit
Ich wurde den Gedanken nicht los, dass die Stimme am anderen Ende kein Lebewesen war, auch wenn es sich nur um ein zweiminütiges Gespräch handelte. Das heißt nicht, dass der Assistent nicht überzeugt hat; Wenn es mir nichts gesagt hätte (und wenn ich nicht in einer Demo-Umgebung gewesen wäre), hätte ich nicht viel über den Austausch mit etwas nachgedacht, das sich wie ein anderer Mensch am anderen Ende anhörte.
Empfohlene Videos
Der Roboteraustausch, den ich hatte, war Teil einer Pressevorführung Googles Duplex-Technologie
, erstmals auf der I/O des Unternehmens angekündigt Entwicklerkonferenz im Mai. Damit können Menschen einen Tisch in einem Restaurant reservieren, einen Friseurtermin vereinbaren und die Öffnungszeiten der Filialen erfahren Google Assistant. Der Sprachassistent ruft das Restaurant oder Geschäft an – nachdem Sie über Ihr Telefon oder einen Assistant-fähigen intelligenten Lautsprecher eine Anfrage gestellt haben, z. B Google Home – und Minuten später erhalten Sie eine Benachrichtigung, die bestätigt, dass Ihre Pläne offiziell gebucht sind (oder ob der Anruf nicht abgeschlossen werden konnte).Verwandt
- Ich habe die Dynamic Island des iPhones auf meinem Pixel 7 Pro installiert – und ich kann nicht mehr zurück
- Ich habe dem Pixel 7 Pro eine zweite Chance gegeben – es lief nicht so, wie ich es mir erhofft hatte
- Kann Googles Pixel 6 Pro-Kamera das Samsung Galaxy S21 Ultra schlagen? ich fand heraus
Die Demo auf der I/O war umwerfend, verlief aber nicht ohne Kontroversen. Es wurden Bedenken geäußert: Warum musste die KI so lebensecht klingen und warum kündigte sie dem menschlichen Anrufer keinen Haftungsausschluss an, was für manche eine Täuschung darstellte? Und da der Anruf aufgezeichnet wurde, fragten sich einige, ob die Technologie gegen bestimmte Gesetze verstoßen würde, die Telefonanrufe regeln.
Seitdem hat Google seinen Standpunkt geklärt und wir haben nun einige Antworten. Digital Trends verbrachte einige Zeit mit dem Team dahinter Duplex und haben die Technologie selbst vorgeführt. Aber bevor wir uns mit unseren Erfahrungen befassen, werfen wir einen Blick auf die neuen Details, die wir darüber ermittelt haben, wie und wo Duplex funktionieren wird.
Was ist Duplex und wo wird es funktionieren?
Bei Duplex handelt es sich um eine in der Entwicklung befindliche Technologie, die es Google Assistant ermöglicht, Telefongespräche über das Mobiltelefon des Benutzers zu führen Auftrag, und es ist das Ergebnis jahrelanger Forschung und Arbeit im Bereich der künstlichen Intelligenz für natürliche Sprache wird bearbeitet.
„Wir können jetzt natürliche Sprache verstehen und natürliche Sprache erzeugen“, sagte Nick Fox, Vizepräsident für Produktmanagement bei Google. „Diese Technologien werden bei Duplex angewendet, um ein natürliches, ansprechendes Gespräch zu führen, das sich an das anpasst, was im Gespräch passiert, mit dem Ziel, letztendlich Dinge zu erledigen.“
Googles Ziel für Assistant ist es, Sie bei der Erledigung von Aufgaben zu unterstützen, und mit Duplex beginnt das Unternehmen damit drei spezifische Aufgaben: Einen Tisch in einem Restaurant reservieren, die Öffnungszeiten des Ladens ermitteln und einen Termin für einen Friseursalon vereinbaren Termin. Mehr kann Duplex im Moment nicht tun. Wenn also eine Anfrage nicht relevant ist (z. B. nach dem Wetter oder den Sportergebnissen), wird der Assistent sie nicht verstehen. Ebenso kann ein Benutzer Assistant nicht bitten, Anrufe zu tätigen, die nichts mit den oben genannten Aufgaben zu tun haben.
Es hat das Potenzial, den Mitarbeitern viel Zeit zu sparen, wenn sie Anrufe bezüglich der Ladenöffnungszeiten beantworten müssen.
Wenn der Assistent diese Anrufe tätigt, spart der Benutzer etwas Zeit, kommt aber auch den Unternehmen zugute, die diese Anrufe erhalten. Wenn ein Anrufer beispielsweise den Assistenten nach den Feiertagsöffnungszeiten eines örtlichen Geschäfts fragt, ruft der Assistent an, erhält die Antwort und die Öffnungszeiten werden hinzugefügt Google Maps und Google-Suche für alle sichtbar, mit einem verifizierten Tag daneben.
Wenn andere Anrufer mit diesen Informationen dieselben Informationen wissen möchten, müsste Assistant sie nur von den Google-Servern abrufen und keinen weiteren Anruf tätigen. Es ist nur eine einzige Person erforderlich, um den Assistenten zu fragen, aber es besteht das Potenzial, viel Zeit für Mitarbeiter zu sparen, die andernfalls Anrufe wegen der Öffnungszeiten im Laden beantworten müssten.
Während der Testphase von Google in diesem Sommer wird Duplex nur mit ausgewählten Unternehmen und Nutzern in der Region funktionieren USA, und es wird nur in Restaurants und Friseursalons verfügbar sein, die keine Online-Buchung haben System. Google Assistant bereits funktioniert mit OpenTableEs ist also nicht nötig, Restaurants anzurufen, die den Buchungsservice nutzen.
Google wird in den nächsten Wochen zunächst Anrufe zu Geschäftszeiten testen und später in diesem Sommer wird der Test auf Anrufe für Reservierungen und Friseurtermine ausgeweitet. In diesem Zeitraum wird es zahlreiche Tests und Optimierungen geben, sodass das Endergebnis von Duplex möglicherweise etwas anders aussieht als das, was wir bereits gesehen haben. Unternehmen können sich abmelden, wenn sie keine Anrufe vom Google Assistant erhalten möchten.
„Was Sie sehen, ist eine Technologie, die sich noch in einem sehr frühen Stadium befindet“, sagte Fox. „Wir möchten bereits jetzt öffentlich darüber sprechen, um sicherzustellen, dass wir es richtig machen, aber Sie sehen hier etwas ziemlich früh im Prozess.“
Die Demo
Das Demo-Erlebnis, das um stattfand Thep Thai im Stadtteil Upper East Side von New York City wurde stark kontrolliert. Zunächst stellte Google eine Präsentation vor, die den gesamten Prozess des Tätigens und Beendens eines Anrufs zeigte, wobei die Technologie tatsächlich in Echtzeit zum Einsatz kam. Ein Techniker gab Duplex eine Zeit und Gruppengröße, die wir für eine Buchung vorgeschlagen hatten, und hier ist, was folgte.
Die Idee ist, dass Sie es Google Assistant auf Ihrem Telefon mitteilen oder Google Home dass Sie „um 20 Uhr einen Tisch im Thep Thai für zwei Personen reservieren möchten“. morgen." Der Assistent wird Sie fragen, ob es in Ordnung ist, eine Zeit ab 20:00 Uhr zu buchen. bis 21 Uhr Für den Fall, dass um 20:00 Uhr kein Tisch frei ist, wird Ihnen nach Ihrer Bestätigung mitgeteilt, dass das Restaurant angerufen wird und sich bei Ihnen meldet bald.
Wenn der Restaurantmitarbeiter den Hörer abnimmt, sagt Assistant Folgendes oder etwas Ähnliches: „Hallo, ich rufe an, um eine Reservierung vorzunehmen. Ich bin der automatische Buchungsdienst von Google und zeichne den Anruf daher auf. Kann ich einen Tisch für Donnerstag reservieren?“
Der Anruf wird aufgezeichnet, damit menschliche Mitarbeiter bei Google die Aufzeichnung anhören, das Gespräch kommentieren und alle von Duplex gemachten Fehler hervorheben können, um den Service zu verbessern.
Duplex auf das Niveau zu bringen, auf dem es jetzt ist, hat mit viel manueller und menschlicher Arbeit begonnen.
Anschließend antwortet der Assistent auf jede gestellte Frage – etwa für welche Uhrzeit und für wie viele Personen die Reservierung gilt Die Leute sind in der Gruppe und der Name für die Reservierung – und das Gespräch höflich und zeitnah endet. Wenn nach Informationen wie der E-Mail-Adresse eines Benutzers gefragt wird, gibt der Assistent an, dass er nicht berechtigt ist, diese Informationen bereitzustellen.
Die Person, die die Reservierung über Assistant vorgenommen hat, erhält nun eine Benachrichtigung, dass der Tisch reserviert wurde, und dieser wird automatisch zu Google Kalender hinzugefügt. Vor der Reservierung erhält der Nutzer eine Benachrichtigung und die Möglichkeit, den Termin abzusagen, falls er diesen nicht mehr wahrnehmen kann. Der Restaurantbesitzer von Thep Thai sagte, dass viele Leute Reservierungen vornehmen und dann nicht erscheinen. Er hofft, dass dieses System, das eine einfache Möglichkeit bietet, eine Buchung zu stornieren, zu weniger leeren Tischen führen wird.
Nach der Hauptdemo erlaubte uns Google, es auszuprobieren. Als wir den Anruf entgegennahmen, versuchten wir, Duplex zum Stolpern zu bringen, und brachten einige Komplikationen mit sich, aber Assistant hat damit gut umgegangen. Wir haben es zu Beginn des Gesprächs gebeten, zu warten – worauf es mit „mhmm“ und nicht mit einem verbalem „Ja“ geantwortet hat. Als wir es am 6. erzählten Uhr Die Buchungszeit war voll, der Assistent antwortete mit einer Zeitspanne zwischen 18:00 und 17:00 Uhr. und 20:00 Uhr, und es war 19:45 Uhr. Empfehlung. Wir fragten dann nach einem Namen und einer Telefonnummer für die Reservierung und fragten, ob der Assistent den Namen buchstabieren könne, was ihm auch gelang.
Es ist beeindruckend, wie konstant gut Assistant seine Demos bewältigte, obwohl wir einen Moment erlebten, in dem er auf einen menschlichen Bediener zurückgreifen musste. Es geschah, als jemand fragte, ob der Kunde des Assistenten damit einverstanden sei, E-Mails vom Restaurant zu erhalten. Die Formulierung war etwas umständlich, und der Assistent antwortete mit „Es tut mir leid, ich glaube, ich war verwirrt“ und sagte, es sei ein Vorgesetzter am Telefon. Der menschliche Operator übernahm schnell die Leitung, teilte dem Anrufer mit, dass er die E-Mail-Adresse nicht preisgeben dürfe, und schloss die Reservierung ab.
So funktioniert Duplex
Frühe Testversionen von Duplex, die Google für uns spielte, klangen unglaublich roboterhaft. Allerdings war der Assistent immer noch in der Lage, Gesprächspausen zu verstehen und sogar „Hallo?“ zu sagen. als ein Restaurantmitarbeiter einige Sekunden innehielt. Dennoch sagte Scott Huffman, Vizepräsident für Technik bei Google Assistant, es sei „schmerzhaft, dem zuzuhören“.
Wenn das System wirklich nicht weiß, was es als nächstes tun soll, bricht es das Gespräch ab und ein menschlicher Operator übernimmt die Leitung.
Duplex auf das Niveau zu bringen, auf dem es jetzt ist, hat mit viel manueller und menschlicher Arbeit begonnen. Menschliche Bediener tätigten Anrufe in Restaurants, kommentierten Gespräche und speisten die Ergebnisse in Duplex ein. Das Team verknüpfte Ausdrücke wie „wie viele Personen“ und ihre Variationen mit „Anzahl der Personen in der Gruppe“, sodass Duplex die Frage verstehen konnte.
In der zweiten Phase hörten menschliche Telefonisten den Anrufen des Assistenten zu, und wenn etwas schiefgeht, sprang der Telefonist ein, um sicherzustellen, dass der Anruf erfolgreich war. Dies ermöglichte es dem Team, die Ecken und Kanten rund um den Dienst zu identifizieren, diese Gespräche zu kommentieren und sie wieder in die Algorithmen des maschinellen Lernens einzuspeisen, damit Duplex lernen konnte.
Die letzte Testphase ist der automatisierte Modus, in dem das automatisierte System Anrufe tätigt und abschließt. Im System integrierte Notluken ermöglichen es dem Assistenten, dank Sätzen wie „Ich bin mir nicht sicher, was Sie gesagt haben“ zum Hauptziel, der Erledigung der Aufgabe, zurückzukehren. Aber kann ich einen Tisch für drei reservieren?“ Wenn das System wirklich nicht weiß, was es als Nächstes tun soll, wird es sich elegant aus dem Gespräch zurückziehen und der menschliche Operator übernimmt über.
Keynote (Google I/O '18)
Derzeit, so Huffman, benötigen etwa vier von fünf von Duplex getätigten Anrufen keine menschliche Unterstützung. Interessanterweise sagte er, dass menschliche Bediener nicht aus dem Dienst abgezogen werden, wenn Duplex besser wird, da Google sie als wesentlichen Bestandteil ansieht, um sicherzustellen, dass Duplex reibungslos funktioniert.
Die „ums“ und „ahs“
Beim Unterrichten von Assistant legte Google Wert darauf, dass der Klang natürlicher und weniger wie ein Roboter klingt. Nach der Demo auf der Google I/O fragten Kritiker, warum Google versucht, „Ähm“ und „Äh“ zu mischen, um den Assistant zu erstellen klingt menschlicher, vor allem, wenn am Anfang des Anrufs nicht der Hinweis hinzugefügt wird, dass es sich nicht um einen Menschen handelt. Mittlerweile gibt es Haftungsausschlüsse, aber Huffman sagte, Sprachfehler wie „ähm“ oder „mhm“ seien hinzugefügt worden, um den Gesprächsfluss aufrechtzuerhalten.
Der Assistent fügte ein „Ähm“ hinzu, nachdem er nicht hören konnte, was der Restaurantmitarbeiter sagte, und kam seiner Anfrage erneut nach.
„Wir versuchen nicht zu täuschen oder uns auszugeben, aber wenn man auf die Aufnahme dieses schmerzhaften frühen Systems zurückblickt, klang es nicht sehr natürlich, es klang nicht sehr menschlich“, sagte Huffman. „Aber das hatte zur Folge, dass der Assistent die Aufgaben nicht sehr erfolgreich erledigte. Viele Leute legten auf oder waren verwirrt darüber, mit wem sie sprachen, das Gespräch brach einfach ab, weil es sich nicht natürlich anfühlte.“
Laut Huffman habe es Sprachstörungen gegeben Linguistensind ein wesentlicher Bestandteil der Aufrechterhaltung einer menschlichen Konversation zwischen zwei Menschen. Wie gut das funktioniert, lässt sich leicht erkennen, wenn man sich Gespräche mit dem Assistant anhört, und die Ergebnisse weichen bei weitem von der Originalaufzeichnung ab.
Eine Möglichkeit, wie Sprachstörungen helfen, ist die Gesprächsbestätigung, beispielsweise wenn eine Person spricht, Sie es aber möchten Stellen Sie sicher, dass der Empfänger weiß, dass Sie noch beschäftigt sind und zuhören, etwa wenn der Assistent auf Aufforderung „mhmm“ zu uns sagt halten.
Ein weiteres nützliches Hilfsmittel ist das „Ähm“-Sagen bei Unsicherheit, um höflich um Klärung zu bitten. Der Assistent fügte ein „Ähm“ hinzu, nachdem er nicht hören konnte, was der Restaurantmitarbeiter sagte, und kam seiner Anfrage erneut nach.
Der Assistent mit diesen Sprachstörungen stellt einen starken Kontrast zum ursprünglichen Roboterassistenten dar. Es ist viel weniger kalt und das Gespräch verlief viel schneller. Und anstatt einfache Befehle anzunehmen, interagiert Assistant tatsächlich mit Menschen über unsere Sprache, was einige sicherlich begeistern und andere erschrecken wird.
Bequemlichkeit
Bei Duplex dreht sich alles um Komfort. Es spart Ihnen ein wenig Zeit, es kann Ihnen genauere Ladenöffnungszeiten liefern und es kann auch Unternehmen Zeit sparen. Google sagte auch, dass hier eine große Chance bestehe, Menschen zu helfen, die nicht sprechen können oder Schwierigkeiten beim Sprechen haben.
Huffman sagte, er stelle sich Duplex als eine Weiterentwicklung automatisierter Sprachmaschinen aus der Vergangenheit vor, wie z wenn Sie Ihre Bank anrufen, als es ein langsamer Prozess war, Zahlen zu drücken, um nach rechts zu gelangen Abteilung.
„Wenn Sie heute diese Fluggesellschaften oder Banken anrufen, bekommen Sie etwas viel, viel Schöneres“, sagte er. „Sie werden eine viel natürlicher klingende Stimme hören, und sie könnte so etwas sagen wie: ‚Sagen Sie mir einfach, was Sie brauchen, Sie können Dinge sagen wie: Wie spät ist mein Flug?‘ Duplex, wir gehen mit dieser Idee eigentlich nur einen Schritt weiter, indem wir die Konversation weiterentwickeln und natürlicher gestalten, damit sie für Benutzer erfolgreicher ist Unternehmen."
Nach allem, was wir bisher gesehen haben, handelt es sich um eine vielversprechende Technologie, aber sollten wir sie annehmen oder fürchten?
Google hat uns weder gezeigt, wie Duplex Unternehmen wegen der Ladenöffnungszeiten anruft, noch die Planung von Friseurterminen vorgeführt – daher können wir nicht sagen, wie gut Duplex in diesen Fällen funktionieren würde. Wir sind uns auch nicht sicher, ob die menschlichen Betreiber Zugriff auf Ihre Telefonnummer und Ihren vollständigen Namen haben, da dies ein gewisses Datenschutzrisiko darstellt. Wir fragen uns auch, ob Duplex in Zukunft mehrere Sprachen unterstützen würde. Wir haben uns an Google gewandt, um einige unbeantwortete Fragen zu überprüfen, aber im Zuge der Weiterentwicklung der Technologie werden es natürlich noch weitere Fragen sein.
Nach allem, was wir bisher gesehen haben, handelt es sich um eine vielversprechende Technologie, aber sollten wir sie annehmen oder fürchten? Wir wären froh, wenn wir nie wieder stundenlang in der Warteschleife sitzen müssten, aber hier ist es wichtig, den Verlauf zu bedenken. Wir bewegen uns ständig auf eine Zukunft zu, in der wir mit niemandem sprechen müssen, in der Sie isoliert in einer Wohnung leben und sich Essen liefern lassen können; Pakete, die von Drohnen abgeworfen werden, und Tausende von Stunden an Medien, die man konsumieren kann, ohne jemals nach draußen gehen zu müssen.
Während Duplex möglicherweise mit einigen der banaleren Telefonanrufe beginnt, wird die KI bei Gesprächen besser werden, was die Übertragung auf andere Branchen erleichtert. Es liegt an uns als Gesellschaft, zu entscheiden, wie viel unserer Gespräche durch KI geführt werden sollen und ob es sich lohnt, wieder zum Telefonhörer zu greifen.
Empfehlungen der Redaktion
- Ich habe mich gezwungen, ein 14,5-Zoll-Tablet auszuprobieren – und es lief nicht sehr gut
- Ich mag das Pixel 7a wirklich, aber es gibt ein großes Problem, das ich nicht ignorieren kann
- Ich möchte das Pixel 7 und Pixel 7 Pro lieben, aber Google lässt mich nicht
- Hier finden Sie alles, was Google bei der Pixel Fall Launch-Veranstaltung nicht angekündigt hat
- Alles, was Google auf der Google I/O 2021 nicht angekündigt hat