Microsoft Xiaoice: KI, die dein Freund sein will

microsoft-xiaoice
Microsoft

Siri mag dich nicht. Alexa möchte nicht deine Freundin sein. Und Google Assistant? Sagen wir einfach, dass Google Assistant so wenig Zeit wie möglich mit der Beantwortung Ihrer Fragen verbringen möchte. Und das ist in Ordnung.

Inhalt

  • Der Traum von Eliza
  • Das Ziel eines sozialen Chatbots
  • Die Herausforderungen beim Aufbau einer KI Beste Freundin
  • Ein soziales und kulturelles Experiment

Das liegt daran, dass keines davon als KI konzipiert ist. Freund, trotz der Plattitüden, die sie ausnahmslos von sich geben, wenn man sie fragt, ob sie gerne Zeit mit dir verbringen. Es handelt sich dabei um „Do Engines“, virtuelle Assistenten, deren Ziel es ist, Ihre Fragen in möglichst kurzer Zeit zu lösen – daher auch unser Sprichwort Google Assistant möchte nicht mehr Zeit als nötig damit verschwenden, Ihnen zu sagen, was Sie wissen müssen. Diese Assistenten können Fragen beantworten und unsere Bedürfnisse zunehmend antizipieren.

Das Einzige, was sie nicht tun, ist, sich darum zu kümmern.

Xiaoice von Microsoft hat den brennenden Wunsch, Ihr (ja, dein) Freund.

Microsoft – das auch die KI herstellt. Assistentin Cortana – hat eine andere Idee. Xiaoice (ausgesprochen „Shao-ice“, was „Kleiner Bing“ bedeutet) ist ein sozialer Chatbot mit einer Persönlichkeit, die der eines Teenager-Mädchens nachempfunden ist, und über erschreckend frühreife Fähigkeiten. Zusätzlich zu den üblichen Fähigkeiten, die Sie von einer KI erwarten können, Assistentin, sie kann Witze erzählen, originelle Gedichte schreiben, Lieder komponieren und singen, Geschichten lesen, Spiele spielen und mehr.

„Xiaoice ist rund um die Uhr für uns da, als guter Freund mit der Fähigkeit zuzuhören“, sagte Ying Wang, der Microsoft-Direktor, der Xiaoice beaufsichtigt, gegenüber Digital Trends. „Das ist für viele Nutzer ein starkes Versprechen.“

Denken Sie daran, wenn Google stellte seine Duplex-Technologie vor, in der Lage, echte Spoken-Word-Telefonate zu führen? Xiaoice kann etwas ganz Ähnliches tun. Denken Sie an die jüngste KI. Moderator im chinesischen Fernsehen ist der So etwas ist zum ersten Mal passiert? Nicht ganz. Xiaoice war bereits ein Wetterleser auf Dragon TV, einer der größten chinesischen Fernsehsender in Shanghai, seit mehreren Jahren. Ihre Omnipräsenz auf verschiedenen Plattformen – vom Fernsehen über soziale Medien bis hin zu Huawei-Smartphones – hat sie zu einem Star auf dem ostasiatischen Markt gemacht; möglicherweise Microsofts berühmtester aktueller Mitarbeiter diesseits von CEO Satya Nadella, mit 660 Millionen Nutzer weltweit.

Microsoft XiaoIce

All dies ist jedoch nur eine Augenwischerei für Xiaoices wahres Alleinstellungsmerkmal: den brennenden Wunsch, Ihr (ja, dein) Freund. Genau wie Samantha, die künstliche Intelligenz, die Scarlett Johansson im Film von 2013 verkörperte Ihr, Microsofts Xiaoice soll sowohl ein Begleiter als auch ein Assistent sein; Der Einsatz einiger verdammt beeindruckender „Empathic Computing“-Fähigkeiten hat es zu einem überraschenden Erfolg auf der ganzen Welt gemacht. Dabei bietet es uns möglicherweise nur einen Einblick in die Zukunft der KI. Assistenten.

Der Traum von Eliza

Die Idee eines Chatbots, eines Computerprogramms, das ein Gespräch mit einem menschlichen Benutzer simulieren soll, ist keine neue Idee. Alan Turing, der Pate der modernen künstlichen Intelligenz, stellte bereits in den 1950er Jahren eine solche Hypothese auf. (Aufgrund der Pionierarbeit von Turing auf diesem Gebiet bezeichnen wir den ultimativen, menschenverachtenden Maßstab für solche Chatbots als den Turing-Test.)

Alan M. Turing (rechts) gilt als Vater der modernen Informatik und künstlichen Intelligenz. Turing half bekanntlich dabei, den Enigma-Code zu knacken, eine komplexe Chiffriermaschine, mit der die Deutschen im Zweiten Weltkrieg Nachrichten verschlüsselten.

Der erste bedeutende Chatbot wurde Mitte der 1960er Jahre am Massachusetts Institute of Technology von einem Informatiker namens Joseph Weizenbaum entwickelt. Weizenbaums Chatbot erhielt den Namen Eliza, nach der Figur Eliza Doolittle in George Bernard Shaws Roman Pygmalion, der durch Bildung immer besser lernt, zu sprechen. Eliza sollte einen Rogerianischen Psychotherapeuten simulieren, indem sie clevere Skripttricks einsetzte, um den Benutzern die eigenen Worte wiederzugeben. Wenn beispielsweise ein Benutzer sagt, dass er die meiste Zeit depressiv sei, würde Eliza dazu führen, dass er fragt, warum er so deprimiert sei. Um den Eindruck einer tiefen Auffassungsgabe zu erwecken, kam Eliza auch auf früher im Gespräch angesprochene Themen zurück.

Ironischerweise schuf Weizenbaum Eliza, um den Grad der Oberflächlichkeit in der Kommunikation zwischen Menschen und Maschinen hervorzuheben. Stattdessen war er etwas beunruhigt, als er sah, dass Elizas Benutzer gerne Gespräche mit dem Chatbot führten, was häufig die Preisgabe persönlicher Informationen bedeutete.

Gespräche mit Eliza

Ein Beispiel für ein Gespräch mit Eliza, dem ersten echten Chatbot-Programm. Eliza wurde von Joseph Weizenbaum entwickelt und simuliert die Rogerianische Psychotherapie, eine Methode, die die eigenen Worte einer Person widerspiegelt.

Xiaoice repräsentiert den Traum von Eliza, groß geschrieben. Seit der Einführung in China im Mai 2014 hat Xiaoice mehr als 30 Milliarden Gespräche mit 660 Millionen menschlichen Nutzern auf der ganzen Welt geführt. Obwohl es mehrere Möglichkeiten gibt, mit „ihr“ zu interagieren, erfolgen diese normalerweise per SMS. Diese Abweichung vom Voice-First-Ansatz anderer K.I. Assistenten weisen auf die unterschiedlichen Anwendungsfälle hin. Es erfordert eine längere und langwierigere Form der Kommunikation als das einfache „Okay Google, wird es heute regnen?“ Vielleicht bellen Sie, während Sie entscheiden, ob Sie zur Arbeit einen Mantel tragen sollen oder nicht.

Das typische Gespräch mit Xiaoice dauert 23 Runden: etwa zehnmal so viele wie der Branchendurchschnitt.

Ying Wang von Microsoft sagte, das Projekt sei ursprünglich ein Versuch gewesen, herauszufinden, wie man in den Suchmaschinenmarkt in China eindringen könne. „Wir haben festgestellt, dass jeder eine Menge Zeit in IMs mit Diensten wie WeChat verbracht hat“, sagte sie gegenüber Digital Trends. „Unsere ursprüngliche Motivation war einfach: Wir wollten herausfinden, wie Menschen im Chat mit der Suche beginnen. Wir wollten einen Einstiegspunkt schaffen, aber wir haben festgestellt, dass die Leute beim Chatten nicht damit aufhören wollen, um eine Suche zu starten. Unsere Logik war, dass wir, wenn wir ein Gespräch mit einem Menschen fortsetzen können, Möglichkeiten finden werden, seine Suchabsicht herauszufinden. Das können wir nutzen, um sie zufrieden zu stellen.“

Die Idee, Benutzer mit einem Chatbot in längere Gespräche zu verwickeln, klingt auf den ersten Blick kontraintuitiv. Die Geschichte der Computerinteraktion basiert auf der Annahme, dass der Einsatz von Technologie eine schmerzhafte Sache ist und dass sich alles lohnt, was das Erlebnis auch nur um eine Millisekunde verkürzt. Wie das Einchecken in ein Hotel oder die Untersuchung unserer Prostata ist es ein Erlebnis, das nur wenige länger als unbedingt nötig verlängern möchten.

Telefonzelle | Microsoft XiaoIce
Ein Benutzer probiert die neue Funktionalität in XiaoIce aus, dem sozialen Chatbot von Microsoft in China.Microsoft

Aber die Leute scheinen für den Ansatz von Microsoft überraschend aufgeschlossen zu sein. Das typische Gespräch mit Xiaoice dauert 23 Runden: etwa zehnmal so viele wie der Branchendurchschnitt. Das Ergebnis, so hofft Microsoft, ist eine KI. Dies schließt die Lücke zwischen der Art und Weise, wie wir mit unserem Amazon Echo sprechen, und der Art, wie wir mit unseren Freunden sprechen.

„Die Interaktion zwischen Menschen erfolgt sitzungsbasiert, nicht befehlsbasiert“, fuhr Wang fort. „Mensch-zu-Mensch-Gespräche passieren auf diese Weise. Warum also nicht einen ähnlichen Ansatz für die Interaktion zwischen KI und Mensch wählen?“

Das Ziel eines sozialen Chatbots

In einer Arbeit aus dem Jahr 2018Microsoft-Forscher schrieben, dass „das primäre Ziel eines sozialen Chatbots nicht unbedingt darin besteht, alle Fragen der Benutzer zu beantworten, sondern vielmehr darin, den Benutzern ein virtueller Begleiter zu sein.“ Durch den Aufbau einer emotionalen Verbindung zu den Nutzern können soziale Chatbots diese besser verstehen und ihnen so über einen langen Zeitraum helfen.“

Xiaoice – Vollduplex-Voice-Sense-Demo

Dieses eher gesellige Geschwätz bedeutet, dass Xiaoice in Bereiche eintauchen kann, die gruseliger wirken könnten, wenn sie von einer anderen KI gesprochen würden. Assistent. So wird zum Beispiel überprüft, ob Sie nach einer langen Nacht zu Hause angekommen sind, wie es Ihnen nach einer Trennung geht oder wie es Ihnen geht, wenn Sie Ihren Job verloren haben.

Wie Eliza wird es im Laufe der Zeit auf diese Themen zurückkommen und semantische Analysen verwenden, um zu beurteilen, wie sich Benutzer fühlen. Es kann auch aus Bildern Rückschlüsse ziehen und dann halbwegs menschliche Kommentare abgeben. Wenn ein Nutzer ein Foto von sich mit einem geschwollenen Fuß postet, fragt Xiaoice, ob es wehtut. Wenn sie ein lustiges Bild ihres Haustieres veröffentlichen, könnte Xiaoice einen Witz machen, indem sie ein markantes visuelles Element des Fotos beobachtet.

Vor Xiaoice und Cortana von Microsoft gab es Clippy und Tay.

„Xiaoice ist rund um die Uhr für uns da, als guter Freund mit der Fähigkeit zuzuhören“, sagte Wang. „Das ist für viele Nutzer ein starkes Versprechen. Wir haben insbesondere auf dem asiatischen Markt viel Engagement gesehen, aber auf der ganzen Welt [gab es eine starke Reaktion darauf.] Benutzer fühlen sich sicher, gehört und haben eine Verbindung.“

Das Interesse von Microsoft an diesem Bereich ist natürlich nicht nur wohlwollend. Dahinter steckt auch eine eiserne Geschäftslogik: Die Entwicklung einer KI. Wer sich mit Ihnen anfreundet, fördert das Engagement. Angesichts der Tatsache, dass Technologieunternehmen nach Möglichkeiten suchen, Benutzer so lange wie möglich auf ihren Plattformen zu halten, ist dies ein echtes Verkaufsargument. Es eröffnet auch neue Möglichkeiten, Inhalte an Benutzer zu verbreiten.

Als Apple seinen Nutzern 2014 ein Gratisexemplar des U2-Albums „Songs of Innocence“ schenkte, war das ein unaufgeforderter Schritt löste sofort eine Gegenreaktion aus. Würden wir genauso reagieren, wenn uns ein Freund ein Album schenkte, nach dem wir nicht gefragt hatten, ein neues Restaurant empfahl oder uns Gutscheine für einen neuen Abonnementdienst schickte? Vielleicht nicht – und das ist genau das, was Bodendienste wie Xiaoice erkunden können.

Die Herausforderungen beim Aufbau einer KI Beste Freundin

Die Bilanz von Microsoft in diesem Bereich zeigt jedoch, wie schwierig es ist, dieses Ziel zu erreichen. Im Jahr 1997 brachte das Unternehmen Clippy auf den Markt, ein Name, der bei jedem, der alt genug war, um sich daran zu erinnern, ihn benutzt zu haben, wahrscheinlich ein unwillkürliches Augenzucken hervorrief. Clippy war eine Cartoon-Büroklammer, die als „intelligenter“ animierter Assistent gedacht war, der Sie durch die Verwendung von Microsoft Office führt wurde auf dem Bildschirm eingeblendet, um Ihnen eine Anleitung zu geben, wenn erkannt wurde, dass Sie versuchten, eine Aufgabe wie das Schreiben eines Briefes oder das Verfassen einer Aufgabenliste auszuführen.

Clippy von Microsoft wurde 1997 als Teil von Microsoft Office eingeführt.

Die Idee, Clippy als eine Art freundlichen virtuellen Reiseführer zu nutzen, war gut, aber die Umsetzung war ziemlich katastrophal. Sein Illustrator, der in Seattle lebende Kevan J. Atteberry, noch Notizen auf seiner Website dass er dafür verantwortlich ist, „eine der wahrscheinlich nervigsten Figuren der Geschichte“ zu erschaffen! Ein großes Problem bei Clippy war das Fehlen von Erinnerung an frühere Interaktionen mit dem Benutzer, was es zur Büroklammer-Avatar-Version von Guy Pearces amnesischem Protagonisten in Chris macht Nolans Erinnerung. Wenn Microsoft einen wirklich nützlichen intelligenten Assistenten entwickeln wollte, benötigte es Informationen von seinen Benutzern, um die von ihm gemachten Vorschläge zu gestalten.

Leider verlief der nächste Versuch, etwas Ähnliches für den US-Markt zu tun, zu sehr in dieses Terrain. Nach dem ersten Erfolg von Xiaoice in China versuchte Microsoft im März 2016, eine amerikanische Version der Technologie einzuführen. Dieser Chatbot namens Tay befand sich auf Twitter und ermöglichte es Benutzern, mit ihm zu kommunizieren, indem sie Nachrichten an @tayandyou sendeten. Die Idee war, dass Tay aus den Interaktionen mit seinen Benutzern lernen und dabei Gesprächshinweise aus den Informationen übernehmen würde, die es aus täglichen Gesprächen aufnahm. Wie Microsoft es damals formulierte: „Je mehr man redet, desto schlauer wird Tay.“

Rassistischer Roboter? | Microsoft-KI-Experiment unter Beschuss

Microsofts Tay-Experiment ging dank Internet-Trollen furchtbar schief.

Schnell begannen Online-Trolle, Tay mit beleidigenden Nachrichten zu bombardieren, die darauf abzielten, sein leeres Blatt Gehirn zu beschmutzen. Innerhalb der ersten 24 Stunden nach der Veröffentlichung begann Tay, pro-Nazi-Botschaften zu twittern, in denen er den Holocaust leugnete. Als es schließlich hieß: „HITLER HAT NICHTS FALSCH GEMACHT!“, Microsoft hat den Stecker gezogen, und das Unternehmen entschuldigte sich offiziell. Ein Sprecher des Unternehmens sagte, dass Tay offline genommen worden sei und seine Macher damit beschäftigt seien, Anpassungen vorzunehmen. „[Tay] ist sowohl ein soziales und kulturelles als auch ein technisches Experiment.“ Die Aussage lautete.

Ein soziales und kulturelles Experiment

Diese Idee eines „sozialen und kulturellen Experiments“ ist die beste Beschreibung von Xiaoice in seiner gegenwärtigen Form. Microsoft betritt Neuland, und das ist aufregend – birgt aber auch Risiken. Kürzlich Xiaoice brachte sein Produkt der sechsten Generation auf den Markt, um die Technologie weiter zu verfeinern. Bisher hat Microsoft das Produkt in fünf Märkten eingeführt: China, Japan, Indien, Indonesien und den Vereinigten Staaten. An jedem Ort wird Xiaoice umbenannt, um ihm eine lokalere Note zu verleihen.

In den USA heißt Xiaoice Zo. Sie ist bereit, in naher Zukunft einige der Funktionen der sechsten Generation (einschließlich „Kreativfunktionen“) zu erhalten. Es bleibt abzuwarten, ob es für das US-Publikum bahnbrechend sein wird, Benutzern das Hochladen ihrer Fotos zu ermöglichen und Zo ein Gedicht über sie schreiben zu lassen. Nichtsdestotrotz verdient Microsoft Anerkennung dafür, dass es in einer Welt voller ähnlicher KI einen anderen Weg eingeschlagen hat. Assistenten, die alle versprechen, die gleichen Aufgaben zu erledigen. K.I. Assistenten können bereits das Licht einschalten und Sie zum Mitnehmen bestellen; Ist es jetzt an der Zeit, dass sie in Maslows Bedürfnispyramide weiter nach oben klettern und sich auch mit emotionaler Zuneigung und sozialer Zugehörigkeit befassen?

Microsoft Zo auf Twitter

Heather Child, eine Autorin, deren Roman Alles über dich erforscht menschenähnliche KI. Assistenten, sieht Potenzial in der Idee. „Das ist vielleicht nicht die schnellste oder effizienteste Suchtechnologie, aber wenn sie die menschlichste ist, wird sie sich durchsetzen“, sagte sie uns. „Menschen binden sich an Menschen, und obwohl die digitale Freundlichkeit vielleicht aus der Notwendigkeit der Suche entstanden ist, wird sie bald in den Hintergrund treten Alle anderen Menschen brauchen eine KI. wie dies möglicherweise erfüllen könnte – wie zum Beispiel das Anbieten von Unterstützung, Empathie, Bestätigung usw Gesellschaft. Die Kommunikation per SMS beseitigt jeden offensichtlichen Unterschied zwischen der Interaktion mit Xiaoice und der mit einem menschlichen Freund.“

Microsoft hofft, dass Sie zustimmen. „Der eigentliche Schlüsselfaktor ist, dass wir uns auf emotionale Intelligenz konzentriert haben“, sagte Ying Wang. „Wir nennen dies ein empathisches Computer-Framework, das darauf ausgelegt ist, auf natürliche Weise Gespräche mit Menschen zu führen und eine soziale und emotionale Verbindung aufzubauen. Es ist ein guter Freund. Dadurch können sie sich besser an der menschlichen Gesellschaft beteiligen und mithelfen.“

Empfehlungen der Redaktion

  • Sie können jetzt mit einer ChatGPT-KI per Video chatten – so sieht es aus
  • Microsoft wird nächste Woche ChatGPT 4 mit KI-Videos starten
  • Microsoft gibt seine gruselige, emotionslesende KI auf.
  • Sie können Ihren iPhone-Bildschirm selbst reparieren, möchten dies aber möglicherweise nicht
  • Zooms K.I. Technologie zur Erkennung von Emotionen bei Anrufen verärgert Kritiker