Seit Siri im Jahr 2011 auf dem iPhone 4s debütierte, haben sich Sprachassistenten von einer unbrauchbaren Spielerei zur Grundlage der Smart-Speaker-Technologie entwickelt, die in jedem sechsten amerikanischen Haushalt zu finden ist.
Inhalt
- Mehr Wissen, weniger Probleme
- Mehr (und bessere) Personalisierung
- Proaktiv werden
- Es geht um das Feedback
- Neue Interaktionsmethoden
„Vor Siri gab es leere Blicke, wenn ich darüber sprach, was ich mache“, sagt Tom Hebner, Leiter Innovation bei Nuance Communications, das modernste KI entwickelt. Sprachtechnologie, sagte Digital Trends. „Die Leute würden sagen: ‚Bauen Sie diese schrecklichen Telefonsysteme?‘ Ich hasse dich.‘ Das war die einzige Interaktion einer Gruppe von Menschen mit Sprachtechnologie.“
Empfohlene Videos
Das ist heute nicht mehr der Fall. Laut eMarketer-Prognosen, fast 100 Millionen Smartphone Bis 2020 werden Nutzer Sprachassistenten nutzen. Aber während K.I. Assistenten sind keine Neuheit mehr, wir stehen noch am Anfang ihrer Entwicklung. Es ist noch ein langer Weg, bis sie das Versprechen, das Sprachassistenten als Produktkategorie haben, vollständig einlösen können.
Hier sind fünf Möglichkeiten, wie die Technologie verbessert werden könnte, um sie intelligenter und effizienter zu machen – und uns dadurch zu einem produktiveren Leben zu verhelfen. Nennen Sie sie „Vorhersagen“ oder „Wunschliste“, das sind die Herausforderungen, die gelöst werden müssen.
Mehr Wissen, weniger Probleme
Alexa kann Ihnen sagen, wie das Wetter in Kuala Lumpur, Malaysia ist; die Gesamtzahl der US-Dollar, die Sie für 720 südafrikanische Rand erhalten, und wie man „Disestablishmentarianism“ buchstabiert. Aber Verbraucher-KI Assistenten sind im Wesentlichen das digitale Äquivalent einer Person mit einer vollständigen Aktualität Enzyklopädien. Sie erhalten (hoffentlich) die richtigen Informationen, aber es gibt kein professionelles Fachwissen.
„Die Herausforderung für die Systeme in Ihrem Zuhause besteht darin, dass sie ein so breites Spektrum an Dingen versuchen“, sagte Hebner gegenüber Digital Trends.
Es ist schwierig, dieses Problem zu lösen, aber es würde das Spiel verändern. Nuance entwickelt viele Spezialsysteme, die auf einen bestimmten Anwendungsfall ausgerichtet sind, beispielsweise um Flugkunden bei der Beantwortung von Fragen oder Ärzten beim Anfertigen von Notizen zu helfen. Dies bedeutet nicht nur, dass diese Systeme einen Drilldown durchführen können, um detailliertere Informationen zu erhalten, sondern auch, dass mehr Informationen einfließen können. „Die Leute waren sehr begeistert von Computern, die Wörter verstehen konnten, aber das spielt nicht unbedingt eine Rolle, wenn man nicht weiß, was man mit diesen Wörtern anfangen soll“, sagte Hebner.
Als Beispiel nennt er ein Nuance-System, das nicht nur versteht, wenn Ärzte Patienten eine Liste potenzieller Medikamente vorlesen, sondern auch auf potenzielle Konflikte hinweisen kann. Dies geht weit über die Fähigkeiten der meisten benutzerorientierten KI hinaus. Assistenten.
Allerdings ist es etwas, über ein spezielleres Detailwissen in verschiedenen Bereichen zu verfügen angedeutet durch Alexa Skills – könnte transformativ sein. Ihren Smart Speaker um rechtlichen oder medizinischen Rat zu bitten, klingt auf den ersten Blick verrückt. Aber es gab welche außergewöhnliche Fortschritte in Bereichen wie Legal Bots, während ein kürzlich veröffentlichter Bericht darauf hindeutet, dass Apple Siri in die Lage versetzen möchte gesundheitsorientierte Gespräche mit Benutzern bis 2021.
Fachwissensgraphen für K.I. Assistenten sind derzeit Stoff für Science-Fiction-Träume, obwohl a aktueller Voicebot.ai-Bericht zeigt, wie schnell sich die Fähigkeiten virtueller Assistenten erweitern. Wenn sich die Fertigkeiten jedoch auf das Gebiet der Spezialitäten verlagern, werden wir uns freuen!
Mehr (und bessere) Personalisierung
Die Personalisierung heutiger intelligenter Lautsprecher steckt noch in den Kinderschuhen. Sie können den Akzent und das Geschlecht des Sprachassistenten ändern, Fähigkeiten hinzufügen oder entfernen und ihn mit Informationen wie Ihrem Namen und Ihrem Arbeitsplatz versorgen. In einigen Fällen können Sie dazu mehrere Sprachprofile einrichten Google Home erkennt die einzelnen Mitglieder Ihres Haushalts.
Aber es liegt noch ein langer Weg vor uns – auch wenn der Saft den Druck wert sein sollte. Mattersight Corporation hat A.I. Call-Center-Technologie, genannt Prädiktives Verhaltensrouting, das die Sprachmuster von Anrufern analysiert und sie menschlichen Mitarbeitern mit kompatiblen Persönlichkeitstypen zuordnet. Nach Angaben des Unternehmens führt das Matching einer Person mit einer kompatiblen Persönlichkeit zu einem erfolgreichen Anruf, der nur halb so lange dauert wie der einer Person mit einem widersprüchlichen Persönlichkeitstyp.
Die Verwendung eines ähnlichen Ansatzes könnte dazu führen, dass K.I. Assistenten, die Ihnen so antworten, wie Sie angesprochen werden möchten. Das könnte so einfach sein wie die Anpassung des Akzents und der Stimmlautstärke der Person, mit der sie sprechen. Oder es könnte die Art und Weise ändern, wie es Ideen anspricht, indem es für einige Benutzer möglicherweise emotionalere Wörter verwendet, im Vergleich zu detaillierteren Informationen, die es für andere verwenden könnte. Vielleicht wünschen sich manche Menschen einen Sprachassistenten, mit dem sie lange chatten können, während andere sich einfach wünschen, dass einer die nötigen Informationen so prägnant wie möglich übermittelt. K.I. Assistenten sollten beides können.
Technologien wie Google Duplex zeigen, wie überzeugend genau KI-generierte synthetisierte Stimmen und Gespräche werden. Da KIs in komplexere Bereiche vordringen als das Austeilen von Songwünschen und Essenstimer, ist davon auszugehen, dass diese Technologie eine wichtige Rolle spielen wird.
Dies könnte durch Durchbrüche bei der Fähigkeit zur Identifizierung von Benutzern anhand der Stimme unterstützt werden. Hebner weist darauf hin, dass die Technologie von Nuance Benutzer bereits in einer einzigen Audiosekunde identifizieren kann. „Früher dauerte es 10 Sekunden, um zu verstehen, wer man ist, um ein genaues Signal zu erhalten“, sagte er. „Die Macht davon ist beträchtlich.“ Die Möglichkeit, Benutzer anhand eines kleinen Sprachausschnitts zu identifizieren, löst das Problem Passwortproblem und eröffnet die Möglichkeit, Sprachassistenten für sensiblere vertrauliche Zwecke zu verwenden Information.
Proaktiv werden
Ein guter Assistent wird etwas tun, wenn Sie ihn darum bitten. Ein großartiger Assistent muss nicht gefragt werden. Im Moment ist A.I. Die Assistenten befinden sich noch in dieser ersten Phase. Benutzer können das gewünschte Lied oder die gewünschte Erinnerung erhalten, normalerweise jedoch nur, wenn dies ausdrücklich angefordert wird. Je vertrauter die Menschen mit Sprachassistenten werden, desto mehr bietet sich für sie eine große Chance, von rein reaktiven Geräten zu proaktiven Geräten überzugehen.
Es stellt sich die große Frage, ob Menschen bestimmte Aufgaben den Maschinen überlassen wollen oder nicht.
Was würden Sie von einer KI halten? Assistent, der in Ihrem Namen Entscheidungen trifft? Das kann alles Mögliche sein: das Hochdrehen des Thermostats, wenn jemand sagt, dass ihm kalt ist, oder das Umbuchen eines Mittagessens Treffen Sie sich, weil Sie zu spät kommen, oder drängen Sie dazu, mehr Sport zu treiben oder Ihr Geld besser zu sparen Gehaltsscheck. Da immer mehr intelligente Geräte Einzug in das Zuhause halten, wird die Anzahl der Dinge, die ein Sprachassistent steuern könnte, erheblich zunehmen.
Ein Teil davon ist eine gesellschaftliche Frage, wie wohl sich Menschen damit fühlen, dass Maschinen ihrerseits Entscheidungen treffen. Es stellt sich die große Frage, ob Menschen bestimmte Aufgaben den Maschinen überlassen wollen oder nicht. Stellen Sie sich das so vor, als würden Sie Ihre Kreditkarte und Ihren Hausschlüssel Ihrem Assistenten aus Fleisch und Blut geben – nur mit einer viel größeren Prise Skynet. Der Nachteil besteht darin, dass man ein gewisses Maß an Kontrolle aufgibt. Der potenzielle Vorteil besteht darin, dass Sie mehr Freizeit haben. Natürlich gibt es eine große technische Herausforderung…
Es geht um das Feedback
Tom Hebner wies auf eine große Herausforderung beim Thema Proaktivität hin: Woher wissen unsere Maschinen, wann sie es richtig machen? Zurück zur Idee des Guten vs. Großartiger Assistent, ein großartiger Assistent kann vor einem großen Meeting alle Ihre Dateien bereitstellen, ohne dass Sie danach fragen müssen. Was aber, wenn es sich um die falschen Dateien handelt? Ein großes Problem bei der Entwicklung von Heim-KI. Wenn Assistenten proaktiver werden, besteht die Tatsache, dass es derzeit nur begrenzte Möglichkeiten gibt, offenzulegen, ob es sich bei den Informationen, die wir erhalten, um die richtigen Informationen handelt oder nicht.
„Wenn ich jeden Tag, wenn ich in mein Haus komme, nach dem gleichen Lied frage und es dann, wenn ich reinkomme, einfach anfängt zu spielen, woher wissen sie dann, dass sie es richtig verstanden haben?“ sagte Hebner. „Wenn ich es nicht aufhöre zu spielen, heißt das dann, dass es richtig ist? Wenn ich „Stopp“ sage, bedeutet das dann, dass es einen Fehler gemacht hat und es nie wieder tun sollte? Der Feedback-Mechanismus ist einer der Gründe, warum es keine proaktiveren Systeme gibt.“
Für Ingenieure ist es eine Herausforderung, dies herauszufinden. Jeder, der jemals von einem Praktikanten um Anleitung und Feedback zu jeder einzelnen Aufgabe gebeten wurde, weiß, dass es manchmal einfacher ist, eine Aufgabe selbst zu erledigen, als sie zu delegieren. Eine K.I. Der Assistent ist da, um Ihr Leben reibungsloser zu gestalten. Ich möchte Ihnen nicht jeden Tag Dutzende Mini-Umfragen geben, um zu bestätigen, ob es seine Arbeit richtig gemacht hat. Dies muss auf eine Weise gelöst werden, die die Benutzerfreundlichkeit dieser Geräte nicht beeinträchtigt und nicht viel Schulung im Vorfeld erfordert, bevor die Systeme Ihre Präferenzen lernen.
Was ist die Antwort? Ich bin mir nicht sicher. Aber wie Steve Jobs einmal sagte: Es ist nicht die Aufgabe des Kunden, es herauszufinden.
Neue Interaktionsmethoden
Es gibt eine Szene 2001: Odyssee im Weltraum in dem der mörderische HAL 9000, beunruhigenderweise immer noch der berühmteste fiktive K.I. Assistent in der Geschichte, verrät, dass es nicht nur Mikrofone verwendet, um zu bestimmen, was zu ihm gesagt wird. Als zwei Besatzungsmitglieder versuchen, einen Ort zum Sprechen auszuwählen, von dem sie wissen, dass HAL ihn nicht hören kann, verrät HAL, dass er sie immer noch verstehen kann. basierend auf dem Ablesen ihrer Lippenbewegung.
Gruseliger Moment im Film? Sicher. Ein Beispiel dafür, wie K.I. Assistenten könnten in Zukunft arbeiten? Äh... sicher!
Die Idee, dass Sprachassistenten auf Sprache beschränkt sein sollten, verringert die möglichen Möglichkeiten, wie sie sinnvoll mit uns interagieren könnten. Mit dem Aufstieg von Gesichtserkennung Und Emotions-Tracking-Technologien, eine ständig wachsende Zahl biometrischer Daten, die ständig über Benutzer gesammelt werden, und sogar die Möglichkeit dazu Gedankenlesetechnologie am HorizontEs gibt viele verschiedene Signale, die von der KI genutzt werden könnten. Assistenten, um ihre Schlussfolgerungen zu ziehen.
Die Idee, dass wir diese KI in 10 Jahren nur noch mit der Stimme steuern werden, ist groß. Assistenten ist, als würde man Anfang der 80er Jahre auf PCs schauen und denken, dass wir nie mehr als eine Tastatur zur Verfügung haben werden.
Empfehlungen der Redaktion
- Emotionserfassende KI ist hier, und es könnte in Ihrem nächsten Vorstellungsgespräch sein
- Apples neuer Campus in Seattle könnte für Siri, künstliche Intelligenz, große Bedeutung haben
- Google hat einen Weg gefunden, KI zu nutzen. den Nutzen der Windenergie zu steigern