5 moduri prin care viitorul A.I. asistenții vor duce tehnologia vocală la următorul nivel

De când Siri a debutat pe iPhone 4s în 2011, asistenții vocali au trecut de la un truc imposibil de realizat la baza pentru tehnologia difuzoarelor inteligente găsite într-una din șase case americane.

Cuprins

Mo’ cunoștințe, mai puține probleme
Personalizare mai mare (și mai bună).
Devin proactiv
Totul ține de feedback
Noi metode de interacțiune

„Înainte de Siri, când vorbeam despre [ce fac], erau priviri goale”, Tom Hebner, șeful de inovație la Nuance Communications, care dezvoltă vârful A.I. tehnologie vocală, a spus Digital Trends. „Oamenii ar spune: „Construiți acele sisteme telefonice oribile? Te urăsc.’ A fost singura interacțiune a unui grup de oameni cu tehnologia vocală.”

Videoclipuri recomandate

Nu mai este cazul astăzi. Conform prognozelor eMarketer, aproape 100 de milioane smartphone utilizatorii vor folosi asistenți vocali până în 2020. Dar în timp ce A.I. asistenții nu mai sunt o noutate, suntem încă la începutul evoluției lor. Mai este un drum lung de parcurs înainte ca aceștia să se ridice la înălțimea promisiunii pe care asistenții vocali o au ca categorie de produse.

Iată cinci moduri în care tehnologia s-ar putea îmbunătăți pentru a o face mai inteligentă și mai eficientă - și, ca urmare, ne ajută să ducem vieți mai productive. Numiți-le „predicții” sau „listă de dorințe”, acestea sunt provocările care trebuie rezolvate.

Mo’ cunoștințe, mai puține probleme

Alexa vă poate spune care este vremea în Kuala Lumpur, Malaezia; numărul total de dolari americani pe care îl veți primi pentru 720 de rand sud-african și cum să scrieți „dezestablishmentarism”. Dar consumator A.I. asistenții sunt, în esență, echivalentul digital al unei persoane cu un set complet de actualizare enciclopedii. Obțineți (sperăm) informațiile corecte, dar nu există un nivel de expertiză pro-grad acolo.

„Provocarea pe care o au sistemele din casa ta este că există o gamă atât de largă de lucruri pe care încearcă să le facă”, a spus Hebner pentru Digital Trends.

Acesta este unul greu de rezolvat, dar acest lucru ar schimba jocul. Nuance dezvoltă multe sisteme specializate care vizează un anumit caz de utilizare, cum ar fi ajutarea clienților companiilor aeriene să răspundă la întrebări sau medicii să ia notițe. Făcând acest lucru nu înseamnă doar că aceste sisteme pot detalia pentru a obține informații mai detaliate, dar înseamnă și că poate fi introdusă mai multă inteligență. „Oamenii erau foarte încântați de computerele care puteau înțelege cuvintele, dar asta nu contează neapărat dacă nu știi ce să faci cu acele cuvinte”, a spus Hebner.

Un exemplu pe care îl dă este al unui sistem Nuance care nu numai că înțelege când medicii citesc o listă de medicamente potențiale pentru pacienți, dar ar putea semnala potențiale conflicte. Acest lucru depășește cu mult capacitățile majorității I.A. de nivel utilizator. asistenți.

Cu toate acestea, a avea o cunoaștere mai detaliată de specialitate a diferitelor domenii - ceva sugerat de Alexa Skills — ar putea fi transformator. A cere consiliere juridică sau medicală a difuzorului tău inteligent sună, la prima vedere, o nebunie. Dar au fost progrese extraordinare în domenii precum roboții legali, în timp ce un raport publicat recent sugerează că Apple dorește ca Siri să poată avea conversații axate pe sănătate cu utilizatorii până în 2021.

Grafice de cunoștințe de specialitate pentru A.I. asistenții sunt obiectul viselor SF chiar acum, deși a raport recent Voicebot.ai arată cât de rapid se extind seturile de abilități ale asistenților virtuali. Când abilitățile se mută pe terenul specialităților, totuși, ne vom bucura de un răsfăț!

Personalizare mai mare (și mai bună).

Personalizarea boxelor inteligente de astăzi este încă la început. Puteți schimba accentul asistenților vocali și sexul de prezentare, puteți adăuga sau elimina abilități și puteți furniza informații precum numele și locul de muncă. În unele cazuri, puteți configura mai multe profiluri vocale astfel încât Google Home va recunoaște membrii individuali ai gospodăriei dvs.

Dar mai este un drum lung de parcurs - deși sucul ar trebui să merite stors. Mattersight Corporation a dezvoltat A.I. tehnologie call center, numit Rutarea comportamentală predictivă, care analizează tiparele de vorbire ale apelanților și le potrivește cu agenți umani cu tipuri de personalitate compatibile. Potrivit companiei, potrivirea unei persoane cu o personalitate compatibilă va avea ca rezultat un apel de succes care durează doar jumătate din timp, alături de cel al unei persoane cu un tip de personalitate conflictuală.

Utilizarea unei abordări similare ar putea duce la I.A. asistenți care vă răspund așa cum doriți să vi se adreseze. Ar putea fi ceva la fel de simplu ca potrivirea accentului și a volumului vocii persoanei cu care vorbesc. Sau ar putea schimba modul în care abordează ideile, poate folosind cuvinte mai emoționante pentru unii utilizatori, în comparație cu informații detaliate mai dense pe care le-ar putea folosi pentru alții. Poate că unii oameni doresc un asistent vocal cu care să discute îndelung, în timp ce alții doresc pur și simplu unul care să transmită informațiile necesare în cel mai concis mod posibil. A.I. asistenții ar trebui să fie capabili de ambele.

Tehnologii ca Google Duplex arată cât de convingător de precise devin vocile și conversațiile sintetizate generate de IA. Pe măsură ce IA se mută în zone mai complexe decât trimiterea cererilor de cântece și cronometrelor pentru mâncare, așteptați-vă să vedeți această tehnologie să joace un rol major.

Acest lucru ar putea fi ajutat de progrese în capacitatea de a identifica utilizatorii prin voce. Hebner observă că tehnologia Nuance poate identifica utilizatorii dintr-o singură secundă de sunet. „Obișnuia să dureze 10 secunde pentru a înțelege cine ești, pentru a obține un semnal precis”, a spus el. „Puterea acestui lucru este semnificativă.” Posibilitatea de a identifica utilizatorii printr-un mic fragment de voce rezolvă problema problemă cu parola și deschide posibilitatea de a utiliza asistenți vocali pentru o confidențialitate mai delicată informație.

Devin proactiv

Un asistent bun va face ceva atunci când îi ceri. Un asistent grozav nu va trebui să fie întrebat. Chiar acum, A.I. asistenții sunt încă în această primă etapă. Utilizatorii pot primi melodia pe care o doresc sau mementoul de care au nevoie, dar de obicei numai atunci când a fost solicitat în mod explicit. Pe măsură ce oamenii devin mai confortabil cu asistenții vocali, există o mare oportunitate pentru ei să treacă dincolo de a fi dispozitive pur reactive la cele proactive.

Există mari întrebări despre dacă oamenii doresc sau nu să predea anumite locuri de muncă la mașini.

Cum te-ai simți despre un A.I. asistent care ia decizii în numele tău? Acestea pot fi orice, de la pornirea termostatului când cineva spune că este frig sau rerezervarea unui prânz întâlnire pentru că întârzii, pentru a vă îndemna să faceți mai mult exercițiu sau să vă salvați mai bine salariu. Pe măsură ce tot mai multe dispozitive inteligente ajung în casă, numărul de lucruri pe care un asistent vocal le-ar putea comanda va crește foarte mult.

O parte din aceasta este o întrebare socială despre cât de confortabil sunt oamenii când mașinile iau decizii din partea lor. Există mari întrebări despre dacă oamenii doresc sau nu să predea anumite locuri de muncă la mașini. Gândiți-vă la asta ca și cum ați oferi cardul de credit și cheile casei asistentului dvs. în carne și oase - doar cu o stropire mult mai mare de Skynet. Dezavantajul este renunțarea la o anumită cantitate de control. Potențialul avantaj este creșterea timpului liber. Desigur, există o mare provocare tehnică...

Totul ține de feedback

Tom Hebner a subliniat o mare provocare legată de problema proactivității: de unde știu mașinile noastre când au înțeles corect? Revenind la ideea de bine vs. un asistent grozav, un asistent grozav ar putea avea toate fișierele înainte de o întâlnire mare, fără a fi nevoie să întrebați. Dar dacă sunt fișiere greșite? O mare problemă cu crearea A.I. Asistenții mai proactivi sunt că în prezent există modalități limitate de a dezvălui dacă obținem sau nu informațiile potrivite.

A.I. este bun ardei robotul — Tomohiro Ohsumi/Getty Images

„Dacă cer aceeași melodie în fiecare zi când intru în casa mea, apoi în ziua în care intru și începe să cânte, de unde știu ei că au înțeles bine?” spuse Hebner. „Dacă nu opresc jocul, înseamnă că este corect? Dacă spun „opriți”, înseamnă că a greșit și nu ar trebui să o mai facă niciodată? Mecanismul de feedback este unul dintre motivele pentru care nu obțineți sisteme mai proactive.”

Acesta este unul provocator pentru ingineri de a-și da seama. Oricine a avut vreodată un stagiar care le cere instrucțiuni și feedback cu privire la fiecare sarcină știe că uneori este mai ușor să faci singur o treabă decât să o delegi. Un A.I. asistentul este acolo pentru a vă face viața mai lipsită de fricțiuni; pentru a nu vă oferi zeci de mini-chechemente în fiecare zi pentru a confirma dacă și-a făcut treaba bine. Acest lucru va trebui să fie rezolvat într-un mod care să nu afecteze ușurința de utilizare a acestor dispozitive și să nu necesite o mulțime de pregătire înainte ca sistemele să învețe preferințele dvs.

Care este raspunsul? Nu sunt sigur. Dar, așa cum a spus odată Steve Jobs, nu este treaba clientului să-și dea seama.

Noi metode de interacțiune

Există o scenă înăuntru 2001: O odisee a spațiului în care criminalul HAL 9000, în mod deconcertant încă cel mai faimos A.I. asistent în istorie, dezvăluie că nu folosește doar microfoanele pentru a determina ce i se spune. Când doi membri ai echipajului încearcă să aleagă o locație pentru a vorbi unde știu că HAL nu poate auzi, HAL dezvăluie că încă îi poate înțelege, pe baza citirii mișcării buzelor lor.

Moment înfricoșător al filmului? Sigur. Un exemplu al modului în care A.I. asistenții ar putea lucra în viitor? Hm, sigur!

Ideea că asistenții vocali ar trebui să se limiteze la voce diminuează numărul posibil de moduri în care ar putea interacționa util cu noi. Odată cu ascensiunea recunoastere faciala și tehnologii de urmărire a emoțiilor, un număr tot mai mare de date biometrice adunate despre utilizatori în mod constant și chiar posibilitatea de a tehnologie de citire a minții la orizont, există o mulțime de semnale diferite care ar putea fi folosite de A.I. asistenții să-și tragă concluziile.

Ideea că, peste 10 ani, vom folosi doar vocea pentru a controla aceste I.A. asistenții este ca și cum ne uitam la PC-uri la începutul anilor 80 și ne gândim că nu vom avea niciodată mai mult decât o tastatură la dispoziție.

Recomandările editorilor

A.I. care sesizează emoții. este aici și ar putea fi la următorul interviu de angajare
Noul campus al Apple din Seattle poate însemna lucruri mari pentru Siri, inteligența artificială
Google a găsit o modalitate de a folosi I.A. pentru a spori utilitatea energiei eoliene

5 moduri prin care viitorul A.I. asistenții vor duce tehnologia vocală la următorul nivel

Mo’ cunoștințe, mai puține probleme

Personalizare mai mare (și mai bună).

Devin proactiv

Totul ține de feedback

Noi metode de interacțiune

Recomandările editorilor

Categorii

Recent

Watchmen: Tot ce trebuie să știți din benzi desenate înainte de a viziona

FSR 2.0 este repornirea completă necesară upscaling-ului AMD

Super Smash Bros. Profesioniștii se distrează cu Kazuya