5 způsobů, jak budoucí A.I. asistenti posunou hlasovou technologii na další úroveň

Jablko

Od uvedení Siri na iPhone 4s v roce 2011 se hlasoví asistenti změnili z nefunkčního triku na základ technologie chytrých reproduktorů, která se nachází v každé šesté americké domácnosti.

Obsah

  • Mo‘ znalosti, méně problémů
  • Více (a lepší) personalizace
  • Buďte proaktivní
  • Vše je o zpětné vazbě
  • Nové interakční metody

„Před Siri, když jsem mluvil o [tom, co dělám], byly tu prázdné pohledy,“ řekl Tom Hebner, šéf inovací ve společnosti Nuance Communications, která vyvíjí špičkovou A.I. hlasové technologie, řekl Digital Trends. "Lidé by řekli:" Stavíte ty hrozné telefonní systémy? Nenávidím tě.‘ To byla jediná interakce jedné skupiny lidí s hlasovou technologií.“

Doporučená videa

To už dnes neplatí. Podle prognóz eMarketer, téměř 100 milionů chytrý telefon uživatelé budou používat hlasové asistenty do roku 2020. Ale zatímco A.I. asistenti již nejsou novinkou, stále jsme na začátku jejich vývoje. K tomu, aby plně dostáli slibu, který mají hlasoví asistenti jako produktovou kategorii, je ještě dlouhá cesta.

Zde je pět způsobů, jak by se tato technologie mohla zlepšit, aby byla chytřejší a efektivnější – a díky tomu nám pomůže vést produktivnější život. Říkejte jim „předpovědi“ nebo „seznam přání“, to jsou výzvy, které je třeba vyřešit.

Mo‘ znalosti, méně problémů

Alexa vám může říct, jaké je počasí v Kuala Lumpur, Malajsie; celkový počet amerických dolarů, které získáte za 720 jihoafrických randů, a jak se píše „disestablishmentarianism“. Ale spotřebitel A.I. asistenti jsou v podstatě digitálním ekvivalentem osoby s kompletní sadou aktuálních informací encyklopedie. Dostanete (doufejme) správné informace, ale není tam žádná profesionální úroveň odbornosti.

„Výzvou, kterou mají systémy ve vaší domácnosti, je to, že se pokoušejí dělat tak širokou škálu věcí,“ řekl Hebner pro Digital Trends.

To je těžké vyřešit, ale kdyby to udělal, znamenalo by to změnu hry. Nuance vyvíjí mnoho specializovaných systémů zaměřených na jeden konkrétní případ použití, jako je pomoc zákazníkům letecké společnosti odpovídat na dotazy nebo lékařům dělat si poznámky. Nejenže to znamená, že tyto systémy mohou proniknout a získat podrobnější informace, ale také to znamená, že se do nich může upéct více inteligence. "Lidé byli velmi nadšení z počítačů, které dokázaly porozumět slovům, ale to nemusí nutně záležet, pokud nevíte, co s těmi slovy dělat," řekl Hebner.

Jedním příkladem, který uvádí, je systém Nuance, který nejenže rozumí tomu, když lékaři přečtou seznam potenciálních léků pro pacienty, ale mohl by upozorňovat na potenciální konflikty. To je daleko za možnostmi většiny uživatelských A.I. asistenti.

Nicméně mít specializovanější podrobné znalosti různých domén – něco naznačil Alexa Skills — může být transformační. Požádat svého chytrého reproduktoru o právní nebo lékařskou radu zní na první pohled bláznivě. Ale byly mimořádný pokrok v oblastech, jako jsou legální roboti, zatímco nedávno zveřejněná zpráva naznačuje, že Apple chce, aby Siri mohl mít konverzace s uživateli zaměřené na zdraví do roku 2021.

Grafy odborných znalostí pro A.I. asistenti jsou právě teď věcí sci-fi snů, ačkoli a nedávná zpráva Voicebot.ai ukazuje, jak rychle se rozšiřují dovednosti virtuálních asistentů. Když se dovednosti přesunou do terénu specialit, budeme se těšit!

Více (a lepší) personalizace

Personalizace dnešních chytrých reproduktorů je stále v plenkách. Můžete změnit přízvuk a prezentační pohlaví hlasových asistentů, přidat nebo odebrat dovednosti a poskytnout jim informace, jako je vaše jméno a místo práce. V některých případech můžete nastavit více hlasových profilů Domovská stránka Google rozezná jednotlivé členy vaší domácnosti.

Amazon Echo Show

Ale je před námi ještě dlouhá cesta – i když šťáva by měla stát za to vymačkat. Mattersight Corporation vyvinula A.I. technologie call centra, tzv Prediktivní směrování chování, která analyzuje řečové vzorce volajících a porovnává je s lidskými agenty s kompatibilními typy osobnosti. Podle společnosti povede spojení osoby s kompatibilní osobností k úspěšnému hovoru, který bude trvat jen poloviční dobu, než u osoby s konfliktním typem osobnosti.

Použití podobného přístupu by mohlo vést k A.I. asistenti, kteří se vám ozvou tak, jak chcete být oslovováni. Mohlo by to být něco tak jednoduchého, jako sladit přízvuk a hlasitost hlasu osoby, se kterou mluví. Nebo by to mohlo změnit způsob, jakým řeší nápady, možná tím, že pro některé uživatele použije emotivnější slova ve srovnání s hustšími podrobnějšími informacemi, které by mohl použít pro jiné. Možná, že někteří lidé chtějí hlasového asistenta, se kterým by mohli zdlouhavě chatovat, zatímco jiní prostě chtějí, aby jim předal potřebné informace co nejstručnějším způsobem. A.I. asistenti by měli umět obojí.

Technologie jako Google Duplex ukázat, jak přesvědčivě přesné jsou syntetizované hlasy a konverzace generované AI. Jak se A.I.s přesouvají do oblastí, které jsou složitější než servírování požadavků na písničky a časovače jídla, očekávejte, že tato technologie bude hrát hlavní roli.

Tomu by mohly napomoci průlomy ve schopnosti identifikovat uživatele podle hlasu. Hebner poznamenává, že technologie Nuance dokáže identifikovat uživatele z pouhé jediné sekundy zvuku. "Dříve trvalo 10 sekund, než jsme pochopili, kdo jsi, abychom dostali přesný signál," řekl. "Ta síla je významná." Schopnost identifikovat uživatele pomocí malého úryvku hlasu řeší problém problém s heslem a otevírá možnost používat hlasové asistenty pro jemnější důvěrnost informace.

Buďte proaktivní

Dobrý asistent něco udělá, když ho o to požádáte. Skvělý pomocník se nemusí ptát. Právě teď A.I. asistenti jsou stále v této první fázi. Uživatelé mohou získat skladbu, kterou chtějí, nebo připomenutí, které potřebují, ale obvykle pouze tehdy, když je o to výslovně požádáno. S tím, jak se lidé s hlasovými asistenty více zorientují, je pro ně skvělá příležitost přejít od čistě reaktivních zařízení k těm proaktivním.

Existují velké otázky o tom, zda lidé chtějí nebo nechtějí předat určité práce strojům.

Jak byste se cítili ohledně A.I. asistent, který rozhoduje za vás? Může to být cokoli, od zapnutí termostatu, když někdo řekne, že je mu zima, nebo přerezervování oběda schůzku, protože chodíte pozdě, k tomu, abyste si zacvičili nebo se zlepšili v ukládání výplata. Jak se do domácnosti dostává stále více chytrých zařízení, počet věcí, které by hlasový asistent mohl případně ovládat, se výrazně zvýší.

Součástí toho je společenská otázka o tom, jak jsou lidé spokojeni s tím, že stroje rozhodují z jejich strany. Existují velké otázky o tom, zda lidé chtějí nebo nechtějí předat určité práce strojům. Představte si to, jako byste dali svou kreditní kartu a klíče od domu svému asistentovi z masa a kostí – jen s mnohem větším posypem Skynetu. Nevýhodou je vzdání se určité míry kontroly. Potenciální výhodou je zvýšení vašeho volného času. Samozřejmě je tu velká technická výzva…

Vše je o zpětné vazbě

Tom Hebner poukázal na velkou výzvu v otázce proaktivity: jak naše stroje poznají, že to udělali správně? Návrat k myšlence dobro vs. skvělý asistent, skvělý asistent může mít všechny vaše soubory před velkou schůzkou, aniž byste se museli ptát. Ale co když jsou to nesprávné soubory? Velký problém při vytváření domácího A.I. Asistenti aktivnější je, že v současné době existují omezené způsoby, jak odhalit, zda získáváme informace jako správné informace.

A.I. je dobrý pepř robota
Tomohiro Ohsumi/Getty Images

"Když každý den požádám o stejnou písničku, když vejdu do svého domu, a pak vejdu dovnitř a začne hrát, jak vědí, že to udělali správně?" řekl Hebner. „Pokud to nepřestanu hrát, znamená to, že je to správné? Pokud řeknu ‚stop‘, znamená to, že jsem to udělal špatně a neměl by to už nikdy dělat? Mechanismus zpětné vazby je jedním z důvodů, proč nezískáváte proaktivnější systémy.“

To je pro inženýry náročné zjistit. Každý, kdo někdy měl stážistu, který je požádal o pokyny a zpětnou vazbu ke každému jednotlivému úkolu, ví, že někdy je snazší udělat práci sami, než ji delegovat. A.I. asistent je tu od toho, aby váš život byl bez tření; aby vám každý den nedával desítky mini průzkumů, které by potvrdily, zda dělá svou práci správně. To bude muset být vyřešeno způsobem, který neohrožuje uživatelskou přívětivost těchto zařízení a nevyžaduje mnoho školení předem, než se systémy naučí vaše preference.

Jaká je odpověď? Nejsem si jistý. Ale jak jednou řekl Steve Jobs, není úkolem zákazníka na to přijít.

Nové interakční metody

Je tam scéna 2001: Vesmírná odysea ve kterém vražedný HAL 9000, znepokojivě stále nejslavnější fiktivní A.I. asistent v historii, odhaluje, že k určení toho, co se mu říká, nepoužívá pouze mikrofony. Když se dva členové posádky pokusí vybrat místo, kde budou mluvit, kde vědí, že HAL neslyší, HAL odhalí, že jim stále rozumí, na základě čtení jejich pohybu rtů.

2001: Vesmírná odysea

Strašidelný moment filmu? Tak určitě. Příklad toho, jak A.I. mohli by asistenti v budoucnu pracovat? Um, jasně!

Myšlenka, že by hlasoví asistenti měli být omezeni na hlas, snižuje možný počet způsobů, jak by s námi mohli užitečně komunikovat. Se vzestupem Rozpoznávání obličeje a technologie sledování emocí, neustále rostoucí počet biometrických údajů shromažďovaných o uživatelích, a dokonce i možnost technologie čtení myšlenek na obzoruexistuje spousta různých signálů, které by A.I. asistenti, aby vyvodili své závěry.

Myšlenka, že za 10 let budeme tyto AI ovládat pouze hlasem. asistenti je jako dívat se na PC na začátku 80. let a myslet si, že nikdy nebudeme mít k dispozici víc než klávesnici.

Doporučení redakce

  • Snímání emocí A.I. je tady a mohlo by to být na vašem příštím pracovním pohovoru
  • Nový kampus společnosti Apple v Seattlu může znamenat velké věci pro Siri, umělou inteligenci
  • Google našel způsob, jak využít A.I. zvýšit využitelnost větrné energie