5 начина, по които бъдещият ИИ асистентите ще изведат гласовата технология на следващото ниво

Откакто Siri дебютира на iPhone 4s през 2011 г., гласовите асистенти се превърнаха от неработещ трик в основата на технологията за интелигентни високоговорители, намираща се във всеки шест американски дома.

Съдържание

Мо’ знания, по-малко проблеми
Повече (и по-добра) персонализация
Да станеш проактивен
Всичко опира до обратната връзка
Нови методи за взаимодействие

„Преди Siri, когато говорех за [какво правя], имаше празни погледи“, Том Хебнър, ръководител на иновациите в Nuance Communications, която разработва авангардни A.I. гласова технология, каза Digital Trends. „Хората биха казали: „Вие ли създавате тези ужасни телефонни системи? Мразя те.” Това беше единственото взаимодействие на една група хора с гласовата технология.”

Препоръчани видеоклипове

Днес вече не е така. Според прогнозите на eMarketer, почти 100 милиона смартфон потребителите ще използват гласови асистенти до 2020 г. Но докато A.I. асистентите вече не са новост, все още сме в началото на тяхната еволюция. Трябва да се извърви дълъг път, преди да изпълнят напълно обещанието, което гласовите асистенти имат като продуктова категория.

Ето пет начина, по които технологията може да се подобри, за да стане по-интелигентна и по-ефективна — и в резултат да ни помогне да водим по-продуктивен живот. Наречете ги „прогнози“ или „списък с желания“, това са предизвикателствата, които трябва да бъдат разрешени.

Мо’ знания, по-малко проблеми

Алекса може да ви каже какво е времето в Куала Лумпур, Малайзия; общия брой щатски долари, които ще получите за 720 южноафрикански ранда, и как се пише „disestablishmentarianism“. Но потребител A.I. асистентите по същество са цифровият еквивалент на човек с пълен набор от актуални енциклопедии. Получавате (надявам се) правилната информация, но там няма професионално ниво на експертиза.

„Предизвикателството, пред което са изправени системите във вашия дом, е, че има толкова широк набор от неща, които се опитват да направят“, каза Хебнер пред Digital Trends.

Това е трудно за решаване, но това би променило играта. Nuance разработва много специализирани системи, насочени към един конкретен случай на употреба, като например подпомагане на клиенти на авиокомпанията да отговарят на запитвания или на лекари да си водят бележки. Това не само означава, че тези системи могат да се задълбочават, за да получат по-подробна информация, но също така означава, че може да се вложи повече интелигентност. „Хората бяха много развълнувани от компютри, които могат да разбират думи, но това не е задължително да има значение, ако не знаете какво да правите с тези думи“, каза Хебнер.

Един пример, който той дава, е система Nuance, която не само разбира, когато лекарите четат списък с потенциални лекарства за пациентите, но може да извика потенциални конфликти. Това е далеч отвъд възможностите на повечето A.I. асистенти.

Въпреки това, да имате по-специализирани подробни познания за различни области - нещо намекнато от Alexa Skills - може да бъде трансформиращо. Да питате своя интелигентен високоговорител за правен или медицински съвет на пръв поглед звучи лудо. Но е имало изключителен напредък в области като легални ботове, докато наскоро публикуван доклад предполага, че Apple иска Siri да може да има фокусирани върху здравето разговори с потребителите до 2021 г.

Графики на специализирани знания за A.I. асистентите са нещо от научнофантастичните мечти в момента, въпреки че a скорошен доклад на Voicebot.ai показва колко бързо се разширява наборът от умения на виртуалните асистенти. Когато обаче уменията се преместят в сферата на специалитетите, ние ще бъдем за удоволствие!

Повече (и по-добра) персонализация

Персонализирането на днешните интелигентни високоговорители е все още в начален стадий. Можете да промените акцента на гласовите асистенти и представянето на пола, да добавите или премахнете умения и да му предоставите части от информация като вашето име и месторабота. В някои случаи можете да настроите няколко гласови профила, така че Начална страница на Google ще разпознае отделните членове на вашето домакинство.

Но има още дълъг път - въпреки че сокът трябва да си заслужава изстискването. Mattersight Corporation разработи A.I. кол център технология, наречена Предсказуемо поведенческо маршрутизиране, който анализира речевите модели на обаждащите се и ги съпоставя с човешки оператори със съвместими типове личности. Според компанията съпоставянето на човек със съвместима личност ще доведе до успешно обаждане, което продължава само половината от времето, до това на човек с конфликтен тип личност.

Използването на подобен подход може да доведе до A.I. асистенти, които ви отговарят по начина, по който искате да се обръщат към вас. Това може да е нещо толкова просто като съпоставяне на акцента и силата на гласа на човека, с когото говорят. Или може да промени начина, по който адресира идеите, като може би използва по-емоционални думи за някои потребители, в сравнение с по-плътна подробна информация, която може да използва за други. Може би някои хора искат гласов асистент, с който да чатят дълго, докато други просто искат такъв, който да предаде необходимата информация по възможно най-сбития начин. ИИ асистентите трябва да са способни и на двете.

Технологии като Google Duplex покажете колко убедително точни стават генерираните от AI синтезирани гласове и разговори. Докато AI се насочват към области, по-сложни от изпращането на заявки за песни и таймери за храна, очаквайте тази технология да играе важна роля.

Това може да бъде подпомогнато от пробиви в способността за идентифициране на потребителите чрез глас. Хебнър отбелязва, че технологията на Nuance може да идентифицира потребителите само от една-единствена секунда аудио. „Отнемаха 10 секунди, за да разбереш кой си, за да получиш точен сигнал“, каза той. „Силата на това е значителна.“ Възможността за идентифициране на потребителите чрез малък фрагмент от глас решава проблема проблем с паролата и отваря възможност за използване на гласови асистенти за по-деликатна поверителна информация информация.

Да станеш проактивен

Добрият асистент ще направи нещо, когато го помолите. Страхотният асистент няма да има нужда да пита. Точно сега, A.I. асистенти все още са на този първи етап. Потребителите могат да получат песента, която искат, или напомнянето, от което се нуждаят, но обикновено само когато това е изрично поискано. Тъй като хората се чувстват по-комфортно с гласовите асистенти, има чудесна възможност за тях да преминат отвъд това да бъдат чисто реактивни устройства към проактивни.

Има големи въпроси относно това дали хората искат или не да предадат определени задачи на машините.

Как бихте се почувствали за A.I. асистент, който взема решения от ваше име? Те могат да бъдат всичко - от задействане на термостата, когато някой каже, че му е студено, или повторно резервиране на обяд среща, защото закъснявате, за да ви подтикне да правите повече упражнения или да станете по-добри в спестяването на вашите заплата. Тъй като все повече и повече интелигентни устройства навлизат в дома, броят на нещата, които един гласов асистент може да командва, значително ще се увеличи.

Част от това е социален въпрос за това колко комфортно се чувстват хората относно машините, които вземат решения от тяхна страна. Има големи въпроси относно това дали хората искат или не да предадат определени задачи на машините. Мислете за това като да дадете кредитната си карта и ключовете за къщата на вашия асистент от плът и кръв – само че с много по-голямо количество Skynet. Недостатъкът е отказването на известна част от контрола. Потенциалният плюс е увеличаване на свободното ви време. Разбира се, има голямо техническо предизвикателство...

Всичко опира до обратната връзка

Том Хебнър посочи голямо предизвикателство с въпроса за проактивността: как нашите машини знаят кога са го направили правилно? Връщайки се към идеята за доброто vs. страхотен асистент, страхотен асистент може да извади всичките ви файлове преди голяма среща, без да е необходимо да питате. Но какво ще стане, ако са грешните файлове? Голям проблем при създаването на домашен ИИ асистенти по-активен е, че понастоящем има ограничени начини за разкриване дали получаваме информацията или не е правилната информация.

ИИ е добър пипер роботът — Томохиро Осуми/Гети изображения

„Ако поискам една и съща песен всеки ден, когато вляза в къщата си, и след това ден, когато вляза и тя просто започне да свири, как ще разберат, че са я разбрали правилно?“ каза Хебнер. „Ако не го спра да свири, това означава ли, че е правилно? Ако кажа „спрете“, това означава ли, че е сбъркал и никога повече не трябва да го прави? Механизмът за обратна връзка е една от причините да не получавате по-проактивни системи.“

Това е предизвикателство за инженерите да разберат. Всеки, който някога е имал стажант да го моли за инструкции и обратна връзка за всяка една задача, знае, че понякога е по-лесно да свършиш работа сам, отколкото да я делегираш. ИИ асистентът е там, за да направи живота ви по-безпроблемен; а не да ви дава десетки мини анкети всеки ден, за да потвърди дали е свършил работата си правилно. Това ще трябва да бъде решено по начин, който не осакатява удобството на потребителя на тези устройства и не изисква много предварително обучение, преди системите да научат вашите предпочитания.

какъв е отговорът Не съм сигурен. Но, както веднъж каза Стив Джобс, не е работа на клиента да го разбере.

Нови методи за взаимодействие

Има сцена 2001: Космическа одисея в който убийственият HAL 9000, смущаващо все още най-известният измислен ИИ. асистент по история, разкрива, че не просто използва микрофони, за да определи какво му се казва. Когато двама членове на екипажа се опитват да изберат място за разговор, където знаят, че HAL не може да чуе, HAL разкрива, че все още може да ги разбере, въз основа на разчитане на движението на устните им.

Страшен момент от филма? Сигурен. Пример за това как A.I. асистентите могат да работят в бъдеще? Хм, разбира се!

Идеята, че гласовите асистенти трябва да бъдат ограничени до глас, намалява възможния брой начини, по които те биха могли да взаимодействат полезно с нас. С нарастването на лицево разпознаване и технологии за проследяване на емоциите, непрекъснато нарастващ брой биометрични данни, събирани за потребителите на постоянна основа, и дори възможността за технология за четене на мисли на хоризонта, има много различни сигнали, които могат да бъдат използвани от A.I. помощници, за да направят своите заключения.

Идеята, че след 10 години ще използваме само глас, за да контролираме тези ИИ. асистенти е като да гледаме персонални компютри в началото на 80-те години и да мислим, че никога няма да имаме повече от една клавиатура на наше разположение.

Препоръки на редакторите

Емоционален ИИ е тук и може да бъде на следващото ви интервю за работа
Новият кампус на Apple в Сиатъл може да означава големи неща за Siri, изкуствения интелект
Google намери начин да използва A.I. за повишаване на полезността на вятърната енергия

5 начина, по които бъдещият ИИ асистентите ще изведат гласовата технология на следващото ниво

Мо’ знания, по-малко проблеми

Повече (и по-добра) персонализация

Да станеш проактивен

Всичко опира до обратната връзка

Нови методи за взаимодействие

Препоръки на редакторите

Категории

Скорошни

Защо кратерът Jezero е най-вълнуващото място на Марс

Дегустирахме апокалиптичното ново уиски на The Last of Us Part II

Обяснен е краят на сезон 1 на The Midnight Club