5 способів майбутнього А.І. асистенти піднімуть голосові технології на новий рівень

Відколи Siri дебютувала на iPhone 4s у 2011 році, голосові помічники перетворилися з непрацездатного трюку в основу технології розумних динаміків, які є в кожному шостому американському домі.

Зміст

Мо’ знання, менше проблем
Більше (і краща) персоналізація
Стати проактивним
Вся справа в зворотному зв’язку
Нові методи взаємодії

«До Siri, коли я говорив про те, що я роблю, у мене були порожні погляди», — Том Хебнер, керівник відділу інновацій у Nuance Communications, яка розробляє передову A.I. голосові технології, розповів Digital Trends. «Люди казали: «Ви створюєте ці жахливі телефонні системи?» Я ненавиджу тебе». Це була єдина група людей, які взаємодіяли з голосовими технологіями».

Рекомендовані відео

Сьогодні це вже не так. За прогнозами eMarketer, майже 100 млн смартфон користувачі будуть користуватися голосовими помічниками до 2020 року. Але в той час як А.І. асистенти вже не є новинкою, ми все ще на початку їх еволюції. Попереду ще довгий шлях, перш ніж вони повністю виправдають обіцянки голосових помічників як категорії продуктів.

Ось п’ять способів вдосконалення технології, щоб зробити її розумнішою та ефективнішою — і, як результат, допомогти нам жити продуктивніше. Назвіть їх «прогнозами» або «списком побажань», це виклики, які потрібно вирішити.

Мо’ знання, менше проблем

Алекса може сказати вам, яка погода в Куала-Лумпурі, Малайзія; загальна кількість доларів США, яку ви отримаєте за 720 південноафриканських рандів, і як пишеться «disestablishmentarianism». Але споживач А.І. асистенти, по суті, є цифровим еквівалентом людини з повним набором найновіших енциклопедії. Ви отримуєте (сподіваємося) правильну інформацію, але там немає професійного рівня знань.

«Проблема, з якою стикаються системи у вашому домі, полягає в тому, що існує такий широкий спектр речей, які вони намагаються зробити», — сказав Гебнер Digital Trends.

Це важко вирішити, але це змінило б ситуацію. Nuance розробляє багато спеціалізованих систем, орієнтованих на один конкретний випадок використання, наприклад, допомагаючи клієнтам авіакомпаній відповідати на запити або лікарям робити нотатки. Це не тільки означає, що ці системи можуть детальніше отримувати детальнішу інформацію, але й означає, що можна використовувати більше інтелекту. «Люди були в захваті від комп’ютерів, які можуть розуміти слова, але це не обов’язково має значення, якщо ви не знаєте, що з цими словами робити», — сказав Хебнер.

Одним із прикладів, який він наводить, є система Nuance, яка не тільки розуміє, коли лікарі зачитують список потенційних ліків для пацієнтів, але й може викликати потенційні конфлікти. Це далеко за межі можливостей більшості A.I. помічники.

Однак володіти більш фаховими детальними знаннями в різних областях — щось натякнув Alexa Skills — може мати трансформаційний характер. Просити ваш розумний динамік отримати юридичну чи медичну пораду, на перший погляд, звучить божевільно. Але були надзвичайні досягнення в таких сферах, як легальні боти, тоді як нещодавно опублікований звіт свідчить про те, що Apple хоче, щоб Siri могла мати розмови з користувачами, спрямовані на здоров’я, до 2021 року.

Графи знань фахівців для А.І. про помічників зараз мріють фантастики, хоча a останній звіт Voicebot.ai показує, наскільки швидко розширюються навички віртуальних помічників. Однак, коли навички перейдуть у сферу спеціальностей, нас чекає задоволення!

Більше (і краща) персоналізація

Персоналізація сучасних розумних динаміків все ще знаходиться в зародковому стані. Ви можете змінювати акцент голосових помічників і подання статі, додавати або видаляти навички, а також надавати йому фрагменти інформації, наприклад своє ім’я та місце роботи. У деяких випадках можна налаштувати кілька голосових профілів, щоб Google Home розпізнає окремих членів вашої родини.

Але попереду ще довгий шлях — хоча сік має бути вартий того, щоб його вичавити. Корпорація Mattersight розробила A.I. техніка колл-центру, зв Прогнозна поведінкова маршрутизація, який аналізує моделі мовлення абонентів і зіставляє їх із людьми-операторами з сумісними типами особистості. За словами компанії, підбір людини з сумісною особистістю призведе до успішного дзвінка, який триватиме лише половину часу, поряд із людиною з конфліктним типом особистості.

Використання подібного підходу може призвести до того, що A.I. помічники, які відповідають вам так, як вам подобається, щоб до вас зверталися. Це може бути щось таке просте, як узгодження акценту та гучності голосу людини, з якою вони розмовляють. Або він може змінити спосіб розгляду ідей, можливо, використовуючи більш емоційні слова для одних користувачів порівняно з більш щільною детальною інформацією, яку він може використовувати для інших. Можливо, деякі люди хочуть мати голосового помічника, щоб довго спілкуватися, а інші просто хочуть, щоб він передавав необхідну інформацію в максимально стислій формі. А.І. помічники повинні вміти і те, і інше.

Такі технології, як Google Duplex показати, наскільки переконливо точними стають синтезовані голоси та розмови, створені штучним інтелектом. Оскільки штучний інтелект переходить у складніші сфери, ніж розсилка запитів пісень і таймерів їжі, очікуйте, що ця технологія зіграє важливу роль.

Цьому можуть допомогти прориви в здатності ідентифікувати користувачів за голосом. Хебнер зазначає, що технологія Nuance може ідентифікувати користувачів лише за одну секунду аудіо. «Раніше було потрібно 10 секунд, щоб зрозуміти, хто ти є, щоб отримати точний сигнал», — сказав він. «Сила цього значна». Можливість ідентифікувати користувачів за невеликим фрагментом голосу вирішує проблему проблеми з паролем і відкриває можливість використовувати голосові помічники для більш делікатної конфіденційності інформації.

Стати проактивним

Хороший помічник щось зробить, коли ви його про це попросите. Чудового помічника не потрібно буде просити. Саме зараз А.І. асистенти все ще знаходяться на цьому першому етапі. Користувачі можуть отримати потрібну пісню або потрібне нагадування, але зазвичай лише за чітким запитом. Оскільки люди почуваються зручніше з голосовими помічниками, у них з’являється чудова можливість перейти від суто реактивних пристроїв до проактивних.

Є великі питання щодо того, чи хочуть люди передати певну роботу машинам.

Як би ви ставилися до ШІ? помічник, який приймає рішення від вашого імені? Це може бути що завгодно: від запуску термостата, коли хтось каже, що йому холодно, або повторного замовлення обіду зустрічі, тому що ви запізнюєтеся, щоб підштовхнути вас робити більше вправ або краще економити зарплата. Оскільки все більше і більше розумних пристроїв потрапляє в дім, кількість речей, якими може керувати голосовий помічник, значно зросте.

Частково це соціальне питання про те, наскільки людям комфортно, коли машини приймають рішення з їхнього боку. Є великі питання щодо того, чи хочуть люди передати певну роботу машинам. Подумайте про це як про віддачу вашої кредитної картки та ключів від дому вашому помічнику з плоті та крові — тільки з набагато більшою кількістю Skynet. Недоліком є втрата певної кількості контролю. Потенційний плюс — збільшення вашого вільного часу. Звичайно, є велика технічна проблема…

Вся справа в зворотному зв’язку

Том Гебнер вказав на велику проблему, пов’язану з проблемою проактивності: як наші машини знають, що вони зробили все правильно? Повертаючись до ідеї добра vs. чудовий помічник, чудовий помічник може отримати всі ваші файли перед великою зустріччю, і вам не потрібно буде питати. Але що, якщо це не ті файли? Велика проблема із створенням домашнього штучного інтелекту. Помічники більш проактивні в тому, що наразі існує обмежена кількість способів виявити, чи правильно ми отримуємо інформацію.

А.І. хороший перець робот — Томохіро Осумі/Getty Images

«Якщо я прошу одну й ту саму пісню кожного дня, коли заходжу в будинок, а потім заходжу й вона починає грати, як вони дізнаються, що все зробили правильно?» – сказав Гебнер. «Якщо я не зупиню його відтворення, це означає, що це правильно? Якщо я скажу «зупинись», чи означає це, що він зрозумів щось не так і більше ніколи цього не робити? Механізм зворотного зв’язку є однією з причин, чому ви не отримуєте більш проактивні системи».

Для інженерів це складно розібратися. Будь-хто, хто коли-небудь мав стажера, який просив у них інструкції та відгуки щодо кожного окремого завдання, знає, що іноді легше виконати роботу самому, ніж доручити її. А.І. помічник тут, щоб зробити ваше життя більш легким; не давати вам десятки міні-опитувань щодня, щоб підтвердити, чи правильно він виконує свою роботу. Це потрібно буде вирішити таким чином, щоб не погіршити зручність використання цих пристроїв і не вимагати багато підготовки, перш ніж системи дізнаються ваші вподобання.

Яка відповідь? Я не впевнений. Але, як одного разу сказав Стів Джобс, це не завдання клієнта розбиратися.

Нові методи взаємодії

Є сцена 2001: Космічна одіссея в якому вбивчий HAL 9000, що викликає занепокоєння, все ще є найвідомішим вигаданим штучним інтелектом. асистент з історії, показує, що він не просто використовує мікрофони, щоб визначити, що йому говорять. Коли два члени екіпажу намагаються вибрати місце для розмови, де, як вони знають, HAL не чує, HAL виявляє, що все ще може їх зрозуміти, на основі читання рухів їхніх губ.

Страшний момент фільму? звичайно Приклад того, як А.І. чи могли б асистенти працювати в майбутньому? Гм, звичайно!

Ідея про те, що голосові помічники повинні бути обмежені голосом, зменшує можливу кількість способів, якими вони могли б корисно взаємодіяти з нами. Зі зростанням розпізнавання обличчя і технології відстеження емоцій, постійно зростаюча кількість біометричних даних, які постійно збираються про користувачів, і навіть можливість технологія читання думок на горизонті, є багато різних сигналів, які можуть бути використані A.I. помічники, щоб зробити свої висновки.

Ідея про те, що через 10 років ми будемо використовувати лише голос для керування ШІ. Assistants — це все одно, що дивитися на комп’ютери на початку 80-х років і думати, що в нашому розпорядженні ніколи не буде більше, ніж клавіатура.

5 способів майбутнього А.І. асистенти піднімуть голосові технології на новий рівень

Мо’ знання, менше проблем

Більше (і краща) персоналізація

Стати проактивним

Вся справа в зворотному зв’язку

Нові методи взаємодії

Рекомендації редакції

Категорії

Останні

Nintendo видаляє свою музику та спільноту з YouTube

Zelda: Breath of the Wild 2 має почекати на Switch Pro

Туніка - чудова гра... за допомогою Twitter