5 способов, с помощью которых будущий ИИ помощники выведут голосовые технологии на новый уровень

Яблоко

С тех пор, как Siri дебютировала на iPhone 4s в 2011 году, голосовые помощники превратились из неработоспособной уловки в основу технологии умных динамиков, которую можно найти в каждом шестом американском доме.

Содержание

  • Больше знаний, меньше проблем
  • Больше (и лучше) персонализации
  • Проактивность
  • Все дело в обратной связи
  • Новые методы взаимодействия

«До появления Siri, когда я говорил о том, чем занимаюсь, на меня смотрели пустые взгляды», — Том Хебнер, руководитель отдела инноваций в компании Нюанс Коммуникации, которая разрабатывает передовые технологии искусственного интеллекта. голосовые технологии, рассказали Digital Trends. «Люди говорили: «Вы строите эти ужасные телефонные системы?» Я тебя ненавижу». Это было единственное взаимодействие одной группы людей с голосовыми технологиями».

Рекомендуемые видео

Сегодня это уже не так. По прогнозам eMarketer, почти 100 миллионов смартфон пользователи будут использовать голосовых помощников к 2020 году. Но пока А.И. помощники уже не новинка, мы все еще находимся в начале их эволюции. Предстоит пройти долгий путь, прежде чем они полностью оправдают обещания, которые голосовые помощники имеют как категорию продуктов.

Вот пять способов улучшить эту технологию, чтобы сделать ее умнее и эффективнее — и в результате помочь нам вести более продуктивную жизнь. Назовите их «прогнозами» или «списком желаний», это задачи, которые необходимо решить.

Больше знаний, меньше проблем

Алекса может рассказать вам, какая погода в Куала-Лумпуре, Малайзия; общее количество долларов США, которое вы получите за 720 южноафриканских рэндов, и как пишется «дезистэблиментарианство». Но потребительский ИИ помощники — это, по сути, цифровой эквивалент человека с полным набором современных энциклопедии. Вы получаете (надеюсь) нужную информацию, но там нет профессионального уровня знаний.

«Проблема, с которой сталкиваются системы в вашем доме, заключается в том, что они пытаются выполнять очень широкий спектр задач», — сказал Хебнер Digital Trends.

Эту проблему сложно решить, но это изменит правила игры. Nuance разрабатывает множество специализированных систем, предназначенных для одного конкретного случая использования, например, помогая клиентам авиакомпаний отвечать на вопросы или врачам делать заметки. Это не только означает, что эти системы смогут детализировать информацию для получения более подробной информации, но также означает, что можно будет внедрить больше интеллектуальных данных. «Людей очень волновали компьютеры, способные понимать слова, но это не обязательно имеет значение, если вы не знаете, что делать с этими словами», — сказал Хебнер.

В качестве примера он приводит систему Nuance, которая не только понимает, когда врачи зачитывают пациентам список потенциальных лекарств, но и может выявлять потенциальные конфликты. Это выходит далеко за рамки возможностей большинства ИИ пользовательского уровня. помощники.

Однако наличие более специализированных детальных знаний в различных областях — это нечто намекает Alexa Skills — может быть преобразующим. Просить у умного динамика юридическую или медицинскую консультацию, на первый взгляд, звучит безумно. Но были выдающиеся достижения в таких областях, как юридические боты, а недавно опубликованный отчет предполагает, что Apple хочет, чтобы Siri могла иметь разговоры с пользователями о здоровье к 2021 году.

Графики специальных знаний для ИИ ассистенты сейчас являются предметом научно-фантастических мечтаний, хотя недавний отчет Voicebot.ai показывает, насколько быстро расширяется набор навыков виртуальных помощников. Однако когда навыки перейдут в сферу специализаций, нас ждет удовольствие!

Больше (и лучше) персонализации

Персонализация сегодняшних умных колонок все еще находится в зачаточном состоянии. Вы можете изменить акцент и представление пола голосовых помощников, добавить или удалить навыки, а также передать им информацию, такую ​​​​как ваше имя и место работы. В некоторых случаях вы можете настроить несколько голосовых профилей, чтобы Главная страница Google узнает отдельных членов вашей семьи.

Амазонское эхо-шоу

Но впереди еще долгий путь — хотя сок должен стоить того, чтобы его выжать. Корпорация Mattersight разработала систему искусственного интеллекта. Технология колл-центра, называемая Прогнозирующая поведенческая маршрутизация, который анализирует речевые модели звонящих и сопоставляет их с людьми-оперативниками с совместимыми типами личности. По данным компании, сопоставление человека с совместимой личностью приведет к успешному звонку, который будет длиться вдвое меньше, чем у человека с конфликтным типом личности.

Использование аналогичного подхода может привести к тому, что ИИ. помощники, которые отвечают вам так, как вы хотите, чтобы к вам обращались. Это может быть что-то простое, например сопоставление акцента и громкости голоса человека, с которым они разговаривают. Или он может изменить способ представления идей, возможно, используя более эмоциональные слова для некоторых пользователей по сравнению с более подробной информацией, которую он мог бы использовать для других. Возможно, некоторые люди хотят, чтобы голосовой помощник мог долго общаться, в то время как другие просто хотят, чтобы он передавал необходимую информацию в максимально сжатой форме. А.И. помощники должны быть способны и на то, и на другое.

Такие технологии, как Гугл Дуплекс покажите, насколько убедительно точными становятся синтезированные голоса и разговоры, генерируемые ИИ. Поскольку искусственный интеллект переходит в более сложные области, чем выдача запросов на песни и таймеры еды, ожидайте, что эта технология сыграет важную роль.

Этому могут способствовать прорывы в способности идентифицировать пользователей по голосу. Хебнер отмечает, что технология Nuance может идентифицировать пользователей всего по одной секунде звука. «Раньше требовалось 10 секунд, чтобы понять, кто вы, и получить точный сигнал», — сказал он. «Сила этого значительна». Возможность идентифицировать пользователей по небольшому фрагменту голоса решает проблему проблема с паролем и открывает возможность использовать голосовых помощников для более деликатной конфиденциальной информации. информация.

Проактивность

Хороший помощник сделает что-то, когда вы его об этом попросите. Отличному помощнику не придется спрашивать. Прямо сейчас, А.И. помощники все еще находятся на этом первом этапе. Пользователи могут получить нужную песню или необходимое напоминание, но обычно только тогда, когда это было явно запрошено. По мере того, как люди начинают чувствовать себя более комфортно с голосовыми помощниками, у них появляется прекрасная возможность перейти от чисто реактивных устройств к проактивным.

Возникает большой вопрос, хотят ли люди передать определенные рабочие места машинам.

Как бы вы отнеслись к ИИ? помощник, принимающий решения от вашего имени? Это может быть что угодно: от включения термостата, когда кто-то говорит, что ему холодно, или до перебронирования обеда. встреча, потому что вы опаздываете, чтобы побудить вас больше заниматься спортом или лучше экономить свои зарплата. По мере того, как все больше и больше умных устройств проникают в дом, количество вещей, которыми может управлять голосовой помощник, значительно увеличится.

Частично это социальный вопрос о том, насколько комфортно людям, когда машины принимают решения за них. Возникает большой вопрос, хотят ли люди передать определенные рабочие места машинам. Думайте об этом как о передаче кредитной карты и ключей от дома своему помощнику из плоти и крови — только с гораздо большей долей Скайнета. Обратной стороной является отказ от определенного контроля. Потенциальный потенциал роста — увеличение вашего свободного времени. Конечно, это серьезная техническая задача…

Все дело в обратной связи

Том Хебнер указал на серьезную проблему, связанную с проактивностью: как наши машины узнают, что они все сделали правильно? Возвращаясь к идее «хорошо против». отличный помощник, отличный помощник может получить все ваши файлы перед большой встречей, даже если вам не придется об этом спрашивать. Но что, если это не те файлы? Большая проблема с созданием домашнего ИИ. Более активные помощники заключаются в том, что в настоящее время существует ограниченное количество способов определить, является ли мы получаем правильную информацию.

А.И. это хороший перец робот
Томохиро Осуми/Getty Images

«Если я прошу одну и ту же песню каждый день, когда вхожу в свой дом, а затем в один прекрасный день я захожу, и она просто начинает играть, как они узнают, что поняли ее правильно?» — сказал Хебнер. «Если я не перестану играть, значит ли это, что это правильно? Если я скажу «стоп», значит ли это, что он сделал это неправильно и никогда больше не должен этого делать? Механизм обратной связи — одна из причин, по которой вы не получаете более проактивных систем».

Это сложная задача для инженеров. Любой, у кого когда-либо был стажер, который просил у него инструкций и отзывов по каждой отдельной задаче, знает, что иногда проще выполнить работу самостоятельно, чем делегировать ее. ИИ помощник сделает вашу жизнь более комфортной; не для того, чтобы каждый день проводить десятки мини-опросов для подтверждения того, правильно ли он выполнил свою работу. Эту проблему необходимо будет решить таким образом, чтобы это не наносило ущерба удобству использования этих устройств и не требовало длительного предварительного обучения, прежде чем системы узнают ваши предпочтения.

Каков ответ? Я не уверен. Но, как однажды сказал Стив Джобс, выяснять это — не задача клиента.

Новые методы взаимодействия

Там есть сцена 2001: Космическая одиссея в котором убийственный HAL 9000, который, к моему разочарованию, до сих пор является самым известным вымышленным искусственным интеллектом. помощник по истории, показывает, что он не просто использует микрофоны, чтобы определить, что ему говорят. Когда два члена экипажа пытаются выбрать место для разговора там, где, как они знают, HAL не слышит, HAL показывает, что он все еще может их понимать. на основе чтения движения их губ.

2001: Космическая одиссея

Страшный момент фильма? Конечно. Пример того, как А.И. помощники могут работать в будущем? Эм, конечно!

Идея о том, что голосовые помощники должны ограничиваться голосом, уменьшает возможное количество способов полезного взаимодействия с нами. С появлением распознавание лиц и технологии отслеживания эмоций, постоянно растущее количество биометрических данных, собираемых о пользователях, и даже возможность Технология чтения мыслей уже на горизонте, существует множество различных сигналов, которые может использовать ИИ. помощники сделать выводы.

Идея о том, что через 10 лет мы будем использовать только голос для управления этими ИИ, Assistants — это все равно, что смотреть на компьютеры начала 80-х годов и думать, что в нашем распоряжении никогда не будет ничего, кроме клавиатуры.

Рекомендации редакции

  • Чувствующий эмоции искусственный интеллект здесь, и это может быть на вашем следующем собеседовании
  • Новый кампус Apple в Сиэтле может иметь большое значение для Siri и искусственного интеллекта
  • Google нашел способ использовать искусственный интеллект. повысить полезность энергии ветра