미래의 A.I.를 구현하는 5가지 방법 어시스턴트는 음성 기술을 다음 단계로 끌어올릴 것입니다

사과

2011년 iPhone 4s에서 Siri가 처음 선보인 이후 음성 비서는 작동하지 않는 특수 효과에서 미국 가정 6곳 중 1곳에서 발견되는 스마트 스피커 기술의 기반으로 발전했습니다.

내용물

  • 더 많은 지식, 문제 감소
  • 더 많은 (그리고 더 나은) 개인화
  • 적극적으로 행동하기
  • 피드백에 관한 모든 것
  • 새로운 상호작용 방법

“Siri 이전에는 [내가 하는 일]에 대해 이야기할 때 멍한 시선이 있었습니다.”라고 혁신 책임자인 Tom Hebner는 말했습니다. 뉘앙스커뮤니케이션즈, 최첨단 AI를 개발합니다. 음성 기술은 Digital Trends에 말했습니다. “사람들은 '그 끔찍한 전화 시스템을 만드나요? 난 당신이 싫어.' 그것은 사람들이 음성 기술과 상호 작용하는 유일한 그룹 중 하나였습니다.”

추천 동영상

오늘날에는 더 이상 그렇지 않습니다. eMarketer 예측에 따르면, 거의 1억 스마트 폰 2020년에는 사용자들이 음성 비서를 사용하게 될 것입니다. 그러나 A.I. 어시스턴트는 더 이상 새로운 것이 아니며, 우리는 아직 진화의 시작 단계에 있습니다. 음성 비서가 제품 카테고리로서 갖는 약속을 완전히 이행하기까지는 갈 길이 멀다.

기술을 더욱 스마트하고 효율적으로 개선하여 결과적으로 우리가 보다 생산적인 삶을 살 수 있도록 돕는 5가지 방법은 다음과 같습니다. 이를 "예측" 또는 "위시리스트"라고 부르십시오. 이는 해결해야 할 과제입니다.

더 많은 지식, 문제 감소

알렉사 말레이시아 쿠알라룸푸르의 날씨를 알려줄 수 있습니다. 720 남아프리카 랜드로 얻을 수 있는 미국 달러의 총 금액과 "해산주의"의 철자법. 하지만 소비자 AI 비서는 본질적으로 최신 정보를 모두 갖춘 사람과 디지털적으로 동일합니다. 백과사전. (희망적으로) 올바른 정보를 얻을 수 있지만 거기에는 전문가 수준의 전문 지식이 없습니다.

Hebner는 Digital Trends에 “가정의 시스템이 수행하려는 작업이 너무 광범위하다는 것이 문제입니다.”라고 말했습니다.

이는 해결하기 어려운 문제이지만 그렇게 하면 게임의 판도가 바뀔 것입니다. Nuance는 항공사 고객이 문의 사항에 답변하거나 의사가 메모하도록 돕는 등 하나의 특정 사용 사례를 목표로 하는 다양한 전문가 시스템을 개발합니다. 그렇게 하면 시스템이 드릴다운하여 더 자세한 정보를 얻을 수 있을 뿐만 아니라 더 많은 인텔리전스를 얻을 수 있음을 의미합니다. Hebner는 “사람들은 단어를 이해할 수 있는 컴퓨터에 대해 매우 열광했지만, 그 단어로 무엇을 해야할지 모른다면 그것은 반드시 중요하지 않습니다.”라고 말했습니다.

그가 제시한 한 가지 예는 의사가 환자에게 잠재적인 약물 목록을 읽어주는 시점을 이해할 뿐만 아니라 잠재적인 충돌을 찾아낼 수 있는 Nuance 시스템입니다. 이는 대부분의 사용자급 AI의 기능을 훨씬 뛰어넘는 수준입니다. 조수.

그러나 다양한 영역에 대해 좀 더 전문적이고 자세한 지식을 갖추는 것이 좋습니다. Alexa Skills가 암시함 — 변혁적일 수 있습니다. 스마트 스피커에 법적 또는 의학적 조언을 요청하는 것은 얼핏 보면 미친 짓처럼 들립니다. 그러나 그런 일이 있었습니다. 법률 봇과 같은 분야의 놀라운 발전최근 발표된 보고서에 따르면 Apple은 Siri가 2021년까지 사용자와 건강에 초점을 맞춘 대화.

A.I를 위한 전문가 지식 그래프 어시스턴트는 지금 공상과학의 꿈의 소재입니다. 최근 Voicebot.ai 보고서 가상 비서의 기술이 얼마나 빠르게 확장되고 있는지 보여줍니다. 하지만 기술이 전문 분야로 옮겨가면 우리는 대접을 받게 될 것입니다!

더 많은 (그리고 더 나은) 개인화

오늘날 스마트 스피커의 개인화는 아직 초기 단계입니다. 음성 어시스턴트의 악센트와 성별 표시를 변경하고, 기술을 추가 또는 제거하고, 이름 및 직장과 같은 정보를 제공할 수 있습니다. 어떤 경우에는 여러 음성 프로필을 설정하여 다음을 수행할 수 있습니다. 구글 홈 귀하 가구의 개별 구성원을 인식하게 됩니다.

아마존 에코 쇼

하지만 아직 갈 길이 멀다. 비록 주스를 짜낼 가치는 있지만 말이다. Mattersight Corporation은 AI를 개발했습니다. 콜센터 기술이라고 불리는 예측 행동 라우팅, 발신자의 음성 패턴을 분석하고 성격 유형이 호환되는 인간 요원과 연결합니다. 회사에 따르면, 어울리는 성격을 가진 사람을 매칭하면 상반된 성격 유형의 사람에 이어 절반의 시간 동안 통화에 성공할 수 있다고 합니다.

유사한 접근 방식을 사용하면 AI가 발생할 수 있습니다. 당신이 원하는 방식으로 당신에게 대답하는 조수. 이는 대화 상대의 억양과 목소리 크기를 맞추는 것만큼 간단한 것일 수도 있습니다. 또는 다른 사용자에게 사용할 수 있는 더 밀집된 세부 정보와 비교하여 일부 사용자에게는 더 감정적인 단어를 사용하여 아이디어를 전달하는 방식을 변경할 수도 있습니다. 어쩌면 어떤 사람들은 길게 채팅할 수 있는 음성 비서를 원하는 반면, 다른 사람들은 단순히 필요한 정보를 가능한 가장 간결한 방식으로 전달하기를 원할 수도 있습니다. 일체 포함. 보조자는 이 두 가지를 모두 할 수 있어야 합니다.

다음과 같은 기술 구글 듀플렉스 AI가 생성한 합성 음성과 대화가 얼마나 설득력 있게 정확한지 보여주세요. AI가 노래 요청 및 음식 타이머를 처리하는 것보다 더 복잡한 영역으로 이동함에 따라 이 기술이 중요한 역할을 할 것으로 기대됩니다.

이는 음성으로 사용자를 식별하는 기능의 획기적인 발전으로 도움이 될 수 있습니다. Hebner는 Nuance의 기술이 단 1초의 오디오만으로도 사용자를 식별할 수 있다고 지적합니다. “예전에는 자신이 누구인지 이해하고 정확한 신호를 받는 데 10초가 걸렸습니다.”라고 그는 말했습니다. "그 힘은 상당합니다." 작은 음성 조각으로 사용자를 식별할 수 있으면 문제가 해결됩니다. 비밀번호 문제를 해결하고 보다 민감한 기밀을 위해 음성 지원을 사용할 수 있는 기회를 열어줍니다. 정보.

적극적으로 행동하기

훌륭한 조수는 당신이 요청하면 뭔가를 해줄 것입니다. 훌륭한 조수는 물어볼 필요가 없습니다. 지금 당장은 A.I. 어시스턴트는 아직 첫 번째 단계에 있습니다. 사용자는 원하는 노래나 필요한 알림을 받을 수 있지만 일반적으로 명시적으로 요청한 경우에만 가능합니다. 사람들이 음성 비서에 더 익숙해짐에 따라 순전히 반응형 장치에서 능동적인 장치로 전환할 수 있는 좋은 기회가 있습니다.

사람들이 특정 작업을 기계에 넘겨주고 싶어하는지 여부에 대한 큰 질문이 있습니다.

AI에 대해 어떻게 생각하시나요? 조수가 당신을 대신하여 결정을 내리나요? 누군가가 춥다고 했을 때 온도 조절 장치를 작동시키거나 점심 식사를 다시 예약하는 것까지 무엇이든 될 수 있습니다. 늦었기 때문에 회의를 하거나, 운동을 더 많이 하거나 돈을 더 잘 절약하라고 재촉하기 위해 월급. 점점 더 많은 스마트 장치가 집에 들어오면서 음성 비서가 명령할 수 있는 명령의 수가 크게 늘어날 것입니다.

이것의 일부는 사람들이 스스로 결정을 내리는 기계에 대해 얼마나 편안한지에 대한 사회적 질문입니다. 사람들이 특정 작업을 기계에 넘겨주고 싶어하는지 여부에 대한 큰 질문이 있습니다. 신용 카드와 집 열쇠를 실제 비서에게 주는 것과 같다고 생각하십시오. 훨씬 더 많은 Skynet을 뿌려야 합니다. 단점은 일정량의 통제권을 포기한다는 것입니다. 잠재적인 장점은 자유 시간을 늘리는 것입니다. 물론 기술적인 어려움이 크지만…

피드백에 관한 모든 것

Tom Hebner는 사전 대응성 문제와 관련된 큰 과제를 지적했습니다. 기계가 올바른 작업을 수행했는지 어떻게 알 수 있습니까? 선과 선의 개념으로 돌아가기 훌륭한 조수, 훌륭한 조수는 큰 회의에 앞서 귀하가 묻지 않고도 모든 파일을 처리할 수 있습니다. 하지만 잘못된 파일이라면 어떻게 될까요? 홈 AI를 만드는 데 큰 문제가 있습니다. 보다 적극적인 방법은 현재 우리가 얻고 있는 정보가 올바른 정보인지 여부를 밝힐 수 있는 방법이 제한되어 있다는 것입니다.

일체 포함. 페퍼 로봇 좋네
오스미 토모히로/게티 이미지

"매일 집에 들어갈 때 같은 노래를 요청했는데, 집에 들어와서 바로 재생이 시작된다면, 그 사람들이 그 노래가 맞는지 어떻게 알 수 있을까요?" 헤브너가 말했다. “내가 연주를 멈추지 않으면 그게 옳다는 뜻인가요? 내가 '그만해'라고 말한다면, 그게 잘못됐고 다시는 그런 일을 해서는 안 된다는 뜻인가요? 피드백 메커니즘은 보다 적극적인 시스템을 확보하지 못하는 이유 중 하나입니다.”

이는 엔지니어가 파악하기 어려운 문제입니다. 인턴에게 모든 단일 작업에 대한 지침과 피드백을 요청한 적이 있는 사람이라면 때로는 업무를 위임하는 것보다 직접 수행하는 것이 더 쉽다는 것을 알고 있습니다. AI. 당신의 삶을 더욱 원활하게 만들어 줄 조수가 있습니다. 작업이 제대로 수행되었는지 확인하기 위해 매일 수십 개의 미니 설문조사를 제공하지 않습니다. 이는 이러한 장치의 사용자 친화성을 저해하지 않는 방식으로 해결되어야 하며 시스템이 사용자의 선호도를 학습하기 전에 사전에 많은 교육이 필요하지 않습니다.

무엇이 정답인가요? 잘 모르겠습니다. 그러나 스티브 잡스가 말했듯이 이를 알아내는 것은 고객의 몫이 아닙니다.

새로운 상호작용 방법

에 장면이 있어요 2001: 스페이스 오디세이 놀랍게도 여전히 가장 유명한 가상의 A.I.인 살인적인 HAL 9000이 등장합니다. 역사 보조원은 말하는 내용을 결정하기 위해 마이크만 사용하는 것이 아님을 밝힙니다. 두 명의 승무원이 HAL이 들을 수 없는 곳에서 말할 장소를 선택하려고 할 때 HAL은 여전히 ​​그들을 이해할 수 있음을 밝힙니다. 입술 움직임을 읽는 것을 기반으로.

2001: 스페이스 오디세이

영화의 무서운 순간? 확신하는. A.I. 조수는 미래에도 일할 수 있나요? 음, 그렇죠!

음성 비서가 음성으로 제한되어야 한다는 생각은 그들이 우리와 유용하게 상호 작용할 수 있는 방법의 수를 줄입니다. 의 증가와 함께 얼굴 인식 그리고 감정 추적 기술, 지속적으로 사용자에 대해 수집되는 생체 인식의 수가 점점 늘어나고 있으며, 심지어 마음을 읽는 기술이 곧 등장, AI가 사용할 수 있는 다양한 신호가 많이 있습니다. 결론을 도출하는 보조자.

지금부터 10년 후에는 이러한 AI를 제어하기 위해 음성만 사용하게 될 것이라는 생각입니다. 어시스턴트는 80년대 초반의 PC를 보면서 우리가 마음대로 사용할 수 있는 키보드 외에는 아무것도 없을 것이라고 생각하는 것과 같습니다.

편집자의 추천

  • 감정 감지 A.I. 여기 있습니다. 다음 면접에 나올 수도 있습니다.
  • Apple의 새로운 시애틀 캠퍼스는 인공 지능인 Siri에게 큰 의미가 있을 수 있습니다.
  • Google은 AI를 사용하는 방법을 찾았습니다. 풍력 에너지의 유용성을 높이기 위해