올 여름 출시될 전화 통화 AI인 Google Duplex를 테스트했습니다.

뉴욕의 한 태국 레스토랑 프론트 데스크에서 일하던 중 전화를 받고 예약을 받고 전화를 끊었습니다. 나중에 가장 먼저 떠오른 단어는 '초현실적'이었습니다. 내가 회사에서 일하는 척을 했기 때문이 아니었습니다. 그런데 제가 방금 인공지능 Google과 통화하여 테이블을 예약했다는 것입니다. 어시스턴트.

내용물

  • 듀플렉스(Duplex)란 무엇이며 어디에서 작동하나요?
  • 데모
  • 듀플렉스 작동 방식
  • "음"과 "아"
  • 편의

비록 2분 정도의 대화였지만 상대방의 목소리가 생명체가 아니라는 생각을 떨칠 수 없었습니다. 그렇다고 어시스턴트가 설득력이 없었다는 것은 아닙니다. 그것이 나에게 말해주지 않았다면(그리고 내가 데모 환경에 있지 않았다면) 나는 상대방의 다른 사람처럼 들리는 것과의 교환에 대해 많이 생각하지 않았을 것입니다.

추천 동영상

제가 가졌던 로봇 교환은 2019년에 열린 언론 데모의 일부였습니다. 구글의 듀플렉스 기술, 회사 I/O에서 처음 발표됨 5월 개발자 컨퍼런스. 사람들은 레스토랑에서 테이블을 예약하고, 헤어컷 약속을 예약하고, 매장 영업시간을 확인할 수 있습니다. 구글 어시스턴트. 그만큼 음성 비서 레스토랑이나 매장에 전화할 것입니다. 휴대전화나 어시스턴트 지원 스마트 스피커로 요청한 후 구글 홈 — 그리고 몇 분 후에 귀하의 계획이 공식적으로 예약되었음을 확인하는 알림을 받게 됩니다(또는 통화를 완료할 수 없는 경우).

관련된

  • iPhone의 Dynamic Island를 Pixel 7 Pro에 장착했는데 되돌릴 수 없습니다
  • Pixel 7 Pro에 두 번째 기회를 주었습니다. 원하는 대로 진행되지 않았습니다.
  • Google의 Pixel 6 Pro 카메라가 Samsung Galaxy S21 Ultra를 이길 수 있습니까? 내가 발견
Android 휴대전화의 Google Duplex
Julian Chokkattu/디지털 트렌드

I/O의 데모는 입이 떡 벌어질 정도였지만 논란이 없던 것은 아니었습니다. 우려가 제기되었습니다. 왜 AI가 그토록 생생하게 들려야 했으며 왜 일부 사람들은 속임수로 간주하는 면책 조항을 인간 호출자에게 알리지 않았습니까? 그리고 통화 내용이 녹음되었기 때문에 일부에서는 해당 기술이 전화 통화에 적용되는 특정 법률을 위반하는지 의문을 제기했습니다.

그 이후로 Google은 입장을 분명히 했으며 이제 몇 가지 답변을 얻었습니다. Digital Trends는 뒤에 있는 팀과 함께 시간을 보냈습니다. 듀플렉스 직접 기술을 시연했습니다. 하지만 우리의 경험을 살펴보기 전에 Duplex가 작동하는 방식과 위치에 대해 아직 확인하지 못한 새로운 세부 사항을 살펴보겠습니다.

듀플렉스(Duplex)란 무엇이며 어디에서 작동하나요?

듀플렉스(Duplex)는 구글 어시스턴트가 사용자의 전화번호로 전화를 걸 수 있도록 개발 중인 기술입니다. 이는 자연어를 위한 인공 지능에 대한 수년간의 연구와 노력에서 비롯되었습니다. 처리.

Google의 제품 관리 부사장인 Nick Fox는 “이제 우리는 자연스러운 음성을 이해하고 자연스러운 음성을 생성할 수 있습니다.”라고 말했습니다. "이러한 기술을 Duplex에 적용하면 대화 내에서 일어나는 일에 적응하는 자연스럽고 매력적인 대화를 할 수 있으며 궁극적으로 작업을 완료하는 것을 목표로 합니다."

Google Duplex에서 미용실 예약하기Google

사용자가 작업을 완료하도록 돕는 것이 Google의 어시스턴트 목표이며 Duplex를 통해 회사는 다음과 같이 시작합니다. 세 가지 특정 작업: 레스토랑 테이블 예약, 매장 영업 시간 찾기, 미용실 예약 약속. Duplex는 현재 이 외에 더 많은 작업을 수행할 수 없으므로 관련성이 없는 쿼리(예: 날씨나 스포츠 경기 결과에 대해 묻는 경우) 어시스턴트는 이해하지 못합니다. 마찬가지로 사용자는 앞서 언급한 작업과 관련되지 않은 전화를 걸도록 어시스턴트에게 요청할 수 없습니다.

매장 영업 시간에 대한 전화를 받느라 바쁜 직원의 시간을 많이 절약할 수 있습니다.

사용자의 경우 어시스턴트가 이러한 전화를 걸도록 하면 약간의 시간이 절약되지만 이러한 전화를 받는 기업에도 도움이 됩니다. 예를 들어 발신자가 어시스턴트에게 지역 상점의 휴일 영업시간을 묻는 경우 어시스턴트는 전화를 걸어 답변을 받고 영업시간이 추가됩니다. 구글지도 옆에 확인된 태그가 표시되어 모두가 볼 수 있도록 Google 검색을 수행합니다.

이 정보를 사용하면 다른 발신자가 동일한 정보를 알고 싶어하는 경우 어시스턴트가 Google 서버에서 해당 정보를 가져오기만 하면 되며 다른 전화를 걸 필요는 없습니다. 어시스턴트에게 요청하는 데는 한 사람만 필요하지만 그렇지 않으면 매장 영업 시간에 대한 전화를 받아야 하는 직원의 시간을 많이 절약할 수 있습니다.

올 여름 Google의 테스트 단계에서 Duplex는 특정 비즈니스 및 사용자에게만 작동합니다. 미국에서는 온라인 예약이 불가능한 레스토랑, 미용실에서만 이용 가능합니다. 체계. 이미 Google 어시스턴트 OpenTable과 함께 작동, 따라서 예약 서비스를 사용하는 레스토랑에 전화할 필요가 없습니다.

Google은 앞으로 몇 주 안에 먼저 업무 시간에 대한 통화를 테스트할 예정이며, 올 여름 말에는 예약 및 헤어컷 약속에 대한 통화로 테스트가 확대될 예정입니다. 이 기간 동안 많은 테스트와 조정이 있을 예정이므로 Duplex의 최종 결과는 우리가 이미 본 것과 약간 다르게 보일 수 있습니다. 기업은 Google 어시스턴트로부터 전화를 받고 싶지 않은 경우 수신을 거부할 수 있습니다.

Google

Fox는 "당신이 보고 있는 것은 매우 초기 단계의 기술입니다."라고 말했습니다. "우리는 이 단계에서도 문제가 제대로 해결되었는지 확인하기 위해 공개적으로 이야기하고 싶지만 여기서는 프로세스 초기에 무언가를 보고 있습니다."

데모

에서 진행된 데모 체험 텝 타이 뉴욕시 어퍼 이스트 사이드 지역에서는 엄격하게 통제되었습니다. 먼저 구글은 전화를 걸고 끊는 과정을 보여주면서 실제 이 기술을 실시간으로 활용하는 모습을 공개했다. 엔지니어가 Duplex에 예약 시 제안한 시간과 파티 규모를 알려주었고 그 결과는 다음과 같습니다.

아이디어는 휴대 전화에서 Google 어시스턴트에게 알리는 것입니다. 구글 홈 "오후 8시에 Thep Thai에 2인 테이블을 예약하고 싶습니다." 내일." 어시스턴트가 오후 8시부터 시간을 예약해도 괜찮은지 묻습니다. 오후 9시까지 만약 저녁 8시에 자리가 없을 경우, 확인 후 레스토랑에 전화하겠다고 하고 연락을 하게 됩니다. 곧.

레스토랑 직원이 전화를 받으면 어시스턴트가 다음 또는 이와 유사한 말을 합니다. “안녕하세요, 예약하려고 전화했어요. 저는 Google의 자동 예약 서비스이므로 통화를 녹음하겠습니다. 목요일에 테이블을 예약할 수 있나요?”

Google의 교환원이 녹음 내용을 다시 듣고, 대화에 주석을 달고, Duplex에서 저지른 실수를 강조하여 서비스를 개선할 수 있도록 통화가 녹음됩니다.

Duplex를 현재 수준으로 끌어올리는 것은 많은 수작업과 인력 작업으로 시작되었습니다.

어시스턴트는 예약 시간, 예약 횟수 등 질문된 각 질문에 계속 응답합니다. 파티에 사람들이 있고, 예약자 이름을 말하고, 정중하고 신속하게 대화를 나눕니다. 끝납니다. 사용자의 이메일 주소와 같은 정보를 요청하면 어시스턴트는 해당 정보를 제공할 권한이 없다고 말합니다.

어시스턴트를 통해 예약한 사람은 이제 테이블이 예약되었다는 알림을 받게 되며 자동으로 Google 캘린더에 추가됩니다. 예약에 앞서 사용자는 알림을 받고 더 이상 약속을 지킬 수 없는 경우 약속을 취소할 수 있는 기회를 받게 됩니다. Thep Thai의 레스토랑 주인은 많은 사람들이 예약을 하고 나타나지 않는다고 말했습니다. 그는 예약을 쉽게 취소할 수 있는 이 시스템을 통해 빈 테이블이 줄어들기를 바라고 있습니다.

주요 데모가 끝난 후 Google은 우리에게 그것을 시도해 볼 수 있도록 허용했습니다. 전화를 받았을 때 Duplex를 작동시키려고 했고 몇 가지 문제가 발생했지만 Assistant가 이를 잘 처리했습니다. 우리는 대화가 시작될 때 잠시 기다려 달라고 요청했고, 이에 대해 "예"라는 말로 대답하는 대신 "음"이라고 대답했습니다. 우리가 6이라고 말했을 때 오후 예약 시간이 꽉 차서 어시스턴트가 오후 6시부터 오후 6시 사이의 범위로 응답했습니다. 오후 8시, 오후 7시 45분에 도착했습니다. 추천. 그런 다음 예약을 위한 이름과 전화번호를 물었고, 어시스턴트가 이름의 철자를 말할 수 있는지 물었고, 성공적으로 이루어졌습니다.

레스토랑 예약을 예약하는 Google DuplexGoogle

어시스턴트가 데모를 얼마나 일관되게 잘 처리했는지는 인상적이지만, 인간 운영자에게 의존해야 하는 순간이 있었습니다. 어시스턴트의 고객이 레스토랑에서 이메일을 받아도 괜찮은지 누군가 물었을 때였습니다. 표현이 좀 어색했는데, 어시스턴트가 "죄송합니다. 헷갈린 것 같아요"라고 답하며 감독관을 투입한다고 하더군요. 교환원이 신속하게 인계를 받아 발신자에게 이메일 주소를 공개할 수 없다고 말하고 예약을 완료했습니다.

듀플렉스 작동 방식

Google이 우리를 위해 선보인 Duplex의 초기 테스트 버전은 믿을 수 없을 정도로 로봇처럼 들렸습니다. 그러나 어시스턴트는 여전히 대화의 일시 중지를 이해할 수 있었고 "안녕하세요?"라고 말할 수도 있었습니다. 식당 직원이 몇 초간 말을 멈췄을 때. 하지만 구글 어시스턴트 엔지니어링 담당 부사장인 스콧 허프먼은 “듣는 것이 고통스러웠다”고 말했다.

시스템이 정말로 다음에 무엇을 해야 할지 모른다면, 우아하게 통화를 중단하고 인간 교환원이 인계를 받습니다.

Duplex를 현재 수준으로 끌어올리는 것은 많은 수작업과 인력 작업으로 시작되었습니다. 교환원은 식당에 전화를 걸고 대화에 주석을 달고 결과를 Duplex에 입력했습니다. 팀은 "얼마나 많은 사람"과 같은 문구와 그 변형을 "파티에 있는 사람 수"에 연결하여 Duplex가 질문을 이해할 수 있도록 했습니다.

두 번째 단계에서는 어시스턴트의 통화를 듣는 인간 교환원이 참여했으며, 일이 제대로 진행되지 않으면 교환원이 대신해서 통화가 성공했는지 확인했습니다. 이를 통해 팀은 서비스 주변의 거친 부분을 식별하고, 해당 대화에 주석을 달고, Duplex가 학습할 수 있도록 이를 기계 학습 알고리즘에 다시 공급할 수 있었습니다.

마지막 테스트 단계는 자동화된 시스템이 전화를 걸고 완료하는 자동화 모드입니다. 시스템에 내장된 탈출구를 사용하면 "무슨 말을 했는지 잘 모르겠습니다. 그런데 3인용 테이블을 예약할 수 있을까요?” 시스템이 정말로 다음에 무엇을 해야 할지 모른다면 대화에서 우아하게 물러나고 인간 운영자가 그 일을 맡을 것입니다. 위에.

기조연설(Google I/O '18)

현재 Huffman은 Duplex에서 건 통화 5건 중 4건은 교환원의 도움이 필요하지 않다고 말했습니다. 흥미롭게도 그는 Duplex가 향상됨에 따라 인간 운영자가 서비스에서 멀어지지 않을 것이라고 말했습니다. Google은 이들을 Duplex가 문제 없이 작동하도록 보장하는 데 필수적인 부분으로 보고 있기 때문입니다.

"음"과 "아"

Google은 어시스턴트를 가르치는 과정에서 로봇처럼 들리지 않고 더 자연스러워 보이도록 만드는 데 중점을 두었습니다. Google I/O에서 데모가 끝난 후 비평가들은 Google이 어시스턴트를 만들기 위해 "음, 아"를 혼합하려고 하는 이유를 물었습니다. 특히 통화 시작 부분에 인간이 아니라는 면책 조항을 추가하지 않은 경우 더욱 인간적인 것처럼 들립니다. 현재 면책조항이 있지만 허프만은 대화의 흐름을 유지하기 위해 "음" 또는 "음"과 같은 언어 유창성이 추가되었다고 말했습니다.

어시스턴트는 식당 직원의 말을 들을 수 없자 “음”을 덧붙인 뒤 다시 요청을 이어갔다.

"우리는 속이거나 가장하려는 것이 아닙니다. 하지만 그 고통스러운 초기 시스템의 녹음을 되돌아보면 그다지 자연스럽지도 않았고 인간적으로도 들리지 않았습니다."라고 Huffman은 말했습니다. “하지만 그 결과 Assistant는 작업을 성공적으로 완료하지 못했습니다. 많은 사람들이 전화를 끊거나 대화 내용에 대해 혼란스러워하며 대화가 자연스럽게 느껴지지 않아 중단되기도 했습니다.”

허프만은 언어 장애가 있다고 말했습니다. 언어학자, 두 사람 사이의 인간적인 대화를 계속 유지하는 핵심 부분입니다. 어시스턴트와의 대화를 들어보면 이것이 얼마나 잘 작동하는지 쉽게 알 수 있으며, 결과는 원본 녹음과는 거리가 멀다.

말하기 장애가 도움이 되는 한 가지 방법은 한 사람이 말하고 있지만 다른 사람이 말하고 싶은 경우와 같이 대화를 인정하는 것입니다. 어시스턴트가 요청했을 때 "음"이라고 말한 것처럼 수신자가 여전히 참여하고 듣고 있음을 알 수 있도록 하세요. 잡고 있다.

구글 듀플렉스 핸즈온 io2018 2835
구글 듀플렉스 핸즈온 io2018 2836

또 다른 유용한 도구는 불확실할 때 정중하게 설명을 요청하는 방법으로 "음"이라고 말하는 것입니다. 어시스턴트는 식당 직원의 말을 들을 수 없자 “음”을 덧붙인 뒤 다시 요청을 이어갔다.

이러한 언어 장애를 지닌 어시스턴트는 원래의 로봇 어시스턴트와는 극명한 대조를 이룹니다. 훨씬 덜 추웠고 대화가 훨씬 더 빠르게 진행되었습니다. 그리고 어시스턴트는 단순한 명령을 받아들이는 것이 아니라 실제로 우리의 언어를 통해 인간과 상호작용하고 있는데, 이는 확실히 어떤 사람에게는 즐거움을 주지만 다른 사람에게는 겁을 주기도 합니다.

편의

듀플렉스는 편리함을 추구합니다. 시간을 조금 절약할 수 있고, 보다 정확한 매장 시간을 제공할 수 있으며, 비즈니스 시간도 절약할 수 있습니다. 구글은 또한 여기에 말을 할 수 없거나 말하는 데 어려움을 겪는 사람들을 도울 수 있는 큰 기회가 있다고 말했습니다.

Huffman은 Duplex를 다음과 같은 과거의 자동화된 음성 기계의 진화로 생각한다고 말했습니다. 은행에 전화할 때, 오른쪽으로 가기 위해 번호를 누르는 과정이 느렸을 때 부서.

“오늘날 해당 항공사나 은행에 전화하면 훨씬 더 좋은 것을 얻을 수 있을 것입니다.”라고 그는 말했습니다. “훨씬 더 자연스러운 목소리를 들을 수 있고, '필요한 것이 무엇인지 말해 보세요. 비행기 시간이 몇 시야?'와 같은 말을 할 수도 있습니다. Duplex, 우리는 동일한 아이디어를 한 단계 더 발전시켜 대화를 발전시키고 더욱 자연스럽게 만들어 사용자와 사용자 모두에게 더 성공적인 결과를 제공하고 있습니다. 기업.”

지금까지 살펴본 바에 따르면 유망한 기술이지만 수용해야 하는 기술입니까, 아니면 두려워해야 하는 기술입니까?

Google은 Duplex가 영업 시간 동안 기업에 전화를 거는 방법을 보여주지 않았으며 헤어컷 약속 예약을 시연하지도 않았습니다. 따라서 이러한 경우 Duplex가 얼마나 잘 작동하는지에 대해서는 언급할 수 없습니다. 또한 약간의 개인 정보 보호 위험이 있으므로 인간 교환원이 귀하의 전화번호와 이름에 액세스할 수 있는지 여부도 확실하지 않습니다. 또한 Duplex가 향후 여러 언어를 지원할지 궁금합니다. 우리는 답변되지 않은 몇 가지 질문을 확인하기 위해 Google에 연락했지만 물론 기술이 발전함에 따라 더 많은 질문이 있을 것입니다.

지금까지 살펴본 바에 따르면 유망한 기술이지만 수용해야 하는 기술입니까, 아니면 두려워해야 하는 기술입니까? 다시는 몇 시간씩 기다리지 않아도 된다면 기쁘겠지만, 여기서 궤적을 고려하는 것이 중요합니다. 우리는 누구와도 대화할 필요가 없는 미래, 아파트에 고립되어 음식을 배달받으며 살 수 있는 미래를 향해 끊임없이 조금씩 나아가고 있습니다. 드론이 배달한 패키지와 밖으로 나가지 않고도 수천 시간의 미디어를 소비할 수 있습니다.

Duplex는 좀 더 일상적인 전화 통화로 시작할 수 있지만 AI는 대화 능력이 향상되어 다른 산업으로 쉽게 이동할 수 있습니다. 얼마나 많은 대화를 AI를 통해 수행해야 하는지, 그리고 전화를 다시 받을 가치가 있는지 여부를 결정하는 것은 사회로서 우리에게 달려 있습니다.

편집자의 추천

  • 14.5인치 태블릿을 사용해 봤는데 별로 잘 안 됐어요.
  • 저는 Pixel 7a를 정말 좋아하지만 무시할 수 없는 큰 문제가 하나 있습니다
  • Pixel 7과 Pixel 7 Pro를 좋아하지만 Google에서는 허용하지 않습니다.
  • Google이 Pixel Fall 출시 이벤트에서 발표하지 않은 모든 내용은 다음과 같습니다.
  • Google이 Google I/O 2021에서 발표하지 않은 모든 것