この夏に登場する電話通話 AI、Google Duplex をテストしました

ニューヨーク市のタイ料理レストランのフロントデスクで働いていたとき、私は電話を取って予約を取り、電話を切りました。 その後、最初に頭に浮かんだ言葉は超現実的でした。それは私が会社で働いているふりをしていたからではありません。 レストランですが、人工知能の Google に話しかけてテーブルを予約しただけです アシスタント。

コンテンツ

  • Duplex とは何ですか? どこで機能しますか?
  • デモ
  • デュプレックスの仕組み
  • 「えーっと」と「あのー」
  • 利便性

たとえたった2分間の会話であっても、相手の声は生き物ではないという思いがぬぐえませんでした。 だからといって、アシスタントの言葉に説得力がなかったわけではない。 もしそれが教えてくれなかったら(そして私がデモ環境にいなかったら)、相手側にいる別の人間のような音とのやりとりについてあまり考えなかったでしょう。

おすすめ動画

私が行ったロボット交換は、 Google の Duplex テクノロジー、同社の I/O で初めて発表されました 5月の開発者カンファレンス. これにより、人々はレストランのテーブルを予約したり、ヘアカットの予約をしたり、店舗の営業時間を調べたりすることができます。 Googleアシスタント. の 音声アシスタント 携帯電話またはアシスタント対応スマート スピーカーからリクエストを行った後、レストランまたは店舗に電話します。 グーグルホーム — そして数分後、プランが正式に予約されたことを確認する通知が届きます(または通話が完了できなかった場合)。

関連している

  • iPhone のダイナミック アイランドを Pixel 7 Pro に装着したら、もう元には戻れません
  • Pixel 7 Pro にもう一度チャンスを与えましたが、期待通りにはいきませんでした
  • GoogleのPixel 6 ProカメラはSamsung Galaxy S21 Ultraに勝てるでしょうか? 分かりました
Android スマートフォン上の Google Duplex
ジュリアン・チョッカトゥ/デジタル トレンド

I/O でのデモは驚くべきものでしたが、論争がなかったわけではありません。 なぜ AI はこれほどリアルに聞こえる必要があるのか​​、なぜ AI は人間の発信者に、欺瞞であると考える人もいるような免責事項をアナウンスしなかったのかという懸念が生じました。 また、通話は録音されていたため、この技術が通話を管理する特定の法律に違反するのではないかと疑問を抱く人もいた。

それ以来、Google は自らの立場を明確にし、現在ではいくつかの答えが得られています。 Digital Trends はチームとともに時間を過ごしました デュプレックス そして私たち自身でテクノロジーのデモを行いました。 しかし、私たちの経験に入る前に、Duplex がどこでどのように機能するかについて、私たちが明らかにした新しい詳細を見てみましょう。

Duplex とは何ですか? どこで機能しますか?

Duplex は、Google アシスタントがユーザーの端末で電話をかけることを可能にする開発中のテクノロジーです。 これは、自然言語のための人工知能に関する長年の研究と取り組みから生まれました。 処理。

「私たちは自然な音声を理解し、自然な音声を生成できるようになりました」とグーグルの製品管理担当副社長ニック・フォックス氏は語った。 「これらのテクノロジーは Duplex に適用され、会話内で起こっていることに適応する自然で魅力的な会話を実現し、最終的には物事を完了するという目標を達成します。」

Google Duplex でヘア予約をスケジュールするグーグル

ユーザーの仕事の遂行を支援することが Google のアシスタントの目標であり、同社は Duplex で次のことから始めています。 3 つの具体的なタスク: レストランのテーブルを予約する、店の営業時間を調べる、ヘアサロンのスケジュールを立てる 予定。 現時点では Duplex はこれ以上のことはできないため、クエリが適切でない場合 (たとえば、天気やスポーツのスコアについての質問など)、アシスタントは理解できません。 同様に、ユーザーはアシスタントに、前述のタスクに関係のない通話を依頼することはできません。

店舗の営業時間に関する電話対応に追われている従業員の時間を大幅に節約できる可能性があります。

ユーザーにとっては、アシスタントにこれらの電話をかけることで時間を少し節約できますが、電話を受ける企業にとってもメリットがあります。 たとえば、発信者がアシスタントに地元の店舗の休日営業時間を尋ねた場合、アシスタントは電話をかけ、応答を得て、営業時間が追加されます。 グーグルマップ Google 検索ではすべてが表示され、横に確認済みのタグが表示されます。

この情報があれば、他の発信者が同じ情報を知りたい場合、アシスタントは Google のサーバーから情報を取得するだけで済み、再度電話をかける必要はありません。 アシスタントに問い合わせるのに必要な作業は 1 人だけですが、そうでなければ営業時間に関する電話に応答できなくなる従業員の時間を大幅に節約できる可能性があります。

この夏の Google のテスト段階では、Duplex は選ばれた企業とユーザーのみと連携します。 アメリカではオンライン予約ができないレストランやヘアサロンのみでの販売となります。 システム。 Googleアシスタントはすでにあります OpenTable と連携する, そのため、予約サービスを利用しているレストランに電話する必要はありません。

Googleは今後数週間以内にまず営業時間内での通話をテストし、今夏後半には予約やヘアカットの予約の電話にもテストを拡大する予定だ。 この期間中に多くのテストと調整が行われるため、Duplex の最終結果は、これまでに見たものとは少し異なるものになる可能性があります。 企業は、Google アシスタントからの通話を受信したくない場合は、オプトアウトすることができます。

グーグル

「あなたが目にしているのは非常に初期段階のテクノロジーです」とフォックス氏は語った。 「私たちは、この段階でもそれについて公に話し合って、確実に正しい結果を導きたいと考えていますが、ここではプロセスのかなり早い段階で何かが見られます。」

デモ

で行われたデモ体験の様子 テープ・タイ ニューヨーク市のアッパーイーストサイド地区では、厳しく規制されていました。 まず、Google は、通話の発信と終了の全体的なプロセスを示すプレゼンテーションを行いましたが、実際にはこのテクノロジーをリアルタイムで使用していました。 エンジニアは、私たちが予約のために提案した時間とパーティーの規模を Duplex に伝えました。その後の結果は次のとおりです。

アイデアは、携帯電話で Google アシスタントに指示するか、 グーグルホーム あなたは「午後 8 時にテープ タイのテーブルを 2 人で予約したい」と考えています。 明日。" アシスタントが午後 8 時からの時間を予約してもよいか尋ねます。 午後9時まで 午後 8 時に空席がない場合に備えて、確認すると、レストランに電話して折り返し連絡すると言われます。 すぐ。

レストランの従業員が電話を取ると、アシスタントは次のようなこと、またはそれに類似したことを言います。「こんにちは、予約するために電話しています。 私は Google の自動予約サービスを利用しているので、通話を録音します。 木曜日のテーブルを予約できますか?」

通話は録音されるため、Google の人間のオペレーターは録音を聞き返し、会話に注釈を付け、Duplex が犯した間違いを強調表示してサービスを向上させることができます。

Duplex を現在のレベルに引き上げるには、多くの手作業と人間の作業が必要です。

アシスタントは、予約時間や予約人数など、質問されたすべての質問に答え続けます。 パーティーに参加している人、予約の名前、そして丁寧かつ迅速な会話 終わります。 ユーザーのメールアドレスなどの情報を求められた場合、アシスタントはその情報を提供する権限がないと答えます。

アシスタントを通じて予約した人には、テーブルが予約されたという通知が届き、そのテーブルは自動的に Google カレンダーに追加されます。 予約に先立って、ユーザーは通知と、予約に参加できなくなった場合に予約をキャンセルする機会を受け取ります。 テープ・タイのレストランのオーナーは、予約しても来ない人が多いと語った。 彼は、予約を簡単にキャンセルできるこのシステムにより、空のテーブルが減ることを期待しています。

メインのデモの後、Google は私たちがそれを試すことを許可してくれました。 電話を受けたとき、Duplex をつまずかせようとしたり、いくつかの複雑な問題を引き起こしたりしましたが、アシスタントはそれらをうまく処理しました。 私たちは会話の初めにそれを続けるように頼みましたが、それに対して口頭で「はい」ではなく「うーん」と答えました。 私たちがそれを6つ言ったとき 午後 予約時間は満席でした。アシスタントは午後 6 時から午後 6 時までの範囲で応答しました。 そして午後8時、そして午後7時45分に落ち着きました。 おすすめ。 次に、予約の名前と電話番号を尋ね、アシスタントが名前を綴れるかどうかを尋ねましたが、アシスタントは正しく答えました。

Google Duplex でレストランの予約をスケジュールするグーグル

人間のオペレーターに頼る必要がある瞬間に遭遇しましたが、アシスタントがデモを一貫してうまく処理したことは印象的です。 それは、アシスタントのクライアントがレストランからメールを受け取っても大丈夫かと誰かが尋ねたときのことです。 言い回しが少しぎこちなかったので、アシスタントは「申し訳ありませんが、混乱していたようです」と返答し、監督者を危険にさらしていると述べた。 人間のオペレーターがすぐに引き継ぎ、電話をかけてきた相手に電子メール アドレスを明かすことはできないと伝え、予約を完了しました。

デュプレックスの仕組み

Google が私たちのためにプレイした Duplex の初期のテスト バージョンは、信じられないほどロボットのように聞こえました。 しかし、アシスタントは会話の合間を理解することができ、「こんにちは?」とさえ言うことができました。 レストランの従業員が数秒間立ち止まったとき。 それでも、Googleアシスタントのエンジニアリング担当副社長のスコット・ハフマン氏は、「聞くのが苦痛だった」と語った。

システムが次に何をすべきか本当に分からない場合は、システムは潔く通話を終了し、人間のオペレーターが引き継ぎます。

Duplex を現在のレベルに引き上げるには、多くの手作業と人間の作業が必要です。 人間のオペレーターがレストランに電話をかけ、会話に注釈を付け、その結果を Duplex に入力しました。 チームは、「何人」などのフレーズとそのバリエーションを「パーティーの人数」に関連付け、Duplex が質問を理解できるようにしました。

第 2 段階では、人間のオペレーターがアシスタントによる通話を聞き、話が軌道から外れると、オペレーターが介入して引き継ぎ、通話が成功するかどうかを確認しました。 これにより、チームはサービスの大まかな部分を特定し、会話に注釈を付けて、Duplex が学習できるように機械学習アルゴリズムにフィードバックすることができました。

最終テスト段階は自動モードで、自動システムが呼び出しを行って完了します。 システムに組み込まれた脱出ハッチにより、アシスタントは次のような文のおかげで、タスクを完了するという重要な目標に戻ることができます。 でも、3人用のテーブルを予約してもいいですか?」 システムが実際に次に何をすべきかわからない場合は、システムは会話から潔く退出し、人間のオペレーターが対応します。 以上。

基調講演(Google I/O '18)

現時点では、Duplex による通話の 5 件中 4 件は人間のオペレーターの支援を必要としない、とハフマン氏は述べています。 興味深いのは、人間のオペレーターは、Google が Duplex が滞りなく動作するために不可欠な部分であると考えているため、Duplex が改善しても人間のオペレーターがサービスから引き離されることはない、と同氏は述べています。

「えーっと」と「あのー」

アシスタントを教えるプロセス全体を通じて、Google はアシスタントがロボットっぽくなく、より自然に聞こえるようにすることに重点を置きました。 Google I/Oでのデモの後、批評家たちはなぜGoogleがアシスタントを作るのに「えーっと」と「ああ」を混ぜようとしているのかと尋ねた 特に、通話の冒頭に人間ではないという免責事項を追加しなかった場合は、より人間らしく聞こえます。 現在は免責条項があるが、ハフマン氏によると、会話の流れを維持するために「えーっと」や「うーん」などの言葉の乱れが追加されているという。

アシスタントはレストラン従業員の言葉が聞き取れなかったために「えー」と付け加えて、再度リクエストをフォローしました。

「私たちは騙したり、なりすましたりしようとしているわけではありませんが、あの痛々しい初期のシステムの録音に戻ってみると、それはあまり自然に聞こえず、あまり人間的に聞こえませんでした」とハフマン氏は語った。 「しかし、その結果、アシスタントはタスクをうまく完了できませんでした。 多くの人は電話を切ったり、何を話しているのか混乱したりして、会話が自然に感じられずに破綻してしまいました。」

によれば、ハフマン氏は言論の混乱があると述べた 言語学者、2 人の間の人間的な会話を続けるための重要な部分です。 アシスタントとの会話を聞くと、これがいかにうまく機能しているかが簡単にわかりますが、その結果は元の録音とはかけ離れています。

発話の齟齬が役立つ一方向の方法は、1 人が話しているが、自分が話したい場合など、会話中の承認に役立ちます。 アシスタントが要求されたときに「うーん」と答えたときのように、あなたがまだ話していて聞いていることを受信機が認識していることを確認します。 所有。

Google Duplex ハンズオン io2018 2835
Google Duplex ハンズオン io2018 2836

もう 1 つの便利なツールは、不明な点があるときに説明を求める丁寧な方法として「えーっと」と言う方法です。 アシスタントはレストラン従業員の言葉が聞き取れなかったために「えー」と付け加えて、再度リクエストをフォローしました。

このような言語の流暢さを持つアシスタントは、元のロボットのアシスタントとはまったく対照的です。 寒さもだいぶ和らぎ、会話もスムーズに進みました。 そして、アシスタントは単純なコマンドを受け入れるのではなく、実際に私たちの言語を通じて人間と対話しているため、興奮する人もいれば、怖がらせる人もいるでしょう。

利便性

デュプレックスは利便性がすべてです。 時間を少し節約でき、より正確な店舗営業時間を知ることができ、ビジネスの時間も節約できます。 Googleはまた、ここには話すことができない、または話すのが困難な人々を助ける大きな機会があるとも述べた。

ハフマン氏は、Duplex を過去の自動音声機械の進化として考えていると述べました。 銀行に電話するとき、番号を押して右に進むのに時間がかかるとき 部門。

「今なら航空会社や銀行に電話すれば、もっとずっといいものをくれるでしょう」と彼は言った。 「より自然な音声が聞こえるようになり、『必要なことを教えてください。飛行機の出発時間は何時ですか?』などと言うことができます。 Duplex、私たちは同じアイデアをさらに一歩進めて、会話を進化させ、より自然なものにして、ユーザーとユーザーにとってより成功できるようにしています。 ビジネス。」

これまで見てきたことから、これは有望なテクノロジーですが、私たちが受け入れるべきものでしょうか、それとも恐れるべきものでしょうか?

Google は、Duplex がどのようにして店舗の営業時間に企業に電話をかけるのかを示していないし、ヘアカットの予約をスケジュールするデモも行っていないため、このような場合に Duplex がどの程度うまく機能するかについてコメントすることはできません。 また、プライバシーのリスクが若干生じるため、人間のオペレーターがあなたの電話番号とフルネームにアクセスできるかどうかもわかりません。 また、Duplex が将来的に複数の言語をサポートするかどうかも疑問です。 私たちはいくつかの未回答の質問を検証するために Google に連絡しましたが、もちろん、テクノロジーの進歩に伴い、さらに多くの質問が見つかるでしょう。

これまで見てきたことから、これは有望なテクノロジーですが、私たちが受け入れるべきものでしょうか、それとも恐れるべきものでしょうか? 二度と何時間も待たされる必要がなくなるなら幸いですが、ここでの軌道を考慮することが重要です。 私たちは、誰とも話す必要がなく、アパートで孤独に暮らし、食べ物が配達される未来に向かって常に一歩ずつ進んでいます。 ドローンで荷物が投下されたり、外に出ることなく何千時間ものメディアを視聴したりできます。

Duplex は日常的な電話での通話から始まるかもしれませんが、AI の会話はさらに向上し、他の業界への移植も容易になります。 私たちの会話のどの程度を AI を通じて行うべきか、また電話に出る価値があるかどうかを決めるのは、社会としての私たち次第です。

編集者のおすすめ

  • 14.5インチのタブレットを試してみましたが、あまりうまくいきませんでした
  • Pixel 7a はとても気に入っていますが、無視できない大きな問題が 1 つあります
  • Pixel 7 と Pixel 7 Pro を愛用したいのですが、Google が許してくれません
  • Google が Pixel Fall 発表イベントで発表しなかった内容はすべてここにあります
  • Google I/O 2021 で Google が発表しなかったすべてのこと