この絵本遊びボットは、A.I. にとって大きなマイルストーンです。

Amazon Echo の新しい Alexa スキルと同様に、ここ数十年で AI が普及してきました。 より多くの愛するゲームで人間性を最大限に発揮する能力を徐々に獲得していきます。 1997 年のディープ ブルーとのチェス, 危険 2011 年に IBM Watson を使用, 2013 年の DeepMind による Atari ゲーム, 行く 2016 年の AlphaGo との出会い、 等々。 少なくとも一般の人々にとって、それぞれの事例は、計算の進歩という抽象的な道筋を観客のスポーツに変えます。 スカイネットはますます賢くなっています。 どうやって知ることができるのでしょうか? なぜなら、それが私たちを説得力をもって打ち負かすことができる娯楽の数が増えていることをチェックしてください。

コンテンツ

  • Pictionary マスターの構築
  • 見た目以上のもの

そのような背景を考えると、AI が開発されたと聞いてもそれほどショックではありません。 ~で説得力のあるパフォーマンスを発揮できるようになりました 図鑑、シャレード風の単語当てゲームで、1 人が画像を描き、他の人が何をスケッチしたかをできるだけ早く理解する必要があります。

おすすめ動画

これは、英国のサリー大学の研究者らが最近、「競争力のあるスケッチ AI」である Pixelor の作成で実行したことです。 エージェント。" ビジュアルを考えると このコンセプトに基づいて、Pixelor は、人間と同じくらい早く、あるいはそれ以上に、意図した対象として (人間と機械の両方に) 認識できるスケッチを描くことができます。 競合他社選手。

関連している

  • 任天堂はAIをどのように活用できるのか 4K ゲームを Switch Pro にもたらす
  • 龍が如くのディレクターは、PS5 の進化は AI に焦点を当てていると考えています。 そして機械学習

「私たちのAI。 エージェントはスケッチを最初からレンダリングできます。」 ソン・イーゼサリー大学ビジョン音声信号処理センターのコンピューター ビジョンと機械学習の読者である、デジタル トレンドに語った。 「『顔』のような単語を与えると、何を描くべきかがわかります。 … 毎回、異なる猫、異なる犬、異なる顔を描きます。 ただし、常にピクショナリーゲームに勝つ方法の知識を持っています。」

Pictionary マスターの構築

複雑な現実世界の画像をスケッチに縮小できること自体、非常に素晴らしいことです。 人間の顔を見て、目が 2 つの小さな楕円形、鼻が 1 本の線、口が半円になっている楕円形として見るには、ある程度の抽象度が必要です。 子供の場合、このように画像を認識する能力は、とりわけ、概念の認知的理解が急速に進んでいることを示しています。

ただし、AI の多くの側面と同様に、次のように要約されることがよくあります。 モラヴェックのパラドックス 「難しい問題は簡単で、簡単な問題は難しい」ということは、機械にとって重要な課題です 知能 ​​- 2歳児の大半にとって、それは基本的で目立たないスキルであるにもかかわらず、 子供たち。

スケッチXラボ

ただし、それは解決不可能な課題ではありません。 2016年では、Sketch というツールを使った Song の仕事について書きました。Sketch は、手描きのスケッチを認識し、現実の製品を検索するために使用できる深層学習ニューラル ネットワークです。 この特定のネットワークは、約 30,000 枚のスケッチと写真の比較で構成されるデータセットを使用してトレーニングされ、実際のオブジェクトが手描きでどのように表現されているかを認識できるようになりました。 Pixelor も同様のことを行いますが、他の人の描画を認識するだけでなく、独自の描画を生成することもできます。

しかし、それで勝つには十分ではありません 図鑑. 図鑑 このゲームは、ただ猫を描くだけではなく、できるだけ少ないストロークで猫を描くことを目的とした時間制限のあるゲームです。 あなたは世界で最も偉大なアーティストかもしれませんが、絵に描いたような完璧な猫を描くのに12時間かかるとしたら、あなたはひどい人です。 図鑑 プレーヤー。

これは、AI を構築することを意味しました。 それは人間を研究して、ピクショナリーをうまくプレイするためにどのような戦略を使うかを知ることができるかもしれない。 Song 氏は次のように述べています。「他の人間の裁判官が推測できるようにするために、最も重要な点は何ですか? 私たちの絵ができるだけ早く当てられることを望んでいます。」

これを行うために、研究者らは、これまでに利用可能な最大の人体スケッチ データセットである QuickDraw を使用しました。 次に彼らは、アーティストが行う必要があるストロークの順序に優先順位を付けるニューラルソートアルゴリズムを構築しました。 オブジェクトをできるだけ少ない行で推測可能な表現にする。 これは、スケッチをストロークに分割し、紙上に配置する必要がある正確な順序が確立されるまで、これらのストロークの順序を入れ替えて結果をテストすることを意味します。

たとえば、アーティストは猫の頭の円形の輪郭をスケッチすることから猫を描き始めることができます。 しかし、たとえそれが頭を表すものであるとわかっていても、円はさまざまなものになりえます。 ただし、とがった耳を 2 つ描いたり、ひげを 2 セット描いたりすると、描ける可能性のあるものの数はすぐに減ります。 この情報は、スケッチ エージェントに指示するために使用されます。

Song 氏は、チームはこれの一般向けバージョンをリリースする可能性があると述べました。 図鑑- 人間のプレイヤーがスケッチ AI を倒すために独自に挑戦できるように、ボットをプレイします。 マスター。 (知るか? エキスパートを演じることで、自分自身のスキルを向上させることもできる 図鑑 ゲーム。)

見た目以上のもの

ただし、Pixelor には単なるゲームプレイ用のボット以上のものがあります。 コンピューター システムに、私たちが対話する表面レベルのインターフェイスと内部のバックエンド コードの両方があるのと同じように、すべての主要な AI にも同様の機能があります。 ゲームプレイのマイルストーンには隠された動機がある。 明示的にコンピューター ゲームを作成している場合を除き、研究機関は開発に膨大な人時間を費やすことはありません。 ゲームプレイ用AI エージェントは、人間がもはや最善ではないという大きなリストに別の項目を追加するだけです で。 目的は常に、AI の基本的な部分を進歩させることです。 問題解決。

Pixelor の場合、隠れた目的は、特定のシーンにおいて人間にとって何が重要かをより適切に理解できるマシンを作成することです。 画像を見ると、最も顕著な詳細が何であるかをすぐに判断できます。

あなたが仕事から車で帰宅しているとします。 街路樹が絵になるかもしれないし、新しい映画の看板が面白いかもしれないし、 どちらも、目の前に出ようとしているかどうかはわからない人の顔やボディーランゲージほど重要ではありません。 あなた。 情報を意識的に処理する前に、脳は最も重要な詳細を選び出します。 コンピュータにこれができるようにするにはどうすればよいでしょうか? そうですね、そうするための優れた方法の 1 つは、人間が画像をスケッチするときに画像内の顕著な認識可能な詳細をどのように優先するかを確認することであることがわかりました。

「写真単体には人間の知識が本質的に埋め込まれているわけではありません」とソン氏は言う。 「私たちが求めているのは、人間が物体をどのように理解しているのかについてのシグナルを与えてくれる人間のデータです。」

前述したように、良い 図鑑 プレーヤーは、優れたボクサーと同様、特定の目的を達成するために必要な絶対的な最低限のことを知っています。 これは、マクロ的な意味で、Yi-Zhe Song と彼の同僚が関心を持っていることです。 コンピュータでゲームをプレイすることほど簡単なことではありません。 コンピューターに特定のシーンで何が重要かを理解させ、うまく一般化できるようにすることです。

からのすべてとして 自動運転車 職場でロボットを使用することがますます一般的になる中、これは解決すべき重要な課題です。

この研究について説明した論文は、11 月の SIGGRAPH Asia 2020 で発表される予定です。

編集者のおすすめ

  • Voyage は AI です。 ボットがルールを記述するゲームの楽園
  • チェス。 危険です。 行く。 AI のベンチマークとしてゲームを使用するのはなぜですか?
  • A.I. 彼はレトロなビデオゲームをデザインしています - そしてそれらは驚くほど優れています