Google ロボットがわずか 2 時間で自ら歩くことを学習

ウォルト・ディズニーのあのシーンを覚えていますか バンビ 名ばかりの子鹿はどこで自分の力で立ち上がって歩くことを学ぶのでしょうか? これは映画の中の魅力的な場面で、豚からキリン、そして鹿に至るまで、多くの動物の赤ちゃんが生後数分以内に習得するスキルを紹介しています。 これらの動物は、生まれてから最初の数時間で、自分の移動を完全に制御できるようになるまで、急速に運動能力を磨きます。 人間は生後7か月くらいで物につかまって立つことを覚え、生後15か月で歩き始めるが、それに比べれば絶望的に遅い。

コンテンツ

  • 正の強化
  • より優れたロボットの構築

ロボットが私たちを打ち負かした最新のタスクは何だと思いますか? 新しい研究では Googleの研究者によって実施されたエンジニアは四足歩行の Minitaur ロボットに歩き方を教えましたが、実際にはあまり教える必要はありませんでした。 むしろ、彼らは一種の目標指向型人工知能を使用して 4 足ロボットを作成しました 前に進む方法を学ぶ、後進、左右に完全に単独で回転します。 平らな地面、柔らかいマットレス、隙間のある玄関マットなど、3 つの異なる地形でこの動作を学習することに成功しました。

おすすめ動画

「脚のあるロボットは優れた機動性を実現できます。なぜなら、脚は未舗装の道路や人間用に設計された場所を移動するのに不可欠だからです。」 ジエ・タンプロジェクトの主任研究者であり、Googleの移動取り組み責任者である同氏はデジタルトレンドに語った。 「私たちは、脚式ロボットが多様で複雑な現実世界の環境をナビゲートできるようにすることに興味を持っています。 しかし、このような多様性に対応できるロボット コントローラーを手動で設計するのは困難です。 複雑。 したがって、ロボットが自ら学習できることが重要です。 これは、私たちのシステムを使用して、脚式ロボットが自立して歩くことを首尾よく学習できるという初期のデモンストレーションであるため、この研究は興味深いものです。」

正の強化

人間の労力を最小限に抑えて現実世界を歩くことを学ぶ

この特定のプロジェクトの根幹にあるテクノロジーは、深層強化学習と呼ばれるものです。 行動主義心理学と試行錯誤にヒントを得たディープラーニングへの具体的なアプローチ 学ぶ。 特定の報酬を最大化するように指示されたソフトウェア エージェントは、可能な限り正確かつ効率的な方法でその結果を達成する環境でアクションを実行することを学習します。 強化学習の力は

2013年に有名に実証されました Google の DeepMind が AI をどのように訓練したかを示す論文を発表したとき。 古典的な Atari ビデオ ゲームをプレイします。 これは、画面上のスコアと、プレイ中のビデオ ゲームの各フレームを構成する約 30,000 ピクセル以外の指示なしで達成されました。

ビデオゲーム、少なくともシミュレーションは、ロボット研究者によっても頻繁に使用されます。 シミュレーションは理論的には完全に理にかなっています。ロボット工学者が現実の世界に出かける前に、仮想世界でマシンを訓練できるからです。 これにより、ロボットが特定のタスクの実行を学習する際に経験する避けられないトラブルや消耗からロボットを守ることができます。 たとえて言えば、すべての運転レッスンがドライビング シミュレーターを使用して行われた場合を想像してください。 自分の身体の安全を危険にさらしたり、自分の車(または他人の車)を傷つけたりすることにそれほど慎重になる必要がないので、より早く学習できるだろうという議論もあるかもしれません。 また、割り当てられたレッスンを待ったり、免許を持ったドライバーが連れて行ってくれるのを待つことなく、より迅速にトレーニングを行うこともできます。

これの問題は、ドライビング ビデオ ゲームをプレイしたことのある人ならわかると思いますが、現実世界を現実世界のようにモデル化するのが非常に難しいことです。 代わりに、Google の研究者は、ロボットがより少ない試行回数でより迅速に学習できるようにする改良されたアルゴリズムの開発に着手しました。 Google の以前の調査に基づいて構築 2018年に出版、この最新のデモンストレーションでは、彼らのロボットはわずか数時間で歩行を学習することができました。

また、転倒を減らし、より慎重で安全な学習アプローチを強調しながらこれを行うこともできます。 その結果、ロボットが転倒するたびに持ち上げて埃を払うために人間が介入する必要が最小限に抑えられます。

より優れたロボットの構築

2時間で歩き方を覚えるというのは、鹿レベルの歩き方の学習効率ではないかもしれないが、エンジニアがロボットの通常の操作方法を明示的にプログラムしなければならないのとは程遠い。 (そして、前述したように、人間の幼児がそのような時間枠で対処できるよりもはるかに優れています!)

「多くの教師なし学習または強化学習アルゴリズムが実証されていますが、 シミュレーションを実際の脚のロボットに適用することは、信じられないほど難しいことが判明しました。」 と説明した。 「第一に、強化学習は大量のデータを必要とし、ロボットのデータ収集には費用がかかります。 私たちの以前の研究では、この課題に対処しました。 第二に、トレーニングでは誰かがロボットを監督するために多くの時間を費やす必要があります。 ロボットを監視し、何百回、何千回もつまずくたびに手動でリセットする人が必要な場合、ロボットのトレーニングには多大な労力と非常に長い時間がかかることになります。 時間がかかるほど、さまざまな環境で多くのロボットに学習をスケールアップすることが難しくなります。」

いつかこの研究は、さまざまな地形により迅速に適応できる、より機敏なロボットの作成に役立つ可能性があります。 「潜在的な応用例は数多くあります」とタン氏は語った。 しかし、タン氏は、これは「まだ初期段階であり、克服しなければならない課題はまだたくさんある」と強調した。

ただし、強化学習のテーマに沿って、これは確かに最大化する価値のある報酬です。

編集者のおすすめ

  • AI がブレイキング・バッドをアニメ化 - それは恐ろしい
  • なぜAIが世界を支配しないのか
  • AI が実際に知覚力を持つようになる時期をどうやって知ることができるのでしょうか?
  • 面白い公式: なぜ機械が生成するユーモアが A.I. の聖杯なのか
  • 不気味に美しい AI の「合成聖典」を読んでください。 それは神だと思っている

ライフスタイルをアップグレードするDigital Trends は、読者が最新ニュース、楽しい製品レビュー、洞察力に富んだ社説、ユニークなスニーク ピークをすべて提供して、ペースの速いテクノロジーの世界を監視するのに役立ちます。