このA.I. 想像上の写真を検索する Google 画像検索のようなもの

永遠
ビッグスリープ

不思議に思っている方のために言っておきますが、上の写真は「永遠を複雑に描いたもの」です。 しかし、それは人間のアーティストの作品ではありません。 それは、生成的な最新の驚くべき例である BigSleep の作成です。 人工知能 (A.I.) が動作中。

コンテンツ

  • BigSleep の仕組み
  • 画像生成AI

のビジュアルバージョンに少し似ています テキスト生成 AI モデル GPT-3, BigSleep は、任意のテキスト プロンプトを受け取り、その単語に合わせて画像を視覚化することができます。 それは永遠のような難解なものかもしれないし、一杯のチェリーや美しい家かもしれない(後者)。 これは、Google 画像検索のようなものだと考えてください。これまでに検索されたことのない写真のみを対象とします。 存在した。

おすすめ動画

BigSleep の仕組み

「大まかに言えば、BigSleep は BigGAN と CLIP という 2 つのニューラル ネットワークを組み合わせることによって機能します。」 ライアン・マードック, BigSleepの創設者である23歳のユタ大学で認知神経科学を学ぶ学生は、デジタルトレンドに語った。

そのうちの最初のものは、 BigGAN, Googleが開発した、ランダムなノイズを取り込んで画像を出力するシステムです。 BigGAN は敵対的生成ネットワークです。つまり、何を実行する 2 つの決闘ニューラル ネットワークです。 マードック氏は、画像生成ネットワークと差別者の間の「敵対的な綱引き」と呼んでいる 通信網。 時間の経過とともに、ジェネレーターとディスクリミネーターの間の相互作用により、両方のニューラル ネットワークが改善されます。

美しい家
BigSleep によれば、「美しい家」です。 つまり、それは間違っていません。ビッグスリープ

クリップ一方、OpenAI によって作成されたニューラル ネットワークは、画像と説明を一致させるように学習されています。 CLIP にテキストと画像を与えると、それらがどの程度一致しているかを判断し、それに応じてスコアを与えようとします。

この 2 つを組み合わせることで、BigSleep は BigGAN の出力から CLIP のスコアを最大化する画像を検索するとマードック氏は説明しました。 次に、生成された画像が説明と一致すると CLIP が判断するまで、BigGAN のジェネレーターに入力されたノイズをゆっくりと微調整します。 プロンプトに一致するイメージの生成には、合計で約 3 分かかります。

「BigSleep は、512 x 512 ピクセルの解像度でさまざまな概念やオブジェクトを適切に生成できるため、重要です」とマードック氏は述べています。 「これまでの研究では印象的な結果が得られましたが、私の知る限り、その多くは低解像度の画像やより日常的な物体に限定されていました。」

画像生成AI

BigSleep は、A.I. が初めてではありません。 画像の生成に使用されています。 その名前は思い出させます ディープドリーム、A.I. Google エンジニア Alex Mordvintsev によって作成され、分類モデルを使用してサイケデリックな画像を作成します。 GAN ベースのシステムも作成に使用されました。 A.I. オークションで売られた絵画 2018年には43万2500ドルという巨額で落札された。 しかし、それは確かに魅力的な前進です。

BigSleep を自分で試してみるには、Murdock 氏は、彼の著書をチェックすることを提案しました。 Google Colab ノートブック プロジェクトに関して。 Colab GUI の使用やその他のいくつかの手順には少し学習が必要ですが、無料で試してみることができます。 今後数週間のうちに、それをテストする他の方法も公開される可能性があります。 興味のある方はこちらもご覧ください r/メディア合成ここでは、ユーザーがこれまでにシステムで生成した最高の画像の一部を投稿しています。

編集者のおすすめ

  • A.I.はできますか? マイクロチップの設計において人間のエンジニアに勝てるでしょうか? Googleはそう考えている
  • 賢い新しいA.I. このシステムは、あなたが家を離れている間に犬を訓練することを約束します
  • AI の次の大きな課題は? Go の量子バージョンをプレイする
  • 練習を必要としない義足: バイオニクスにおける最新の進歩の内部
  • A.I. 翻訳ツールがネズミの秘密言語に光を当てる

ライフスタイルをアップグレードするDigital Trends は、読者が最新ニュース、楽しい製品レビュー、洞察力に富んだ社説、ユニークなスニーク ピークをすべて提供して、ペースの速いテクノロジーの世界を監視するのに役立ちます。