Meta がビデオ用に DALL-E を作成しました。不気味でありながら素晴らしいものです

Meta は、ユーザーが入力した説明をビデオに変換できるクレイジーな人工知能モデルを発表しました。 システムは次のように呼ばれます ビデオを作ります これは、Web 上の AI 生成コンテンツの最新トレンドです。

このシステムは、「海で波をサーフィンするロボット」や「サンゴ礁を泳ぐカクレクマノミ」などの短い説明を受け入れ、その説明の短い GIF を動的に生成します。 超現実的、現実的、様式化された 3 つの異なるスタイルのビデオから選択することもできます。

キャンバス上にアーティストが筆で描く様子をクローズアップ

によると フェイスブックの投稿 Meta CEO の Mark Zuckerberg 氏によると、ビデオには動きが必要なため、書かれたテキストをビデオに翻訳するのは非常に困難です。

おすすめ動画

「システムは各ピクセルを正確に生成するだけでなく、ピクセルが時間の経過とともにどのように変化するかを予測する必要があるため、写真よりもビデオを生成する方がはるかに困難です。 Make-A-Video は、システムが物理世界の動きを理解し、それを従来のテキストから画像への生成に適用できるようにする教師なし学習のレイヤーを追加することで、この問題を解決します。」

大雨の中を歩く若い夫婦

Meta の AI 研究チームは、 システムがどのように動作するか、また現在のテキストから画像への変換 (T2I) 方式との違いについて説明します。 他の機械語モデルとは異なり、Meta の Text-to-Video (T2V) メソッドは、事前定義されたテキストとビデオのペアを使用しません。 たとえば、「歩く男性」と実際に歩く男性の動画を組み合わせることはありません。

これが人気のある T2I アプリケーションである DALL-E によく似ていると思われる方も、そう遠くないでしょう。 DALL-E の人気が高まって以来、他の T2I アプリケーションも展開されています。 TikTokがフィルターをリリース 8 月には、入力した単語に基づいて絵画風の画像を生成する AI Greenscreen と呼ばれるものが発表されました。

オレンジ色のニット帽をかぶったふわふわの赤ちゃんナマケモノが、目に映る非常に詳細なスタジオ照明画面をクローズアップしてラップトップを理解しようとしています

AI によって生成されたコンテンツは、ここ数年で非常に話題になるようになりました。

ディープフェイク技術、人の顔を別の顔に置き換える機械学習技術は、視覚効果スタジオでも、次のような巨額予算の番組で使用されています。 マンダロリアン.

7月、タイムズ紙はロシア・ウクライナ戦争の最中にウクライナ人女性について誤って報道した。 問題は 彼女は本物ではなかった.

おそらくAIの脅威 本当の脅威ではないしかし、DALL-E や Make-A-Video のようなプロジェクトは、興味深い可能性のいくつかを探求する楽しいものです。

編集者のおすすめ

  • Apple の ChatGPT ライバルが自動的にコードを作成する可能性がある
  • Bing Image Creator は、DALL-E AI で生成された画像をブラウザーに提供します
  • AI ウェブ検索の (遠い) 未来を見てきました – ここが素晴らしいところであり、どこが苦労しているのか
  • 画像生成 AI Dall-E が誰でも無料で遊べるようになりました
  • ばかばかしいスタートアップのアイデアをロボットベンチャーキャピタルに売り込んだ

ライフスタイルをアップグレードするDigital Trends は、読者が最新ニュース、楽しい製品レビュー、洞察力に富んだ社説、ユニークなスニーク ピークをすべて提供して、ペースの速いテクノロジーの世界を監視するのに役立ちます。