AI 画像ジェネレーターが依然として苦労している 5 つのこと

AI画像ジェネレーターのようなもの ダルイー, 安定した拡散, 旅の途中、 と Bing イメージ クリエーター 素晴らしい結果が得られますが、時には信じられないほどイライラすることもあります。 わずか数語の簡単なプロンプトで、AI はプロの写真や説得力のあるアートのような印象的な画像をさまざまなスタイルで出力できます。 ただし、同じプロンプトによって、恐ろしい生き物や、笑えるほど欠陥のあるレンダリングが作成される場合があります。

コンテンツ

  • ハンドサラダと指の腹
  • 文章や書き方に問題がある
  • 目にはそれがない
  • 面倒な道具
  • 悪夢の歯
  • AIアートは急速に進歩している

否定的なプロンプトは、これらのエラーの可能性を減らすのに役立つかもしれませんが、複雑さが常にあなたを救うとは限りません。 AI の専門家でさえ、いびつな生き物やこの世のものとは思えない光景に苦労しており、プロンプトを調整したり、従来の写真編集者で画像を修正したりするのに長時間かかる必要があります。 当面は、画像の適切な領域を注意深く観察すれば、それが機械によって作成されたものであるかどうかを識別できる可能性が高くなります。

おすすめ動画

ハンドサラダと指の腹

AI 開発者は、人間の手がどのように見えるべきかを人工知能ツールに教えるという取り組みで進歩を遂げてきましたが、改善の余地はたくさんあります。 指が目立たないとエラーを見逃しやすくなりますが、これは進行中の問題です。

関連している

  • 安定拡散はフィンガーの生成に関する問題を解決することを目的としています
  • AI によって生成されたビデオが登場し、急速に進化しています
  • Bing Image Creator は、DALL-E AI で生成された画像をブラウザーに提供します
Dall-E は初期の AI リーダーでしたが、手は AI の特徴ではありません。
Dall-E は初期の AI リーダーでしたが、手は AI のものではありません。アラン・トゥルーリーに促されたダルイー

一般に公開されている最初で最高の AI 画像ジェネレーターの 1 つ、 OpenAI の Dall-E、手をつないでいる人々の写真を作成しました。 一見、大丈夫そうに見えるかもしれません。 詳しく調べると、いくつかの問題が明らかになります。 余分な指、奇妙な爪、結合した数字に注意してください。

複雑なグリップと交差した指はさらに困難です。 AI 画像に「手のサラダ」または「指の腹」と呼ばれる古典的な不具合が返されても驚かないでください。

Dall-E の組まれた手が不穏です。
Dall-E の組まれた手が不穏です。アラン・トゥルーリーに促されたダルイー

文章や書き方に問題がある

テキストはコンピュータで簡単に生成できると期待するかもしれません。 電話を取ったりブラウザを開いたりすると、毎日画面に単語の痕跡が表示されます。 初期のコンピューターとは異なり、 トップのゲーミングPC 今日では、いかなる種類のグラフィックも表示できませんでした。 すべてはテキストまたは数字でした。

Leonardo AI はスタイルを知っていますが、印刷されたテキストは困難です。
Leonardo AI はスタイルを認識しますが、印刷されたテキストは困難です。Alan Truly が促した Leonardo AI

しかし、実際の文字や記号を印刷または書き言葉として表示することは、ユーザーにとって驚くほど難しいことです。 AI画像生成器. 簡単に解決できる問題のように聞こえるかもしれませんが、そうではありません。 アプリはプレーンテキストを単にオーバーレイすることはできません。 説得力を持たせるには、テキストのスタイル、シェーディング、角度、遠近感がシーンの残りの部分と一致している必要があります。

この例では、比較的新しい AI 画像ジェネレーターである Leonardo AI が、ジャック ラビット スリムのダイナーのヴィンテージ看板で勇敢な取り組みを行いました。 何度も試行した後、AI はリクエストに非常に近い「Jack Rabbit's」をなんとか言いました。 どの画像もビンテージ写真のスタイルは完璧でしたが、文字や言葉にはほとんど欠陥がありました。

Leonardo AI は、これらのレンダリングの 1 つでテキストを正確に取得するところまで来ました。
Leonardo AI は、左側のレンダリングでテキストをほぼ正確に取得しました。Alan Truly による Leonardo AI レンダリングのプロンプト

目にはそれがない

Bing Image Creator は目に問題があります。
Alan Truly による Bing Image Creator のプロンプト

目は心の窓だとよく言われます。 私たちはアイコンタクトに大きく依存しているため、それがリアルなポートレートを作成する上で最も重要な詳細となる可能性があります。 しかし、多くの AI ツールは人間の目をレンダリングするのが困難です。

Bing Image Creator は、スタジオの背景と多世代の家族写真のポーズを適切に作成しました。 しかし、ほとんどすべての人は、宇宙人によって挿入されたような奇妙な目をしています。あるいは、おそらくこれらの笑顔の人々は、不気味な生き物に変貌しつつあるのかもしれません。

Bing Image Creator の目の問題のより近い例を 2 つ挙げます。
Bing Image Creator の目の不快な問題のより近い例を 2 つ紹介します。Alan Truly による Bing Image Creator のプロンプト

面倒な道具

人間は、AI のようなデジタル製品だけでなく、ツールにも優れています。 私たちは、手に入る物理的なツールをすぐに使いこなします。 一方、AI は、それらが何であり、どのように使用されるかを理解するのに苦労します。

ミッドジャーニーは手のことは理解していますが、レンチには戸惑っています。
ミッドジャーニーは手のことは理解していますが、レンチについては困惑しています。 左下にあるのは電球でしょうか?アラン・トゥルーリーが提案するミッドジャーニー

Midjourney は、人間の顔や手に関する問題の解決において素晴らしい進歩を遂げている AI 画像ジェネレーターです。 しかし、整備士がレンチでボルトを締めているところを見せるように求められたとき、ツールはまったくありません。 あるケースでは手袋に爪が追加され、別のケースではどういうわけか電球が表示されます。

この切断中の髪のクローズアップ レンダリングでは、Bing Image Creator にはハサミが複雑すぎます。 それらは 1 枚の画像で開いているだけで、切断行為をしているようには見えません。

Bing Image Creator はハサミを認識できません。
Bing Image Creator はハサミがどのように機能するかを理解できません。Alan Truly による Bing Image Creator のプロンプト

悪夢の歯

安定した拡散による笑顔のレンダリングでは、歯が多すぎることがあります。
Alan Truly が推進した Leonardo AI による安定した拡散

人々が微笑んだり笑ったりすると、通常、写真が改善され、楽しく楽しいものになります。 2 人の学生が微笑んで笑うなどの単純なプロンプトが与えられると、AI はこれを複数の歯列やその他の奇妙な歪みを伴う悪夢の燃料に変えることができます。

Leonardo AI では、いくつかのモデルから選択することができ、歯をうまく処理できるモデルもあります。 人気の 安定拡散2.1モデル 歯を正しく整えるには助けが必要でした。 いくつかの否定的なプロンプトがあったため、問題は解決されました。 こうした AI 画像の問題には解決策がありますが、良い結果を得るにはまだ努力が必要です。

安定した拡散の笑顔は否定的なプロンプトから恩恵を受けます。
安定した拡散笑顔は、「奇妙な歯」と「歪んだ口」を取り除くという否定的なプロンプトの恩恵を受けます。Alan Truly が推進した Leonardo AI による安定した拡散

AIアートは急速に進歩している

AI アートの初期の頃、その結果は奇妙かつ素晴らしく、美しさと恐怖を同じくらい放棄して生み出していました。 新しいアップデートが行われるたびにエラーは目立たなくなり、多くの問題は改善することで解決できます。

非常に多くの AI ツールが利用可能、別のシステムを試すのは簡単です。 多くの AI 画像ジェネレーターでは、アルゴリズムを調整してより良い結果を得るために、否定的なプロンプトやその他のオプションを使用できます。

特に顔や手に焦点を当てている場合は、使用可能な写真を取得するために何度か試行する必要がある場合があります。 活字や書き言葉を含めたい場合は、画像エディターで AI の無意味な文字を消去し、正しいテキストをブレンドするのに時間を費やす準備をしてください。

良いニュースは、多くの AI 画像ジェネレーターが無料であり、サブスクリプション モデルが比較的安価であることです。 1 年以内に、これらの依然として残る問題が解決され、AI レンダリングを完成したアート作品として使用できるようになる可能性があります。 写真の代わり.

編集者のおすすめ

  • Midjourney の新しいズームアウト機能は、次の大きな AI センセーションになりつつあります
  • 更新された Bing Chat は 6 つの重要な新しい方法で ChatGPT を飛び越えます
  • このバイラル AI 画像は世界を騙しました、あなたはすでに見たかもしれません
  • Grammarly の新しい ChatGPT のような AI ジェネレーターは、文章を校正する以上のことができます
  • AI ウェブ検索の (遠い) 未来を見てきました – ここが素晴らしいところであり、どこが苦労しているのか

ライフスタイルをアップグレードするDigital Trends は、読者が最新ニュース、楽しい製品レビュー、洞察力に富んだ社説、ユニークなスニーク ピークをすべて提供して、ペースの速いテクノロジーの世界を監視するのに役立ちます。