AI 画像ジェネレーターが依然として苦労している 5 つのこと

AI画像ジェネレーターのようなものダルイー, 安定した拡散, 旅の途中、と Bing イメージクリエーター素晴らしい結果が得られますが、時には信じられないほどイライラすることもあります。わずか数語の簡単なプロンプトで、AI はプロの写真や説得力のあるアートのような印象的な画像をさまざまなスタイルで出力できます。ただし、同じプロンプトによって、恐ろしい生き物や、笑えるほど欠陥のあるレンダリングが作成される場合があります。

コンテンツ

ハンドサラダと指の腹
文章や書き方に問題がある
目にはそれがない
面倒な道具
悪夢の歯
AIアートは急速に進歩している

否定的なプロンプトは、これらのエラーの可能性を減らすのに役立つかもしれませんが、複雑さが常にあなたを救うとは限りません。 AI の専門家でさえ、いびつな生き物やこの世のものとは思えない光景に苦労しており、プロンプトを調整したり、従来の写真編集者で画像を修正したりするのに長時間かかる必要があります。当面は、画像の適切な領域を注意深く観察すれば、それが機械によって作成されたものであるかどうかを識別できる可能性が高くなります。

おすすめ動画

ハンドサラダと指の腹

AI 開発者は、人間の手がどのように見えるべきかを人工知能ツールに教えるという取り組みで進歩を遂げてきましたが、改善の余地はたくさんあります。指が目立たないとエラーを見逃しやすくなりますが、これは進行中の問題です。

文章や書き方に問題がある

テキストはコンピュータで簡単に生成できると期待するかもしれません。電話を取ったりブラウザを開いたりすると、毎日画面に単語の痕跡が表示されます。初期のコンピューターとは異なり、トップのゲーミングPC 今日では、いかなる種類のグラフィックも表示できませんでした。すべてはテキストまたは数字でした。

Leonardo AI はスタイルを知っていますが、印刷されたテキストは困難です。 — Leonardo AI はスタイルを認識しますが、印刷されたテキストは困難です。Alan Truly が促した Leonardo AI

しかし、実際の文字や記号を印刷または書き言葉として表示することは、ユーザーにとって驚くほど難しいことです。 AI画像生成器. 簡単に解決できる問題のように聞こえるかもしれませんが、そうではありません。アプリはプレーンテキストを単にオーバーレイすることはできません。説得力を持たせるには、テキストのスタイル、シェーディング、角度、遠近感がシーンの残りの部分と一致している必要があります。

この例では、比較的新しい AI 画像ジェネレーターである Leonardo AI が、ジャックラビットスリムのダイナーのヴィンテージ看板で勇敢な取り組みを行いました。何度も試行した後、AI はリクエストに非常に近い「Jack Rabbit's」をなんとか言いました。どの画像もビンテージ写真のスタイルは完璧でしたが、文字や言葉にはほとんど欠陥がありました。

Leonardo AI は、これらのレンダリングの 1 つでテキストを正確に取得するところまで来ました。 — Leonardo AI は、左側のレンダリングでテキストをほぼ正確に取得しました。Alan Truly による Leonardo AI レンダリングのプロンプト

目にはそれがない

Bing Image Creator は目に問題があります。 — Alan Truly による Bing Image Creator のプロンプト

目は心の窓だとよく言われます。私たちはアイコンタクトに大きく依存しているため、それがリアルなポートレートを作成する上で最も重要な詳細となる可能性があります。しかし、多くの AI ツールは人間の目をレンダリングするのが困難です。

Bing Image Creator は、スタジオの背景と多世代の家族写真のポーズを適切に作成しました。しかし、ほとんどすべての人は、宇宙人によって挿入されたような奇妙な目をしています。あるいは、おそらくこれらの笑顔の人々は、不気味な生き物に変貌しつつあるのかもしれません。

Bing Image Creator の目の問題のより近い例を 2 つ挙げます。 — Bing Image Creator の目の不快な問題のより近い例を 2 つ紹介します。Alan Truly による Bing Image Creator のプロンプト

面倒な道具

人間は、AI のようなデジタル製品だけでなく、ツールにも優れています。私たちは、手に入る物理的なツールをすぐに使いこなします。一方、AI は、それらが何であり、どのように使用されるかを理解するのに苦労します。

ミッドジャーニーは手のことは理解していますが、レンチには戸惑っています。 — ミッドジャーニーは手のことは理解していますが、レンチについては困惑しています。左下にあるのは電球でしょうか？アラン・トゥルーリーが提案するミッドジャーニー

Midjourney は、人間の顔や手に関する問題の解決において素晴らしい進歩を遂げている AI 画像ジェネレーターです。しかし、整備士がレンチでボルトを締めているところを見せるように求められたとき、ツールはまったくありません。あるケースでは手袋に爪が追加され、別のケースではどういうわけか電球が表示されます。

この切断中の髪のクローズアップレンダリングでは、Bing Image Creator にはハサミが複雑すぎます。それらは 1 枚の画像で開いているだけで、切断行為をしているようには見えません。

Bing Image Creator はハサミを認識できません。 — Bing Image Creator はハサミがどのように機能するかを理解できません。Alan Truly による Bing Image Creator のプロンプト

悪夢の歯

安定した拡散による笑顔のレンダリングでは、歯が多すぎることがあります。 — Alan Truly が推進した Leonardo AI による安定した拡散

人々が微笑んだり笑ったりすると、通常、写真が改善され、楽しく楽しいものになります。 2 人の学生が微笑んで笑うなどの単純なプロンプトが与えられると、AI はこれを複数の歯列やその他の奇妙な歪みを伴う悪夢の燃料に変えることができます。

Leonardo AI では、いくつかのモデルから選択することができ、歯をうまく処理できるモデルもあります。人気の安定拡散2.1モデル歯を正しく整えるには助けが必要でした。いくつかの否定的なプロンプトがあったため、問題は解決されました。こうした AI 画像の問題には解決策がありますが、良い結果を得るにはまだ努力が必要です。

安定した拡散の笑顔は否定的なプロンプトから恩恵を受けます。 — 安定した拡散笑顔は、「奇妙な歯」と「歪んだ口」を取り除くという否定的なプロンプトの恩恵を受けます。Alan Truly が推進した Leonardo AI による安定した拡散

AIアートは急速に進歩している

AI アートの初期の頃、その結果は奇妙かつ素晴らしく、美しさと恐怖を同じくらい放棄して生み出していました。新しいアップデートが行われるたびにエラーは目立たなくなり、多くの問題は改善することで解決できます。

と非常に多くの AI ツールが利用可能、別のシステムを試すのは簡単です。多くの AI 画像ジェネレーターでは、アルゴリズムを調整してより良い結果を得るために、否定的なプロンプトやその他のオプションを使用できます。

特に顔や手に焦点を当てている場合は、使用可能な写真を取得するために何度か試行する必要がある場合があります。活字や書き言葉を含めたい場合は、画像エディターで AI の無意味な文字を消去し、正しいテキストをブレンドするのに時間を費やす準備をしてください。

良いニュースは、多くの AI 画像ジェネレーターが無料であり、サブスクリプションモデルが比較的安価であることです。 1 年以内に、これらの依然として残る問題が解決され、AI レンダリングを完成したアート作品として使用できるようになる可能性があります。写真の代わり.

編集者のおすすめ

Midjourney の新しいズームアウト機能は、次の大きな AI センセーションになりつつあります
更新された Bing Chat は 6 つの重要な新しい方法で ChatGPT を飛び越えます
このバイラル AI 画像は世界を騙しました、あなたはすでに見たかもしれません
Grammarly の新しい ChatGPT のような AI ジェネレーターは、文章を校正する以上のことができます
AI ウェブ検索の (遠い) 未来を見てきました – ここが素晴らしいところであり、どこが苦労しているのか

ライフスタイルをアップグレードするDigital Trends は、読者が最新ニュース、楽しい製品レビュー、洞察力に富んだ社説、ユニークなスニークピークをすべて提供して、ペースの速いテクノロジーの世界を監視するのに役立ちます。

AI 画像ジェネレーターが依然として苦労している 5 つのこと

ハンドサラダと指の腹

文章や書き方に問題がある

目にはそれがない

面倒な道具

悪夢の歯

AIアートは急速に進歩している

編集者のおすすめ

カテゴリ

最近

この未来的なファブリックはウェアラブル技術を再定義する可能性がある

ルカ: ベスパと濁った水がピクサーの次の映画をどのように形作ったか

優れた Google Pixel 5 は依然として使いやすい