MiniGPT-4: 今すぐ試せる無料の画像からテキストへの AI ツール

チャットGPT は素晴らしいですが、現時点ではテキストのみ (テキスト入力、テキスト出力) に制限されています。 GPT-4 は、画像処理を追加してこれを拡張し、画像に基づいてテキストを生成できるようにする予定でした。

コンテンツ

  • MiniGPT-4とは何ですか?
  • MiniGPT-4の使い方
  • MiniGPT-4 の制限事項

MiniGPT-4: 高度な大規模言語モデルによる視覚言語理解の強化

ただし、OpenAI はこの機能をまだリリースしていません。ここで MiniGPT-4 が登場します。 このオープンソース プロジェクトでは、画像処理のプレビューが提供されます。 GPT-4 と思われるかもしれませんが、それはとても素敵です。

おすすめ動画

MiniGPT-4とは何ですか?

MiniGPT-4 は、AI システムにおけるビジョン言語機能を実証するために GitHub に投稿されたオープン ソース プロジェクトです。 実行できることの例には、画像の説明の生成、画像に基づいたストーリーの作成、さらには図面だけから Web サイトを作成することが含まれます。

関連している

  • トップクラスの著者がAI企業に作品の使用料を要求
  • GPT-4: ChatGPT 顔負けの AI チャットボットの使い方
  • Wix は ChatGPT を使用して、ウェブサイト全体を迅速に構築するのに役立ちます

名前が示すとおり、MiniGPT-4 は OpenAI または GPT-4 に正式に接続されていません。 博士のグループによって作成されました。 サウジアラビアに拠点を置くキング・アブドラ科学技術大学の学生たち。 また、Vicuna と呼ばれる別の大規模言語モデル (LLM) にも基づいており、Vicuna 自体はオープンソースの大規模言語モデル メタ AI (LLaMA) に基づいて構築されています。 ChatGPT ほど強力ではありませんが、次のように評価されています。 GPT-4 ビクーニャ自体は 90% 以内に収まります。

MiniGPT-4の使い方

MiniGPT-4 は単なるデモであり、まだ最初のバージョンです。 現時点では無料でアクセスできます グループ公式サイトにて. これを使用するには、画像をドラッグするか、「ここに画像をドロップ」をクリックするだけです。 アップロードしたら、検索ボックスにプロンプ​​トを入力します。

どのようなことを試してみるとよいでしょうか? MiniGPT-4 に画像の説明を依頼するのは非常に簡単です。 しかし、会社の Instagram 投稿用にコピーが必要になるかもしれません。 あるいは、面白い料理に必要な材料や、その作り方のレシピさえ知りたいかもしれません。 MiniGPT-4 はこれらのタスクを驚くほどうまく処理できます。

コーディング面はもう少し荒削りです。 単純なナプキンの描画を機能する Web サイトに変えることは、GPT-4 が最初に発表されたときに OpenAI によって披露されたトリックでした。 しかし、MiniGPT-4 はまだそれを十分に処理できていないようです。 ChatGPT はより正確なコードを提供します。実際、MiniGPT-4 コードが何であれ、ChatGPT または GPT-4 より良い結果が得られます。

注意すべき点の 1 つは、MiniGPT-4 はローカル システムの GPU を使用するということです。 したがって、かなり強力な個別 GPU を持っていない限り、エクスペリエンスがかなり遅いと感じるかもしれません。 コンテキストのために、私はそれを試してみました M2 マックス MacBook Pro、アップロードした画像に基づいてテキストを生成するのに約 30 秒かかりました。

MiniGPT-4 の制限事項

MiniGPT-4 の速度には確かに制限があります。 まともなグラフィックスなしでこれにアクセスしようとすると、反応が遅すぎて感じられません。 クラウドベースの ChatGPT の速度に慣れている場合、または Bing イメージ クリエーター, MiniGPT-4 はひどく遅く感じるでしょう。

さらに、MiniGPT-4 には、ChatGPT や グーグル吟遊詩人 または、「幻覚」を見せたり、情報をでっち上げたりすることができるという点で、その他の AI チャットボットです。

編集者のおすすめ

  • GPT-4 が時間の経過とともに愚かになる可能性があると人々が考える理由は次のとおりです
  • ChatGPT: 最新のニュース、論争、知っておくべきヒント
  • ChatGPT の DAN プロンプトとは何ですか?
  • Google Bard は話せるようになりましたが、ChatGPT をかき消すことができるでしょうか?
  • ChatGPTメーカーのOpenAIは消費者保護法を巡りFTCの捜査に直面している

ライフスタイルをアップグレードするDigital Trends は、読者が最新ニュース、楽しい製品レビュー、洞察力に富んだ社説、ユニークなスニーク ピークをすべて提供して、ペースの速いテクノロジーの世界を監視するのに役立ちます。