MiniGPT-4: Ingyenes kép-szöveg mesterséges intelligencia eszköz, amelyet még ma kipróbálhat

ChatGPT nagyszerű, de jelenleg csak szövegre korlátozódik – szöveg be, szöveg ki. GPT-4 Ezt kellett volna kibővíteni egy képfeldolgozás hozzáadásával, amely lehetővé teszi, hogy képek alapján szöveget generáljon.

Tartalom

  • Mi az a MiniGPT-4?
  • A MiniGPT-4 használata
  • A MiniGPT-4 korlátai

MiniGPT-4: A látás-nyelv megértésének javítása fejlett, nagy nyelvű modellekkel

Az OpenAI azonban még nem adta ki ezt a funkciót, itt jön be a MiniGPT-4. Ez a nyílt forráskódú projekt áttekintést ad arról, hogy miben történik a képfeldolgozás GPT-4 lehet, hogy olyan – és ez elég ügyes.

Ajánlott videók

Mi az a MiniGPT-4?

A MiniGPT-4 egy nyílt forráskódú projekt, amelyet a GitHubon tettek közzé, hogy bemutassák egy mesterséges intelligencia-rendszer látásnyelvi képességeit. Néhány példa arra, hogy mire képes, képek leírásának generálása, képek alapján történetek írása, vagy akár weboldalak létrehozása rajzokból.

Összefüggő

  • A legjobb szerzők fizetést követelnek az AI-cégektől munkájuk felhasználásáért
  • GPT-4: hogyan kell használni az AI chatbotot, amely megszégyeníti a ChatGPT-t
  • A Wix a ChatGPT segítségével segít egy teljes webhely gyors felépítésében

Annak ellenére, amit a név sugall, a MiniGPT-4 hivatalosan nem kapcsolódik az OpenAI-hoz vagy a GPT-4-hez. Ezt a Ph.D. csoport hozta létre. Szaúd-Arábiában élő hallgatók a King Abdullah Tudományos és Technológiai Egyetemen. Ezenkívül egy másik nagy nyelvi modellre (LLM), a Vicuna-ra épül, amely maga a nyílt forráskódú Large Language Model Meta AI-re (LLaMA) épült. Nem annyira erős, mint a ChatGPT, de minősíti GPT-4 maga Vicuna 90%-on belülre kerül.

A MiniGPT-4 használata

A MiniGPT-4 csak egy demó, és még mindig az első verziójában van. Egyelőre ingyenesen elérhető a csoport hivatalos honlapján. Használatához egyszerűen húzzon be egy képet, vagy kattintson a "Drop Image Here" gombra. A feltöltés után írja be a promptot a keresőmezőbe.

Milyen dolgokat érdemes kipróbálni? Nos, megkérni a MiniGPT-4-et egy kép leírására, elég egyszerű. De lehet, hogy szüksége van egy példányra egy Instagram-bejegyzéshez a cége számára. Esetleg össze akarja gyúrni a hozzávalókat, amelyek egy érdekes étel elkészítéséhez szükségesek, és még egy receptet is szeretne elkészíteni. A MiniGPT-4 meglepően jól tudja kezelni ezeket a feladatokat.

A kódolási szempontok egy kicsit durvábbak a széleken. Egy egyszerű szalvétarajzból működő weboldalt alakítani az OpenAI trükkje volt, amikor először bejelentették a GPT-4-et. De úgy tűnik, hogy a MiniGPT-4 ezt még nem tudja olyan jól kezelni. A ChatGPT pontosabb kódot biztosít – valójában bármilyen MiniGPT-4 kódot is futtathat a ChatGPT-n vagy GPT-4 jobb eredményeket ér el.

Meg kell jegyezni, hogy a MiniGPT-4 a helyi rendszer GPU-ját használja. Tehát, hacsak nincs elég erős különálló GPU-ja, előfordulhat, hogy az élmény meglehetősen lassú. A szövegkörnyezet kedvéért kipróbáltam a M2 Max MacBook Pro, és körülbelül 30 másodpercbe telt a szöveg létrehozása egy feltöltött kép alapján.

A MiniGPT-4 korlátai

A MiniGPT-4 sebessége minden bizonnyal korlátot jelent. Ha valami tisztességes grafika nélkül próbál hozzáférni, akkor túl lassú ahhoz, hogy reagáljon. Ha megszokta a felhőalapú ChatGPT sebességét vagy akár Bing Image Creator, a MiniGPT-4 fájdalmasan lassú lesz.

Ezen túlmenően a MiniGPT-4 ugyanazokkal a korlátozásokkal rendelkezik, mint a ChatGPT ill Google Bard vagy bármely más mesterséges intelligencia chatbot, amely képes „hallucinálni” vagy információt alkotni.

Szerkesztői ajánlások

  • Ezért gondolják az emberek, hogy a GPT-4 idővel egyre hülyébb lesz
  • ChatGPT: a legfrissebb hírek, viták és tippek, amelyeket tudnia kell
  • Mi az a DAN prompt a ChatGPT-hez?
  • A Google Bard már beszélni tud, de ki tudja-e fojtani a ChatGPT-t?
  • A ChatGPT-t gyártó OpenAI-t az FTC vizsgálja a fogyasztóvédelmi törvényekkel kapcsolatban

Frissítse életmódjátA Digital Trends segítségével az olvasók nyomon követhetik a technológia rohanó világát a legfrissebb hírekkel, szórakoztató termékismertetőkkel, éleslátó szerkesztőségekkel és egyedülálló betekintésekkel.