ChatGPT nagyszerű, de jelenleg csak szövegre korlátozódik – szöveg be, szöveg ki. GPT-4 Ezt kellett volna kibővíteni egy képfeldolgozás hozzáadásával, amely lehetővé teszi, hogy képek alapján szöveget generáljon.
Tartalom
- Mi az a MiniGPT-4?
- A MiniGPT-4 használata
- A MiniGPT-4 korlátai
MiniGPT-4: A látás-nyelv megértésének javítása fejlett, nagy nyelvű modellekkel
Az OpenAI azonban még nem adta ki ezt a funkciót, itt jön be a MiniGPT-4. Ez a nyílt forráskódú projekt áttekintést ad arról, hogy miben történik a képfeldolgozás GPT-4 lehet, hogy olyan – és ez elég ügyes.
Ajánlott videók
Mi az a MiniGPT-4?
A MiniGPT-4 egy nyílt forráskódú projekt, amelyet a GitHubon tettek közzé, hogy bemutassák egy mesterséges intelligencia-rendszer látásnyelvi képességeit. Néhány példa arra, hogy mire képes, képek leírásának generálása, képek alapján történetek írása, vagy akár weboldalak létrehozása rajzokból.
Összefüggő
- A legjobb szerzők fizetést követelnek az AI-cégektől munkájuk felhasználásáért
- GPT-4: hogyan kell használni az AI chatbotot, amely megszégyeníti a ChatGPT-t
- A Wix a ChatGPT segítségével segít egy teljes webhely gyors felépítésében
Annak ellenére, amit a név sugall, a MiniGPT-4 hivatalosan nem kapcsolódik az OpenAI-hoz vagy a GPT-4-hez. Ezt a Ph.D. csoport hozta létre. Szaúd-Arábiában élő hallgatók a King Abdullah Tudományos és Technológiai Egyetemen. Ezenkívül egy másik nagy nyelvi modellre (LLM), a Vicuna-ra épül, amely maga a nyílt forráskódú Large Language Model Meta AI-re (LLaMA) épült. Nem annyira erős, mint a ChatGPT, de minősíti
A MiniGPT-4 használata
A MiniGPT-4 csak egy demó, és még mindig az első verziójában van. Egyelőre ingyenesen elérhető a csoport hivatalos honlapján. Használatához egyszerűen húzzon be egy képet, vagy kattintson a "Drop Image Here" gombra. A feltöltés után írja be a promptot a keresőmezőbe.
Milyen dolgokat érdemes kipróbálni? Nos, megkérni a MiniGPT-4-et egy kép leírására, elég egyszerű. De lehet, hogy szüksége van egy példányra egy Instagram-bejegyzéshez a cége számára. Esetleg össze akarja gyúrni a hozzávalókat, amelyek egy érdekes étel elkészítéséhez szükségesek, és még egy receptet is szeretne elkészíteni. A MiniGPT-4 meglepően jól tudja kezelni ezeket a feladatokat.
A kódolási szempontok egy kicsit durvábbak a széleken. Egy egyszerű szalvétarajzból működő weboldalt alakítani az OpenAI trükkje volt, amikor először bejelentették a GPT-4-et. De úgy tűnik, hogy a MiniGPT-4 ezt még nem tudja olyan jól kezelni. A ChatGPT pontosabb kódot biztosít – valójában bármilyen MiniGPT-4 kódot is futtathat a ChatGPT-n vagy
Meg kell jegyezni, hogy a MiniGPT-4 a helyi rendszer GPU-ját használja. Tehát, hacsak nincs elég erős különálló GPU-ja, előfordulhat, hogy az élmény meglehetősen lassú. A szövegkörnyezet kedvéért kipróbáltam a M2 Max MacBook Pro, és körülbelül 30 másodpercbe telt a szöveg létrehozása egy feltöltött kép alapján.
A MiniGPT-4 korlátai
A MiniGPT-4 sebessége minden bizonnyal korlátot jelent. Ha valami tisztességes grafika nélkül próbál hozzáférni, akkor túl lassú ahhoz, hogy reagáljon. Ha megszokta a felhőalapú ChatGPT sebességét vagy akár Bing Image Creator, a MiniGPT-4 fájdalmasan lassú lesz.
Ezen túlmenően a MiniGPT-4 ugyanazokkal a korlátozásokkal rendelkezik, mint a ChatGPT ill Google Bard vagy bármely más mesterséges intelligencia chatbot, amely képes „hallucinálni” vagy információt alkotni.
Szerkesztői ajánlások
- Ezért gondolják az emberek, hogy a GPT-4 idővel egyre hülyébb lesz
- ChatGPT: a legfrissebb hírek, viták és tippek, amelyeket tudnia kell
- Mi az a DAN prompt a ChatGPT-hez?
- A Google Bard már beszélni tud, de ki tudja-e fojtani a ChatGPT-t?
- A ChatGPT-t gyártó OpenAI-t az FTC vizsgálja a fogyasztóvédelmi törvényekkel kapcsolatban
Frissítse életmódjátA Digital Trends segítségével az olvasók nyomon követhetik a technológia rohanó világát a legfrissebb hírekkel, szórakoztató termékismertetőkkel, éleslátó szerkesztőségekkel és egyedülálló betekintésekkel.