MiniGPT-4: Bezplatný nástroj umelej inteligencie na prevod obrázkov na text, ktorý si môžete vyskúšať už dnes

ChatGPT je skvelé, ale momentálne je obmedzené len na text – textový vstup, textový výstup. GPT-4 mal to rozšíriť pridaním spracovania obrázkov, ktoré mu umožní generovať text na základe obrázkov.

Obsah

  • Čo je MiniGPT-4?
  • Ako používať MiniGPT-4
  • Obmedzenia MiniGPT-4

MiniGPT-4: Zlepšenie porozumenia zraku a jazyka pomocou pokročilých modelov veľkých jazykov

OpenAI však túto funkciu ešte neuvoľnila, čo je miesto, kde prichádza MiniGPT-4. Tento open source projekt nám dáva náhľad na to, v čom je spracovanie obrazu GPT-4 môže byť - a je to celkom pekné.

Odporúčané videá

Čo je MiniGPT-4?

MiniGPT-4 je projekt s otvoreným zdrojovým kódom, ktorý bol zverejnený na GitHub, aby demonštroval schopnosti jazyka videnia v systéme AI. Medzi príklady toho, čo dokáže, patrí generovanie popisov obrázkov, písanie príbehov na základe obrázkov alebo dokonca vytváranie webových stránok len z kresieb.

Súvisiace

  • Špičkoví autori požadujú od firiem AI platbu za používanie ich práce
  • GPT-4: ako používať chatbota AI, ktorý robí ChatGPT hanbou
  • Wix používa ChatGPT, ktorý vám pomôže rýchlo vytvoriť celý web

Napriek tomu, čo názov napovedá, MiniGPT-4 nie je oficiálne pripojený k OpenAI alebo GPT-4. Vytvorila ho skupina Ph.D. študentov so sídlom v Saudskej Arábii na Univerzite vedy a techniky kráľa Abdulláha. Je tiež založený na inom veľkom jazykovom modeli (LLM) s názvom Vicuna, ktorý bol postavený na open-source Large Language Model Meta AI (LLaMA). Nie je to také silné ako ChatGPT, ale podľa hodnotenia GPT-4 samotná Vicuna sa dostane do 90 %.

Ako používať MiniGPT-4

MiniGPT-4 je len demo a je stále vo svojej prvej verzii. Zatiaľ je k nemu prístup zadarmo na oficiálnej stránke skupiny. Ak ho chcete použiť, jednoducho presuňte obrázok dovnútra alebo kliknite na „Drop Image Here“. Po nahraní zadajte výzvu do vyhľadávacieho poľa.

Aké veci by ste mali vyskúšať? Požiadať MiniGPT-4, aby opísal obrázok, je dosť jednoduché. Ale možno budete potrebovať nejakú kópiu pre príspevok na Instagrame pre vašu spoločnosť. Alebo možno chcete poznať ingrediencie potrebné na zaujímavé jedlo a dokonca aj recept na jeho varenie. MiniGPT-4 zvládne tieto úlohy prekvapivo dobre.

Aspekty kódovania sú na okrajoch trochu drsnejšie. Premena jednoduchej kresby obrúskom na fungujúcu webovú stránku bol trik, ktorý OpenAI ukázal, keď bol prvýkrát ohlásený GPT-4. Zdá sa však, že MiniGPT-4 to zatiaľ nedokáže zvládnuť. ChatGPT poskytne presnejší kód - v skutočnosti bude spustený akýkoľvek kód MiniGPT-4 cez ChatGPT alebo GPT-4 prinesie vám lepšie výsledky.

Jedna vec, ktorú treba poznamenať, je, že MiniGPT-4 používa GPU vášho miestneho systému. Ak teda nemáte pomerne výkonný samostatný GPU, môže sa vám zdať, že je to dosť pomalé. Pre kontext som to vyskúšal na a MacBook Pro M2 Maxa generovanie textu na základe obrázka, ktorý som odovzdal, trvalo približne 30 sekúnd.

Obmedzenia MiniGPT-4

Rýchlosť MiniGPT-4 je určite obmedzením. Ak sa k tomu pokúšate pristupovať bez slušnej grafiky, je to príliš pomalé na to, aby ste cítili odozvu. Ak ste zvyknutí na rýchlosť cloudového ChatGPT alebo dokonca Bing Image Creator, MiniGPT-4 sa bude cítiť bolestne pomalý.

Okrem toho má MiniGPT-4 všetky rovnaké obmedzenia ako ChatGPT alebo Google Bard alebo akéhokoľvek iného AI chatbota, ktorý dokáže „halucinovať“ alebo si vymýšľať informácie.

Odporúčania redaktorov

  • Tu je dôvod, prečo si ľudia myslia, že GPT-4 môže byť časom hlúpejší
  • ChatGPT: najnovšie správy, kontroverzie a tipy, ktoré potrebujete vedieť
  • Čo je výzva DAN pre ChatGPT?
  • Google Bard teraz môže hovoriť, ale dokáže prehlušiť ChatGPT?
  • Výrobca ChatGPT OpenAI čelí vyšetrovaniu FTC v súvislosti so zákonmi na ochranu spotrebiteľa

Zlepšite svoj životný štýlDigitálne trendy pomáhajú čitateľom mať prehľad o rýchlo sa rozvíjajúcom svete technológií so všetkými najnovšími správami, zábavnými recenziami produktov, užitočnými úvodníkmi a jedinečnými ukážkami.