MiniGPT-4: besplatni AI alat za pretvaranje slike u tekst koji možete isprobati danas

ChatGPT je sjajan, ali trenutačno je ograničen samo na tekst — unos teksta, unos teksta. GPT-4 trebao je to proširiti dodavanjem obrade slike kako bi se omogućilo generiranje teksta na temelju slika.

Sadržaj

  • Što je MiniGPT-4?
  • Kako koristiti MiniGPT-4
  • Ograničenja MiniGPT-4

MiniGPT-4: Poboljšanje razumijevanja vida i jezika s naprednim modelima velikih jezika

Međutim, OpenAI tek treba objaviti ovu značajku, a tu dolazi MiniGPT-4. Ovaj projekt otvorenog koda daje nam pregled onoga što se sastoji od obrade slike GPT-4 može biti kao - i prilično je uredan.

Preporučeni videozapisi

Što je MiniGPT-4?

MiniGPT-4 je projekt otvorenog koda koji je objavljen na GitHubu kako bi demonstrirao mogućnosti vizijskog jezika u sustavu umjetne inteligencije. Neki primjeri onoga što može učiniti uključuju generiranje opisa slika, pisanje priča na temelju slika ili čak stvaranje web stranica samo iz crteža.

Povezano

  • Vrhunski autori traže plaćanje od AI tvrtki za korištenje njihovog rada
  • GPT-4: kako koristiti AI chatbot koji posramljuje ChatGPT
  • Wix koristi ChatGPT kako bi vam pomogao da brzo napravite cijelu web stranicu

Unatoč tome što ime implicira, MiniGPT-4 nije službeno povezan s OpenAI-jem ili GPT-4. Kreirala ga je grupa dr. sc. studenti sa sjedištem u Saudijskoj Arabiji na Sveučilištu znanosti i tehnologije King Abdullah. Također se temelji na drugom velikom jezičnom modelu (LLM) nazvanom Vicuna, koji je i sam izgrađen na otvorenom izvornom modelu velikog jezika Meta AI (LLaMA). Nije toliko moćan kao ChatGPT, ali prema ocjenama GPT-4 sama Vicuna ulazi unutar 90%.

Kako koristiti MiniGPT-4

MiniGPT-4 je samo demo i još uvijek je u svojoj prvoj verziji. Za sada mu se može pristupiti besplatno na službenim stranicama grupe. Da biste ga koristili, samo povucite sliku ili kliknite "Drop Image Here." Nakon što se prenese, upišite svoj upit u okvir za pretraživanje.

Koje stvari biste trebali isprobati? Pa, tražiti od MiniGPT-4 da opiše sliku dovoljno je jednostavno. Ali možda vam treba kopija za objavu na Instagramu za vašu tvrtku. Ili možda želite znati sastojke potrebne za zanimljivo jelo, pa čak i recept kako ga skuhati. MiniGPT-4 se može nositi s ovim zadacima iznenađujuće dobro.

Aspekti kodiranja su malo grublji oko rubova. Pretvaranje jednostavnog crteža salvete u funkcionalnu web stranicu bio je trik koji je pokazao OpenAI kada je GPT-4 prvi put najavljen. Ali čini se da se MiniGPT-4 još ne može tako dobro nositi s tim. ChatGPT će pružiti točniji kod — zapravo, pokretanjem bilo kojeg MiniGPT-4 koda kroz ChatGPT ili GPT-4 će vam donijeti bolje rezultate.

Jedna stvar koju treba napomenuti je da MiniGPT-4 koristi GPU vašeg lokalnog sustava. Dakle, osim ako nemate prilično moćan diskretni GPU, iskustvo će vam se možda učiniti prilično sporim. Za kontekst, isprobao sam to na M2 Max MacBook Pro, a bilo je potrebno oko 30 sekundi za generiranje teksta na temelju slike koju sam učitao.

Ograničenja MiniGPT-4

Brzina MiniGPT-4 svakako je ograničenje. Ako pokušavate pristupiti ovome bez neke pristojne grafike, presporo je da bi reagiralo. Ako ste navikli na brzinu ChatGPT-a u oblaku ili čak Bing Image Creator, MiniGPT-4 će se činiti bolno sporim.

Osim toga, MiniGPT-4 ima sva ista ograničenja kao ChatGPT ili Google Bard ili bilo koji drugi AI chatbot u smislu da može "halucinirati" ili izmišljati informacije.

Preporuke urednika

  • Evo zašto ljudi misle da bi GPT-4 s vremenom mogao postati gluplji
  • ChatGPT: najnovije vijesti, kontroverze i savjeti koje trebate znati
  • Što je DAN upit za ChatGPT?
  • Google Bard sada može govoriti, ali može li ugušiti ChatGPT?
  • Proizvođač ChatGPT-a OpenAI suočava se s istragom FTC-a zbog zakona o zaštiti potrošača

Nadogradite svoj životni stilDigitalni trendovi pomažu čitateljima da prate brzi svijet tehnologije sa svim najnovijim vijestima, zabavnim recenzijama proizvoda, pronicljivim uvodnicima i jedinstvenim brzim pregledima.