MiniGPT-4: brezplačno orodje AI za pretvorbo slik v besedilo, ki ga lahko preizkusite že danes

ChatGPT je odličen, vendar je trenutno omejen samo na besedilo - besedilo vnese, besedilo ven. GPT-4 naj bi to razširil z dodajanjem obdelave slik, da bi omogočil ustvarjanje besedila na podlagi slik.

Vsebina

  • Kaj je MiniGPT-4?
  • Kako uporabljati MiniGPT-4
  • Omejitve MiniGPT-4

MiniGPT-4: Izboljšanje razumevanja vizualnega jezika z naprednimi modeli velikega jezika

Vendar OpenAI še ni izdal te funkcije, kjer nastopi MiniGPT-4. Ta odprtokodni projekt nam daje predogled tega, kaj je obdelava slike GPT-4 lahko je podobno - in je precej lepo.

Priporočeni videoposnetki

Kaj je MiniGPT-4?

MiniGPT-4 je odprtokodni projekt, ki je bil objavljen na GitHubu za predstavitev zmogljivosti vizualnega jezika v sistemu AI. Nekaj ​​primerov, kaj lahko počne, vključuje ustvarjanje opisov slik, pisanje zgodb na podlagi slik ali celo ustvarjanje spletnih strani samo iz risb.

Povezano

  • Najboljši avtorji zahtevajo plačilo od podjetij AI za uporabo njihovega dela
  • GPT-4: kako uporabljati klepetalni robot AI, ki osramoti ChatGPT
  • Wix uporablja ChatGPT, da vam pomaga hitro zgraditi celotno spletno mesto

Kljub temu, kar pove ime, MiniGPT-4 ni uradno povezan z OpenAI ali GPT-4. Ustvarila ga je skupina doktorjev znanosti. študenti s sedežem v Savdski Arabiji na Univerzi za znanost in tehnologijo kralja Abdullaha. Temelji tudi na drugem velikem jezikovnem modelu (LLM), imenovanem Vicuna, ki je bil zgrajen na odprtokodnem velikem jezikovnem modelu Meta AI (LLaMA). Ni ravno tako zmogljiv kot ChatGPT, ampak glede na ocene GPT-4 sama Vicuna pride znotraj 90 %.

Kako uporabljati MiniGPT-4

MiniGPT-4 je samo demo in je še vedno v svoji prvi različici. Za zdaj je dostopen brezplačno na uradni spletni strani skupine. Če ga želite uporabiti, preprosto povlecite sliko ali kliknite »Spusti sliko sem«. Ko je naložen, vnesite svoj poziv v iskalno polje.

Katere stvari bi morali preizkusiti? Prositi MiniGPT-4, da opiše sliko, je dovolj preprosto. Morda pa potrebujete kopijo za objavo na Instagramu za vaše podjetje. Morda pa želite izvedeti sestavine, potrebne za zanimivo jed, in celo recept, kako jo skuhati. MiniGPT-4 lahko presenetljivo dobro opravi te naloge.

Vidiki kodiranja so po robovih nekoliko bolj grobi. Spreminjanje preproste risbe prtička v delujočo spletno stran je bil trik, ki ga je pokazal OpenAI, ko je bil GPT-4 prvič objavljen. Vendar se zdi, da MiniGPT-4 tega še ne zmore tako dobro. ChatGPT bo zagotovil natančnejšo kodo – pravzaprav izvajanje katere koli kode MiniGPT-4 prek ChatGPT ali GPT-4 vam bodo prinesli boljše rezultate.

Upoštevati je treba, da MiniGPT-4 uporablja GPE vašega lokalnega sistema. Torej, če nimate dokaj zmogljivega diskretnega GPE-ja, se vam lahko zdi izkušnja dokaj počasna. Za kontekst sem ga preizkusil na M2 Max MacBook Pro, in trajalo je približno 30 sekund, da sem ustvaril besedilo na podlagi slike, ki sem jo naložil.

Omejitve MiniGPT-4

Hitrost MiniGPT-4 je vsekakor omejitev. Če poskušate dostopati do tega brez spodobne grafike, je prepočasen, da bi se počutil odzivno. Če ste navajeni hitrosti ChatGPT v oblaku ali celo Bing Image Creator, se bo MiniGPT-4 zdel boleče počasen.

Poleg tega ima MiniGPT-4 vse enake omejitve kot ChatGPT oz Google Bard ali kateri koli drug klepetalni robot z umetno inteligenco, saj lahko »halucinira« ali si izmisli informacije.

Priporočila urednikov

  • Zato ljudje mislijo, da GPT-4 sčasoma postaja vse bolj neumen
  • ChatGPT: najnovejše novice, polemike in nasveti, ki jih morate vedeti
  • Kaj je DAN poziv za ChatGPT?
  • Google Bard lahko zdaj govori, a ali lahko preglasi ChatGPT?
  • Izdelovalec ChatGPT OpenAI se sooča s preiskavo FTC zaradi zakonov o varstvu potrošnikov

Nadgradite svoj življenjski slogDigitalni trendi bralcem pomagajo slediti hitremu svetu tehnologije z vsemi najnovejšimi novicami, zabavnimi ocenami izdelkov, pronicljivimi uvodniki in enkratnimi vpogledi v vsebine.