MiniGPT-4: bezmaksas attēla pārveides AI rīks, ko varat izmēģināt jau šodien

ChatGPT ir lieliski, taču šobrīd tas attiecas tikai uz tekstu — ievadiet tekstu, ievadiet tekstu. GPT-4 bija paredzēts to paplašināt, pievienojot attēlu apstrādi, lai ļautu ģenerēt tekstu, pamatojoties uz attēliem.

Saturs

  • Kas ir MiniGPT-4?
  • Kā lietot MiniGPT-4
  • MiniGPT-4 ierobežojumi

MiniGPT-4: redzes valodas izpratnes uzlabošana, izmantojot uzlabotos lielo valodu modeļus

Tomēr OpenAI vēl nav izlaidusi šo funkciju, tāpēc tiek izmantots MiniGPT-4. Šis atvērtā pirmkoda projekts sniedz priekšskatījumu par to, kādā veidā notiek attēlu apstrāde GPT-4 varētu būt kā — un tas ir diezgan glīti.

Ieteiktie videoklipi

Kas ir MiniGPT-4?

MiniGPT-4 ir atvērtā pirmkoda projekts, kas tika publicēts vietnē GitHub, lai demonstrētu AI sistēmā redzamās valodas iespējas. Daži piemēri, ko tas var darīt, ietver attēlu aprakstu ģenerēšanu, stāstu rakstīšanu, pamatojoties uz attēliem, vai pat vietņu izveidi tikai no zīmējumiem.

Saistīts

  • Labākie autori pieprasa samaksu no AI firmām par viņu darba izmantošanu
  • GPT-4: kā izmantot AI tērzēšanas robotu, kas padara ChatGPT kaunā
  • Wix izmanto ChatGPT, lai palīdzētu ātri izveidot visu vietni

Neskatoties uz to, ko norāda nosaukums, MiniGPT-4 nav oficiāli savienots ar OpenAI vai GPT-4. To izveidoja grupa Ph.D. studenti, kas atrodas Saūda Arābijā Karaļa Abdullas Zinātnes un tehnoloģiju universitātē. Tas ir balstīts arī uz citu lielas valodas modeli (LLM), ko sauc par Vicuna, kas pats tika izveidots uz atvērtā koda lielās valodas modeļa Meta AI (LLaMA). Tas nav tik spēcīgs kā ChatGPT, taču to novērtē GPT-4 pati Vicuna tiek 90% robežās.

Kā lietot MiniGPT-4

MiniGPT-4 ir tikai demonstrācija, un tā joprojām ir pirmajā versijā. Pagaidām tai var piekļūt bez maksas grupas oficiālajā tīmekļa vietnē. Lai to izmantotu, vienkārši velciet attēlu vai noklikšķiniet uz "Nomest attēlu šeit". Kad tas ir augšupielādēts, ierakstiet uzvedni meklēšanas lodziņā.

Kāda veida lietas jums vajadzētu izmēģināt? Nu, lūgt MiniGPT-4 aprakstīt attēlu ir pietiekami vienkārši. Bet varbūt jums ir nepieciešama kāda kopija Instagram ierakstam jūsu uzņēmumam. Vai varbūt jūs vēlaties sapulcināt sastāvdaļas, kas nepieciešamas interesantam ēdienam, un pat recepti, kā to pagatavot. MiniGPT-4 var pārsteidzoši labi tikt galā ar šiem uzdevumiem.

Kodēšanas aspekti ir nedaudz aptuvenāki ap malām. Vienkārša salvešu zīmējuma pārvēršana par funkcionējošu vietni bija OpenAI triks, kad pirmo reizi tika paziņots par GPT-4. Bet šķiet, ka MiniGPT-4 vēl nevar tikt galā ar to tik labi. ChatGPT nodrošinās precīzāku kodu — faktiski jebkura MiniGPT-4 koda palaišana, izmantojot ChatGPT vai GPT-4 nodrošinās jums labākus rezultātus.

Viena lieta, kas jāņem vērā, ir tāda, ka MiniGPT-4 izmanto jūsu vietējās sistēmas GPU. Tātad, ja vien jums nav diezgan jaudīga diskrēta GPU, darbība var šķist diezgan lēna. Kontekstam es to izmēģināju a M2 Max MacBook Pro, un bija nepieciešamas aptuveni 30 sekundes, lai ģenerētu tekstu, pamatojoties uz augšupielādēto attēlu.

MiniGPT-4 ierobežojumi

MiniGPT-4 ātrums noteikti ir ierobežojums. Ja mēģināt tai piekļūt bez pienācīgas grafikas, tas ir pārāk lēns, lai justos atsaucīgi. Ja esat pieradis pie mākoņa ChatGPT ātruma vai pat Bing attēlu veidotājs, MiniGPT-4 jutīsies sāpīgi lēns.

Turklāt MiniGPT-4 ir visi tie paši ierobežojumi, kas ChatGPT vai Google Bard vai jebkuru citu AI tērzēšanas robotu, jo tas var “halucinēt” vai izdomāt informāciju.

Redaktoru ieteikumi

  • Lūk, kāpēc cilvēki domā, ka GPT-4 laika gaitā varētu kļūt muļķīgāks
  • ChatGPT: jaunākās ziņas, strīdi un padomi, kas jums jāzina
  • Kas ir DAN uzvedne ChatGPT?
  • Google Bard tagad var runāt, bet vai tas var noslāpēt ChatGPT?
  • ChatGPT veidotājs OpenAI saskaras ar FTC izmeklēšanu par patērētāju aizsardzības likumiem

Uzlabojiet savu dzīvesveiduDigitālās tendences palīdz lasītājiem sekot līdzi steidzīgajai tehnoloģiju pasaulei, izmantojot visas jaunākās ziņas, jautrus produktu apskatus, ieskatu saturošus rakstus un unikālus ieskatus.