MiniGPT-4: nemokamas vaizdo į tekstą AI įrankis, kurį galite išbandyti šiandien

ChatGPT yra puiku, bet šiuo metu apsiribojama tik tekstu – tekstą įvesti, išvesti. GPT-4 turėjo tai išplėsti pridedant vaizdo apdorojimą, kad būtų galima generuoti tekstą pagal vaizdus.

Turinys

  • Kas yra MiniGPT-4?
  • Kaip naudotis MiniGPT-4
  • MiniGPT-4 apribojimai

MiniGPT-4: vizijos ir kalbos supratimo gerinimas naudojant pažangius didelių kalbų modelius

Tačiau „OpenAI“ dar neišleido šios funkcijos, todėl čia atsiranda „MiniGPT-4“. Šis atvirojo kodo projektas suteikia mums galimybę peržiūrėti, kaip apdorojamas vaizdas GPT-4 gali būti panašus – ir tai gana tvarkinga.

Rekomenduojami vaizdo įrašai

Kas yra MiniGPT-4?

„MiniGPT-4“ yra atvirojo kodo projektas, paskelbtas „GitHub“, siekiant parodyti AI sistemos vizijos kalbos galimybes. Kai kurie pavyzdžiai, ką jis gali padaryti, yra vaizdų aprašymų generavimas, istorijų rašymas pagal vaizdus ar net svetainių kūrimas tik iš piešinių.

Susijęs

  • Geriausi autoriai reikalauja iš dirbtinio intelekto įmonių atlyginimo už naudojimąsi jų darbu
  • GPT-4: kaip naudoti AI pokalbių robotą, dėl kurio „ChatGPT“ daroma gėda
  • „Wix“ naudoja „ChatGPT“, kad padėtų greitai sukurti visą svetainę

Nepaisant to, ką rodo pavadinimas, MiniGPT-4 nėra oficialiai prijungtas prie OpenAI ar GPT-4. Jį sukūrė grupė Ph.D. studentai, įsikūrę Saudo Arabijoje, Karaliaus Abdulos mokslo ir technologijų universitete. Jis taip pat pagrįstas kitu didelės kalbos modeliu (LLM), vadinamu Vicuna, kuris pats buvo sukurtas naudojant atvirojo kodo didelės kalbos modelį Meta AI (LLaMA). Jis nėra toks galingas kaip „ChatGPT“, bet įvertintas pagal GPT-4 pati Vicuna patenka per 90 proc.

Kaip naudotis MiniGPT-4

MiniGPT-4 yra tik demonstracinė versija ir tebėra pirmoji versija. Kol kas ją galima pasiekti nemokamai oficialioje grupės svetainėje. Norėdami jį naudoti, tiesiog vilkite vaizdą arba spustelėkite „Numesti vaizdą čia“. Kai jis bus įkeltas, paieškos laukelyje įveskite raginimą.

Kokius dalykus turėtumėte išbandyti? Na, paprašyti MiniGPT-4 apibūdinti vaizdą yra pakankamai paprasta. Bet galbūt jums reikia kopijos jūsų įmonės „Instagram“ įrašui. O gal norisi išminkyti įdomiam patiekalui reikalingus ingredientus ir net receptą, kaip jį paruošti. MiniGPT-4 stebėtinai gerai gali susidoroti su šiomis užduotimis.

Kodavimo aspektai yra šiek tiek grubesni aplink kraštus. Paprastą servetėlių piešinį paversti veikiančia svetaine buvo „OpenAI“ triukas, kai pirmą kartą buvo paskelbtas GPT-4. Tačiau atrodo, kad MiniGPT-4 kol kas negali su tuo susitvarkyti. „ChatGPT“ suteiks tikslesnį kodą – iš tikrųjų, bet koks MiniGPT-4 kodas bus paleistas per „ChatGPT“ arba GPT-4 pasieksite geresnių rezultatų.

Reikia atkreipti dėmesį į tai, kad „MiniGPT-4“ naudoja jūsų vietinės sistemos GPU. Taigi, nebent turite gana galingą atskirą GPU, patirtis gali pasirodyti gana lėta. Dėl konteksto aš išbandžiau jį a M2 Max MacBook Pro, ir užtruko maždaug 30 sekundžių, kol sugeneravo tekstą pagal mano įkeltą vaizdą.

MiniGPT-4 apribojimai

MiniGPT-4 greitis tikrai yra apribojimas. Jei bandote tai pasiekti be tinkamos grafikos, per lėta jaustis reaguoti. Jei esate pripratę prie debesyje pagrįsto ChatGPT greičio ar net Bing vaizdo kūrėjas, MiniGPT-4 bus skausmingai lėtas.

Be to, MiniGPT-4 turi visus tuos pačius apribojimus, kaip ir ChatGPT arba Google Bard ar bet kuris kitas AI pokalbių robotas, kuris gali „haliucinuoti“ arba sudaryti informaciją.

Redaktorių rekomendacijos

  • Štai kodėl žmonės mano, kad laikui bėgant GPT-4 gali tapti kvailesnis
  • ChatGPT: naujausios naujienos, ginčai ir patarimai, kuriuos turite žinoti
  • Kas yra „ChatGPT“ DAN raginimas?
  • „Google Bard“ dabar gali kalbėti, bet ar gali užgožti „ChatGPT“?
  • „ChatGPT“ gamintoja „OpenAI“ susiduria su FTC tyrimu dėl vartotojų apsaugos įstatymų

Atnaujinkite savo gyvenimo būdąSkaitmeninės tendencijos padeda skaitytojams stebėti sparčiai besivystantį technologijų pasaulį, kuriame pateikiamos visos naujausios naujienos, smagios produktų apžvalgos, įžvalgūs vedamieji leidiniai ir unikalūs žvilgsniai.