MiniGPT-4: Et gratis bilde-til-tekst AI-verktøy du kan prøve i dag

ChatGPT er flott, men akkurat nå er det begrenset til bare tekst - tekst inn, tekst ut. GPT-4 skulle utvide dette ved å legge til bildebehandling for å la det generere tekst basert på bilder.

Innhold

  • Hva er MiniGPT-4?
  • Slik bruker du MiniGPT-4
  • Begrensninger for MiniGPT-4

MiniGPT-4: Forbedring av syn-språkforståelse med avanserte store språkmodeller

OpenAI har imidlertid ennå ikke gitt ut denne funksjonen, og det er her MiniGPT-4 kommer inn. Dette åpen kildekodeprosjektet gir oss en forhåndsvisning av hva bildebehandlingen inneholder GPT-4 kan være sånn - og det er ganske pent.

Anbefalte videoer

Hva er MiniGPT-4?

MiniGPT-4 er et åpen kildekode-prosjekt som ble lagt ut på GitHub for å demonstrere funksjoner for synspråk i et AI-system. Noen eksempler på hva det kan gjøre inkluderer å generere beskrivelser av bilder, skrive historier basert på bilder, eller til og med lage nettsteder bare fra tegninger.

I slekt

  • Toppforfattere krever betaling fra AI-firmaer for å bruke arbeidet deres
  • GPT-4: hvordan bruke AI-chatboten som gjør ChatGPT til skamme
  • Wix bruker ChatGPT for å hjelpe deg raskt å bygge et helt nettsted

Til tross for hva navnet tilsier, er ikke MiniGPT-4 offisielt koblet til OpenAI eller GPT-4. Den ble laget av en gruppe Ph.D. studenter basert i Saudi-Arabia ved King Abdullah University of Science and Technology. Den er også basert på en annen stor språkmodell (LLM) kalt Vicuna, som i seg selv ble bygget på åpen kildekode Large Language Model Meta AI (LLaMA). Det er ikke fullt så kraftig som ChatGPT, men som gradert av GPT-4 selv kommer Vicuna innenfor 90 %.

Slik bruker du MiniGPT-4

MiniGPT-4 er bare en demo og er fortsatt i sin første versjon. Foreløpig kan den nås gratis på gruppens offisielle nettsted. For å bruke det, bare dra et bilde inn eller klikk på "Slipp bilde her." Når den er lastet opp, skriv inn ledeteksten i søkeboksen.

Hva slags ting bør du prøve ut? Vel, å be MiniGPT-4 om å beskrive et bilde er enkelt nok. Men kanskje du trenger en kopi til et Instagram-innlegg for bedriften din. Eller kanskje du vil vite ingrediensene som trengs for en interessant rett, og til og med en oppskrift på hvordan du lager den. MiniGPT-4 kan håndtere disse oppgavene overraskende bra.

Kodeaspektene er litt mer røffe rundt kantene. Å gjøre en enkel servietttegning til et fungerende nettsted var et triks som ble vist frem av OpenAI da GPT-4 først ble annonsert. Men MiniGPT-4 ser ikke ut til å være i stand til å håndtere det like bra ennå. ChatGPT vil gi mer nøyaktig kode - faktisk kjører uansett MiniGPT-4-koden gjennom ChatGPT eller GPT-4 vil gi deg bedre resultater.

En ting å merke seg er at MiniGPT-4 bruker det lokale systemets GPU. Så med mindre du har en ganske kraftig diskret GPU, kan du oppleve at opplevelsen er ganske treg. For kontekst prøvde jeg det ut på en M2 Max MacBook Pro, og det tok rundt 30 sekunder å generere tekst basert på et bilde jeg lastet opp.

Begrensninger for MiniGPT-4

Hastigheten til MiniGPT-4 er absolutt en begrensning. Hvis du prøver å få tilgang til dette uten anstendig grafikk, er det for tregt til å føle deg responsiv. Hvis du er vant til hastigheten til skybasert ChatGPT eller til og med Bing Image Creator, MiniGPT-4 kommer til å føles smertefullt treg.

Utover det har MiniGPT-4 alle de samme begrensningene som ChatGPT eller Google Bard eller en hvilken som helst annen AI-chatbot ved at den kan "hallusinere" eller lage informasjon.

Redaktørenes anbefalinger

  • Her er grunnen til at folk tror at GPT-4 kan bli dummere over tid
  • ChatGPT: de siste nyhetene, kontroversene og tipsene du trenger å vite
  • Hva er en DAN-forespørsel for ChatGPT?
  • Google Bard kan nå snakke, men kan det overdøve ChatGPT?
  • ChatGPT-produsenten OpenAI står overfor FTC-undersøkelse over forbrukerbeskyttelseslover

Oppgrader livsstilen dinDigitale trender hjelper leserne å følge med på den fartsfylte teknologiverdenen med alle de siste nyhetene, morsomme produktanmeldelser, innsiktsfulle redaksjoner og unike sniktitter.