MiniGPT-4: Et gratis billed-til-tekst AI-værktøj, du kan prøve i dag

click fraud protection

ChatGPT er fantastisk, men lige nu er det begrænset til kun tekst - tekst ind, tekst ud. GPT-4 skulle udvide dette ved at tilføje billedbehandling, så det kunne generere tekst baseret på billeder.

Indhold

  • Hvad er MiniGPT-4?
  • Sådan bruger du MiniGPT-4
  • Begrænsninger af MiniGPT-4

MiniGPT-4: Forbedring af vision-sprogforståelse med avancerede store sprogmodeller

OpenAI har dog endnu ikke frigivet denne funktion, og det er her, MiniGPT-4 kommer ind. Dette open source-projekt giver os en forhåndsvisning af, hvad billedbehandlingen indeholder GPT-4 kan være ligesom - og det er ret pænt.

Anbefalede videoer

Hvad er MiniGPT-4?

MiniGPT-4 er et open source-projekt, der blev udgivet på GitHub for at demonstrere vision-sprog-kapaciteter i et AI-system. Nogle eksempler på, hvad det kan, omfatter at generere beskrivelser af billeder, skrive historier baseret på billeder eller endda oprette websteder kun ud fra tegninger.

Relaterede

  • Topforfattere kræver betaling fra AI-virksomheder for at bruge deres arbejde
  • GPT-4: hvordan man bruger AI chatbot, der gør ChatGPT til skamme
  • Wix bruger ChatGPT til at hjælpe dig med hurtigt at bygge et helt websted

På trods af hvad navnet antyder, er MiniGPT-4 ikke officielt forbundet til OpenAI eller GPT-4. Det blev skabt af en gruppe af Ph.D. studerende baseret i Saudi-Arabien på King Abdullah University of Science and Technology. Den er også baseret på en anden stor sprogmodel (LLM) kaldet Vicuna, som i sig selv blev bygget på open source Large Language Model Meta AI (LLaMA). Det er ikke helt så kraftfuldt som ChatGPT, men som bedømt af GPT-4 selv kommer Vicuna inden for 90%.

Sådan bruger du MiniGPT-4

MiniGPT-4 er kun en demo og er stadig i sin første version. Indtil videre kan den tilgås gratis på gruppens officielle hjemmeside. For at bruge det skal du bare trække et billede ind eller klikke på "Slip billede her." Når det er uploadet, skal du skrive din prompt i søgefeltet.

Hvilken slags ting skal du prøve? Nå, det er nemt nok at bede MiniGPT-4 om at beskrive et billede. Men måske har du brug for en kopi til et Instagram-opslag til din virksomhed. Eller måske vil du kende de nødvendige ingredienser til en interessant ret, og endda en opskrift på, hvordan man tilbereder den. MiniGPT-4 kan klare disse opgaver overraskende godt.

Kodningsaspekterne er lidt mere ru rundt om kanterne. At omdanne en simpel serviettegning til en fungerende hjemmeside var et trick, som OpenAI viste, da GPT-4 først blev annonceret. Men MiniGPT-4 ser ikke ud til at kunne håndtere det helt så godt endnu. ChatGPT vil give mere nøjagtig kode - faktisk kører uanset MiniGPT-4-koden gennem ChatGPT eller GPT-4 vil give dig bedre resultater.

En ting at bemærke er, at MiniGPT-4 bruger dit lokale systems GPU. Så medmindre du har en ret kraftig diskret GPU, kan du opleve, at oplevelsen er ret langsom. For kontekst prøvede jeg det på en M2 Max MacBook Pro, og det tog omkring 30 sekunder at generere tekst baseret på et billede, jeg uploadede.

Begrænsninger af MiniGPT-4

Hastigheden af ​​MiniGPT-4 er bestemt en begrænsning. Hvis du forsøger at få adgang til dette uden nogen anstændig grafik, er det for langsomt til at føle sig lydhør. Hvis du er vant til hastigheden af ​​cloud-baseret ChatGPT eller endda Bing Image Creator, MiniGPT-4 kommer til at føles smerteligt langsom.

Ud over det har MiniGPT-4 alle de samme begrænsninger som ChatGPT eller Google Bard eller enhver anden AI-chatbot, idet den kan "hallucinere" eller opfinde information.

Redaktørens anbefalinger

  • Her er grunden til, at folk tror, ​​at GPT-4 kan blive dummere med tiden
  • ChatGPT: de seneste nyheder, kontroverser og tips, du har brug for at vide
  • Hvad er en DAN-prompt til ChatGPT?
  • Google Bard kan nu tale, men kan den overdøve ChatGPT?
  • ChatGPT-producenten OpenAI står over for FTC-undersøgelse over forbrugerbeskyttelseslove

Opgrader din livsstilDigital Trends hjælper læserne med at holde styr på den hurtige teknologiske verden med alle de seneste nyheder, sjove produktanmeldelser, indsigtsfulde redaktionelle artikler og enestående smugkig.