MiniGPT-4: een gratis AI-tool voor beeld-naar-tekst die u vandaag nog kunt uitproberen

ChatGPT is geweldig, maar op dit moment is het beperkt tot alleen tekst: tekst in, tekst uit. GPT-4 moest dit uitbreiden door beeldverwerking toe te voegen, zodat het tekst op basis van afbeeldingen kon genereren.

Inhoud

  • Wat is MiniGPT-4?
  • Hoe MiniGPT-4 te gebruiken
  • Beperkingen van MiniGPT-4

MiniGPT-4: Verbetering van het inzicht in visie en taal met geavanceerde grote taalmodellen

OpenAI moet deze functie echter nog vrijgeven, en dat is waar MiniGPT-4 in beeld komt. Dit open source-project geeft ons een voorproefje van wat de beeldverwerking inhoudt GPT-4 zou zo kunnen zijn - en het is best netjes.

Aanbevolen video's

Wat is MiniGPT-4?

MiniGPT-4 is een open source-project dat op GitHub is geplaatst om de mogelijkheden van visietaal in een AI-systeem te demonstreren. Enkele voorbeelden van wat het kan doen zijn het genereren van beschrijvingen van afbeeldingen, het schrijven van verhalen op basis van afbeeldingen of zelfs het maken van websites alleen op basis van tekeningen.

Verwant

  • Topauteurs eisen betaling van AI-bedrijven voor het gebruik van hun werk
  • GPT-4: hoe je de AI-chatbot gebruikt die ChatGPT te schande maakt
  • Wix gebruikt ChatGPT om u te helpen snel een hele website te bouwen

Ondanks wat de naam impliceert, is MiniGPT-4 officieel niet verbonden met OpenAI of GPT-4. Het is gemaakt door een groep Ph. D. studenten gevestigd in Saoedi-Arabië aan de King Abdullah University of Science and Technology. Het is ook gebaseerd op een ander groot taalmodel (LLM), genaamd Vicuna, dat zelf is gebouwd op het open-source Large Language Model Meta AI (LLaMA). Het is niet zo krachtig als ChatGPT, maar beoordeeld door GPT-4 zelf komt Vicuna binnen 90%.

Hoe MiniGPT-4 te gebruiken

MiniGPT-4 is slechts een demo en bevindt zich nog in de eerste versie. Voorlopig is het gratis toegankelijk op de officiële website van de groep. Om het te gebruiken, sleept u gewoon een afbeelding naar binnen of klikt u op 'Afbeelding hier neerzetten'. Nadat het is geüpload, typt u uw prompt in het zoekvak.

Wat voor dingen moet je uitproberen? Nou, MiniGPT-4 vragen om een ​​afbeelding te beschrijven is eenvoudig genoeg. Maar misschien heb je wat tekst nodig voor een Instagram-post voor je bedrijf. Of misschien wil je weten welke ingrediënten nodig zijn voor een interessant gerecht, en zelfs een recept voor het bereiden ervan. MiniGPT-4 kan deze taken verrassend goed aan.

De codeeraspecten zijn wat ruwer aan de randen. Het omzetten van een eenvoudige servettekening in een functionerende website was een truc van OpenAI toen GPT-4 voor het eerst werd aangekondigd. Maar MiniGPT-4 lijkt daar nog niet zo goed mee om te kunnen gaan. ChatGPT zal nauwkeurigere code leveren - in feite wordt de MiniGPT-4-code uitgevoerd via ChatGPT of GPT-4 zal u betere resultaten opleveren.

Eén ding om op te merken is dat MiniGPT-4 de GPU van uw lokale systeem gebruikt. Dus tenzij je een redelijk krachtige afzonderlijke GPU hebt, kan het zijn dat de ervaring tamelijk traag is. Voor de context heb ik het uitgeprobeerd op a M2Max MacBook Pro, en het duurde ongeveer 30 seconden om tekst te genereren op basis van een afbeelding die ik had geüpload.

Beperkingen van MiniGPT-4

De snelheid van MiniGPT-4 is zeker een beperking. Als je hier toegang toe probeert te krijgen zonder fatsoenlijke graphics, is het te traag om responsief te zijn. Als je gewend bent aan de snelheid van cloudgebaseerde ChatGPT of zelfs Bing Image Creator, MiniGPT-4 gaat pijnlijk traag aanvoelen.

Verder heeft MiniGPT-4 dezelfde beperkingen als ChatGPT of Google Bard of een andere AI-chatbot in die zin dat deze kan “hallucineren” of informatie kan verzinnen.

Aanbevelingen van de redactie

  • Dit is de reden waarom mensen denken dat GPT-4 in de loop van de tijd dommer zal worden
  • ChatGPT: het laatste nieuws, controverses en tips die u moet weten
  • Wat is een DAN-prompt voor ChatGPT?
  • Google Bard kan nu spreken, maar kan het ChatGPT overstemmen?
  • ChatGPT-maker OpenAI wordt geconfronteerd met een FTC-onderzoek naar wetten inzake consumentenbescherming

Upgrade uw levensstijlMet Digital Trends kunnen lezers de snelle technische wereld in de gaten houden met het laatste nieuws, leuke productrecensies, inzichtelijke redactionele artikelen en unieke sneak peeks.