MiniGPT-4: uno strumento AI gratuito per trasformare immagini in testo che puoi provare oggi

ChatGPT è fantastico, ma al momento è limitato al solo testo: testo in ingresso, testo in uscita. GPT-4 avrebbe dovuto espandere questo aspetto aggiungendo l'elaborazione delle immagini per consentirgli di generare testo basato su immagini.

Contenuti

  • Cos'è MiniGPT-4?
  • Come utilizzare MiniGPT-4
  • Limitazioni del MiniGPT-4

MiniGPT-4: migliorare la comprensione del linguaggio visivo con modelli linguistici avanzati di grandi dimensioni

OpenAI deve ancora rilasciare questa funzionalità, tuttavia, ed è qui che entra in gioco MiniGPT-4. Questo progetto open source ci offre un'anteprima di come viene elaborata l'immagine GPT-4 potrebbe essere come - ed è piuttosto carino.

Video consigliati

Cos'è MiniGPT-4?

MiniGPT-4 è un progetto open source pubblicato su GitHub per dimostrare le capacità del linguaggio visivo in un sistema di intelligenza artificiale. Alcuni esempi di ciò che può fare includono la generazione di descrizioni di immagini, la scrittura di storie basate su immagini o persino la creazione di siti Web solo da disegni.

Imparentato

  • Gli autori più importanti richiedono un pagamento alle aziende di intelligenza artificiale per l’utilizzo del loro lavoro
  • GPT-4: come utilizzare il chatbot AI che fa vergognare ChatGPT
  • Wix utilizza ChatGPT per aiutarti a creare rapidamente un intero sito web

Nonostante ciò che suggerisce il nome, MiniGPT-4 non è ufficialmente connesso a OpenAI o GPT-4. È stato creato da un gruppo di Ph. D. studenti con sede in Arabia Saudita presso la King Abdullah University of Science and Technology. Si basa anche su un diverso modello linguistico di grandi dimensioni (LLM) chiamato Vicuna, che a sua volta è stato costruito sul Large Language Model Meta AI (LLaMA) open source. Non è potente come ChatGPT, ma classificato da GPT-4 stesso, Vicuna arriva entro il 90%.

Come utilizzare MiniGPT-4

MiniGPT-4 è solo una demo ed è ancora nella sua prima versione. Per ora è possibile accedervi gratuitamente sul sito ufficiale del gruppo. Per usarlo, basta trascinare un'immagine o fare clic su "Rilascia immagine qui". Una volta caricato, digita il messaggio nella casella di ricerca.

Che tipo di cose dovresti provare? Bene, chiedere a MiniGPT-4 di descrivere un'immagine è abbastanza semplice. Ma forse hai bisogno di qualche testo per un post Instagram per la tua azienda. O forse vuoi conoscere gli ingredienti necessari per un piatto interessante e persino una ricetta su come cucinarlo. MiniGPT-4 può gestire queste attività sorprendentemente bene.

Gli aspetti di codifica sono un po' più approssimativi. Trasformare un semplice disegno su un tovagliolo in un sito web funzionante è stato un trucco mostrato da OpenAI quando è stato annunciato per la prima volta GPT-4. Ma MiniGPT-4 non sembra essere ancora in grado di gestirlo altrettanto bene. ChatGPT fornirà un codice più accurato, in effetti eseguendo qualunque codice MiniGPT-4 sia tramite ChatGPT o GPT-4 ti garantirà risultati migliori.

Una cosa da notare è che MiniGPT-4 utilizza la GPU del tuo sistema locale. Pertanto, a meno che tu non disponga di una GPU discreta abbastanza potente, potresti trovare l'esperienza piuttosto lenta. Per contesto, l'ho provato su a MacBook Pro M2 Maxe ci sono voluti circa 30 secondi per generare testo in base a un'immagine che ho caricato.

Limitazioni del MiniGPT-4

La velocità del MiniGPT-4 è sicuramente un limite. Se stai tentando di accedervi senza una grafica decente, è troppo lento per sembrare reattivo. Se sei abituato alla velocità di ChatGPT basato su cloud o anche Creatore di immagini Bing, MiniGPT-4 sembrerà dolorosamente lento.

Oltre a ciò, MiniGPT-4 presenta tutte le stesse limitazioni di ChatGPT o Google Bardo o qualsiasi altro chatbot AI in quanto può “allucinare” o inventare informazioni.

Raccomandazioni degli editori

  • Ecco perché le persone pensano che GPT-4 potrebbe diventare più stupido nel tempo
  • ChatGPT: le ultime novità, controversie e consigli che devi sapere
  • Cos'è un prompt DAN per ChatGPT?
  • Google Bard ora può parlare, ma può soffocare ChatGPT?
  • OpenAI, produttore di ChatGPT, affronta l'indagine della FTC sulle leggi sulla protezione dei consumatori

Migliora il tuo stile di vitaDigital Trends aiuta i lettori a tenere d'occhio il frenetico mondo della tecnologia con tutte le ultime notizie, divertenti recensioni di prodotti, editoriali approfonditi e anteprime uniche nel loro genere.