ChatGPT este grozav, dar în acest moment, este limitat doar la text - text în, text out. GPT-4 trebuia să extindă acest lucru prin adăugarea de procesare a imaginilor pentru a-i permite să genereze text bazat pe imagini.
Cuprins
- Ce este MiniGPT-4?
- Cum se utilizează MiniGPT-4
- Limitările MiniGPT-4
MiniGPT-4: Îmbunătățirea înțelegerii limbii vizuale cu modele avansate de limbaj mari
OpenAI nu a lansat încă această caracteristică, totuși, aici intervine MiniGPT-4. Acest proiect open source ne oferă o previzualizare a procesării imaginii GPT-4 ar putea fi ca - și este destul de îngrijit.
Videoclipuri recomandate
Ce este MiniGPT-4?
MiniGPT-4 este un proiect open source care a fost postat pe GitHub pentru a demonstra capacitățile de limbaj vizual într-un sistem AI. Câteva exemple de ceea ce poate face includ generarea de descrieri ale imaginilor, scrierea de povești bazate pe imagini sau chiar crearea de site-uri web doar din desene.
Legate de
- Autorii de top cer plăți de la firmele de inteligență artificială pentru utilizarea lucrărilor lor
- GPT-4: cum să folosești chatbot-ul AI care face ChatGPT de rușine
- Wix folosește ChatGPT pentru a vă ajuta să construiți rapid un întreg site
În ciuda a ceea ce sugerează numele, MiniGPT-4 nu este conectat oficial la OpenAI sau GPT-4. A fost creat de un grup de doctoranzi. studenți cu sediul în Arabia Saudită la Universitatea de Știință și Tehnologie King Abdullah. De asemenea, se bazează pe un alt model de limbă mare (LLM) numit Vicuna, care a fost construit pe baza modelului de limbă mare Meta AI (LLaMA) open-source. Nu este la fel de puternic ca ChatGPT, dar este evaluat de
Cum se utilizează MiniGPT-4
MiniGPT-4 este doar o demonstrație și este încă în prima sa versiune. Deocamdată, poate fi accesat gratuit pe site-ul oficial al grupului. Pentru a o utiliza, trebuie doar să trageți o imagine sau să faceți clic pe „Aruncă imaginea aici”. După ce este încărcat, introduceți solicitarea în caseta de căutare.
Ce fel de lucruri ar trebui să încerci? Ei bine, a cere lui MiniGPT-4 să descrie o imagine este destul de simplu. Dar poate ai nevoie de o copie pentru o postare pe Instagram pentru compania ta. Sau poate vrei să cunoști ingredientele necesare pentru un fel de mâncare interesant și chiar o rețetă despre cum să-l gătești. MiniGPT-4 poate face față acestor sarcini surprinzător de bine.
Aspectele de codare sunt puțin mai aspre în jurul marginilor. Transformarea unui simplu desen de șervețel într-un site web funcțional a fost un truc prezentat de OpenAI atunci când GPT-4 a fost anunțat pentru prima dată. Dar MiniGPT-4 nu pare să se descurce încă la fel de bine. ChatGPT va oferi un cod mai precis - de fapt, rulând orice este codul MiniGPT-4 prin ChatGPT sau
Un lucru de reținut este că MiniGPT-4 folosește GPU-ul sistemului local. Deci, cu excepția cazului în care aveți un GPU discret destul de puternic, este posibil să găsiți experiența destul de lentă. Pentru context, l-am încercat pe un M2 Max MacBook Pro, și a durat aproximativ 30 de secunde pentru a genera text pe baza unei imagini pe care am încărcat-o.
Limitările MiniGPT-4
Viteza MiniGPT-4 este cu siguranță o limitare. Dacă încercați să accesați acest lucru fără o grafică decentă, este prea lent pentru a vă simți receptiv. Dacă sunteți obișnuit cu viteza ChatGPT bazată pe cloud sau chiar Bing Image Creator, MiniGPT-4 se va simți dureros de lent.
Dincolo de asta, MiniGPT-4 are toate aceleași limitări ca ChatGPT sau Google Bard sau orice alt chatbot AI prin care poate „halucina” sau poate inventa informații.
Recomandările editorilor
- Iată de ce oamenii cred că GPT-4 ar putea deveni mai prost în timp
- ChatGPT: cele mai recente știri, controverse și sfaturi pe care trebuie să le cunoașteți
- Ce este un prompt DAN pentru ChatGPT?
- Google Bard poate vorbi acum, dar poate îneca ChatGPT?
- Creatorul de ChatGPT OpenAI se confruntă cu o anchetă FTC cu privire la legile privind protecția consumatorilor
Îmbunătățește-ți stilul de viațăDigital Trends îi ajută pe cititori să țină cont de lumea rapidă a tehnologiei cu toate cele mai recente știri, recenzii distractive despre produse, editoriale perspicace și anticipări unice.