MiniGPT-4: Безплатен AI инструмент за преобразуване на изображение в текст, който можете да опитате днес

ChatGPT е страхотно, но в момента е ограничено само до текст - въвеждане на текст, извеждане на текст. GPT-4 трябваше да разшири това чрез добавяне на обработка на изображения, за да може да генерира текст въз основа на изображения.

Съдържание

  • Какво е MiniGPT-4?
  • Как да използвате MiniGPT-4
  • Ограничения на MiniGPT-4

MiniGPT-4: Подобряване на разбирането на зрителния език с усъвършенствани големи езикови модели

OpenAI все още не е пуснал тази функция, но тук идва MiniGPT-4. Този проект с отворен код ни дава предварителен преглед на това, което представлява обработката на изображения GPT-4 може да е като - и е доста спретнато.

Препоръчани видеоклипове

Какво е MiniGPT-4?

MiniGPT-4 е проект с отворен код, който беше публикуван в GitHub, за да демонстрира възможностите на визуалния език в AI система. Някои примери за това, което може да прави, включват генериране на описания на изображения, писане на истории въз основа на изображения или дори създаване на уебсайтове само от рисунки.

Свързани

  • Топ автори изискват заплащане от фирми за изкуствен интелект за използване на работата им
  • GPT-4: как да използвате AI chatbot, който засрамва ChatGPT
  • Wix използва ChatGPT, за да ви помогне бързо да създадете цял уебсайт

Въпреки това, което подсказва името, MiniGPT-4 не е официално свързан с OpenAI или GPT-4. Създаден е от група д-р. студенти, базирани в Саудитска Арабия в Университета за наука и технологии „Крал Абдула“. Той също така се основава на различен голям езиков модел (LLM), наречен Vicuna, който сам по себе си е изграден върху отворен код Large Language Model Meta AI (LLaMA). Не е толкова мощен като ChatGPT, но според оценката GPT-4 сама по себе си викуня достига до 90%.

Как да използвате MiniGPT-4

MiniGPT-4 е само демонстрация и все още е в първата си версия. Засега е достъпен безплатно на официалния сайт на групата. За да го използвате, просто плъзнете изображение или щракнете върху „Пуснете изображение тук“. След като бъде качен, въведете подканата си в полето за търсене.

Какви неща трябва да опитате? Е, искането на MiniGPT-4 да опише изображение е достатъчно просто. Но може би имате нужда от копие за публикация в Instagram за вашата компания. Или може би искате да знаете съставките, необходими за интересно ястие, и дори рецепта как да го приготвите. MiniGPT-4 може да се справи с тези задачи изненадващо добре.

Аспектите на кодирането са малко по-груби около краищата. Превръщането на обикновена рисунка на салфетка във функциониращ уебсайт беше трик, демонстриран от OpenAI, когато GPT-4 беше обявен за първи път. Но MiniGPT-4 изглежда все още не може да се справи с това толкова добре. ChatGPT ще осигури по-точен код - всъщност, изпълнявайки какъвто и да е кодът MiniGPT-4 през ChatGPT или GPT-4 ще ви донесе по-добри резултати.

Едно нещо, което трябва да се отбележи, е, че MiniGPT-4 наистина използва GPU на вашата локална система. Така че, освен ако нямате доста мощен дискретен графичен процесор, може да откриете, че изживяването е доста бавно. За контекст, изпробвах го на a M2 Max MacBook Proи отне около 30 секунди за генериране на текст въз основа на изображение, което качих.

Ограничения на MiniGPT-4

Скоростта на MiniGPT-4 със сигурност е ограничение. Ако се опитвате да получите достъп до това без някаква прилична графика, това е твърде бавно, за да се чувствате отзивчиви. Ако сте свикнали със скоростта на базирания в облак ChatGPT или дори Bing Image Creator, MiniGPT-4 ще се почувства болезнено бавен.

Освен това MiniGPT-4 има всички същите ограничения като ChatGPT или Google Bard или всеки друг AI чатбот, тъй като може да „халюцинира“ или да измисля информация.

Препоръки на редакторите

  • Ето защо хората смятат, че GPT-4 може да става все по-глупав с времето
  • ChatGPT: последните новини, спорове и съвети, които трябва да знаете
  • Какво е DAN подкана за ChatGPT?
  • Google Bard вече може да говори, но може ли да заглуши ChatGPT?
  • Създателят на ChatGPT OpenAI е изправен пред разследване на FTC относно законите за защита на потребителите

Надградете начина си на животDigital Trends помага на читателите да следят забързания свят на технологиите с всички най-нови новини, забавни ревюта на продукти, проницателни редакционни статии и единствени по рода си кратки погледи.