ChatGPT це чудово, але зараз він обмежений лише текстом — введення тексту, виведення тексту. ГПТ-4 передбачалося розширити це, додавши обробку зображень, щоб дозволити генерувати текст на основі зображень.
Зміст
- Що таке MiniGPT-4?
- Як використовувати MiniGPT-4
- Обмеження MiniGPT-4
MiniGPT-4: покращення розуміння візуальної мови за допомогою вдосконалених моделей великої мови
Однак OpenAI ще не випустив цю функцію, і тут на допомогу приходить MiniGPT-4. Цей проект із відкритим вихідним кодом дає нам попередній огляд того, що таке обробка зображень ГПТ-4 може бути як — і це досить акуратно.
Рекомендовані відео
Що таке MiniGPT-4?
MiniGPT-4 — це проект із відкритим вихідним кодом, опублікований на GitHub для демонстрації можливостей візуальної мови в системі ШІ. Деякі приклади того, що він може робити, включають створення описів зображень, написання історій на основі зображень або навіть створення веб-сайтів лише з малюнків.
Пов'язані
- Найпопулярніші автори вимагають від фірм штучного інтелекту плату за використання їхніх робіт
- GPT-4: як використовувати чат-бот ШІ, який ганьбить ChatGPT
- Wix використовує ChatGPT, щоб допомогти вам швидко створити весь веб-сайт
Незважаючи на те, що випливає з назви, MiniGPT-4 офіційно не підключений до OpenAI або GPT-4. Його створила група к.ф.н. студенти в Саудівській Аравії в Університеті науки і технологій короля Абдалли. Він також базується на іншій великій мовній моделі (LLM) під назвою Vicuna, яка сама була побудована на основі великої мовної моделі Meta AI (LLaMA) з відкритим кодом. Він не такий потужний, як ChatGPT, але оцінений
Як використовувати MiniGPT-4
MiniGPT-4 – це лише демонстраційна версія, яка все ще знаходиться в своїй першій версії. Наразі до нього можна отримати безкоштовний доступ на офіційному сайті групи. Щоб використати його, просто перетягніть зображення або натисніть «Перетягнути зображення сюди». Після завантаження введіть запит у вікно пошуку.
Які речі варто спробувати? Попросити MiniGPT-4 описати зображення досить просто. Але, можливо, вам потрібна копія публікації в Instagram для вашої компанії. А може, ви хочете дізнатися інгредієнти, необхідні для цікавої страви, і навіть рецепт, як її приготувати. MiniGPT-4 справляється з цими завданнями напрочуд добре.
Аспекти кодування трохи грубіші навколо країв. Перетворення простого малюнка серветки на функціонуючий веб-сайт був трюк, продемонстрований OpenAI, коли вперше було оголошено GPT-4. Але MiniGPT-4, здається, поки що не в змозі впоратися з цим. ChatGPT надасть більш точний код — фактично, запускаючи будь-який код MiniGPT-4 через ChatGPT або
Варто зауважити, що MiniGPT-4 дійсно використовує GPU вашої локальної системи. Отже, якщо у вас немає достатньо потужного дискретного графічного процесора, ви можете виявити, що робота буде досить повільною. Для контексту я спробував це на a M2 Max MacBook Pro, і для створення тексту на основі завантаженого мною зображення знадобилося близько 30 секунд.
Обмеження MiniGPT-4
Швидкість MiniGPT-4, безумовно, є обмеженням. Якщо ви намагаєтеся отримати доступ до цього без пристойної графіки, це надто повільно, щоб відчувати себе чуйним. Якщо ви звикли до швидкості хмарного ChatGPT або навіть Bing Image Creator, MiniGPT-4 буде здаватися дуже повільним.
Крім того, MiniGPT-4 має ті ж обмеження, що й ChatGPT або Google Bard або будь-який інший чат-бот штучного інтелекту, оскільки він може «галюцинувати» або вигадувати інформацію.
Рекомендації редакції
- Ось чому люди думають, що GPT-4 з часом може ставати дурнішим
- ChatGPT: останні новини, суперечки та поради, які вам потрібно знати
- Що таке підказка DAN для ChatGPT?
- Google Bard тепер може говорити, але чи може він заглушити ChatGPT?
- Розробник ChatGPT OpenAI стикається з розслідуванням FTC щодо законів про захист прав споживачів
Оновіть свій спосіб життяDigital Trends допомагає читачам стежити за динамічним світом технологій завдяки всім останнім новинам, цікавим оглядам продуктів, проникливим редакційним статтям і унікальним у своєму роді коротким оглядам.