Мовна модель Midjourney v5 додає реалізму людським рукам

Midjourney v5 — остання мовна модель популярного генератора тексту в зображення, відомого своїми реалістичними творами.

The оновлення розгорнуто до платної клієнтської бази Midjourney у середу, і багато користувачів, у тому числі графічний дизайнер Джулі Віланд, поділилися своїми новими творами мистецтва, створеними штучним інтелектом. Деталі штучного інтелекту, які приносить із собою модель мови v5, включають покращену «ефективність, узгодженість і якість», сказав Міджорні. на своєму веб-сайті.

Лише попередження – штучний інтелект Midjourney тепер може правильно складати руки. Будьте дуже критичні до будь-яких політичних образів (особливо фотографій), які ви бачите в Інтернеті, які намагаються викликати реакцію. pic.twitter.com/ebEagrQAQq

— Дель Вокер (@TheCartelDel) 16 березня 2023 р

Багато користувачів особливо відзначили вдосконалення деталей людської руки, причому у суб’єктів частіше було по п’ять пальців на руці. У попередніх моделях людські руки часто генерувалися з неправильною кількістю цифр, десь від чотирьох до семи-десяти. Ті, хто мав змогу випробувати Midjourney v5, були вражені візуальними оновленнями.

Рекомендовані відео

«Остання модель Midjourney v5 надзвичайно приголомшлива/страшна і понад захоплююча», — сказав Віланд PetaPixel.

«Його здатність відтворювати складні деталі та текстури, такі як реалістична текстура шкіри/риси обличчя та освітлення, не має собі рівних», — додала вона.

Хоча Midjourney є дещо унікальною мовною моделлю, вона працює подібно до інших генераторів тексту в зображення, таких як Стабільна дифузія та DALL-E, використовуючи сформульовані дескриптори підказок для створення зображень відповідно до моделі, яка навчається з використанням мистецтва, створеного людиною, як посилання, відповідно до ArsTechnica.

Тривають дебати щодо того, чи є створене штучним інтелектом мистецтво законним чи етичним; однак багато користувачів Midjourney v5 вважають, що за умови продовження оновлень його неможливо буде відрізнити від справжнього мистецтва та фотографії. Віланд вважає, що генератори зображень штучного інтелекту, такі як Midjourney, швидше за все, будуть супутниками для фотографів, а не заміною.

Midjourney v5 тут! (цього разу по-справжньому, лол)

Ось деякі пліч-о-пліч моїх підказок, v4 проти v5, а також кілька нових підказок і знімків натовпу. У міру експериментів я додам ще більше.

🧵 pic.twitter.com/qSEZWQBXou

— Нік Сен-П'єр (@nickfloats) 15 березня 2023 р

Однак Midjourney v5 не позбавлений помилок. Творець зображень штучного інтелекту Нік Сен-П’єр поділився багатьма своїми роботами, для яких він використовував ті самі підказки в попередніх Midjourney v4 і Midjourney v5. Одне зображення було захоплюючим знімком молодих жінок у вуличному стилі 1960-х років, що нагадує модну зйомку просто неба. При ближчому розгляді ви можете помітити плаваючі руки, не прикріплені до тіл, і деформовані обличчя на задньому плані.

З останньою моделлю v5 засновник Midjourney Девід Хольц рекомендував на Discord бренду, щоб користувачі уникали коротких підказок на користь «довшого, більш відвертого тексту», щоб отримати кращі результати.

Оновіть свій спосіб життяDigital Trends допомагає читачам стежити за динамічним світом технологій завдяки всім останнім новинам, цікавим оглядам продуктів, проникливим редакційним статтям і унікальним у своєму роді коротким оглядам.