Генерація зображень ШІ поширює гендерні та расові стереотипи

Експерти стверджують, що популярні генератори зображень ШІ, такі як Стабільна дифузія не настільки вправні в тому, щоб виявляти гендерні та культурні упередження, коли використовують алгоритми машинного навчання для створення мистецтва.

Багато генераторів тексту в мистецтво дозволяють вводити фрази та створювати унікальне зображення на іншому кінці. Однак ці генератори часто можуть базуватися на стереотипних упередженнях, що може вплинути на моделювання машинного навчання виготовлення зображень. Зображення часто можуть бути вестернізованими або демонструвати прихильність до певної статі чи раси, залежно від типів використовувані фрази, Gizmodo зазначив.

Рекомендовані відео

Яка різниця між цими двома групами людей? Відповідно до Stable Diffusion, перша група представляє «амбітного генерального директора», а друга — «підтримуючого генерального директора».
Я створив простий інструмент для дослідження упереджень, вкорінених у цій моделі: https://t.co/l4lqt7rTQjpic.twitter.com/xYKA8w3N8N

— доктор Саша Лучіоні 💻🌎✨ (@SashaMTL) 31 жовтня 2022 р

Саша Лучіоні, дослідник штучного інтелекту для Hugging Face, створив інструмент, який демонструє, як упередженість штучного інтелекту в генераторах тексту в мистецтво працює в дії. Використовуючи Стабільна дифузія Як приклад Explorer, введення фрази «амбітний генеральний директор» дало результати для різних типів чоловіків, тоді як фраза «підтримуючий генеральний директор» дала результати, які показали як чоловіків, так і жінок.

Аналогічно, Генератор DALL-E 2, який був створений брендом OpenAI, показав чоловічі упередження щодо терміну «будівельник» і жіночі упередження щодо терміну «стюардеса» в результатах зображень, незважаючи на те, що є жінки-будівельники та чоловіки-льотчики обслуговуючий персонал.

Хоча багато генераторів зображень зі штучним інтелектом, здається, беруть лише кілька слів, а машинне навчання створює зображення, у фоновому режимі відбувається багато іншого. Stable Diffusion, наприклад, використовує набір зображень LAION, який містить «мільярди зображень, фотографій і багато іншого, взятого з Інтернету, включаючи сайти розміщення зображень і мистецькі сайти», зазначив Gizmodo.

Расові та культурні упередження в пошуку зображень в Інтернеті вже були актуальною темою задовго до зростання популярності генераторів зображень штучного інтелекту. Лучіоні сказав виданню, що такі системи, як набір даних LAION, швидше за все, отримають 90% зображень, пов’язаних із підказкою, і використають їх для генератора зображень.

Рекомендації редакції

  • Нова функція зменшення масштабу Midjourney стає наступною великою сенсацією ШІ
  • Цей новий інструмент Photoshop може привнести магію ШІ у ваші зображення
  • 5 речей, з якими генератори зображень ШІ все ще борються
  • Нова програма Microsoft Designer робить генеративний штучний інтелект надзвичайно простим
  • Ілон Маск створює проект генеративного штучного інтелекту в Twitter, стверджує звіт

Оновіть свій спосіб життяDigital Trends допомагає читачам стежити за динамічним світом технологій завдяки всім останнім новинам, цікавим оглядам продуктів, проникливим редакційним статтям і унікальним у своєму роді коротким оглядам.