Машинно обучение и изкуство – Google I/O 2016
Мислете за компютрите като за деца и е лесно да разберете как програмистите могат да ги научат да учат. Изкуственият интелект в началото е много елементарен и прост. Човешките модератори инструктират компютрите, като им показват как да мислят и по този начин да се обучават. След като програмистите обаче им дадат основите, те могат бързо да разширят тези знания.
„Какво можете да направите със 7 милиона дигитални артефакта?“
В Културен институт на Google в Париж, Франция, гигантът за търсене учи машините как да категоризират 7 милиона изображения на човешки художествени постижения през вековете. Институтът дори има уебсайт, както и приложения за iOS и Android където можете да търсите сред произведения на изкуството от различни музеи по целия свят. За да създадат своя каталог на изкуството, кодовите художници в института трябваше да обучат компютри разглеждайте изображения по начина, по който биха го направили хората, за да създадете точен цифров архив на изкуството през цялата човешка история.
Историята на каталогизирането е добра и добра, но някои от уменията, които компютрите усвояват от сортирането и архивирането, всъщност ги правят по-креативни. Художниците в резиденцията сега експериментират с компютри, за да създават нови произведения на изкуството, използвайки машинния интелект и каталога от 7 милиона изображения, които са събрали заедно. По време на Google I/O 2016 г. Кирил Диагне и Марио Клингеман обясниха как са научили машините да виждат изкуството като хората и как са обучили машините да бъдат креативни.
Обучаване на компютрите на тяхната азбука
Едно от първите неща, на които учите детето, е езикът. В западната култура това означава да научите своята азбука. Марио Клингеман, самоопределящ се художник на кодове от Германия, започна да преподава машини на идентифицира стилизирани букви от стари текстове, за да разбере дали може да научи компютър да разпознава хиляди различно изглеждащи As, Bs, Cs и т.н. На. Това беше интензивен курс за обучение на машини как да категоризират изображения по начина, по който хората биха го направили.
Докато компютърът може да погледне стилизирана буква B, покрита с лози и цветя, и да види някакво растение, дори 5-годишно дете може веднага да идентифицира изображението като буква B - не растение. За да научи компютъра си да разпознава ABC, Клингеман го захранва с хиляди изображения на стилизирани букви. Той създаде подобен на Tinder интерфейс за плъзгане надясно или наляво, за да каже на машините си дали са познали буквата правилно или грешно.
Оказва се, че машините научават своите ABC доста бързо; те започнаха да виждат букви във всичко. Точно както хората виждат лица в облаци и изображения в абстрактни произведения на изкуството, неговите компютри виждат букви в напълно несвързани изображения. Клингеман показа на компютъра си рисунка или гравюра на разрушена сграда и вместо това видяха буква B.
Клингеман обясни, че когато тренирате компютър само с един набор от изображения, той започва да вижда само този вид изображение във всичко. Ето защо машините му видяха писмо в развалини.
Обучаване на компютрите да категоризират 7 милиона изображения
Когато художникът на дигиталното взаимодействие Сирил Диагне се присъедини към Културния институт, Google му зададе доста плашещ въпрос: „Какво можете да направите със 7 милиона цифрови артефакта?“
Диагн беше поразен от въпроса, така че начерта всяко изображение във великолепен мащаб синусоида, които можете да видите по-долу. Тази вълна по-късно се превърна в красиво представяне на всичко, което проектът се надява да постигне с машинното обучение. Синусоидата на Diagne всъщност може да се търси, така че можете да сърфирате в море от всички изображения в дигиталния архив, направен от Google Cultural Institute. Изображенията са групирани в категории и от птичи поглед виждате просто море от точки. Докато навлизате, можете да видите конкретни изображения, всички с обща тема, независимо дали става дума за кученца, ферми или хора.
1 на 3
Можете също да търсите в него и да намерите изображенията, които искате. Ако се вгледате достатъчно, може дори да попаднете на това, което Diagne нарича Брегът на портретите. Това е мястото, където са групирани всички изображения на лицата на хората.
За да направят карта с възможност за търсене на всяко изображение в архива, Diagne и неговият екип трябваше да създадат категория за всичко, за да научат машината какво е какво.
Категоризирането на 7 милиона артефакта, много от които може да имат няколко категории, не е лесна задача. Екипът трябваше да измисли някои, които бяха извън кутията. Не е достатъчно просто да категоризирате нещата въз основа на това, което представляват. Те също трябваше да създадат категории за емоциите, които изображенията предизвикват.
Обучаването на машините на човешки емоции е важна стъпка към превръщането им в по-креативни.
По този начин можете да търсите изображение на „спокойствие“ и компютърът ще ви покаже изображения, които предизвикват усещане за спокойствие, като залези, спокойни езера и т.н. Удивително, машините се научиха как да идентифицират човешките емоции с такова умение, че могат да се поставят на наше място, за да обмислят как дадено изображение би накарало човек да се чувства.
Обучаването на машините на човешки емоции е важна стъпка към превръщането им в по-креативни. В крайна сметка голяма част от съвременното изкуство е визуално представяне на човешките емоции.
Но може ли една машина да бъде креативна?
Креативността и артистичността са две неща, които ние, хората, обичаме да мислим само за наши. Животните не правят изкуство, нито пък машините... все още. Проектът Deep Dream на Google се опитаха да обърнат идеята, че машините не могат да създават изкуство. Гигантът за търсене обучи компютри да манипулират изображения, за да създават странни, психеделични произведения на изкуството. Изображенията, създадени от Google Двигател Deep Dream може да не са красиви, но със сигурност са уникални и изключително креативни. Машинните творения съдържат психеделични цветове, охлюви, странни очи и безплътни животни, които се въртят в неопределени пространства.
Някои може да възразят, че не е наистина изкуство, ако машините просто комбинират съществуващи изображения, усукват ги и ги потапят в екстремни цветове; Google би искал да се противопостави, както и художникът на код Клингеман.
„Хората не са способни на оригинални идеи“, обясни той.
1 на 8
Дори известни картини съдържат елементи от предишни произведения на изкуството, отбеляза той. Шедьовърът на Пикасо от 1907 г Les Demoiselles d’Avignon, например има влияния от африканско изкуство и предшественици на кубисти като Пол Сезан. По този въпрос колажите, които комбинират съществуващи изображения по артистичен начин, са друга добре установена форма на изкуство. Пикасо, Анди Уорхол, Ман Рей и други са известни със своите ексцентрични колажи, така че защо колажите, направени от машини, също да не могат да бъдат изкуство?
Клингеман искаше да разшири границите на дигиталното изкуство и да види как могат да станат творческите машини много преди да започне резиденцията си в Google Cultural Institute. Използвайки собствените си по-малко мощни машини, Клингеман започва да си играе с интернет архивите и тези на Google TensorFlow софтуер за машинно обучение за създаване на цифрови колажи.
Той създаде инструмент за машинно обучение, наречен Ernst, кръстен на сюрреалиста и колажиста Макс Ернст. Клингеман идентифицира серия от обекти от работата на Ернст и нарежда на компютъра си да направи различни колажи с едни и същи елементи. Резултатите често бяха сюрреалистични, понякога смешни, а в други моменти абсолютно ужасни.
„Хората не са способни на оригинални идеи.“
Клингеман искаше повече контрол върху хаотичните изображения, които произвеждаха неговите машини, така че започна да ги учи на нови неща. Той се запита: "Какво е интересно за хората?" Клингеман знаеше, че трябва да обучи системата какво да търси, да я научи как да вижда всички тези елементи, както би го направил човек-художник.
Полученото произведение на изкуството е прекрасно и напълно уникално. Въпреки че Klingemann очевидно е използвал стари изображения, за да създаде своята работа, те са показани в нов контекст и това прави цялата разлика.
В момента компютърното творчество е ограничено до интересни колажи и разбиране кои изображения вървят добре заедно. Машините все още не създават свое собствено изкуство, но творците на кодове, които ги захранват, стават повече куратори, отколкото създатели по време на процеса.
Остава да видим докъде човек може да разшири творческия ум на машините, но със сигурност е очарователно за гледане.
Препоръки на редакторите
- Google Bard вече може да говори, но може ли да заглуши ChatGPT?
- Вече можете да изпробвате Bard на Google, съперник на ChatGPT
- Новият Bard AI на Google може да е достатъчно мощен, за да накара ChatGPT да се тревожи - и вече е тук
- Google Meet или Zoom? Скоро това няма да има значение
- Странната нова клавиатура на Google Japan също може да хване (буквално) грешки