Програмер тренира вештачку интелигенцију да црта лица из текста

Т2Ф тренинг тиме лапсе

Програмер Анимесх Карневар желео је да зна како ће се ликови описани у књигама појавити у стварности, па се окренуо вештачкој интелигенцији да види да ли она може правилно да прикаже ове измишљене људе. Под називом Т2Ф, истраживачки пројекат користи генеративну адверсариал мрежу (ГАН) за кодирање текста и синтезу слика лица.

Једноставно речено, ГАН се састоји од две неуронске мреже које се међусобно свађају да произведе најбоље резултате. На пример, посао мреже бр. 1 је да превари мрежу бр. 2 да верује да је приказана слика права фотографија, док мрежа бр. 2 покушава да докаже да је наводна фотографија само рендерована слика. Овај процес напред-назад фино подешава процес рендеровања све док мрежа бр. 2 на крају не буде преварена.

Препоручени видео снимци

Карневар је започео пројекат користећи а скуп података под називом Фаце2Тект који су обезбедили истраживачи са Универзитета у Копенхагену, који садржи описе природног језика за 400 насумичних слика.

„Описи су очишћени како би се уклонили невољни и ирелевантни натписи за људе на сликама“, пише он. „Неки од описа не само да описују црте лица, већ пружају и неке имплициране информације са слика.

Иако резултати који произилазе из Карневаровог Т2Ф пројекта нису баш фотореалистични, то је почетак. Видео који је уграђен изнад показује временски преглед како је ГАН обучен да приказује илустрације од текста, почевши од чврстих блокова боја и завршавајући грубим, али препознатљивим пиксилама рендерингс.

„Открио сам да генерисани узорци на вишим резолуцијама (32 к 32 и 64 к 64) имају више позадинског шума у поређењу са узорцима генерисаним на нижим резолуцијама“, објашњава Карневар. „Осећам то због недовољне количине података (само 400 слика).“

Техника која се користи за обуку противничких мрежа назива се „Прогресивни раст ГАН-ова“, што побољшава квалитет и стабилност током времена. Као што видео показује, генератор слике почиње од изузетно ниске резолуције. Нови слојеви се полако уводе у модел, повећавајући детаље како обука напредује током времена.

„Прогресивни раст ГАН-а је феноменална техника за бржу и стабилнију обуку ГАН-а“, додаје он. „Ово се може комбиновати са разним новим прилозима из других листова.

У датом примеру, текстуални опис илуструје жену у касним двадесетим са дугом смеђом косом пребаченом на једну страну, нежним цртама лица и без шминке. Она је „лежерна“ и „опуштена“. Други опис илуструје човека у 40-им годинама са издуженим лицем, истакнутим носом, смеђим очима, повученом линијом косе и кратким брковима. Иако су крајњи резултати изузетно пикселизирани, коначни рендери показују велики напредак у томе како А.И. може генерисати лица од нуле.

Карневар каже да планира да прошири пројекат како би интегрисао додатне скупове података као што су Флицкер8К и Цоцо титлови. На крају, Т2Ф би се могао користити у области спровођења закона за идентификацију жртава и/или криминалаца на основу текстуалних описа, између осталих апликација. Отворен је за предлоге и доприносе пројекту.

Да бисте приступили коду и допринели, идите до Карневаровог спремишта на Гитхубу овде.

Препоруке уредника

Научници користе А.И. да створи вештачки људски генетски код
Осврт на успон АИ: Колико далеко је вештачка интелигенција стигла од 2010.
Интел и Фацебоок се удружују како би Купер Лејку подстакли вештачку интелигенцију

Надоградите свој животни стилДигитални трендови помажу читаоцима да прате убрзани свет технологије са свим најновијим вестима, забавним рецензијама производа, проницљивим уводницима и јединственим кратким прегледима.

Програмер тренира вештачку интелигенцију да црта лица из текста

Препоруке уредника

Категорије

Скорашњи

ПхотоВу представља 22-инчни ЛЦД фото рам

Сони представља осам нових Цибер-схот камера

Никон најављује Д3, Д300 Про ДСЛР-ове