
Om du undrar är bilden ovan "en intrikat teckning av evigheten." Men det är inte en mänsklig konstnärs verk; det är skapandet av BigSleep, det senaste fantastiska exemplet på generativ artificiell intelligens (A.I.) i aktion.
Innehåll
- Hur BigSleep fungerar
- Bildgenererande A.I.
Lite som en visuell version av textgenererande A.I. modell GPT-3, BigSleep kan ta vilken text som helst och visualisera en bild så att den passar orden. Det kan vara något esoteriskt som evigheten, eller det kan vara en skål med körsbär eller ett vackert hus (det senare av som kan ses nedan.) Se det som en Google Bilder-sökning — bara för bilder som aldrig har gjort det tidigare existerade.
Rekommenderade videor
Hur BigSleep fungerar
"På en hög nivå fungerar BigSleep genom att kombinera två neurala nätverk: BigGAN och CLIP," Ryan Murdock, berättade BigSleeps 23-åriga skapare, en student som studerar kognitiv neurovetenskap vid University of Utah, till Digital Trends.
Den första av dessa, BigGAN, är ett system skapat av Google som tar in slumpmässigt brus och matar ut bilder. BigGAN är ett generativt motståndsnätverk: ett par duellerande neurala nätverk som utför vad Murdock kallar en "motstridig dragkamp" mellan ett bildskapande nätverk och en diskriminator nätverk. Med tiden resulterar interaktionen mellan generator och diskriminator i förbättringar av båda neurala nätverk.

KLÄMMA, under tiden, är ett neuralt nät tillverkat av OpenAI som har lärt sig att matcha bilder och beskrivningar. Ge CLIP-text och bilder, så kommer det att försöka ta reda på hur väl de matchar och ge dem ett betyg därefter.
Genom att kombinera de två förklarade Murdock att BigSleep söker igenom BigGANs utdata efter bilder som maximerar CLIPs poängsättning. Den justerar sedan långsamt brusingången i BigGANs generator tills CLIP säger att bilderna som produceras matchar beskrivningen. Att skapa en bild för att matcha en uppmaning tar cirka tre minuter totalt.
"BigSleep är betydande eftersom det kan generera en mängd olika koncept och objekt ganska bra vid 512 x 512 pixlars upplösning," sa Murdock. "Tidigare arbete har gett imponerande resultat, men vad jag vet har mycket av det begränsats till bilder med lägre upplösning och mer vardagliga föremål."
Bildgenererande A.I.
BigSleep är inte första gången A.I. har använts för att skapa bilder. Dess namn påminner om DeepDream, en A.I. skapad av Googles ingenjör Alex Mordvintsev som skapar psykedeliska bilder med hjälp av klassificeringsmodeller. Ett GAN-baserat system användes också för att skapa A.I. tavla såld på auktion 2018 för enorma $432 500. Men det är verkligen ett fascinerande steg framåt.
För att prova BigSleep själv föreslog Murdock att du skulle kolla in hans Google Colab-anteckningsbok angående projektet. Det finns lite av en inlärningskurva som involverar användning av Colab GUI och några andra steg, men det är gratis att ta en runda. Andra sätt att testa det kommer sannolikt också att öppnas under de kommande veckorna. Om du är intresserad kan du också besöka r/MediaSynthesis, där användare lägger upp några av de bästa bilderna de har skapat med systemet hittills.
Redaktörens rekommendationer
- Kan A.I. slå mänskliga ingenjörer vid design av mikrochips? Google tycker det
- Smart ny A.I. systemet lovar att träna din hund när du är borta från hemmet
- A.I: s nästa stora utmaning? Spelar en kvantversion av Go
- Proteser som inte kräver övning: Inuti det senaste genombrottet inom bionik
- A.I. översättningsverktyg kastar ljus över mössens hemliga språk
Uppgradera din livsstilDigitala trender hjälper läsare att hålla koll på den snabba teknikvärlden med alla de senaste nyheterna, roliga produktrecensioner, insiktsfulla redaktioner och unika smygtittar.