Deze A.I. is als Google Afbeeldingen zoeken naar denkbeeldige afbeeldingen

Eeuwigheid
Grote slaap

Voor het geval je het je afvraagt: de afbeelding hierboven is ‘een ingewikkelde tekening van de eeuwigheid’. Maar het is niet het werk van een menselijke kunstenaar; het is de creatie van BigSleep, het nieuwste verbazingwekkende voorbeeld van generatief kunstmatige intelligentie (A.I.) in actie.

Inhoud

  • Hoe BigSleep werkt
  • Beeldgenererende A.I.

Een beetje zoals een visuele versie van tekstgenererende A.I. modelGPT-3, BigSleep is in staat om elke tekstprompt te nemen en een afbeelding te visualiseren die bij de woorden past. Dat kan iets esoterisch zijn, zoals de eeuwigheid, of het kan een kom kersen zijn, of een prachtig huis (de laatste van (die je hieronder kunt zien.) Zie het als een Google Afbeeldingen-zoekopdracht - alleen voor foto's die nog nooit eerder zijn gemaakt bestond.

Aanbevolen video's

Hoe BigSleep werkt

“Op een hoog niveau werkt BigSleep door twee neurale netwerken te combineren: BigGAN en CLIP,” Ryan Murdock, vertelde de 23-jarige maker van BigSleep, een student cognitieve neurowetenschappen aan de Universiteit van Utah, aan Digital Trends.

De eerste hiervan, GrootGAN, is een systeem gemaakt door Google dat willekeurige ruis opneemt en afbeeldingen uitvoert. BigGAN is een generatief vijandig netwerk: een paar duellerende neurale netwerken die uitvoeren wat Murdock noemt een ‘tegenstrijdig getouwtrek’ tussen een beeldgenererend netwerk en een discriminator netwerk. Na verloop van tijd resulteert de interactie tussen generator en discriminator in verbeteringen in beide neurale netwerken.

Mooi huis
Een ‘prachtig huis’, aldus BigSleep. Ik bedoel, het is niet verkeerd.Grote slaap

KLEM, ondertussen, is een neuraal netwerk gemaakt door OpenAI dat is geleerd om afbeeldingen en beschrijvingen te matchen. Geef CLIP-tekst en afbeeldingen, en het zal proberen uit te vinden hoe goed ze bij elkaar passen en ze dienovereenkomstig een score geven.

Door de twee te combineren, legde Murdock uit dat BigSleep door de output van BigGAN zoekt naar afbeeldingen die de scores van CLIP maximaliseren. Vervolgens wordt de ruisinvoer in de generator van BigGAN langzaam aangepast totdat CLIP zegt dat de geproduceerde afbeeldingen overeenkomen met de beschrijving. Het genereren van een afbeelding die bij een prompt past, duurt in totaal ongeveer drie minuten.

"BigSleep is belangrijk omdat het redelijk goed een grote verscheidenheid aan concepten en objecten kan genereren met een resolutie van 512 x 512 pixels", aldus Murdock. “Eerder werk heeft indrukwekkende resultaten opgeleverd, maar bij mijn weten is een groot deel daarvan beperkt gebleven tot afbeeldingen met een lagere resolutie en meer alledaagse voorwerpen.”

Beeldgenererende A.I.

BigSleep is niet de eerste keer dat A.I. is gebruikt om afbeeldingen te genereren. De naam doet denken aan Diepe Droom, een A.I. gemaakt door Google-ingenieur Alex Mordvintsev die psychedelische beelden creëert met behulp van classificatiemodellen. Er werd ook een op GAN gebaseerd systeem gebruikt om de AI schilderij verkocht op een veiling in 2018 voor maar liefst $ 432.500. Het is echter zeker een fascinerende stap voorwaarts.

Om BigSleep zelf uit te proberen, stelde Murdock voor om de zijne te bekijken Google Colab-notitieboekje met betrekking tot het project. Er is een beetje een leercurve bij het gebruik van de Colab GUI en een paar andere stappen, maar het is gratis om eens te proberen. Andere manieren om het te testen zullen de komende weken waarschijnlijk ook beschikbaar komen. Als u geïnteresseerd bent, kunt u ook langskomen r/MediaSynthese, waar gebruikers enkele van de beste afbeeldingen plaatsen die ze tot nu toe met het systeem hebben gegenereerd.

Aanbevelingen van de redactie

  • Kan A.I. menselijke ingenieurs verslaan bij het ontwerpen van microchips? Google denkt van wel
  • Slimme nieuwe A.I. systeem belooft uw hond te trainen terwijl u niet thuis bent
  • De volgende grote uitdaging van AI? Een kwantumversie van Go spelen
  • Protheses waarvoor geen oefening nodig is: de nieuwste doorbraak in de bionica
  • AI vertaaltool werpt licht op de geheime taal van muizen

Upgrade uw levensstijlMet Digital Trends kunnen lezers de snelle technische wereld in de gaten houden met het laatste nieuws, leuke productrecensies, inzichtelijke redactionele artikelen en unieke sneak peeks.