Cette A.I. c'est comme la recherche d'images Google pour des images imaginaires

Éternité
Grand Sommeil

Au cas où vous vous poseriez la question, l’image ci-dessus est « un dessin complexe de l’éternité ». Mais ce n’est pas l’œuvre d’un artiste humain; c'est la création de BigSleep, le dernier exemple étonnant de intelligence artificielle (IA) en action.

Contenu

  • Comment fonctionne BigSleep
  • L'IA génératrice d'images

Un peu comme une version visuelle de IA génératrice de texte modèle GPT-3, BigSleep est capable de prendre n'importe quelle invite de texte et de visualiser une image adaptée aux mots. Cela pourrait être quelque chose d'ésotérique comme l'éternité, ou cela pourrait être un bol de cerises, ou une belle maison (cette dernière des deux). qui peut être vu ci-dessous.) Pensez-y comme à une recherche Google Images - uniquement pour les images qui n'ont jamais été publiées auparavant. existait.

Vidéos recommandées

Comment fonctionne BigSleep

« À un niveau élevé, BigSleep fonctionne en combinant deux réseaux de neurones: BigGAN et CLIP » Ryan Murdock, a déclaré à Digital Trends le créateur de BigSleep, 23 ans, étudiant en neurosciences cognitives à l'Université de l'Utah.

Le premier d'entre eux, GrosGAN, est un système créé par Google qui capte le bruit aléatoire et génère des images. BigGAN est un réseau contradictoire génératif: une paire de réseaux neuronaux en duel qui effectuent ce que Murdock qualifie de « tir à la corde » entre un réseau générateur d’images et un discriminateur réseau. Au fil du temps, l’interaction entre le générateur et le discriminateur entraîne des améliorations des deux réseaux neuronaux.

Jolie maison
Une « belle maison », selon BigSleep. Je veux dire, ce n'est pas faux.Grand Sommeil

AGRAFE, quant à lui, est un réseau neuronal créé par OpenAI qui a appris à faire correspondre les images et les descriptions. Donnez du texte et des images CLIP, et il tentera de déterminer dans quelle mesure ils correspondent et leur attribuera un score en conséquence.

En combinant les deux, Murdock a expliqué que BigSleep recherche dans les sorties de BigGAN les images qui maximisent le score de CLIP. Il ajuste ensuite lentement le bruit d'entrée dans le générateur de BigGAN jusqu'à ce que CLIP indique que les images produites correspondent à la description. La génération d'une image correspondant à une invite prend environ trois minutes au total.

"BigSleep est important car il peut générer assez bien une grande variété de concepts et d'objets à une résolution de 512 x 512 pixels", a déclaré Murdock. "Des travaux antérieurs ont produit des résultats impressionnants, mais, à ma connaissance, une grande partie s'est limitée à des images de plus faible résolution et à des objets plus quotidiens."

L'IA génératrice d'images

BigSleep n’est pas la première fois que l’IA a été utilisé pour générer des images. Son nom rappelle Rêve profond, une I.A. créé par l'ingénieur de Google Alex Mordvintsev qui crée des images psychédéliques à l'aide de modèles de classification. Un système basé sur le GAN a également été utilisé pour créer le I.A. tableau vendu aux enchères en 2018 pour la somme colossale de 432 500 $. Cependant, il s’agit certainement d’un pas en avant fascinant.

Pour essayer BigSleep par vous-même, Murdock a suggéré de consulter son Bloc-notes Google Colab concernant le projet. Il y a une petite courbe d'apprentissage impliquant l'utilisation de l'interface graphique de Colab et quelques autres étapes, mais c'est gratuit. D’autres moyens de le tester s’ouvriront probablement également dans les semaines à venir. Si vous êtes intéressé, vous pouvez également visiter r/MediaSynthèse, où les utilisateurs publient certaines des meilleures images qu’ils ont générées jusqu’à présent avec le système.

Recommandations des rédacteurs

  • L’IA peut-elle battre les ingénieurs humains dans la conception de micropuces? Google le pense
  • Une nouvelle IA intelligente le système promet de dresser votre chien pendant que vous êtes loin de chez vous
  • Le prochain grand défi de l’IA? Jouer à une version quantique de Go
  • Des prothèses qui ne nécessitent pas de pratique: les dernières avancées en matière de bionique
  • I.A. un outil de traduction met en lumière le langage secret des souris

Améliorez votre style de vieDigital Trends aide les lecteurs à garder un œil sur le monde en évolution rapide de la technologie avec toutes les dernières nouvelles, des critiques de produits amusantes, des éditoriaux perspicaces et des aperçus uniques.