Diese K.I. ist wie die Google-Bildersuche nach imaginären Bildern

Ewigkeit
BigSleep

Falls Sie sich fragen: Das Bild oben ist „eine komplizierte Zeichnung der Ewigkeit“. Aber es ist nicht das Werk eines menschlichen Künstlers; Es ist die Schöpfung von BigSleep, dem neuesten erstaunlichen Beispiel für Generativität künstliche Intelligenz (K.I.) in Aktion.

Inhalt

  • So funktioniert BigSleep
  • Bildgenerierende KI

Ein bisschen wie eine visuelle Version von Textgenerierende KI. Modell GPT-3BigSleep ist in der Lage, jede Textaufforderung zu übernehmen und ein Bild zu visualisieren, das zu den Wörtern passt. Das könnte etwas Esoterisches wie die Ewigkeit sein, oder es könnte eine Schale mit Kirschen oder ein schönes Haus sein (Letzteres). (was unten zu sehen ist.) Stellen Sie sich das wie eine Google-Bildersuche vor – nur nach Bildern, die es noch nie zuvor gab existierte.

Empfohlene Videos

So funktioniert BigSleep

„Auf hohem Niveau funktioniert BigSleep durch die Kombination zweier neuronaler Netze: BigGAN und CLIP.“ Ryan Murdock, sagte der 23-jährige Erfinder von BigSleep, ein Student der kognitiven Neurowissenschaften an der University of Utah, gegenüber Digital Trends.

Das erste davon, BigGANist ein von Google entwickeltes System, das zufälliges Rauschen aufnimmt und Bilder ausgibt. BigGAN ist ein generatives kontradiktorisches Netzwerk: Ein Paar duellierender neuronaler Netzwerke, die was ausführen Murdock spricht von einem „kontradiktorischen Tauziehen“ zwischen einem bildgenerierenden Netzwerk und einem Diskriminator Netzwerk. Im Laufe der Zeit führt die Interaktion zwischen Generator und Diskriminator zu Verbesserungen bei beiden neuronalen Netzen.

Schönes Haus
Laut BigSleep ein „wunderschönes Haus“. Ich meine, es ist nicht falsch.BigSleep

CLIPist ein neuronales Netz von OpenAI, dem beigebracht wurde, Bilder und Beschreibungen abzugleichen. Geben Sie CLIP-Text und -Bilder ein, und es wird versuchen, herauszufinden, wie gut sie zusammenpassen, und ihnen eine entsprechende Bewertung zu geben.

Durch die Kombination der beiden, erklärte Murdock, durchsucht BigSleep die Ausgaben von BigGAN nach Bildern, die die CLIP-Bewertung maximieren. Anschließend optimiert es langsam den Rauscheingang im BigGAN-Generator, bis CLIP meldet, dass die erzeugten Bilder mit der Beschreibung übereinstimmen. Das Generieren eines Bildes entsprechend einer Eingabeaufforderung dauert insgesamt etwa drei Minuten.

„BigSleep ist von Bedeutung, weil es mit einer Auflösung von 512 x 512 Pixeln recht gut eine Vielzahl von Konzepten und Objekten erzeugen kann“, sagte Murdock. „Frühere Arbeiten haben zu beeindruckenden Ergebnissen geführt, aber meines Wissens war ein Großteil davon auf Bilder mit niedrigerer Auflösung und eher alltägliche Objekte beschränkt.“

Bildgenerierende KI

BigSleep ist nicht das erste Mal, dass K.I. wurde zur Generierung von Bildern verwendet. Sein Name erinnert an DeepDream, eine K.I. erstellt vom Google-Ingenieur Alex Mordvintsev, der mithilfe von Klassifizierungsmodellen psychedelische Bilder erstellt. Zur Erstellung wurde ebenfalls ein GAN-basiertes System verwendet K.I. Gemälde auf einer Auktion verkauft im Jahr 2018 für satte 432.500 US-Dollar. Es ist jedoch sicherlich ein faszinierender Schritt nach vorne.

Um BigSleep selbst auszuprobieren, schlug Murdock vor, sich seines anzuschauen Google Colab-Notizbuch zum Projekt. Die Verwendung der Colab-Benutzeroberfläche und einiger anderer Schritte ist mit einer gewissen Lernkurve verbunden, aber es ist kostenlos, es auszuprobieren. In den kommenden Wochen werden voraussichtlich auch andere Möglichkeiten zum Testen eröffnet. Wenn Sie interessiert sind, können Sie auch vorbeikommen r/MediaSynthesis, wo Benutzer einige der besten Bilder veröffentlichen, die sie bisher mit dem System generiert haben.

Empfehlungen der Redaktion

  • Kann K.I. menschliche Ingenieure bei der Entwicklung von Mikrochips schlagen? Google glaubt es
  • Clevere neue K.I. Das System verspricht, Ihren Hund zu trainieren, während Sie nicht zu Hause sind
  • Die nächste große Herausforderung für KI? Eine Quantenversion von Go spielen
  • Prothetik, die keine Übung erfordert: Einblicke in den neuesten Durchbruch in der Bionik
  • K.I. Übersetzungstool bringt Licht in die Geheimsprache der Mäuse

Werten Sie Ihren Lebensstil aufDigital Trends hilft Lesern mit den neuesten Nachrichten, unterhaltsamen Produktrezensionen, aufschlussreichen Leitartikeln und einzigartigen Einblicken, den Überblick über die schnelllebige Welt der Technik zu behalten.