Questa I.A. è come Google Image Search per immagini immaginarie

Eternità
Grande sonno

Nel caso ve lo stiate chiedendo, l’immagine sopra è “un intricato disegno dell’eternità”. Ma non è il lavoro di un artista umano; è la creazione di BigSleep, l’ultimo straordinario esempio di generativa intelligenza artificiale (A.I.) in azione.

Contenuti

  • Come funziona BigSleep
  • A.I. che genera immagini

Un po' come una versione visiva di A.I. che genera testo modello GPT-3, BigSleep è in grado di ricevere qualsiasi suggerimento di testo e visualizzare un'immagine per adattarla alle parole. Potrebbe essere qualcosa di esoterico come l'eternità, o potrebbe essere una ciotola di ciliegie, o una bella casa (quest'ultima delle che può essere visto di seguito.) Considerala come una ricerca su Google Immagini, solo per immagini mai viste prima esistito.

Video consigliati

Come funziona BigSleep

“Ad alto livello, BigSleep funziona combinando due reti neurali: BigGAN e CLIP”, Ryan Murdock, ha detto a Digital Trends il creatore 23enne di BigSleep, uno studente di neuroscienze cognitive all'Università dello Utah.

Il primo di questi, BigGAN, è un sistema creato da Google che assorbe rumore casuale e genera immagini. BigGAN è una rete avversaria generativa: una coppia di reti neurali in duello che realizzano cosa Murdock definisce un “tiro alla fune contraddittorio” tra una rete generatrice di immagini e un discriminatore rete. Nel tempo, l’interazione tra generatore e discriminatore porta a miglioramenti su entrambe le reti neurali.

Bellissima casa
Una “bella casa”, secondo BigSleep. Voglio dire, non è sbagliato.Grande sonno

CLIP, nel frattempo, è una rete neurale creata da OpenAI a cui è stato insegnato ad abbinare immagini e descrizioni. Fornisci testo e immagini a CLIP e tenterà di capire quanto bene corrispondono e di assegnare loro un punteggio di conseguenza.

Combinando i due, Murdock ha spiegato che BigSleep cerca tra gli output di BigGAN immagini che massimizzano il punteggio di CLIP. Quindi modifica lentamente il rumore in ingresso nel generatore di BigGAN finché CLIP non dice che le immagini prodotte corrispondono alla descrizione. La generazione di un'immagine corrispondente a un prompt richiede circa tre minuti in totale.

"BigSleep è significativo perché può generare abbastanza bene un'ampia varietà di concetti e oggetti con una risoluzione di 512 x 512 pixel", ha affermato Murdock. "Il lavoro precedente ha prodotto risultati impressionanti, ma, per quanto ne so, gran parte di esso è stato limitato a immagini a bassa risoluzione e oggetti più quotidiani."

A.I. che genera immagini

BigSleep non è la prima volta che A.I. è stato utilizzato per generare immagini. Il suo nome ricorda Sogno profondo, un'I.A. creato dall'ingegnere di Google Alex Mordvintsev che crea immagini psichedeliche utilizzando modelli di classificazione. Per creare il file è stato utilizzato anche un sistema basato su GAN A.I. dipinto venduto all'asta nel 2018 per la massiccia cifra di $ 432.500. Tuttavia, è certamente un passo avanti affascinante.

Per provare tu stesso BigSleep, Murdock ha suggerito di dare un'occhiata al suo Taccuino di Google Colab riguardo al progetto. C'è un po' di curva di apprendimento che coinvolge l'uso della GUI di Colab e alcuni altri passaggi, ma è un'esperienza gratuita. Probabilmente nelle prossime settimane si apriranno anche altri modi per testarlo. Se sei interessato puoi anche visitare r/MediaSynthesis, dove gli utenti pubblicano alcune delle migliori immagini che hanno generato finora con il sistema.

Raccomandazioni degli editori

  • L'A.I. battere gli ingegneri umani nella progettazione di microchip? Google la pensa così
  • Nuova IA intelligente il sistema promette di addestrare il tuo cane mentre sei lontano da casa
  • La prossima grande sfida dell’intelligenza artificiale? Giocare a una versione quantistica di Go
  • Protesi che non richiedono pratica: all'interno dell'ultima scoperta della bionica
  • A.I. strumento di traduzione fa luce sul linguaggio segreto dei topi

Migliora il tuo stile di vitaDigital Trends aiuta i lettori a tenere d'occhio il frenetico mondo della tecnologia con tutte le ultime notizie, divertenti recensioni di prodotti, editoriali approfonditi e anteprime uniche nel loro genere.