Αυτό το A.I. είναι σαν την Αναζήτηση εικόνων Google για φανταστικές εικόνες

Αιωνιότητα
BigSleep

Σε περίπτωση που αναρωτιέστε, η παραπάνω εικόνα είναι «ένα περίπλοκο σχέδιο της αιωνιότητας». Αλλά δεν είναι έργο ανθρώπου καλλιτέχνη. είναι η δημιουργία του BigSleep, το τελευταίο εκπληκτικό παράδειγμα γενετικής τεχνητή νοημοσύνη (A.I.) σε δράση.

Περιεχόμενα

  • Πώς λειτουργεί το BigSleep
  • A.I που δημιουργεί εικόνα.

Λίγο σαν μια οπτική εκδοχή του δημιουργίας κειμένου A.I. μοντέλο GPT-3, το BigSleep μπορεί να λάβει οποιοδήποτε μήνυμα κειμένου και να οπτικοποιήσει μια εικόνα ώστε να ταιριάζει στις λέξεις. Αυτό θα μπορούσε να είναι κάτι απόκρυφο όπως η αιωνιότητα, ή μπορεί να είναι ένα μπολ με κεράσια ή ένα όμορφο σπίτι (το τελευταίο του που μπορείτε να δείτε παρακάτω.) Σκεφτείτε το σαν μια αναζήτηση στο Google Images — μόνο για φωτογραφίες που δεν είχαν ποτέ στο παρελθόν υπήρχε.

Προτεινόμενα βίντεο

Πώς λειτουργεί το BigSleep

"Σε υψηλό επίπεδο, το BigSleep λειτουργεί συνδυάζοντας δύο νευρωνικά δίκτυα: BigGAN και CLIP." Ράιαν Μέρντοκ, είπε στο Digital Trends ο 23χρονος δημιουργός του BigSleep, φοιτητής που σπουδάζει γνωστικές νευροεπιστήμες στο Πανεπιστήμιο της Γιούτα.

Το πρώτο από αυτά, BigGAN, είναι ένα σύστημα που δημιουργήθηκε από την Google που λαμβάνει τυχαίο θόρυβο και εξάγει εικόνες. Το BigGAN είναι ένα παραγωγικό ανταγωνιστικό δίκτυο: Ένα ζεύγος μονομαχικών νευρωνικών δικτύων που πραγματοποιούν Ο Murdock αποκαλεί μια «αντίπαλη διελκυστίνδα» μεταξύ ενός δικτύου παραγωγής εικόνων και ενός ατόμου που διακρίνει δίκτυο. Με την πάροδο του χρόνου, η αλληλεπίδραση μεταξύ γεννήτριας και διαχωριστή έχει ως αποτέλεσμα βελτιώσεις και στα δύο νευρωνικά δίκτυα.

Ομορφο σπίτι
Ένα «όμορφο σπίτι», σύμφωνα με το BigSleep. Θέλω να πω, δεν είναι λάθος.BigSleep

ΣΥΝΔΕΤΗΡΑΣ, εν τω μεταξύ, είναι ένα νευρωνικό δίκτυο που κατασκευάστηκε από την OpenAI που έχει διδαχθεί να ταιριάζει με εικόνες και περιγραφές. Δώστε κείμενο και εικόνες CLIP και θα προσπαθήσει να καταλάβει πόσο ταιριάζουν και να τους δώσει μια βαθμολογία ανάλογα.

Συνδυάζοντας τα δύο, ο Murdock εξήγησε ότι το BigSleep αναζητά μέσα από τις εξόδους του BigGAN εικόνες που μεγιστοποιούν τη βαθμολογία του CLIP. Στη συνέχεια, τροποποιεί αργά την είσοδο θορύβου στη γεννήτρια του BigGAN έως ότου το CLIP πει ότι οι εικόνες που παράγονται ταιριάζουν με την περιγραφή. Η δημιουργία μιας εικόνας για να ταιριάζει με μια προτροπή διαρκεί περίπου τρία λεπτά συνολικά.

«Το BigSleep είναι σημαντικό γιατί μπορεί να δημιουργήσει μια μεγάλη ποικιλία από έννοιες και αντικείμενα αρκετά καλά σε ανάλυση 512 x 512 pixel», είπε ο Murdock. «Προηγούμενες εργασίες είχαν δώσει εντυπωσιακά αποτελέσματα, αλλά, από τις γνώσεις μου, μεγάλο μέρος τους περιορίστηκε σε εικόνες χαμηλότερης ανάλυσης και σε περισσότερα καθημερινά αντικείμενα».

A.I που δημιουργεί εικόνα.

Το BigSleep δεν είναι η πρώτη φορά που το A.I. έχει χρησιμοποιηθεί για τη δημιουργία εικόνων. Το όνομά του θυμίζει DeepDream, ένα A.I. δημιουργήθηκε από τον μηχανικό της Google Alex Mordvintsev που δημιουργεί ψυχεδελικές εικόνες χρησιμοποιώντας μοντέλα ταξινόμησης. Ένα σύστημα που βασίζεται σε GAN χρησιμοποιήθηκε επίσης για τη δημιουργία του ΟΛΑ ΣΥΜΠΕΡΙΛΑΜΒΑΝΟΝΤΑΙ. πίνακας που πουλήθηκε σε δημοπρασία το 2018 για ένα τεράστιο ποσό $432.500. Ωστόσο, είναι σίγουρα ένα συναρπαστικό βήμα προς τα εμπρός.

Για να δοκιμάσετε μόνοι σας το BigSleep, ο Murdock πρότεινε να ελέγξετε το δικό του Σημειωματάριο Google Colab σχετικά με το έργο. Υπάρχει μια μικρή καμπύλη εκμάθησης που περιλαμβάνει τη χρήση του γραφικού περιβάλλοντος εργασίας Colab και μερικών άλλων βημάτων, αλλά είναι δωρεάν για μια περιστροφή. Άλλοι τρόποι δοκιμής πιθανότατα θα ανοίξουν επίσης τις επόμενες εβδομάδες. Εάν ενδιαφέρεστε, μπορείτε επίσης να επισκεφθείτε r/MediaSynthesis, όπου οι χρήστες δημοσιεύουν μερικές από τις καλύτερες εικόνες που έχουν δημιουργήσει με το σύστημα μέχρι στιγμής.

Συστάσεις των συντακτών

  • Μπορεί η A.I. νικήσει τους ανθρώπους μηχανικούς στο σχεδιασμό μικροτσίπ; Το πιστεύει η Google
  • Έξυπνο νέο A.I. το σύστημα υπόσχεται να εκπαιδεύσει τον σκύλο σας ενώ λείπετε από το σπίτι
  • Η επόμενη μεγάλη πρόκληση της A.I.; Παίζοντας μια κβαντική έκδοση του Go
  • Προσθετικά που δεν απαιτούν εξάσκηση: Μέσα στην τελευταία ανακάλυψη στη βιονική
  • ΟΛΑ ΣΥΜΠΕΡΙΛΑΜΒΑΝΟΝΤΑΙ. Το εργαλείο μετάφρασης ρίχνει φως στη μυστική γλώσσα των ποντικών

Αναβαθμίστε τον τρόπο ζωής σαςΤο Digital Trends βοηθά τους αναγνώστες να παρακολουθούν τον γρήγορο κόσμο της τεχνολογίας με όλα τα τελευταία νέα, διασκεδαστικές κριτικές προϊόντων, διορατικά editorial και μοναδικές κρυφές ματιές.