Inside The Coder Art Στο Πολιτιστικό Ινστιτούτο της Google

Μηχανική μάθηση και τέχνη - Google I/O 2016

Μπορεί ένα μηχάνημα να είναι δημιουργικό; Η Google το πιστεύει, και έχει μια ολόκληρη ομάδα αφιερωμένη στη διδασκαλία των μηχανών πώς να βλέπουν τον κόσμο λίγο περισσότερο σαν εμάς τους συναισθηματικούς ανθρώπους.

Σκεφτείτε τους υπολογιστές σαν να ήταν παιδιά και είναι εύκολο να καταλάβετε πώς οι κωδικοποιητές μπορούν να τους διδάξουν να μαθαίνουν. Η τεχνητή νοημοσύνη είναι, στην αρχή, πολύ βασική και απλή. Οι ανθρώπινοι συντονιστές δίνουν οδηγίες στους υπολογιστές, δείχνοντάς τους πώς να σκέφτονται και να διδάσκουν έτσι τον εαυτό τους. Μόλις οι κωδικοποιητές τους δώσουν τα βασικά, όμως, μπορούν να επεκτείνουν αυτές τις γνώσεις γρήγορα.

«Τι μπορείτε να κάνετε με 7 εκατομμύρια ψηφιακά αντικείμενα;»

Στο Πολιτιστικό Ινστιτούτο Google στο Παρίσι της Γαλλίας, ο γίγαντας της αναζήτησης διδάσκει σε μηχανές πώς να κατηγοριοποιούν 7 εκατομμύρια εικόνες ανθρώπινων καλλιτεχνικών επιτευγμάτων ανά τους αιώνες. Το Ινστιτούτο διαθέτει ακόμη και ιστότοπο, καθώς και εφαρμογές για

iOS και Android όπου μπορείτε να αναζητήσετε έργα τέχνης από διάφορα μουσεία σε όλο τον κόσμο. Για να δημιουργήσουν τον κατάλογο τέχνης του, οι καλλιτέχνες κώδικα που κατοικούσαν στο Ινστιτούτο έπρεπε να διδάξουν τους υπολογιστές να δείτε τις εικόνες με τον τρόπο που θα έκαναν οι άνθρωποι για να δημιουργήσουν ένα ακριβές ψηφιακό αρχείο τέχνης σε όλη την ανθρώπινη ιστορία.

Η καταλογογράφηση του ιστορικού είναι καλή και καλή, αλλά ορισμένες από τις δεξιότητες που μαθαίνουν οι υπολογιστές από την ταξινόμηση και την αρχειοθέτηση τους κάνουν πραγματικά πιο δημιουργικούς. Οι καλλιτέχνες στο σπίτι πειραματίζονται τώρα με υπολογιστές για να δημιουργήσουν νέα έργα τέχνης χρησιμοποιώντας νοημοσύνη μηχανών και τον κατάλογο 7 εκατομμυρίων εικόνων που έχουν συνδυάσει. Κατά τη διάρκεια του Google I/O 2016, Cyril Diagne και Μάριο Κλίνγκεμαν εξήγησαν πώς έχουν διδάξει τις μηχανές να βλέπουν την τέχνη όπως οι άνθρωποι και πώς έχουν εκπαιδεύσει τις μηχανές να είναι δημιουργικές.

Διδάσκοντας τους υπολογιστές τα ABC τους

Ένα από τα πρώτα πράγματα που διδάσκετε σε ένα παιδί είναι η γλώσσα. Στη δυτική κουλτούρα, αυτό σημαίνει να μάθετε τα ABC σας. Ο Mario Klingemann, ένας αυτοαποκαλούμενος καλλιτέχνης κώδικα από τη Γερμανία, άρχισε να διδάσκει μηχανές σε αναγνωρίσει στυλιζαρισμένα γράμματα από παλιά κείμενα για να ανακαλύψει εάν θα μπορούσε να διδάξει σε έναν υπολογιστή να αναγνωρίζει χιλιάδες As, Bs, Cs και ούτω καθεξής επί. Ήταν ένα τρακαρισμένο μάθημα στη διδασκαλία μηχανών πώς να κατηγοριοποιούν τις εικόνες με τον τρόπο που θα έκαναν οι άνθρωποι.

Ενώ ένας υπολογιστής μπορεί να κοιτάξει ένα στυλιζαρισμένο γράμμα Β καλυμμένο με αμπέλια και λουλούδια και να δει ένα φυτό κάποιου είδους, ακόμη και ένα 5χρονο παιδί θα μπορούσε αμέσως να αναγνωρίσει την εικόνα ως γράμμα Β — όχι φυτό. Για να διδάξει τον υπολογιστή του να αναγνωρίζει τα ABC του, ο Klingemann του έδωσε χιλιάδες εικόνες με στυλιζαρισμένα γράμματα. Δημιούργησε μια διεπαφή που μοιάζει με Tinder με σάρωση προς τα δεξιά ή προς τα αριστερά για να πει στις μηχανές του αν μάντευαν σωστά ή λάθος το γράμμα.

Αποδεικνύεται ότι οι μηχανές μαθαίνουν τα ABC τους αρκετά γρήγορα. άρχισαν να βλέπουν γράμματα σε όλα. Ακριβώς όπως οι άνθρωποι βλέπουν πρόσωπα σε σύννεφα και εικόνες σε αφηρημένα έργα τέχνης, οι υπολογιστές του έβλεπαν γράμματα σε εντελώς άσχετες εικόνες. Ο Κλίνγκεμαν έδειξε στον υπολογιστή του ένα σχέδιο ή ένα χαρακτικό ενός ερειπωμένου κτιρίου και αντί αυτού είδαν ένα γράμμα Β.

Ο Klingemann εξήγησε ότι όταν εκπαιδεύεις έναν υπολογιστή με ένα μόνο σύνολο εικόνων, αρχίζει να βλέπει μόνο αυτό το είδος εικόνας σε όλα. Γι' αυτό οι μηχανές του είδαν ένα γράμμα σε ερείπιο.

Διδάσκοντας υπολογιστές να κατηγοριοποιούν 7 εκατομμύρια εικόνες

Όταν ο καλλιτέχνης της Digital Interaction Cyril Diagne εντάχθηκε στο Πολιτιστικό Ινστιτούτο, η Google του έθεσε μια μάλλον τρομακτική ερώτηση: «Τι μπορείς να κάνεις με 7 εκατομμύρια ψηφιακά αντικείμενα;»

Ο Diagne κυριεύτηκε από την ερώτηση, έτσι χάραξε κάθε εικόνα σε μια υπέροχα ογκώδη ημιτονοειδές κύμα, που μπορείτε να δείτε παρακάτω. Αυτό το κύμα αργότερα κατέληξε να γίνει μια όμορφη αναπαράσταση όλων όσων ελπίζει να επιτύχει το έργο με τη μηχανική μάθηση. Το ημιτονοειδές κύμα του Diagne είναι πραγματικά αναζητήσιμο, ώστε να μπορείτε να σερφάρετε στη θάλασσα όλων των εικόνων στο ψηφιακό αρχείο που δημιουργήθηκε από το Πολιτιστικό Ινστιτούτο Google. Οι εικόνες ομαδοποιούνται σε κατηγορίες και από την οπτική γωνία, βλέπετε απλώς μια θάλασσα από κουκκίδες. Καθώς μετακινείστε, μπορείτε να δείτε συγκεκριμένες εικόνες, όλες με ένα κοινό θέμα, είτε πρόκειται για κουτάβια, φάρμες ή ανθρώπους.

1 του 3

Μπορείτε επίσης να το ψάξετε και να βρείτε τις εικόνες που θέλετε. Αν κοιτάξετε αρκετά σκληρά, μπορεί ακόμη και να συναντήσετε αυτό που ο Diagne αποκαλεί την Ακτή των Πορτρέτων. Εκεί συγκεντρώνονται όλες οι εικόνες των προσώπων των ανθρώπων.

Για να φτιάξουν τον χάρτη με δυνατότητα αναζήτησης κάθε εικόνας στο αρχείο, ο Diagne και η ομάδα του έπρεπε να δημιουργήσουν μια κατηγορία για τα πάντα για να διδάξουν στη μηχανή τι ήταν τι.

Η κατηγοριοποίηση 7 εκατομμυρίων αντικειμένων, πολλά από τα οποία μπορεί να έχουν πολλές κατηγορίες, δεν είναι εύκολη υπόθεση. Η ομάδα έπρεπε να σκεφτεί κάποια που ήταν έξω από το κουτί. Δεν αρκεί απλώς να κατηγοριοποιούμε τα πράγματα με βάση αυτό που είναι. Έπρεπε επίσης να δημιουργήσουν κατηγορίες για τα συναισθήματα που προκαλούν οι εικόνες.

Η διδασκαλία των ανθρώπινων συναισθημάτων στις μηχανές είναι ένα σημαντικό βήμα για να γίνουν πιο δημιουργικοί.

Με αυτόν τον τρόπο, μπορείτε να αναζητήσετε μια εικόνα «ηρεμίας» και ο υπολογιστής θα σας δείξει εικόνες που προκαλούν μια αίσθηση ηρεμίας, όπως ηλιοβασιλέματα, γαλήνιες λίμνες κ.λπ. Παραδόξως, οι μηχανές έμαθαν πώς να αναγνωρίζουν τα ανθρώπινα συναισθήματα με τέτοια ικανότητα που μπορούν να μπουν στη θέση μας για να εξετάσουν πώς θα έκανε μια συγκεκριμένη εικόνα να αισθανθεί έναν άνθρωπο.

Η διδασκαλία των ανθρώπινων συναισθημάτων στις μηχανές είναι ένα σημαντικό βήμα για να γίνουν πιο δημιουργικοί. Εξάλλου, μεγάλο μέρος της σύγχρονης τέχνης είναι οπτικές αναπαραστάσεις των ανθρώπινων συναισθημάτων.

Μπορεί όμως ένα μηχάνημα να είναι δημιουργικό;

Η δημιουργικότητα και η καλλιτεχνία είναι δύο πράγματα που εμείς οι άνθρωποι μας αρέσει να θεωρούμε μόνο δικά μας. Τα ζώα δεν κάνουν τέχνη, ούτε οι μηχανές… ακόμα. Το έργο Deep Dream της Google προσπάθησε να ανατρέψει την αντίληψη ότι οι μηχανές δεν μπορούν να δημιουργήσουν τέχνη στο κεφάλι του. Ο γίγαντας της αναζήτησης εκπαίδευσε υπολογιστές να χειρίζονται εικόνες για να δημιουργούν παράξενα, ψυχεδελικά έργα τέχνης. Οι εικόνες που δημιουργούνται από την Google Κινητήρας Deep Dream μπορεί να μην είναι όμορφα, αλλά σίγουρα είναι μοναδικά και εξαιρετικά δημιουργικά. Οι δημιουργίες μηχανών περιέχουν ψυχεδελικά χρώματα, γυμνοσάλιαγκες, περίεργα μάτια και ασώματα ζώα που στροβιλίζονται σε απροσδιόριστους χώρους.

Κάποιοι μπορεί να υποστηρίξουν ότι δεν είναι πραγματικά τέχνη αν οι μηχανές απλώς συνδυάζουν υπάρχουσες εικόνες, τις στρίβουν και τις βυθίζουν σε ακραία χρώματα. Η Google θα παρακαλούσε να διαφέρει, όπως και ο καλλιτέχνης κώδικα Klingemann.

«Οι άνθρωποι είναι ανίκανοι για πρωτότυπες ιδέες», εξήγησε.

1 του 8

Ακόμη και διάσημοι πίνακες ζωγραφικής περιέχουν στοιχεία προηγούμενων έργων τέχνης, σημείωσε. Το αριστούργημα του Πικάσο το 1907 Les Demoiselles d’Avignon, για παράδειγμα, έχει επιρροές από Αφρικανική τέχνη και πρόδρομοι κυβιστές όπως Πωλ Σεζάν. Για το θέμα αυτό, τα κολάζ, τα οποία συνδυάζουν υπάρχουσες εικόνες με καλλιτεχνικό τρόπο, είναι μια άλλη καθιερωμένη μορφή τέχνης. Ο Πικάσο, ο Άντι Γουόρχολ, ο Μαν Ρέι και άλλοι είναι γνωστοί για τα εκκεντρικά κολάζ τους, οπότε γιατί τα κολάζ που κατασκευάζονται από μηχανές δεν μπορούν να σταθούν και ως τέχνη;

Ο Klingemann ήθελε να ξεπεράσει τα όρια της ψηφιακής τέχνης και να δει πώς θα μπορούσαν να γίνουν οι δημιουργικές μηχανές πολύ πριν ξεκινήσει τη διαμονή του στο Πολιτιστικό Ινστιτούτο Google. Χρησιμοποιώντας τα δικά του λιγότερο ισχυρά μηχανήματα, ο Klingemann άρχισε να παίζει με τα αρχεία του Διαδικτύου και τα αρχεία της Google TensorFlow λογισμικό μηχανικής εκμάθησης για την κατασκευή ψηφιακών κολάζ.

Δημιούργησε ένα εργαλείο μηχανικής μάθησης που ονομάζεται Ernst, που πήρε το όνομά του από τον σουρεαλιστή και καλλιτέχνη κολάζ Μαξ Ερνστ. Ο Klingemann αναγνώρισε μια σειρά από αντικείμενα από το έργο του Ernst και είπε στον υπολογιστή του να φτιάξει διαφορετικά κολάζ με τα ίδια στοιχεία. Τα αποτελέσματα ήταν συχνά σουρεαλιστικά, άλλοτε αστεία και άλλοτε απολύτως τρομερά.

«Οι άνθρωποι είναι ανίκανοι για πρωτότυπες ιδέες».

Ο Klingemann ήθελε περισσότερο έλεγχο στις χαοτικές εικόνες που παρήγαγαν οι μηχανές του, έτσι άρχισε να τους διδάσκει νέα πράγματα. Αναρωτήθηκε: «Τι είναι ενδιαφέρον για τους ανθρώπους;» Ο Klingemann ήξερε ότι έπρεπε να εκπαιδεύσει το σύστημα τι να αναζητήσει, να του διδάξει πώς να βλέπει όλα αυτά τα στοιχεία όπως θα έκανε ένας άνθρωπος καλλιτέχνης.

Το έργο τέχνης που προκύπτει είναι πανέμορφο και εντελώς μοναδικό. Αν και ο Klingemann προφανώς χρησιμοποίησε παλιές εικόνες για να δημιουργήσει το έργο του, εμφανίζονται σε ένα νέο πλαίσιο και αυτό κάνει τη διαφορά.

Αυτήν τη στιγμή, η δημιουργικότητα των υπολογιστών περιορίζεται σε ενδιαφέροντα κολάζ και στην κατανόηση ποιες εικόνες ταιριάζουν καλά μεταξύ τους. Οι μηχανές δεν φτιάχνουν ακόμα τη δική τους τέχνη, αλλά οι καλλιτέχνες κώδικα που τις τροφοδοτούν γίνονται περισσότερο επιμελητές παρά δημιουργοί κατά τη διάρκεια της διαδικασίας.

Μένει να δούμε πόσο μακριά μπορεί ο άνθρωπος να επεκτείνει το δημιουργικό μυαλό των μηχανών, αλλά σίγουρα είναι συναρπαστικό να το παρακολουθείς.

Συστάσεις των συντακτών

Το Google Bard μπορεί τώρα να μιλήσει, αλλά μπορεί να πνίξει το ChatGPT;
Τώρα μπορείτε να δοκιμάσετε το Bard της Google, τον αντίπαλο του ChatGPT
Το νέο Bard AI της Google μπορεί να είναι αρκετά ισχυρό ώστε να ανησυχεί το ChatGPT — και είναι ήδη εδώ
Google Meet ή Zoom; Σύντομα, δεν θα έχει σημασία
Το παράξενο νέο πληκτρολόγιο της Google Japan μπορεί επίσης να εντοπίσει (κυριολεκτικά) σφάλματα