Αυτό το Pictionary-Playing Bot είναι ένα τεράστιο ορόσημο για την A.I.

Όπως τα νέα Alexa Skills στο Amazon Echo σας, αυτές τις τελευταίες δύο δεκαετίες έχουν δει A.I. αποκτήστε σταδιακά την ικανότητα να βρίσκετε καλύτερα την ανθρωπότητα σε όλο και περισσότερα από τα αγαπημένα μας παιχνίδια: Σκάκι με το Deep Blue το 1997, Διακινδύνευση με την IBM Watson το 2011, Παιχνίδια Atari με το DeepMind το 2013, Πηγαίνω με το AlphaGo το 2016, και ούτω καθεξής. Στο ευρύ κοινό, τουλάχιστον, κάθε περίπτωση μετατρέπει την αφηρημένη διαδρομή της υπολογιστικής προόδου σε άθλημα θεατών. Το Skynet γίνεται πιο έξυπνο. Πως ξέρουμε? Επειδή ρίξτε μια ματιά στον αυξανόμενο αριθμό των χόμπι που μπορεί να μας κερδίσει πειστικά.

Περιεχόμενα

  • Κατασκευάζοντας έναν πλοίαρχο Pictionary
  • Περισσότερα από όσα βλέπει το μάτι

Με αυτό το υπόβαθρο, δεν είναι πολύ σοκαριστικό να ακούς ότι η A.I. μπορεί τώρα να αποδώσει επιτακτικά καλά σε Εικονογραφικό, το παιχνίδι εικασίας λέξεων εμπνευσμένο από παρωδίες που απαιτεί από ένα άτομο να σχεδιάσει μια εικόνα και από άλλους να προσπαθήσουν να καταλάβουν τι σκιαγράφησαν το συντομότερο δυνατό.

Προτεινόμενα βίντεο

Αυτό πραγματοποίησαν πρόσφατα ερευνητές από το Πανεπιστήμιο του Σάρεϊ του Ηνωμένου Βασιλείου με τη δημιουργία του Pixelor, ενός «ανταγωνιστικού σκίτσου A.I. μέσο." Δίνεται μια οπτική Η ιδέα, το Pixelor είναι σε θέση να σχεδιάσει ένα σκίτσο που είναι αναγνωρίσιμο (τόσο από ανθρώπους όσο και από μηχανές) ως θέμα που προορίζεται τόσο γρήγορα - ή ακόμα πιο γρήγορα - από έναν άνθρωπο ανταγωνιστής.

Σχετίζεται με

  • Πώς η Nintendo θα μπορούσε να χρησιμοποιήσει το A.I. για να φέρει το 4K gaming στο Switch Pro
  • Ο διευθυντής του Yakuza πιστεύει ότι η εξέλιξη του PS5 θα επικεντρωθεί στο A.I. και μηχανικής μάθησης

«Το A.I μας. Ο πράκτορας είναι σε θέση να αποδώσει ένα σκίτσο από την αρχή. Τραγούδι Yi-Zhe, αναγνώστης του Computer Vision and Machine Learning στο Center for Vision Speech and Signal Processing στο Πανεπιστήμιο του Surrey, είπε στο Digital Trends. «Δώστε του μια λέξη όπως «πρόσωπο» και θα ξέρει τι να σχεδιάσει. … Θα ζωγραφίζει μια διαφορετική γάτα, έναν διαφορετικό σκύλο, ένα διαφορετικό πρόσωπο, κάθε φορά. Αλλά πάντα με τη γνώση του πώς να κερδίσετε το παιχνίδι Pictionary."

Κατασκευάζοντας έναν πλοίαρχο Pictionary

Το να μπορούμε να μειώσουμε μια πολύπλοκη εικόνα του πραγματικού κόσμου σε ένα σκίτσο είναι, από μόνη της, αρκετά εντυπωσιακό. Χρειάζεται ένα επίπεδο αφαίρεσης για να κοιτάξεις ένα ανθρώπινο πρόσωπο και να το δεις ως οβάλ με δύο μικρότερα οβάλ για τα μάτια, μια γραμμή για τη μύτη και έναν μισό κύκλο για το στόμα. Στα παιδιά, η ικανότητα αντίληψης μιας εικόνας με αυτόν τον τρόπο δείχνει, μεταξύ άλλων, μια αυξανόμενη γνωστική κατανόηση των εννοιών.

Ωστόσο, όπως συμβαίνει με πολλές πτυχές της A.I., που συχνά συνοψίζονται ως Το παράδοξο του Moravec ότι «τα δύσκολα προβλήματα είναι εύκολα και τα εύκολα προβλήματα είναι δύσκολα», είναι μια σημαντική πρόκληση για τη μηχανή νοημοσύνη — παρά το γεγονός ότι είναι μια βασική, ασυνήθιστη δεξιότητα για την πλειοψηφία των δύο ετών παιδιά.

Εργαστήριο SketchX

Ωστόσο, δεν είναι μια άλυτη πρόκληση. Το 2016, γράψαμε για το έργο του Song με ένα εργαλείο που ονομάζεται Sketch, ένα νευρωνικό δίκτυο βαθιάς μάθησης που ήταν σε θέση να αναγνωρίζει σκίτσα που σχεδιάζονταν με το χέρι και να τα χρησιμοποιεί για αναζήτηση προϊόντων πραγματικής ζωής. Το συγκεκριμένο δίκτυο εκπαιδεύτηκε χρησιμοποιώντας ένα σύνολο δεδομένων που αποτελείται από περίπου 30.000 συγκρίσεις σκίτσου-φωτογραφιών, επιτρέποντάς του να αναγνωρίζει τον τρόπο με τον οποίο παρουσιάζονται πραγματικά αντικείμενα στο σχέδιο με το χέρι. Το Pixelor κάνει κάτι παρόμοιο, αλλά μπορεί επίσης να δημιουργήσει τα δικά του σχέδια, αντί να αναγνωρίζει απλώς τα σχέδια άλλων ανθρώπων.

Αλλά αυτό δεν είναι αρκετό για να κερδίσετε Εικονογραφικό. Εικονογραφικό είναι ένα παιχνίδι με προκλήσεις χρόνου όπου ο στόχος δεν είναι απλώς να σχεδιάσετε, ας πούμε, μια γάτα, αλλά να σχεδιάσετε μια γάτα με όσο το δυνατόν λιγότερα χτυπήματα. Θα μπορούσες να είσαι ο μεγαλύτερος καλλιτέχνης του κόσμου, αλλά, αν σου παίρνει 12 ώρες για να ζωγραφίσεις μια τέλεια γάτα, είσαι τρομερός Εικονογραφικό παίχτης.

Αυτό σήμαινε την κατασκευή ενός A.I. που θα μπορούσε να μελετήσει τους ανθρώπους για να δει ποιες στρατηγικές χρησιμοποιούν για να παίξουν καλά το Pictionary. Όπως είπε ο Song, «Ποια είναι τα πιο σημαντικά κομμάτια που πρέπει να σχεδιάσουμε για να μπορέσουν άλλοι ανθρώπινοι κριτές να μπορούν να μαντέψουν; Θέλουμε να μαντέψουμε το σχέδιό μας όσο το δυνατόν νωρίτερα».

Για να γίνει αυτό, οι ερευνητές πήραν το QuickDraw, το μεγαλύτερο σύνολο δεδομένων ανθρώπινων σκίτσων που είναι διαθέσιμο μέχρι σήμερα. Στη συνέχεια δημιούργησαν έναν αλγόριθμο νευρικής ταξινόμησης που δίνει προτεραιότητα στη σειρά των εγκεφαλικών επεισοδίων που πρέπει να κάνει ένας καλλιτέχνης. δίνοντας μια εικαστική αναπαράσταση ενός αντικειμένου σε όσο το δυνατόν λιγότερες γραμμές. Αυτό σημαίνει διάσπαση των σκίτσων σε πινελιές, στη συνέχεια ανακάτεμα της σειράς αυτών των πινελιών και δοκιμή των αποτελεσμάτων μέχρι να καθοριστεί η ακριβής σειρά με την οποία πρέπει να τεθούν σε χαρτί.

Για παράδειγμα, ένας καλλιτέχνης θα μπορούσε να αρχίσει να σχεδιάζει μια γάτα σκιαγραφώντας ένα κυκλικό περίγραμμα για το κεφάλι της. Αλλά ένας κύκλος θα μπορούσε να είναι πολλά πράγματα, ακόμα κι αν γνωρίζετε ότι υποτίθεται ότι αντιπροσωπεύει ένα κεφάλι. Σχεδιάστε, ωστόσο, δύο μυτερά αυτιά ή δύο σετ μουστάκια και ο αριθμός των πιθανών πραγμάτων που θα μπορούσατε να σχεδιάσετε μειώνεται πολύ, πολύ γρήγορα. Αυτές οι πληροφορίες χρησιμοποιούνται στη συνέχεια για να δοθούν οδηγίες στον πράκτορα σκιαγράφησης.

Ο Song είπε ότι η ομάδα θα μπορούσε να κυκλοφορήσει μια δημόσια έκδοση αυτού Εικονογραφικό-παίζοντας bot έτσι ώστε οι ανθρώπινοι παίκτες να μπορούν να νικήσουν ένα σκίτσο A.I. κύριος. (Ποιός ξέρει? Το να παίξετε έναν ειδικό θα μπορούσε ακόμη και να σας βοηθήσει να βελτιώσετε το δικό σας Εικονογραφικό παιχνίδι.)

Περισσότερα από όσα βλέπει το μάτι

Ωστόσο, υπάρχουν περισσότερα στο Pixelor από ένα άλλο ασήμαντο bot που παίζει παιχνίδι. Ακριβώς όπως ένα σύστημα υπολογιστή έχει και μια διεπαφή σε επίπεδο επιφάνειας με την οποία αλληλεπιδρούμε και τον κώδικα υποστήριξης κάτω από την κουκούλα, έτσι και κάθε σημαντικό A.I. Το ορόσημο του παιχνιδιού έχει ένα απώτερο κίνητρο. Εκτός αν φτιάχνουν ρητά παιχνίδια υπολογιστή, τα ερευνητικά εργαστήρια δεν ξοδεύουν αμέτρητες ώρες ατόμου για να χτίσουν παιχνίδι-παιχνίδι A.I. πράκτορες απλώς για να προσθέσουν άλλη μια καταχώριση στη μεγάλη λίστα των πραγμάτων που οι άνθρωποι δεν είναι πλέον οι καλύτεροι στο. Ο σκοπός είναι πάντα η προώθηση κάποιου θεμελιώδους μέρους της A.I. επίλυση προβλήματος.

Στην περίπτωση του Pixelor, ο κρυφός στόχος είναι να φτιάξουμε μηχανές που να είναι καλύτερα ικανές να καταλάβουν τι είναι σημαντικό για έναν άνθρωπο σε μια συγκεκριμένη σκηνή. Όταν κοιτάμε μια εικόνα, είμαστε αμέσως σε θέση να πούμε ποιες είναι οι πιο σημαντικές λεπτομέρειες.

Ας υποθέσουμε ότι πηγαίνετε σπίτι από τη δουλειά. Ενώ τα δέντρα στην άκρη του δρόμου μπορεί να είναι γραφικά και η διαφημιστική πινακίδα για μια νέα ταινία μπορεί να είναι ενδιαφέρουσα, κανένα δεν είναι τόσο σημαντικό όσο η γλώσσα του προσώπου και του σώματος του ατόμου που μπορεί ή δεν πρόκειται να βγει μπροστά εσείς. Πριν καν επεξεργαστείτε συνειδητά τις πληροφορίες, ο εγκέφαλός σας έχει ξεχωρίσει τις πιο σημαντικές λεπτομέρειες. Πώς διδάσκετε έναν υπολογιστή να μπορεί να το κάνει αυτό; Λοιπόν, αποδεικνύεται ότι ένας πολύ καλός τρόπος για να το κάνετε αυτό είναι να δείτε πώς οι άνθρωποι δίνουν προτεραιότητα στις εμφανείς αναγνωρίσιμες λεπτομέρειες σε μια εικόνα όταν την σχεδιάζουν.

«Δεν υπάρχει καμία ανθρώπινη γνώση ενσωματωμένη στις φωτογραφίες [μόνο]», είπε ο Σονγκ. «Αυτό που θέλουμε είναι ανθρώπινα δεδομένα που μπορούν να μας δώσουν σήματα για το πώς οι άνθρωποι κατανοούν ένα αντικείμενο».

Όπως σημειώθηκε, ένα καλό Εικονογραφικό Ο παίκτης, όπως ένας καλός πυγμάχος, θα γνωρίζει το απόλυτο ελάχιστο που χρειάζεται να κάνει για να επιτύχει έναν συγκεκριμένο στόχο. Αυτό, από μια μακροοικονομική έννοια, είναι αυτό που ενδιαφέρει ο Yi-Zhe Song και οι συνάδελφοί του. Δεν είναι κάτι τόσο ασήμαντο όσο το να κάνεις έναν υπολογιστή να παίξει ένα παιχνίδι. κάνει έναν υπολογιστή να καταλάβει τι είναι σημαντικό για ορισμένες σκηνές — και, ελπίζουμε, να μπορεί να γενικεύει καλύτερα.

Όπως όλα από αυτοοδηγούμενα αυτοκίνητα Τα ρομπότ στο χώρο εργασίας γίνονται ολοένα και πιο συνηθισμένα, αυτό είναι ένα ουσιαστικό έργο που πρέπει να επιλυθεί.

Μια εργασία που θα περιγράφει το έργο θα παρουσιαστεί στο SIGGRAPH Asia 2020 τον Νοέμβριο.

Συστάσεις των συντακτών

  • Το Voyage είναι ένα A.I. παράδεισος gaming όπου τα bots γράφουν τους κανόνες
  • Σκάκι. Διακινδύνευση. Πηγαίνω. Γιατί χρησιμοποιούμε τα παιχνίδια ως σημείο αναφοράς για την A.I.;
  • Ένα A.I. σχεδιάζει ρετρό βιντεοπαιχνίδια — και είναι εκπληκτικά καλά