Οι οπτικές ψευδαισθήσεις θα μπορούσαν να μας βοηθήσουν να δημιουργήσουμε μια νέα γενιά τεχνητής νοημοσύνης

Κοιτάτε μια εικόνα ενός μαύρου κύκλου σε ένα πλέγμα κυκλικών κουκκίδων. Μοιάζει με μια τρύπα που έχει καεί σε ένα κομμάτι λευκού δικτυωτού υλικού, αν και στην πραγματικότητα είναι μια επίπεδη, σταθερή εικόνα σε μια οθόνη ή ένα κομμάτι χαρτί. Αλλά ο εγκέφαλός σας δεν το καταλαβαίνει έτσι. Όπως κάποια παραισθησιολογική εμπειρία χαμηλού επιπέδου, το μυαλό σας ξεφεύγει. αντιλαμβάνεστε τη στατική εικόνα ως το στόμιο μιας μαύρης σήραγγας που κινείται προς το μέρος σας.

Περιεχόμενα

  • Μια εξελικτική άκρη
  • Η μηχανική όραση βελτιώνεται
  • Ένα τεστ Turing για μηχανική όραση
  • Χρησιμοποίησε τη ψευδαίσθησή σου
  • Επίτευξη Γενικού Οράματος

Αντιδρώντας στην αληθοφάνεια του αποτελέσματος, το σώμα αρχίζει να αντιδρά ασυνείδητα: οι κόρες του ματιού διαστέλλονται για να αφήσουν περισσότερο φως, ακριβώς όπως θα προσαρμόζονταν αν επρόκειτο να βυθιστείτε στο σκοτάδι για να εξασφαλίσετε το καλύτερο δυνατό όραμα.

Η οπτική ψευδαίσθηση της μαύρης τρύπας

Το επίμαχο αποτέλεσμα δημιουργήθηκε από Akiyoshi Kitaoka, ψυχολόγος στο Πανεπιστήμιο Ritsumeikan στο Κόμπε της Ιαπωνίας. Είναι μια από τις δεκάδες οπτικές ψευδαισθήσεις που έχει δημιουργήσει σε μια μακρά καριέρα. ("Μου αρέσουν όλα", είπε, απαντώντας στην ερώτηση της Digital Trend για το αν έχει κάποιο αγαπημένο.)

Προτεινόμενα βίντεο

Αυτή η νέα ψευδαίσθηση ήταν το αντικείμενο μιας έρευνας που δημοσιεύτηκε πρόσφατα στο περιοδικό Frontiers in Human Neuroscience. Ενώ το επίκεντρο της εργασίας είναι σταθερά στις ανθρώπινες φυσιολογικές αποκρίσεις στο νέο φαινόμενο (το οποίο αποδεικνύεται ότι περίπου το 86 τοις εκατό από εμάς θα βιώσει), το Το γενικό θέμα μπορεί επίσης να έχει μεγάλη συνάφεια όταν πρόκειται για το μέλλον της νοημοσύνης μηχανών — όπως ένας από τους ερευνητές ήθελε να εξηγήσει στην Digital Τάσεις.

Μια εξελικτική άκρη

μια οπτική ψευδαίσθηση γνωστή ως σπείρα Fraser
Με την πρώτη ματιά, μπορεί να φαίνεται ότι αυτή η εικόνα δείχνει μια σπείρα που τυλίγει προς το κέντρο. Αλλά προσπαθήστε να ακολουθήσετε μια από τις γραμμές καθώς φαινομενικά καμπυλώνει προς τα μέσα και θα συνειδητοποιήσετε ότι δεν είναι καθόλου σπείρα.

Κάτι δεν πάει καλά με τον εγκέφαλό σου. Τουλάχιστον, αυτό είναι ένα εύκολο συμπέρασμα που μπορεί να εξαχθεί από τον τρόπο με τον οποίο ο ανθρώπινος εγκέφαλος αντιλαμβάνεται τις οπτικές ψευδαισθήσεις. Ποια άλλη εξήγηση υπάρχει για μια δισδιάστατη, στατική εικόνα που ο εγκέφαλος αντιλαμβάνεται ως κάτι εντελώς διαφορετικό; Για πολύ καιρό, η κυρίαρχη ψυχολογία υπολόγιζε ακριβώς αυτό.

«Αρχικά οι άνθρωποι σκέφτηκαν: «Εντάξει, ο εγκέφαλός μας δεν είναι τέλειος… Δεν το καταλαβαίνει πάντα σωστά.» Είναι αποτυχία, σωστά;» είπε Μπρούνο Λάενγκ, καθηγητής στο Τμήμα Ψυχολογίας του Πανεπιστημίου του Όσλο και πρώτος συγγραφέας της προαναφερθείσας μελέτης. «Οι ψευδαισθήσεις σε εκείνη την περίπτωση ήταν ενδιαφέρουσες γιατί θα αποκάλυπταν κάποιο είδος ατέλειας στον μηχανισμό».

Ο εγκέφαλος δεν έχει τρόπο να ξέρει τι υπάρχει [πραγματικά] εκεί έξω».

Οι ψυχολόγοι δεν τα βλέπουν πλέον έτσι. Αν μη τι άλλο, μια έρευνα όπως αυτή υπογραμμίζει πώς το οπτικό σύστημα δεν είναι απλώς μια απλή κάμερα. Η οπτική ψευδαίσθηση «Illusory Expanding Hole» καθιστά σαφές ότι το μάτι προσαρμόζεται στο αντιληπτό, ακόμη και στο φανταστικό, φως και σκοτάδι, παρά στη φυσική ενέργεια.

Το πιο σημαντικό είναι ότι δείχνει ότι δεν καταγράφουμε απλώς χαζά τον κόσμο με τα οπτικά μας συστήματα, αλλά αντ 'αυτού να εκτελούν μια συνεχή σειρά επιστημονικών πειραμάτων προκειμένου να αποκτήσουν μια ελαφρά εξελικτική πλεονέκτημα. Ο στόχος είναι να αναλύσουμε τα δεδομένα που μας παρουσιάζονται και να προσπαθήσουμε να αντιμετωπίσουμε προληπτικά τα προβλήματα πριν γίνουν, λοιπόν, προβλήματα.

«Ο εγκέφαλος δεν έχει τρόπο να γνωρίζει τι υπάρχει [πραγματικά] εκεί έξω», είπε ο Laeng. «Αυτό που κάνει είναι να δημιουργεί ένα είδος εικονικής πραγματικότητας αυτού που θα μπορούσε να είναι εκεί έξω. Υπάρχει μια μικρή εικασία. Από αυτή την άποψη, μπορείτε να σκεφτείτε τον εγκέφαλο ως ένα είδος πιθανολογικής μηχανής. Μπορείτε να το ονομάσετε α Bayesian μηχανή αν θέλεις. Χρησιμοποιεί κάποια προηγούμενη υπόθεση και προσπαθεί να τη δοκιμάζει συνεχώς για να δει αν λειτουργεί».

Ο Laeng δίνει το παράδειγμα των ματιών μας που κάνουν προσαρμογές που δεν βασίζονται σε τίποτα περισσότερο από την εντύπωση του φωτός από τον ήλιο: ακόμα και όταν αυτό παρατηρείται μέσα από την κάλυψη σύννεφων ή από ένα πάνω μέρος από φύλλα. Για παν ενδεχόμενο.

«Αυτό που έχει σημασία στην εξέλιξη δεν είναι ότι είναι αλήθεια [αυτή τη στιγμή], αλλά είναι πιθανό», συνέχισε. «Με τη στένωση της κόρης, το σώμα σας προσαρμόζεται ήδη σε μια κατάσταση που είναι πολύ πιθανό να συμβεί σε σύντομο χρονικό διάστημα. Αυτό που συμβαίνει [αν βγει ξαφνικά ο ήλιος] είναι ότι θαμπωθείς. Θαμπωμένος σημαίνει προσωρινά ανίκανος. Αυτό έχει τεράστιες συνέπειες είτε είσαι θήραμα είτε είσαι αρπακτικό. Χάνεις ένα κλάσμα του δευτερολέπτου σε μια συγκεκριμένη κατάσταση και μπορεί να μην επιβιώσεις».

Δεν είναι μόνο το φως και το σκοτάδι όπου τα οπτικά μας συστήματα πρέπει να κάνουν εικασίες. Σκεφτείτε ένα παιχνίδι τένις, όπου η μπάλα ταξιδεύει με μεγάλη ταχύτητα. Αν βασίζαμε τη συμπεριφορά μας εξ ολοκλήρου σε αυτό που λαμβάνει το οπτικό σύστημα ανά πάσα στιγμή, θα καθυστερούσαμε πίσω από την πραγματικότητα και θα αποτυγχάναμε να επιστρέψουμε την μπάλα. «Είμαστε σε θέση να αντιληφθούμε το παρόν αν και είμαστε πραγματικά κολλημένοι στο παρελθόν», είπε ο Laeng. «Ο μόνος τρόπος για να το κάνουμε είναι να προβλέψουμε το μέλλον. Ακούγεται λίγο σαν παιχνίδι λέξεων, αλλά αυτό είναι με λίγα λόγια».

Η μηχανική όραση βελτιώνεται

αναγνώριση προσώπου
izusek/Getty Images

Τι σχέση έχει αυτό με την όραση του υπολογιστή; Δυνητικά τα πάντα. Προκειμένου ένα ρομπότ, για παράδειγμα, να μπορεί να λειτουργεί αποτελεσματικά στον πραγματικό κόσμο, πρέπει να μπορεί να κάνει αυτού του είδους τις προσαρμογές εν κινήσει. Οι υπολογιστές έχουν ένα πλεονέκτημα όταν πρόκειται για την ικανότητά τους να εκτελούν εξαιρετικά γρήγορους υπολογισμούς. Αυτό που δεν έχουν είναι εκατομμύρια χρόνια εξέλιξης με το μέρος τους.

Ωστόσο, τα τελευταία χρόνια, η μηχανική όραση έχει κάνει τεράστια βήματα προόδου. Μπορούν να αναγνωρίσουν πρόσωπα ή βηματισμούς σε ροές βίντεο σε πραγματικό χρόνο — ενδεχομένως ακόμη και σε τεράστια πλήθη ανθρώπων. Παρόμοια εργαλεία ταξινόμησης εικόνων και τεχνολογίας μπορούν να αναγνωρίσουν την παρουσία και άλλων αντικειμένων, ενώ Οι ανακαλύψεις τμηματοποίησης αντικειμένων καθιστούν δυνατή την καλύτερη κατανόηση του περιεχομένου των διαφορετικών σκηνές. Σημειώθηκε επίσης σημαντική πρόοδος όσον αφορά την προέκταση τρισδιάστατων εικόνων από σκηνές 2D, επιτρέποντας στις μηχανές να «διαβάζουν» τρισδιάστατες πληροφορίες, όπως το βάθος, από σκηνές. Αυτό φέρνει τη σύγχρονη όραση υπολογιστή πιο κοντά στην αντίληψη της ανθρώπινης εικόνας.

Ωστόσο, εξακολουθεί να υπάρχει ένα χάσμα μεταξύ των καλύτερων αλγορίθμων μηχανικής όρασης και των ειδών ικανοτήτων που βασίζονται στην όραση που η συντριπτική πλειοψηφία των ανθρώπων είναι σε θέση να πραγματοποιήσει από νεαρή ηλικία. Αν και δεν μπορούμε να διατυπώσουμε ακριβώς πώς εκτελούμε αυτές τις εργασίες που βασίζονται στην όραση (για να αναφέρουμε τον Ουγγροβρετανό πολυμαθή Michael Polanyi, «μπορούμε να γνωρίζουμε περισσότερα από όσα μπορούμε να πούμε»), είμαστε ωστόσο σε θέση να εκτελέσουμε μια εντυπωσιακή σειρά εργασιών που μας επιτρέπουν να αξιοποιήσουμε την όρασή μας μια ποικιλία έξυπνων τρόπους.

Ένα τεστ Turing για μηχανική όραση

Εάν οι ερευνητές και οι μηχανικοί ελπίζουν να δημιουργήσουν συστήματα όρασης υπολογιστών που θα λειτουργούν τουλάχιστον στο ίδιο επίπεδο με την οπτική οι δεξιότητες επεξεργασίας του εγκεφάλου wetware, η δημιουργία αλγορίθμων που μπορούν να κατανοήσουν τις οπτικές ψευδαισθήσεις δεν είναι μια κακή αρχή σημείο. Τουλάχιστον, θα μπορούσε να αποδειχθεί ένας καλός τρόπος μέτρησης του πόσο καλά λειτουργούν τα συστήματα μηχανικής όρασης στον εγκέφαλό μας. Μπορεί να μην είναι η απάντηση στο μυθικό Τεχνητή Γενική Νοημοσύνη, αλλά μπορεί να είναι το κλειδί για το ξεκλείδωμα του General Vision.

μια οπτική ψευδαίσθηση που ξεγελάει τον εγκέφαλό σας για να δει ψεύτικα χρώματα
Είτε το πιστεύετε είτε όχι, αλλά όλες αυτές οι μπάλες έχουν την ίδια απόχρωση του γκρι και ο εγκέφαλός σας τις ερμηνεύει ότι έχουν διαφορετικά χρώματα με βάση τα συμφραζόμενα των έγχρωμων γραμμών που διασταυρώνονται πάνω τους

«Αν κάποιος αναπτύξει, μια μέρα, ένα τεχνητό οπτικό σύστημα που διαπράττει τα ίδια λάθη απατηλής αντίληψης ότι το κάνουμε, θα ξέρετε σε αυτό το σημείο ότι [επιτυγχάνουν] μια καλή προσομοίωση του πώς λειτουργεί ο εγκέφαλός μας», είπε ο Laeng είπε. «Θα ήταν ένα είδος δοκιμής Turing. Εάν έχετε ένα τεχνητό δίκτυο που ξεγελιέται από την ψευδαίσθηση όπως εμείς, τότε [θα είμαστε] πολύ κοντά στο να κατανοήσουμε τον υποκείμενο υπολογισμό του ίδιου του εγκεφάλου».

Τραγούδι Yi-Zhe, αναγνώστης του Computer Vision and Machine Learning στο Center for Vision Speech and Signal Processing στο Πανεπιστήμιο του Surrey του Ηνωμένου Βασιλείου, συμφωνεί με την υπόθεση. «Το να ζητάμε από τους αλγόριθμους όρασης να κατανοούν τις οπτικές ψευδαισθήσεις ως γενικό θέμα έχει μεγάλη αξία για την κοινότητα», είπε στο Digital Trends. «Ξεπερνά το επίκεντρο της τρέχουσας κοινότητας να ζητάμε από τις μηχανές να [αναγνωρίζουν], πιέζοντας το φάκελο περαιτέρω [και] ζητώντας από τις μηχανές να αιτιολογήσουν. Αυτή η ώθηση [θα αντιπροσώπευε] ένα σημαντικό βήμα προς τα εμπρός προς το «Γενικό Όραμα», όπου πρέπει να ληφθούν υπόψη οι υποκειμενικές ερμηνείες των οπτικών εννοιών».

Χρησιμοποίησε τη ψευδαίσθησή σου

Μέχρι σήμερα, έχει γίνει κάποια περιορισμένη έρευνα για αυτόν τον στόχο — αν και παραμένει σε σχετικά πρώιμο στάδιο. Ο Nasim Nematzadeh, ένας ερευνητής που είναι κάτοχος διδακτορικού διπλώματος. στα μοντέλα Τεχνητής Νοημοσύνης και Ρομποτικής-Χαμηλού επιπέδου όρασης, είναι ένα άτομο που έχει δημοσιευμένη εργασία για αυτό το θέμα.

«Πιστεύουμε ότι η περαιτέρω διερεύνηση του ρόλου των απλών μοντέλων τύπου Gauss στην επεξεργασία του αμφιβληστροειδούς χαμηλού επιπέδου και του πυρήνα Gauss σε πρώιμο στάδιο [βαθιά νευρική δίκτυα], και η πρόβλεψή του για απώλεια της αντιληπτικής ψευδαίσθησης, θα οδηγήσει σε πιο ακριβείς τεχνικές και μοντέλα υπολογιστικής όρασης», δήλωσε ο Nematzadeh στο Digital Trends. «[Αυτό θα μπορούσε] να συμβάλει σε μοντέλα υψηλότερου επιπέδου επεξεργασίας βάθους και κίνησης και να γενικευτεί στην κατανόηση των φυσικών εικόνων από υπολογιστή».

Κινούμενοι ακίνητοι κύκλοι (Οπτική ψευδαίσθηση) !

Ο Max Williams, ένας ερευνητής τεχνητής νοημοσύνης που βοήθησε στη σύνταξη ενός συνόλου δεδομένων του χιλιάδες εικόνες οπτικής ψευδαίσθησης για τα συστήματα όρασης υπολογιστή, θέτει τη σχέση μεταξύ της γενικής όρασης και των οπτικών ψευδαισθήσεων πιο συνοπτικά: «Οι ψευδαισθήσεις υπάρχουν επειδή τα μάτια και ο εγκέφαλός μας εκτελούν ακατάστατα και ad-hoc διαδικασία για την εξαγωγή μιας οπτικής σκηνής από ένα κατά τα άλλα ακατανόητο φωτεινό πεδίο, που δημιουργήθηκε από έναν φυσικό κόσμο από τον οποίο είμαστε σχεδόν εντελώς αποκλεισμένοι», είπαν στην Digital Τάσεις. «Δεν νομίζω ότι είναι δυνατό να γίνει ένα οπτικό σύστημα αρκετά εκφραστικό ώστε να θεωρείται «αντίληψη», η οποία είναι επίσης απαλλαγμένη από ψευδαισθήσεις».

Επίτευξη Γενικού Οράματος

Για να είμαστε σαφείς, η επίτευξη ανθρώπινου επιπέδου (ή καλύτερου) General Vision for AI δεν πρόκειται απλώς να τους εκπαιδεύσει να αναγνωρίζουν τυπικές οπτικές ψευδαισθήσεις. Καμία υπερειδική ικανότητα, ας πούμε, να αποκωδικοποιήσει τις ψευδαισθήσεις Magic Eye με ακρίβεια 99,9% σε 0,001 δευτερόλεπτα δεν πρόκειται να υποκαταστήσει εκατομμύρια χρόνια ανθρώπινης εξέλιξης.

(Είναι ενδιαφέρον ότι η μηχανική όραση έχει ήδη τη δική της εκδοχή οπτικών ψευδαισθήσεων με τη μορφή αντίθετων μοντέλων, τα οποία μπορεί να τους κάνουν να κάνουν λάθος – όπως σε μια ανησυχητική απεικόνιση – ένα Τρισδιάστατη εκτυπωμένη χελώνα παιχνίδι για τουφέκι. Ωστόσο, αυτά δεν αποφέρουν τα ίδια εξελικτικά οφέλη με τις οπτικές ψευδαισθήσεις που λειτουργούν στους ανθρώπους.)

Ωστόσο, το να καταλάβουν οι μηχανές τις ανθρώπινες οπτικές ψευδαισθήσεις και να ανταποκριθούν σε αυτές με τον τρόπο που κάνουμε εμείς, θα μπορούσε να είναι πολύ χρήσιμη έρευνα.

Και ένα πράγμα είναι σίγουρο: When General Vision AI είναι επιτεύχθηκε, θα πέσει στα ίδια είδη οπτικών ψευδαισθήσεων με εμάς. Τουλάχιστον, στην περίπτωση της Απατηλής Διαστελλόμενης Τρύπας, το 86% από εμάς.

Συστάσεις των συντακτών

  • Το Wix χρησιμοποιεί το ChatGPT για να σας βοηθήσει να δημιουργήσετε γρήγορα έναν ολόκληρο ιστότοπο
  • Η OpenAI χτίζει νέα ομάδα για να σταματήσει η υπερευφυής τεχνητή νοημοσύνη να γίνεται απατεώνας
  • Αυτές οι έξυπνες ιδέες θα μπορούσαν να βοηθήσουν να γίνει το AI λίγο λιγότερο κακό
  • Το εργαλείο ανίχνευσης εικόνων AI της Google φαίνεται ότι θα μπορούσε να λειτουργήσει
  • Η τεχνητή νοημοσύνη θα μπορούσε να αντικαταστήσει περίπου 7.800 θέσεις εργασίας στην IBM ως μέρος μιας παύσης προσλήψεων