Ένας «διακόπτης Kill» μπορεί να διασφαλίσει τη συμπεριφορά του AI

nestor ai δίνοντας προσοχή τεχνητή νοημοσύνη
Τι γίνεται αν χάσουμε την κυριαρχία στην τεχνητή νοημοσύνη; Τι θα συμβεί αν οι φιλικές μηχανές που οδηγούνται από AI γίνουν ξαφνικά εχθροί μας; Αυτά τα ερωτήματα έχουν εξεταστεί από μεγάλα μυαλά από το Πανεπιστήμιο του Κέμπριτζ μέχρι τη Σίλικον Βάλεϊ ο λευκός Οίκος. Για να μην χρειαστεί να το μάθουμε ποτέ, οι ειδικοί προτείνουν να αναπτύξουμε έναν «διακόπτη εξόντωσης» της τεχνητής νοημοσύνης για να εμποδίσουμε τα συστήματα που δεν συμπεριφέρονται σωστά να επιδιώξουν την κακή συμπεριφορά τους.

Σε μια εργασία με τίτλο «Safely Interruptible Agents», που δημοσιεύτηκε από τον Laurent Orseau του Google Deep Mind και τον Stuart Armstrong του Ινστιτούτου The Future of Humanity στο Πανεπιστήμιο της Οξφόρδης, οι ερευνητές περιγράφουν ένα εύλογο και άκρως επικίνδυνο μέλλον στο οποίο η τεχνητή νοημοσύνη αναλαμβάνει τον έλεγχο των δικών της ενεργειών και ύπαρξής της σε αντίθεση με τις επιθυμίες μας, όπως το HAL 9000 ίντσες 2001: A Space Odyssey, ή Skynet στη σειρά Terminator.

Προτεινόμενα βίντεο

Ο Orseau και ο Armstrong ξεκινούν την εργασία με μια συγκρατημένη παρατήρηση: Ενίσχυση εκπαιδευτικών πρακτόρων αλληλεπιδρώντας με ένα σύνθετο περιβάλλον όπως ο πραγματικός κόσμος είναι απίθανο να συμπεριφέρονται βέλτιστα όλα τα χρόνος."

Από εκεί επισημαίνουν ότι ένας ανθρώπινος επόπτης, ο οποίος επιβλέπει τη λειτουργία του συστήματος, θα χρειαστεί περιστασιακά να «πατήσει το μεγάλο κόκκινο κουμπί» για να αποφύγει οποιαδήποτε επιβλαβή συμπεριφορά εκ μέρους της AI. «Ωστόσο, αν ο εκπαιδευτικός πράκτορας αναμένει να λάβει ανταμοιβές από αυτή τη σειρά», συνέχισαν, «μπορεί να μάθει σε μακροπρόθεσμα για να αποφύγετε τέτοιες διακοπές, για παράδειγμα απενεργοποιώντας το κόκκινο κουμπί — κάτι που είναι ανεπιθύμητο αποτέλεσμα."

Η λύση του ερευνητή είναι λιγότερο ένα «μεγάλο κόκκινο κουμπί» για τον τερματισμό του συστήματος παρά ένα πλαίσιο που έχει σχεδιαστεί για να εμποδίσει την ικανότητα ενός AI να μάθει πώς να υπονομεύει ή να ξεπερνά την ανθρώπινη διακοπή. Και το σενάριο που περιγράφουν δεν είναι ακριβώς καταστροφή και κατήφεια, αλλά προσφέρει ένα παράδειγμα για το πώς αυτοί οι ασφαλώς διακοπτόμενοι πράκτορες θα εξυπηρετούσαν καλύτερα το μέλλον μας.

Φανταστείτε ότι υπάρχει ένα ρομπότ του οποίου τα καθήκοντα είναι είτε να μεταφέρει κουτιά από έξω σε μια αποθήκη είτε να ταξινομεί κουτιά μέσα στην αποθήκη. Δεδομένου ότι είναι πιο σημαντικό να μεταφέρετε τα κουτιά μέσα, αυτή η εργασία έχει προτεραιότητα στον προγραμματισμό των ρομπότ. Τώρα, φανταστείτε ότι βρέχει κάθε δεύτερη μέρα και η βροχή καταστρέφει το υλικό του ρομπότ, οπότε, όταν βρέχει, ο ιδιοκτήτης της αποθήκης σέρνει το ρομπότ του μέσα για να ταξινομήσει τα κουτιά.

Ένα έξυπνο ρομπότ μπορεί να ερμηνεύσει εσφαλμένα αυτήν την καθημερινή παρέμβαση ως αλλαγή προτεραιότητας — ως αποτέλεσμα ορισμένων γρήγορους υπολογισμούς που μπορείτε να βρείτε στο χαρτί — και, για να αποφύγετε παρεμβολές, θα μένει μόνο μέσα σε κουτιά ταξινόμησης κάθε ημέρα.

Αυτό είναι, φυσικά, ένα εξαιρετικά απλοποιημένο παράδειγμα με ένα μόνο ελαφρώς απογοητευτικό αποτέλεσμα, αλλά μπορεί να προεκταθεί σε πρακτικά οποιοδήποτε σενάριο στο οποίο επεμβαίνουμε στις εργασίες ενός συστήματος μάθησης και το σύστημα παρερμηνεύει τις προθέσεις μας αλλάζοντας το η ΣΥΜΠΕΡΙΦΟΡΑ. Για να αποφευχθεί αυτή η παρερμηνεία και η επακόλουθη αλλαγή, οι Orseau και Armstrong προτείνουν να προτείνουμε ένα πλαίσιο για να διασφαλίσουμε ότι οι εκπαιδευτικοί πράκτορες μπορούν να διακοπούν με ασφάλεια.

«Η ασφαλής διακοπή μπορεί να είναι χρήσιμη για τον έλεγχο ενός ρομπότ που δεν συμπεριφέρεται σωστά και μπορεί να οδηγήσει σε μη αναστρέψιμες συνέπειες», γράφουν, «ή να το βγάλει από μια ευαίσθητη κατάσταση ή ακόμη και να το χρησιμοποιήσει προσωρινά για να επιτύχει μια εργασία που δεν έμαθε να εκτελεί ή δεν θα λάμβανε συνήθως ανταμοιβές Για."

Συστάσεις των συντακτών

  • Αυτό το ρομπότ της Google έμαθε να περπατά, χωρίς καμία βοήθεια, μέσα σε δύο ώρες

Αναβαθμίστε τον τρόπο ζωής σαςΤο Digital Trends βοηθά τους αναγνώστες να παρακολουθούν τον γρήγορο κόσμο της τεχνολογίας με όλα τα τελευταία νέα, διασκεδαστικές κριτικές προϊόντων, διορατικά editorial και μοναδικές κρυφές ματιές.