Το ρομπότ Google διδάσκει τον εαυτό του να περπατά σε μόλις δύο ώρες

Θυμάστε αυτή τη σκηνή στο Walt Disney's Μπάμπη όπου το τιμώμενο ελαφάκι μαθαίνει να σηκώνεται και να περπατά με τη δική του δύναμη; Είναι ένα γοητευτικό χρονογράφημα στην ταινία, που δείχνει μια δεξιότητα που πολλά μωρά ζώα - από γουρούνια μέχρι καμηλοπάρδαλη και, ναι, ελάφια - αποκτούν μέσα σε λίγα λεπτά από τη γέννησή τους. Τις πρώτες ώρες της ζωής τους, αυτά τα ζώα βελτιώνουν γρήγορα τις κινητικές τους δεξιότητες μέχρι να έχουν τον πλήρη έλεγχο της κίνησής τους. Οι άνθρωποι, που μαθαίνουν να στέκονται κρατούμενοι από πράγματα σε περίπου επτά μήνες και που αρχίζουν να περπατούν στους 15 μήνες, είναι απελπιστικά νωθροί συγκριτικά.

Περιεχόμενα

  • Θετική ενίσχυση
  • Κατασκευάζοντας καλύτερα ρομπότ

Μαντέψτε ποια είναι η πιο πρόσφατη αποστολή στην οποία μας έχουν νικήσει τα ρομπότ; Σε μια νέα μελέτη που πραγματοποιήθηκε από ερευνητές της Google, οι μηχανικοί έχουν διδάξει σε ένα τετράποδο ρομπότ Minitaur να περνάει, καλά, χωρίς να χρειάζεται να το διδάξει καθόλου. Αντίθετα, έχουν χρησιμοποιήσει έναν τύπο τεχνητής νοημοσύνης με στόχο την κατασκευή ενός τετράποδου ρομπότ

μάθετε πώς να περπατάτε μπροστά, προς τα πίσω και στρίψτε αριστερά και δεξιά εντελώς μόνο του. Μπόρεσε να διδάξει επιτυχώς να το κάνει αυτό σε τρία διαφορετικά εδάφη, όπως ένα επίπεδο έδαφος, ένα μαλακό στρώμα και ένα χαλάκι πόρτας με σχισμές.

Προτεινόμενα βίντεο

«Τα ρομπότ με πόδια μπορούν να έχουν μεγάλη κινητικότητα επειδή τα πόδια είναι απαραίτητα για την πλοήγηση σε μη ασφαλτοστρωμένους δρόμους και μέρη που έχουν σχεδιαστεί για ανθρώπους». Τζι Ταν, κύριος ερευνητής για το έργο και επικεφαλής των προσπαθειών μετακίνησης της Google, δήλωσε στο Digital Trends. «Μας ενδιαφέρει να επιτρέψουμε στα ρομπότ με πόδια να πλοηγούνται στα διαφορετικά και πολύπλοκα περιβάλλοντα του πραγματικού κόσμου, αλλά είναι δύσκολο να κατασκευαστούν χειροκίνητα ρομποτικοί ελεγκτές που μπορούν να χειριστούν τέτοια ποικιλομορφία και περίπλοκο. Επομένως, είναι σημαντικό τα ρομπότ να μπορούν να μαθαίνουν μόνα τους. Αυτή η δουλειά είναι συναρπαστική γιατί αυτή είναι μια πρώιμη απόδειξη ότι, με το σύστημά μας, ένα ρομπότ με πόδια μπορεί να μάθει με επιτυχία να περπατά μόνο του».

Θετική ενίσχυση

Μαθαίνοντας να περπατάς στον πραγματικό κόσμο με ελάχιστη ανθρώπινη προσπάθεια

Η τεχνολογία στη ρίζα αυτού του συγκεκριμένου έργου είναι κάτι που ονομάζεται μάθηση βαθιάς ενίσχυσης, α συγκεκριμένη προσέγγιση στη βαθιά μάθηση που είναι εμπνευσμένη από τη συμπεριφοριστική ψυχολογία και τη δοκιμή και το λάθος μάθηση. Για να μεγιστοποιήσουν μια συγκεκριμένη ανταμοιβή, οι πράκτορες λογισμικού μαθαίνουν να αναλαμβάνουν ενέργειες σε ένα περιβάλλον που θα επιτύχει αυτά τα αποτελέσματα με τον πιο ακριβή και αποτελεσματικό δυνατό τρόπο. Η δύναμη της ενισχυτικής μάθησης ήταν αποδείχθηκε περίφημα το 2013 όταν το DeepMind της Google κυκλοφόρησε ένα έγγραφο που δείχνει πώς είχε εκπαιδεύσει ένα A.I. για να παίξετε κλασικά βιντεοπαιχνίδια Atari. Αυτό επιτεύχθηκε χωρίς καμία άλλη οδηγία εκτός από το σκορ στην οθόνη και τα περίπου 30.000 pixel που αποτελούσαν κάθε καρέ των βιντεοπαιχνιδιών που έπαιζε.

Τα βιντεοπαιχνίδια, ή τουλάχιστον οι προσομοιώσεις, χρησιμοποιούνται συχνά και από ερευνητές ρομποτικής. Μια προσομοίωση είναι απολύτως λογική θεωρητικά, αφού επιτρέπει στους ρομποτικούς να εκπαιδεύσουν τη μηχανή τους σε έναν εικονικό κόσμο πριν βγουν στον πραγματικό. Αυτό σώζει τα ρομπότ από τις αναπόφευκτες καταστροφές και τη φθορά που θα υποστούν καθώς μαθαίνει να εκτελεί μια συγκεκριμένη εργασία. Κατ' αναλογία, φανταστείτε αν όλα τα μαθήματα οδήγησης πραγματοποιήθηκαν χρησιμοποιώντας έναν προσομοιωτή οδήγησης. Θα μπορούσε να προβληθεί το επιχείρημα ότι θα μαθαίνατε πιο γρήγορα επειδή δεν θα χρειάζεται να είστε τόσο προσεκτικοί σχετικά με τη σωματική σας ασφάλεια ή την καταστροφή του αυτοκινήτου σας (ή κάποιου άλλου). Θα μπορούσατε επίσης να προπονηθείτε πιο γρήγορα χωρίς να χρειάζεται να περιμένετε για τα μαθήματα που έχουν δοθεί ή για έναν οδηγό με άδεια να είναι πρόθυμος να σας βγάλει έξω.

Το πρόβλημα με αυτό είναι ότι, όπως γνωρίζει όποιος έχει παίξει ποτέ ένα βιντεοπαιχνίδι οδήγησης, είναι πολύ δύσκολο να μοντελοποιήσεις τον πραγματικό κόσμο με τρόπο που μοιάζει με τον πραγματικό κόσμο. Αντίθετα, οι ερευνητές της Google άρχισαν να αναπτύσσουν βελτιωμένους αλγόριθμους που επιτρέπουν στο ρομπότ τους να μαθαίνει πιο γρήγορα με λιγότερες δοκιμές. Με βάση ένα προηγούμενο κομμάτι της έρευνας της Google δημοσιεύθηκε το 2018, το ρομπότ τους μπόρεσε να μάθει να περπατά μέσα σε λίγες μόνο ώρες σε αυτή την τελευταία επίδειξη.

Είναι επίσης σε θέση να το κάνει αυτό, ενώ δίνει έμφαση σε μια πιο προσεκτική, ασφαλέστερη προσέγγιση στη μάθηση, που περιλαμβάνει λιγότερες πτώσεις. Ως αποτέλεσμα, ελαχιστοποιεί τον αριθμό των ανθρώπινων παρεμβάσεων που πρέπει να γίνουν για να σηκωθεί το ρομπότ και να ξεσκονιστεί κάθε φορά που χρειάζεται μια ανατροπή.

Κατασκευάζοντας καλύτερα ρομπότ

Το να μάθεις να περπατάς σε δύο ώρες μπορεί να μην είναι αρκετά ελάχιστα επίπεδα αποτελεσματικότητας εκμάθησης για περπάτημα, αλλά απέχει πολύ από το να πρέπει οι μηχανικοί να προγραμματίσουν ρητά πώς ένα ρομπότ συνήθως διδάσκεται να ελίσσεται. (Και, όπως σημειώθηκε, είναι πολύ καλύτερα από ό, τι μπορούν να διαχειριστούν τα ανθρώπινα βρέφη σε αυτό το είδος χρόνου!)

«Αν και πολλοί αλγόριθμοι μάθησης χωρίς επίβλεψη ή ενίσχυσης μάθησης έχουν αποδειχθεί σε η προσομοίωση, η εφαρμογή τους σε αληθινά ρομπότ με πόδια αποδεικνύεται απίστευτα δύσκολη», δήλωσε ο Tan εξήγησε. «Πρώτον, η ενισχυτική μάθηση απαιτεί δεδομένα και η συλλογή δεδομένων ρομπότ είναι ακριβή. Η προηγούμενη εργασία μας αντιμετώπισε αυτήν την πρόκληση. Δεύτερον, η εκπαίδευση απαιτεί από κάποιον να αφιερώσει πολύ χρόνο στην επίβλεψη του ρομπότ. Εάν χρειαζόμαστε ένα άτομο να παρακολουθεί το ρομπότ και να το επαναφέρει χειροκίνητα κάθε φορά που σκοντάφτει - εκατοντάδες ή χιλιάδες φορές - θα χρειαστεί πολλή προσπάθεια και πολύς χρόνος για να εκπαιδεύσουμε το ρομπότ. Όσο περισσότερο χρόνο χρειάζεται, τόσο πιο δύσκολο είναι να κλιμακωθεί η μάθηση σε πολλά ρομπότ σε πολλά διαφορετικά περιβάλλοντα.»

Μια μέρα αυτή η έρευνα θα μπορούσε να βοηθήσει στη δημιουργία πιο ευέλικτων ρομπότ που θα είναι πιο γρήγορα ικανά να προσαρμοστούν σε μια ποικιλία εδαφών. «Οι πιθανές εφαρμογές είναι πολλές», είπε ο Tan. Ωστόσο, ο Ταν τόνισε ότι αυτό είναι «ακόμα νωρίς και υπάρχουν πολλές προκλήσεις που πρέπει ακόμα να ξεπεράσουμε».

Σύμφωνα με το θέμα της ενίσχυσης μάθησης, είναι σίγουρα μια ανταμοιβή που αξίζει να μεγιστοποιήσετε!

Συστάσεις των συντακτών

  • Η τεχνητή νοημοσύνη μετέτρεψε το Breaking Bad σε anime - και είναι τρομακτικό
  • Γιατί η τεχνητή νοημοσύνη δεν θα κυβερνήσει ποτέ τον κόσμο
  • Πώς θα ξέρουμε πότε ένα AI γίνεται πραγματικά αισθητό;
  • Η αστεία φόρμουλα: Γιατί το χιούμορ που δημιουργείται από μηχανή είναι το ιερό δισκοπότηρο του A.I.
  • Διαβάστε την απόκοσμα όμορφη «συνθετική γραφή» ενός A.I. που νομίζει ότι είναι Θεός

Αναβαθμίστε τον τρόπο ζωής σαςΤο Digital Trends βοηθά τους αναγνώστες να παρακολουθούν τον γρήγορο κόσμο της τεχνολογίας με όλα τα τελευταία νέα, διασκεδαστικές κριτικές προϊόντων, διορατικά editorial και μοναδικές κρυφές ματιές.