Vous souvenez-vous de cette scène dans Walt Disney Bambi où le faon titulaire apprend à se lever et à marcher par ses propres moyens? C’est une charmante vignette du film, mettant en valeur une compétence que de nombreux bébés animaux – des cochons à la girafe en passant par, oui, les cerfs – acquièrent quelques minutes après leur naissance. Au cours des premières heures de leur vie, ces animaux affinent rapidement leurs capacités motrices jusqu'à avoir le contrôle total de leur propre locomotion. Les humains, qui apprennent à s’accrocher aux objets vers sept mois et qui commencent à marcher vers 15 mois, sont désespérément lents en comparaison.
Contenu
- Renforcement positif
- Construire de meilleurs robots
Devinez quelle est la dernière tâche dans laquelle les robots nous ont battus? Dans une nouvelle étude réalisée par des chercheurs de Google, les ingénieurs ont appris à un robot quadrupède Minitaur à passer, sans vraiment avoir à lui apprendre grand-chose. Au lieu de cela, ils ont utilisé une sorte d’intelligence artificielle orientée vers un objectif pour créer un robot à quatre pattes.
apprendre à avancer, reculer et tourner à gauche et à droite tout seul. Il a réussi à apprendre à le faire sur trois terrains différents, dont un sol plat, un matelas moelleux et un paillasson avec des crevasses.Vidéos recommandées
"Les robots à pattes peuvent avoir une grande mobilité car leurs jambes sont essentielles pour naviguer sur des routes non pavées et dans des lieux conçus pour les humains", Jie Tan, chercheur principal du projet et responsable des efforts de locomotion de Google, a déclaré à Digital Trends. "Nous souhaitons permettre aux robots à pattes de naviguer dans nos environnements réels divers et complexes, mais il est difficile de concevoir manuellement des contrôleurs robotiques capables de gérer une telle diversité et complexité. Il est donc important que les robots soient capables d’apprendre par eux-mêmes. Ce travail est passionnant car il s’agit d’une première démonstration selon laquelle, grâce à notre système, un robot à pattes peut apprendre à marcher tout seul.
Renforcement positif
Apprendre à marcher dans le monde réel avec un minimum d'effort humain
La technologie à la base de ce projet particulier est ce qu'on appelle l'apprentissage par renforcement profond, un approche spécifique de l’apprentissage profond inspirée de la psychologie behavioriste et des essais et erreurs apprentissage. Invités à maximiser une certaine récompense, les agents logiciels apprennent à prendre des mesures dans un environnement qui permettront d'obtenir ces résultats de la manière la plus précise et la plus efficace possible. Le pouvoir de l’apprentissage par renforcement était démonstration célèbre en 2013 lorsque DeepMind de Google a publié un article montrant comment il avait formé une IA. pour jouer aux jeux vidéo Atari classiques. Ceci a été réalisé sans aucune instruction autre que le score à l'écran et les environ 30 000 pixels qui composaient chaque image des jeux vidéo auxquels ils jouaient.
Les jeux vidéo, ou du moins les simulations, sont également fréquemment utilisés par les chercheurs en robotique. En théorie, une simulation prend tout son sens puisqu'elle permet aux roboticiens d'entraîner leur machine dans un monde virtuel avant de se lancer dans le monde réel. Cela évite aux robots les inévitables chutes et l’usure qu’ils subiraient lorsqu’ils apprendraient à effectuer une tâche spécifique. Par analogie, imaginez si tous vos cours de conduite se déroulaient à l’aide d’un simulateur de conduite. On pourrait faire valoir que vous apprendriez plus rapidement parce que vous n’auriez pas à être aussi prudent au sujet de risquer votre sécurité physique ou d’endommager votre voiture (ou celle de quelqu’un d’autre). Vous pourriez également vous entraîner plus rapidement sans avoir à attendre les leçons attribuées ou qu'un chauffeur licencié soit prêt à vous emmener.
Le problème est que, comme le savent tous ceux qui ont déjà joué à un jeu vidéo de conduite, il est sacrément difficile de modéliser le monde réel d’une manière qui ressemble au monde réel. Au lieu de cela, les chercheurs de Google ont commencé à développer des algorithmes améliorés qui permettent à leur robot d’apprendre plus rapidement avec moins d’essais. S'appuyant sur une recherche précédente de Google publié en 2018, leur robot a pu apprendre à marcher en quelques heures seulement lors de cette dernière démonstration.
Il est également capable de le faire tout en mettant l’accent sur une approche d’apprentissage plus prudente et plus sûre, impliquant moins de chutes. En conséquence, cela minimise le nombre d’interventions humaines nécessaires pour ramasser le robot et le dépoussiérer à chaque chute.
Construire de meilleurs robots
Apprendre à marcher en deux heures n’est peut-être pas tout à fait un niveau d’efficacité d’apprentissage à marcher, mais on est loin des ingénieurs qui doivent programmer explicitement la façon dont un robot apprend habituellement à manœuvrer. (Et, comme indiqué, c’est bien mieux que ce que les nourrissons humains peuvent gérer dans ce genre de laps de temps !)
« Bien que de nombreux algorithmes d’apprentissage non supervisé ou d’apprentissage par renforcement aient été démontrés dans simulation, les appliquer sur de vrais robots à pattes s'avère incroyablement difficile », Tan expliqué. « Premièrement, l’apprentissage par renforcement est gourmand en données et la collecte de données sur les robots coûte cher. Nos travaux antérieurs ont relevé ce défi. Deuxièmement, la formation nécessite que quelqu’un passe beaucoup de temps à superviser le robot. Si nous avons besoin d’une personne pour surveiller le robot et le réinitialiser manuellement à chaque fois qu’il trébuche – des centaines ou des milliers de fois – il faudra beaucoup d’efforts et beaucoup de temps pour entraîner le robot. Plus cela prend de temps, plus il est difficile d’étendre l’apprentissage à de nombreux robots dans de nombreux environnements différents.
Un jour, ces recherches pourraient contribuer à créer des robots plus agiles, capables de s’adapter plus rapidement à une variété de terrains. "Les applications potentielles sont nombreuses", a déclaré Tan. Cependant, Tan a souligné que « nous n’en sommes qu’à nos débuts et qu’il y a de nombreux défis que nous devons encore surmonter ».
Conformément au thème de l’apprentissage par renforcement, c’est certainement une récompense qui mérite d’être maximisée !
Recommandations des rédacteurs
- L’IA a transformé Breaking Bad en anime – et c’est terrifiant
- Pourquoi l'IA ne dirigera jamais le monde
- Comment saurons-nous quand une IA devient réellement sensible?
- La formule amusante: pourquoi l'humour généré par la machine est le Saint Graal de l'IA.
- Lisez les « écritures synthétiques » étrangement belles d’un IA. qui pense que c'est Dieu
Améliorez votre style de vieDigital Trends aide les lecteurs à garder un œil sur le monde en évolution rapide de la technologie avec toutes les dernières nouvelles, des critiques de produits amusantes, des éditoriaux perspicaces et des aperçus uniques.