El robot de Google aprende a caminar solo en dos horas

¿Recuerdas esa escena en Walt Disney? Bambi ¿Dónde el cervatillo titular aprende a levantarse y caminar por sus propios medios? Es una viñeta encantadora de la película, que muestra una habilidad que muchos animales bebés, desde cerdos hasta jirafas y, sí, ciervos, adquieren a los pocos minutos de su nacimiento. Durante las primeras horas de vida, estos animales afinan rápidamente sus habilidades motoras hasta tener un control total sobre su propia locomoción. Los seres humanos, que aprenden a mantenerse en pie agarrados a cosas alrededor de los siete meses y que comienzan a caminar a los 15 meses, son en comparación irremediablemente lentos.

Contenido

Refuerzo positivo
Construyendo mejores robots

¿Adivina cuál es la última tarea en la que los robots nos han superado? En un nuevo estudio realizado por investigadores de Google, los ingenieros han enseñado a un robot Minitaur cuadrúpedo a caminar, bueno, en realidad no han tenido que enseñarle mucho. Más bien, han utilizado un tipo de inteligencia artificial orientada a objetivos para crear un robot de cuatro patas.

aprende a caminar hacia adelante, hacia atrás y girar hacia la izquierda y hacia la derecha por sí solo. Pudo aprender a hacer esto por sí solo con éxito en tres terrenos diferentes, incluido un terreno plano, un colchón suave y un felpudo con grietas.

Vídeos recomendados

"Los robots con patas pueden tener una gran movilidad porque las piernas son esenciales para navegar por caminos sin pavimentar y lugares diseñados para humanos". Jie Tan, dijo a Digital Trends el investigador principal del proyecto y jefe de esfuerzos de locomoción de Google. “Estamos interesados en permitir que los robots con patas naveguen por nuestros diversos y complejos entornos del mundo real. pero es difícil diseñar manualmente controladores robóticos que puedan manejar tal diversidad y complejidad. Por eso es importante que los robots puedan aprender por sí mismos. Este trabajo es apasionante porque es una demostración temprana de que, con nuestro sistema, un robot con patas puede aprender con éxito a caminar por sí solo”.

Refuerzo positivo

Aprender a caminar en el mundo real con un mínimo esfuerzo humano

La tecnología en la raíz de este proyecto en particular es algo llamado aprendizaje por refuerzo profundo, una Enfoque específico del aprendizaje profundo inspirado en la psicología conductista y el ensayo y error. aprendiendo. Cuando se les dice que maximicen una determinada recompensa, los agentes de software aprenden a tomar medidas en un entorno que logrará esos resultados de la manera más precisa y eficiente posible. El poder del aprendizaje por refuerzo fue famosa demostración en 2013 cuando DeepMind de Google publicó un artículo que mostraba cómo había entrenado una IA. para jugar videojuegos clásicos de Atari. Esto se logró sin más instrucción que la puntuación en pantalla y los aproximadamente 30.000 píxeles que componían cada cuadro de los videojuegos que jugaba.

Los investigadores en robótica también utilizan con frecuencia los videojuegos, o al menos las simulaciones. En teoría, una simulación tiene mucho sentido, ya que permite a los robóticos entrenar su máquina en un mundo virtual antes de salir al mundo real. Eso salva a los robots de las inevitables caídas y el desgaste que sufrirían a medida que aprenden a realizar una tarea específica. Como analogía, imagine si todas sus lecciones de conducción se realizaran utilizando un simulador de conducción. Se podría argumentar que aprendería más rápidamente porque no tendría que ser tan cauteloso para no arriesgar su seguridad física o dañar su automóvil (o el de otra persona). También podrías entrenar más rápido sin tener que esperar a que te asignen lecciones o a que un conductor con licencia esté dispuesto a llevarte.

El problema con esto es que, como sabrá cualquiera que haya jugado un videojuego de conducción, es bastante difícil modelar el mundo real de una manera que se sienta como, bueno, el mundo real. En cambio, los investigadores de Google comenzaron a desarrollar algoritmos mejorados que permiten a su robot aprender más rápidamente con menos pruebas involucradas. Basado en una investigación anterior de Google publicado en 2018, su robot pudo aprender a caminar en sólo un par de horas en esta última demostración.

También puede hacer esto al tiempo que enfatiza un enfoque de aprendizaje más cauteloso y seguro, que implica menos caídas. Como resultado, minimiza la cantidad de intervenciones humanas que deben realizarse para levantar el robot y quitarle el polvo cada vez que cae.

Construyendo mejores robots

Aprender a caminar en dos horas puede no ser un nivel muy alto de eficiencia para aprender a caminar, pero está muy lejos de que los ingenieros tengan que programar explícitamente cómo se suele enseñar a maniobrar a un robot. (Y, como se señaló, ¡es mucho mejor de lo que los bebés humanos pueden manejar en ese tipo de período de tiempo!)

“Aunque se han demostrado muchos algoritmos de aprendizaje no supervisado o de aprendizaje por refuerzo en simulación, aplicarlos en robots reales con patas resulta increíblemente difícil”, dijo Tan explicado. “En primer lugar, el aprendizaje por refuerzo requiere muchos datos y la recopilación de datos de robots es costosa. Nuestro trabajo anterior ha abordado este desafío. En segundo lugar, la formación requiere que alguien dedique mucho tiempo a supervisar el robot. Si necesitamos que una persona supervise el robot y lo reinicie manualmente cada vez que tropieza (cientos o miles de veces), se necesitará mucho esfuerzo y mucho tiempo para entrenar al robot. Cuanto más tiempo lleve, más difícil será ampliar el aprendizaje a muchos robots en muchos entornos diferentes”.

Algún día, esta investigación podría ayudar a crear robots más ágiles que puedan adaptarse más rápidamente a una variedad de terrenos. "Las aplicaciones potenciales son numerosas", dijo Tan. Sin embargo, Tan enfatizó que esto “aún es temprano y hay muchos desafíos que aún debemos superar”.

Sin embargo, de acuerdo con el tema del aprendizaje por refuerzo, ¡sin duda es una recompensa que vale la pena maximizar!

Recomendaciones de los editores

La IA convirtió Breaking Bad en un anime, y es aterrador
Por qué la IA nunca gobernará el mundo
¿Cómo sabremos cuándo una IA realmente se vuelve sensible?
La fórmula divertida: por qué el humor generado por máquinas es el santo grial de la IA
Lea la inquietantemente hermosa "escritura sintética" de una IA. que piensa que es dios

Mejora tu estilo de vidaDigital Trends ayuda a los lectores a mantenerse al tanto del vertiginoso mundo de la tecnología con las últimas noticias, reseñas divertidas de productos, editoriales interesantes y adelantos únicos.

El robot de Google aprende a caminar solo en dos horas

Refuerzo positivo

Construyendo mejores robots

Recomendaciones de los editores

Categorías

Reciente

Cómo las desintoxicaciones digitales se aprovechan de la confusión sobre la adicción a Internet

Cómo Samsung arregló el Galaxy Fold y por qué debes probarlo tú mismo

El brazo robótico de Kinova convierte una silla de ruedas en el dispositivo de asistencia definitivo