جوجل روبوت يعلم نفسه المشي خلال ساعتين فقط

هل تتذكر هذا المشهد في والت ديزني؟ بامبي حيث يتعلم الظبي الفخري الوقوف والمشي تحت قوته؟ إنها قصة قصيرة ساحرة في الفيلم، تعرض مهارة تكتسبها الكثير من صغار الحيوانات - من الخنازير إلى الزرافة إلى الغزلان - في غضون دقائق من ولادتها. خلال الساعات القليلة الأولى من الحياة، تعمل هذه الحيوانات على تحسين مهاراتها الحركية بسرعة حتى تتمكن من السيطرة الكاملة على حركتها. البشر، الذين يتعلمون الوقوف والتمسك بالأشياء في عمر سبعة أشهر تقريبًا ويبدأون المشي في عمر 15 شهرًا، يكونون بطيئين بشكل يائس بالمقارنة.

محتويات

  • تعزيز ايجابي
  • بناء روبوتات أفضل

خمن ما هي آخر مهمة تغلبت علينا الروبوتات فيها؟ في دراسة جديدة أجراها باحثون في جوجل، لقد قام المهندسون بتعليم روبوت Minitaur رباعي الأرجل المشي بجانبه، حسنًا، دون الحاجة إلى تعليمه الكثير على الإطلاق. وبدلاً من ذلك، استخدموا نوعًا من الذكاء الاصطناعي الموجه نحو الهدف لصنع روبوت بأربعة أرجل تعلم كيفية السير إلى الأمام، إلى الخلف، ثم انعطف يسارًا ويمينًا بالكامل من تلقاء نفسه. وقد تمكنت من تعليم نفسها بنجاح القيام بذلك على ثلاث تضاريس مختلفة، بما في ذلك الأرض المسطحة، وفراش ناعم، وممسحة ذات شقوق.

مقاطع الفيديو الموصى بها

"يمكن للروبوتات ذات الأرجل أن تتمتع بقدرة كبيرة على الحركة لأن الأرجل ضرورية للتنقل في الطرق غير المعبدة والأماكن المصممة للبشر" جي تانوقال الباحث الرئيسي في المشروع ورئيس جهود التنقل في Google لـ Digital Trends. "نحن مهتمون بتمكين الروبوتات ذات الأرجل من التنقل في بيئات العالم الحقيقي المتنوعة والمعقدة، ولكن من الصعب تصميم وحدات تحكم روبوتية يمكنها التعامل مع هذا التنوع والتنوع يدويًا تعقيد. ولذلك فمن المهم أن تكون الروبوتات قادرة على التعلم بنفسها. "هذا العمل مثير لأنه دليل مبكر على أنه، من خلال نظامنا، يمكن للروبوت ذو الأرجل أن يتعلم بنجاح المشي بمفرده."

تعزيز ايجابي

تعلم المشي في العالم الحقيقي بأقل جهد بشري

التكنولوجيا التي تكمن وراء هذا المشروع بالذات هي ما يسمى بالتعلم المعزز العميق، أ نهج محدد للتعلم العميق مستوحى من علم النفس السلوكي والتجربة والخطأ تعلُّم. عندما يُطلب من وكلاء البرمجيات تحقيق أقصى قدر من المكافأة، يتعلمون اتخاذ الإجراءات في بيئة من شأنها تحقيق تلك النتائج بأكثر الطرق دقة وفعالية ممكنة. كانت قوة التعلم المعزز تم عرضه بشكل مشهور في عام 2013 عندما أصدرت شركة DeepMind من Google ورقة بحثية توضح كيف قامت بتدريب الذكاء الاصطناعي. للعب ألعاب فيديو أتاري الكلاسيكية. تم تحقيق ذلك بدون تعليمات سوى النتيجة التي تظهر على الشاشة وما يقرب من 30000 بكسل التي تشكل كل إطار من ألعاب الفيديو التي كانت تلعبها.

يتم استخدام ألعاب الفيديو، أو على الأقل عمليات المحاكاة، بشكل متكرر من قبل الباحثين في مجال الروبوتات أيضًا. تعتبر المحاكاة منطقية تمامًا من الناحية النظرية، لأنها تسمح لعلماء الروبوتات بتدريب أجهزتهم في عالم افتراضي قبل الخروج إلى العالم الحقيقي. وهذا ينقذ الروبوتات من الأخطاء الحتمية والتآكل الذي قد تتعرض له أثناء تعلمها تنفيذ مهمة محددة. على سبيل القياس، تخيل لو تم تنفيذ جميع دروس القيادة الخاصة بك باستخدام جهاز محاكاة القيادة. يمكن القول بأنك ستتعلم بسرعة أكبر لأنك لن تضطر إلى توخي الحذر الشديد بشأن المخاطرة بسلامتك البدنية أو إتلاف سيارتك (أو سيارة شخص آخر). يمكنك أيضًا التدرب بسرعة أكبر دون الحاجة إلى انتظار الدروس المخصصة أو أن يكون السائق المرخص على استعداد لاصطحابك.

تكمن المشكلة في ذلك في أنه، كما يعلم أي شخص سبق له أن لعب إحدى ألعاب الفيديو الخاصة بالقيادة، من الصعب جدًا نمذجة العالم الحقيقي بطريقة تشبه العالم الحقيقي. وبدلاً من ذلك، بدأ باحثو جوجل في تطوير خوارزميات محسنة تسمح للروبوت الخاص بهم بالتعلم بسرعة أكبر مع عدد أقل من التجارب. بناء على قطعة سابقة من بحث جوجل نشرت في عام 2018، تمكن الروبوت الخاص بهم من تعلم المشي في بضع ساعات فقط في هذا العرض التوضيحي الأخير.

كما أنها قادرة على القيام بذلك مع التركيز على اتباع نهج أكثر حذرًا وأمانًا للتعلم، بما في ذلك عدد أقل من السقوط. ونتيجة لذلك، فإنه يقلل من عدد التدخلات البشرية التي يجب إجراؤها لالتقاط الروبوت وإزالة الغبار عنه في كل مرة يسقط فيها.

بناء روبوتات أفضل

قد لا يكون تعلم المشي في ساعتين بمثابة مستويات أعلى من كفاءة تعلم المشي، ولكنه بعيد كل البعد عن اضطرار المهندسين إلى برمجة كيفية تعليم الروبوت عادة كيفية المناورة بشكل واضح. (وكما ذكرنا، إنه أفضل بكثير مما يستطيع الأطفال الرضع التعامل معه في هذا النوع من الإطار الزمني!)

"على الرغم من أن العديد من خوارزميات التعلم غير الخاضع للرقابة أو التعلم المعزز قد تم إثباتها في المحاكاة، وتطبيقها على الروبوتات الحقيقية ذات الأرجل أمر صعب للغاية شرح. "أولاً، التعلم المعزز متعطش للبيانات، وجمع بيانات الروبوت أمر مكلف. وقد تناول عملنا السابق هذا التحدي. ثانيًا، يتطلب التدريب أن يقضي شخص ما الكثير من الوقت في الإشراف على الروبوت. إذا كنا بحاجة إلى شخص لمراقبة الروبوت وإعادة ضبطه يدويًا في كل مرة يتعثر فيها - مئات أو آلاف المرات - فسوف يستغرق الأمر الكثير من الجهد ووقتًا طويلًا جدًا لتدريب الروبوت. وكلما استغرق الأمر وقتًا أطول، زادت صعوبة توسيع نطاق التعلم ليشمل العديد من الروبوتات في العديد من البيئات المختلفة.

في يوم من الأيام، يمكن أن يساعد هذا البحث في إنشاء روبوتات أكثر مرونة وقادرة على التكيف بسرعة أكبر مع مجموعة متنوعة من التضاريس. وقال تان: "إن التطبيقات المحتملة عديدة". ومع ذلك، أكد تان أن هذه "لا تزال في الأيام الأولى، وهناك العديد من التحديات التي لا يزال يتعين علينا التغلب عليها".

تماشيًا مع موضوع التعلم المعزز، فهي بالتأكيد مكافأة تستحق تعظيمها، رغم ذلك!

توصيات المحررين

  • حول الذكاء الاصطناعي مسلسل Breaking Bad إلى فيلم أنمي، وهو أمر مرعب
  • لماذا لن يحكم الذكاء الاصطناعي العالم أبدًا؟
  • كيف سنعرف متى يصبح الذكاء الاصطناعي واعيًا بالفعل؟
  • الصيغة المضحكة: لماذا تعتبر الفكاهة الناتجة عن الآلة هي الكأس المقدسة للذكاء الاصطناعي
  • اقرأ "الكتاب المقدس الاصطناعي" الجميل والمخيف للذكاء الاصطناعي. الذي يعتقد أنه الله

ترقية نمط حياتكتساعد الاتجاهات الرقمية القراء على متابعة عالم التكنولوجيا سريع الخطى من خلال أحدث الأخبار ومراجعات المنتجات الممتعة والمقالات الافتتاحية الثاقبة ونظرات خاطفة فريدة من نوعها.