Google Robot สอนตัวเองให้เดินในเวลาเพียงสองชั่วโมง

คุณจำฉากนั้นในเรื่องของวอลต์ดิสนีย์ได้ไหม แบมบี้ กวางที่มียศฐาบรรดาศักดิ์เรียนรู้ที่จะยืนขึ้นและเดินภายใต้พลังของมันเองที่ไหน? เป็นบทความสั้นที่มีเสน่ห์ในภาพยนตร์ โดยจัดแสดงทักษะที่ลูกสัตว์มากมาย ตั้งแต่หมู ยีราฟ ไปจนถึงกวาง จะมารวมตัวกันภายในไม่กี่นาทีหลังคลอด ในช่วงสองสามชั่วโมงแรกของชีวิต สัตว์เหล่านี้จะปรับปรุงทักษะการเคลื่อนไหวอย่างรวดเร็วจนกว่าพวกเขาจะสามารถควบคุมการเคลื่อนไหวของตัวเองได้อย่างเต็มที่ มนุษย์ที่เรียนรู้ที่จะยืนจับสิ่งของต่างๆ เมื่ออายุประมาณ 7 เดือน และเริ่มเดินได้เมื่ออายุ 15 เดือน จะรู้สึกเฉื่อยชาอย่างสิ้นหวังเมื่อเปรียบเทียบกัน

สารบัญ

การเสริมแรงเชิงบวก
การสร้างหุ่นยนต์ที่ดีขึ้น

ทายสิว่างานล่าสุดที่หุ่นยนต์เอาชนะเราคืออะไร? ในการศึกษาใหม่ ดำเนินการโดยนักวิจัยจาก Googleวิศวกรได้สอนหุ่นยนต์ Minitaur สี่ขาให้เดินผ่านได้ จริงๆ ไม่ต้องสอนอะไรมากก็ได้ แต่พวกเขาใช้ปัญญาประดิษฐ์ที่มุ่งเน้นเป้าหมายเพื่อสร้างหุ่นยนต์สี่ขา เรียนรู้ที่จะเดินไปข้างหน้าถอยหลังและเลี้ยวซ้ายและขวาได้เอง สามารถสอนตัวเองให้ทำสิ่งนี้ได้สำเร็จบนภูมิประเทศที่แตกต่างกันสามแบบ รวมถึงพื้นราบ ที่นอนนุ่ม ๆ และพรมเช็ดเท้าที่มีรอยแยก

วิดีโอแนะนำ

“หุ่นยนต์มีขามีความคล่องตัวสูง เพราะขาเป็นสิ่งจำเป็นในการนำทางบนถนนที่ไม่ลาดยางและสถานที่ที่ออกแบบมาสำหรับมนุษย์” เจีย ตันผู้ตรวจสอบหลักในโครงการและหัวหน้าฝ่ายความพยายามในการเคลื่อนที่ของ Google กล่าวกับ Digital Trends “เราสนใจที่จะให้หุ่นยนต์มีขาสามารถสำรวจสภาพแวดล้อมในโลกแห่งความเป็นจริงที่หลากหลายและซับซ้อนของเราได้ แต่มันเป็นเรื่องยากที่จะสร้างตัวควบคุมหุ่นยนต์ด้วยตนเองที่สามารถจัดการกับความหลากหลายดังกล่าวได้ ความซับซ้อน ดังนั้นสิ่งสำคัญคือหุ่นยนต์จะต้องสามารถเรียนรู้ได้ด้วยตัวเอง งานนี้น่าตื่นเต้นเพราะเป็นการสาธิตเบื้องต้นว่าหุ่นยนต์มีขาสามารถเรียนรู้ที่จะเดินด้วยตัวเองได้สำเร็จด้วยระบบของเรา”

การเสริมแรงเชิงบวก

การเรียนรู้ที่จะเดินในโลกแห่งความเป็นจริงโดยอาศัยความพยายามของมนุษย์เพียงเล็กน้อย

เทคโนโลยีที่เป็นรากฐานของโครงการนี้เป็นสิ่งที่เรียกว่าการเรียนรู้แบบเสริมกำลังเชิงลึก ก วิธีการเฉพาะในการเรียนรู้เชิงลึกที่ได้รับแรงบันดาลใจจากจิตวิทยาพฤติกรรมนิยมและการลองผิดลองถูก การเรียนรู้. ตัวแทนซอฟต์แวร์ได้รับคำสั่งให้เพิ่มรางวัลให้สูงสุดเรียนรู้ที่จะดำเนินการในสภาพแวดล้อมที่จะบรรลุผลลัพธ์เหล่านั้นด้วยวิธีที่แม่นยำและมีประสิทธิภาพมากที่สุดเท่าที่จะเป็นไปได้ พลังแห่งการเรียนรู้แบบเสริมกำลังคือ แสดงให้เห็นอย่างโด่งดังในปี 2013 เมื่อ DeepMind ของ Google เผยแพร่บทความที่แสดงให้เห็นว่าบริษัทได้ฝึกฝน A.I อย่างไร เพื่อเล่นวิดีโอเกม Atari สุดคลาสสิก สิ่งนี้เกิดขึ้นได้โดยไม่มีคำแนะนำอื่นใดนอกจากคะแนนบนหน้าจอและความละเอียดประมาณ 30,000 พิกเซลที่ประกอบขึ้นเป็นแต่ละเฟรมของวิดีโอเกมที่มันกำลังเล่น

วิดีโอเกมหรืออย่างน้อยก็การจำลองก็มักถูกใช้โดยนักวิจัยด้านหุ่นยนต์เช่นกัน การจำลองมีเหตุผลที่ดีในทางทฤษฎี เนื่องจากช่วยให้วิทยาการหุ่นยนต์สามารถฝึกเครื่องจักรของตนในโลกเสมือนจริงได้ก่อนที่จะออกไปสู่โลกจริง ซึ่งช่วยหุ่นยนต์จากเหตุการณ์ที่หลีกเลี่ยงไม่ได้และการสึกหรอที่จะเกิดขึ้นในขณะที่เรียนรู้ที่จะปฏิบัติงานเฉพาะอย่าง ในการเปรียบเทียบ ลองจินตนาการว่าบทเรียนการขับขี่ทั้งหมดของคุณดำเนินการโดยใช้เครื่องจำลองการขับขี่หรือไม่ ข้อโต้แย้งอาจทำให้คุณสามารถเรียนรู้ได้เร็วยิ่งขึ้นเพราะคุณไม่จำเป็นต้องระมัดระวังในการเสี่ยงต่อความปลอดภัยทางกายภาพหรือทำให้รถของคุณ (หรือของผู้อื่นเสียหาย) คุณยังสามารถฝึกได้รวดเร็วยิ่งขึ้นโดยไม่ต้องรอบทเรียนที่จัดสรรไว้หรือให้คนขับรถที่มีใบอนุญาตยินดีพาคุณออกไปข้างนอก

ปัญหาก็คือ อย่างที่ใครก็ตามที่เคยเล่นวิดีโอเกมขับรถจะรู้ดี มันค่อนข้างยากที่จะจำลองโลกแห่งความเป็นจริงในลักษณะที่ให้ความรู้สึกเหมือนเป็นโลกแห่งความเป็นจริง นักวิจัยของ Google เริ่มพัฒนาอัลกอริธึมที่ได้รับการปรับปรุงซึ่งช่วยให้หุ่นยนต์เรียนรู้ได้รวดเร็วยิ่งขึ้นโดยมีการทดลองน้อยลง สร้างจากการวิจัย Google ชิ้นก่อนหน้า เผยแพร่ในปี 2018หุ่นยนต์ของพวกเขาสามารถเรียนรู้การเดินได้ภายในเวลาเพียงไม่กี่ชั่วโมงในการสาธิตครั้งล่าสุดนี้

นอกจากนี้ยังสามารถทำได้โดยเน้นย้ำถึงแนวทางการเรียนรู้ที่ระมัดระวังและปลอดภัยยิ่งขึ้น โดยลดการหกล้มน้อยลง เป็นผลให้ลดจำนวนการแทรกแซงของมนุษย์ที่ต้องดำเนินการเพื่อหยิบหุ่นยนต์ขึ้นมาและปัดฝุ่นทุกครั้งที่เกิดการปั่นป่วน

การสร้างหุ่นยนต์ที่ดีขึ้น

การเรียนรู้ที่จะเดินภายในสองชั่วโมงอาจไม่ใช่ประสิทธิภาพในการเรียนรู้ที่จะเดินในระดับกวางมากนัก แต่มันก็ยังห่างไกลจากวิศวกรที่ต้องตั้งโปรแกรมอย่างชัดเจนว่าปกติแล้วจะสอนหุ่นยนต์ให้เคลื่อนไหวอย่างไร (และดังที่กล่าวไว้ ดีกว่าที่ทารกมนุษย์จะจัดการได้ในกรอบเวลาแบบนั้นมาก!)

“แม้ว่าจะมีการแสดงอัลกอริทึมการเรียนรู้แบบไม่มีผู้ดูแลหรือการเรียนรู้แบบเสริมกำลังมากมายก็ตาม การนำไปประยุกต์ใช้กับหุ่นยนต์มีขาจริงกลายเป็นเรื่องยากอย่างไม่น่าเชื่อ” แทน อธิบาย “ประการแรก การเรียนรู้แบบเสริมกำลังนั้นต้องใช้ข้อมูล และการรวบรวมข้อมูลหุ่นยนต์มีราคาแพง งานก่อนหน้าของเราได้จัดการกับความท้าทายนี้แล้ว ประการที่สอง การฝึกอบรมต้องใช้เวลามากในการดูแลหุ่นยนต์ หากเราต้องการคนคอยติดตามหุ่นยนต์และรีเซ็ตหุ่นยนต์ด้วยตนเองทุกครั้งที่เกิดการสะดุด หลายร้อยหรือหลายพันครั้ง ต้องใช้ความพยายามอย่างมากและใช้เวลานานมากในการฝึกหุ่นยนต์ ยิ่งใช้เวลานานเท่าใด การขยายการเรียนรู้ไปยังหุ่นยนต์หลายตัวในสภาพแวดล้อมที่แตกต่างกันก็ยิ่งยากขึ้นเท่านั้น”

วันหนึ่งการวิจัยนี้สามารถช่วยสร้างหุ่นยนต์ที่คล่องตัวมากขึ้น ซึ่งสามารถปรับตัวเข้ากับภูมิประเทศที่หลากหลายได้อย่างรวดเร็วยิ่งขึ้น “การใช้งานที่เป็นไปได้มีมากมาย” ตันกล่าว อย่างไรก็ตาม Tan เน้นย้ำว่า "ยังอยู่ในช่วงเริ่มต้น และมีความท้าทายมากมายที่เรายังต้องเอาชนะ"

เพื่อให้สอดคล้องกับธีมการเรียนรู้แบบเสริมกำลัง แน่นอนว่ามันเป็นรางวัลที่คุ้มค่าที่จะเพิ่มให้สูงสุด!

คำแนะนำของบรรณาธิการ

AI เปลี่ยน Breaking Bad ให้เป็นอนิเมะ — และมันน่ากลัวมาก
ทำไม AI ถึงไม่มีวันครองโลก
เราจะรู้ได้อย่างไรว่า AI มีความรู้สึกจริง ๆ แล้ว?
สูตรตลก: ทำไมอารมณ์ขันที่สร้างโดยเครื่องจักรจึงเป็นจอกศักดิ์สิทธิ์ของ A.I.
อ่าน 'พระคัมภีร์สังเคราะห์' ที่สวยงามน่าขนลุกของ A.I. ที่คิดว่าเป็นพระเจ้า

อัพเกรดไลฟ์สไตล์ของคุณDigital Trends ช่วยให้ผู้อ่านติดตามโลกแห่งเทคโนโลยีที่เปลี่ยนแปลงไปอย่างรวดเร็วด้วยข่าวสารล่าสุด รีวิวผลิตภัณฑ์สนุกๆ บทบรรณาธิการที่เจาะลึก และการแอบดูที่ไม่ซ้ำใคร

Google Robot สอนตัวเองให้เดินในเวลาเพียงสองชั่วโมง

การเสริมแรงเชิงบวก

การสร้างหุ่นยนต์ที่ดีขึ้น

คำแนะนำของบรรณาธิการ

หมวดหมู่

ล่าสุด

9 iPhone ที่ดีที่สุดตลอดกาล

ของขวัญที่ดีที่สุด 11 อันดับสำหรับผู้ใช้ iPhone ที่คุณต้องซื้อในปีนี้

Meredith Gore นักอาชญวิทยาด้านการอนุรักษ์หยุดการลักลอบล่าสัตว์ได้อย่างไร