Google რობოტი ასწავლის საკუთარ თავს სიარული სულ რაღაც ორ საათში

გახსოვთ ის სცენა უოლტ დისნეისში? ბამბი სად სწავლობს ტიტულოვანი ყვავილი ადგომას და საკუთარი ძალის ქვეშ სიარულს? ეს არის მომხიბვლელი ვინეტი ფილმში, რომელიც აჩვენებს უნარს, რომელსაც უამრავი ცხოველი - ღორებიდან ჟირაფებამდე და, დიახ, ირმებით - იძენს დაბადებიდან რამდენიმე წუთში. სიცოცხლის პირველი რამდენიმე საათის განმავლობაში, ეს ცხოველები სწრაფად აუმჯობესებენ მოტორულ უნარებს, სანამ სრულად აკონტროლებენ საკუთარ მოძრაობას. ადამიანები, რომლებიც სწავლობენ ნივთებზე დგომას დაახლოებით შვიდი თვის შემდეგ და რომლებიც იწყებენ სიარულს 15 თვის ასაკში, შედარებით უიმედოდ დუნეები არიან.

შინაარსი

  • დადებითი გაძლიერება
  • უკეთესი რობოტების შექმნა

გამოიცანით რა უახლესი დავალება დაგვამარცხეს რობოტებმა? ახალ კვლევაში განხორციელდა Google-ის მკვლევარების მიერინჟინრებმა ოთხფეხა მინიტავრ რობოტს ასწავლეს გვერდით სიარული, ისე, რომ მას ბევრი რამის სწავლება ნამდვილად არ სჭირდება. პირიქით, მათ გამოიყენეს მიზანზე ორიენტირებული ხელოვნური ინტელექტის ტიპი ოთხფეხა რობოტის შესაქმნელად ისწავლეთ წინსვლა, უკან და სრულიად თავისით მოუხვიეთ მარცხნივ და მარჯვნივ. მან შეძლო წარმატებით ესწავლა ამის გაკეთება სამ სხვადასხვა რელიეფზე, მათ შორის ბრტყელ ადგილზე, რბილი ლეიბი და კარის ხალიჩა ნაპრალებით.

რეკომენდებული ვიდეოები

„ფეხიან რობოტებს შეიძლება ჰქონდეთ დიდი მობილურობა, რადგან ფეხები აუცილებელია ასფალტირებული გზებისა და ადამიანებისთვის განკუთვნილი ადგილებისთვის ნავიგაციისთვის“. ჯი ტანი, განუცხადა Digital Trends-ს პროექტის მთავარმა გამომძიებელმა და Google-ის მოძრაობის ხელმძღვანელმა. ”ჩვენ დაინტერესებული ვართ, რომ ფეხით რობოტებს საშუალება მივცეთ ნავიგაცია ჩვენს მრავალფეროვან და რთულ რეალურ სამყაროში, მაგრამ ძნელია ხელით დაამზადო რობოტული კონტროლერები, რომლებსაც შეუძლიათ გაუმკლავდნენ ასეთ მრავალფეროვნებას და სირთულე. ამიტომ მნიშვნელოვანია, რომ რობოტებს შეეძლოთ თავად ისწავლონ. ეს ნამუშევარი ამაღელვებელია, რადგან ეს არის ადრეული დემონსტრირება იმისა, რომ ჩვენი სისტემით, ფეხიან რობოტს შეუძლია წარმატებით ისწავლოს დამოუკიდებლად სიარული.”

დადებითი გაძლიერება

ისწავლეთ რეალურ სამყაროში სიარული ადამიანის მინიმალური ძალისხმევით

ამ კონკრეტული პროექტის სათავეში არსებული ტექნოლოგია არის ის, რასაც ღრმა გაძლიერების სწავლა ჰქვია, ა ღრმა სწავლის სპეციფიკური მიდგომა, რომელიც შთაგონებულია ბიჰევიორისტული ფსიქოლოგიით და ცდა-შეცდომით სწავლა. პროგრამული უზრუნველყოფის აგენტები სწავლობენ მოქმედებების განხორციელებას ისეთ გარემოში, რომელიც მიაღწევს ამ შედეგებს მაქსიმალურად ზუსტი, ეფექტური გზით. განმამტკიცებელი სწავლის ძალა იყო ცნობილი გახდა 2013 წელს როდესაც Google-ის DeepMind-მა გამოუშვა ნაშრომი, რომელშიც ნაჩვენები იყო, თუ როგორ ავარჯიშებდა A.I. კლასიკური Atari ვიდეო თამაშების სათამაშოდ. ეს მიღწეული იქნა სხვა ინსტრუქციის გარეშე, გარდა ეკრანზე ქულისა და დაახლოებით 30,000 პიქსელისა, რომელიც შეადგენდა ვიდეო თამაშების თითოეულ კადრს, რომელსაც ის თამაშობდა.

ვიდეო თამაშები, ან სულ მცირე სიმულაციები, ხშირად გამოიყენება რობოტების მკვლევარების მიერაც. სიმულაცია თეორიულად სრულყოფილად ლოგიკურია, რადგან ის საშუალებას აძლევს რობოტიკოსებს ავარჯიშონ თავიანთი მანქანა ვირტუალურ სამყაროში, სანამ რეალურ სამყაროში გავიდნენ. ეს იცავს რობოტებს იმ გარდაუვალი ცვეთასა და ცვეთასგან, რომელსაც ისინი განიცდიან, როდესაც ის სწავლობს კონკრეტული დავალების შესრულებას. ანალოგიურად, წარმოიდგინეთ, თუ თქვენი მართვის ყველა გაკვეთილი ჩატარდა მართვის სიმულატორის გამოყენებით. არგუმენტი შეიძლება იყოს ის, რომ თქვენ უფრო სწრაფად გაიგებდით, რადგან არ მოგიწევთ ასეთი ფრთხილი იყოთ თქვენი ფიზიკური უსაფრთხოების რისკის ქვეშ ან თქვენი მანქანის (ან სხვისი) დაზიანების შესახებ. თქვენ ასევე შეგიძლიათ უფრო სწრაფად ივარჯიშოთ ისე, რომ არ დაგჭირდეთ დაელოდოთ გამოყოფილ გაკვეთილებს ან ლიცენზირებულ მძღოლს თქვენი წაყვანა.

ამის პრობლემა ის არის, რომ, როგორც ყველამ იცის, ვინც ოდესმე ითამაშა მამოძრავებელი ვიდეო თამაში, საკმაოდ რთულია რეალური სამყაროს მოდელირება ისე, როგორც რეალურ სამყაროს. ამის ნაცვლად, Google-ის მკვლევარებმა დაიწყეს გაუმჯობესებული ალგორითმების შემუშავება, რომელიც საშუალებას აძლევს მათ რობოტს ისწავლოს უფრო სწრაფად, ნაკლები საცდელებით. Google-ის წინა კვლევის საფუძველზე გამოქვეყნდა 2018 წელსმათმა რობოტმა შეძლო სიარულის სწავლა სულ რამდენიმე საათში ამ ბოლო დემონსტრაციით.

მას ასევე შეუძლია ამის გაკეთება, ხოლო ხაზს უსვამს სწავლის უფრო ფრთხილ, უსაფრთხო მიდგომას, რაც მოიცავს ნაკლებ დაცემას. შედეგად, ის მინიმუმამდე ამცირებს ადამიანის ჩარევების რაოდენობას, რომელიც უნდა განხორციელდეს რობოტის ასაღებად და მტვრის მოსაშორებლად ყოველ ჯერზე, როცა ის წახვალ.

უკეთესი რობოტების შექმნა

ორ საათში სიარულის სწავლა შეიძლება არ იყოს სწავლის სიარულის ეფექტურობის საკმაოდ მაღალი დონე, მაგრამ ინჟინრებს არ მოუწევთ მკაფიოდ დაპროგრამონ, თუ როგორ ასწავლიან რობოტს ჩვეულებრივ მანევრირებას. (და, როგორც აღინიშნა, ეს ბევრად უკეთესია, ვიდრე ადამიანმა ახალშობილმა შეძლოს ასეთ დროს!)

„მიუხედავად იმისა, რომ მრავალი უკონტროლო სწავლის ან განმტკიცების სწავლის ალგორითმი იქნა ნაჩვენები სიმულაცია, მათი გამოყენება რეალურ, ფეხიან რობოტებზე წარმოუდგენლად რთული აღმოჩნდება“, - ტან განმარტა. „პირველ რიგში, განმამტკიცებელი სწავლა არის მონაცემების მშიერი და რობოტის მონაცემების შეგროვება ძვირია. ჩვენი წინა ნამუშევარი ამ გამოწვევას ეხებოდა. მეორეც, ტრენინგი მოითხოვს, რომ ვინმემ დიდი დრო დახარჯოს რობოტის ზედამხედველობაზე. თუ ჩვენ გვჭირდება ადამიანი, რომ რობოტს აკონტროლოს და ხელით გადააყენოს ის ყოველ ჯერზე, როცა ის დაბრკოლდება - ასობით ან ათასობით ჯერ - რობოტის მომზადებას დიდი ძალისხმევა და ძალიან დიდი დრო დასჭირდება. რაც უფრო მეტი დრო სჭირდება, მით უფრო რთულია სწავლის მასშტაბირება მრავალ რობოტზე სხვადასხვა გარემოში. ”

ერთ მშვენიერ დღეს ეს კვლევა ხელს შეუწყობს უფრო მოქნილი რობოტების შექმნას, რომლებიც უფრო სწრაფად შეძლებენ ადაპტირებას სხვადასხვა რელიეფთან. ”პოტენციური აპლიკაციები უამრავია”, - თქვა ტანმა. თუმცა, ტანმა ხაზგასმით აღნიშნა, რომ ეს „ჯერ ადრეა და არის ბევრი გამოწვევა, რომელთა გადალახვა ჯერ კიდევ გვჭირდება“.

გაძლიერების სწავლის თემის შესაბამისად, ეს ნამდვილად არის ჯილდო, რომლის მაქსიმიზაციაც ღირს!

რედაქტორების რეკომენდაციები

  • AI-მა Breaking Bad ანიმედ აქცია - და ეს საშინელებაა
  • რატომ AI არასოდეს მართავს სამყაროს
  • როგორ გავიგოთ, როდის ხდება AI რეალურად მგრძნობიარე?
  • სასაცილო ფორმულა: რატომ არის მანქანით წარმოქმნილი იუმორი A.I.-ს წმინდა გრაალი.
  • წაიკითხეთ A.I.-ის საოცრად ლამაზი "სინთეზური წერილი". რომ ფიქრობს, რომ ღმერთია

განაახლეთ თქვენი ცხოვრების წესიDigital Trends ეხმარება მკითხველს თვალყური ადევნონ ტექნოლოგიების სწრაფ სამყაროს ყველა უახლესი სიახლეებით, სახალისო პროდუქტების მიმოხილვებით, გამჭრიახი რედაქციებითა და უნიკალური თვალით.

კატეგორიები

Ბოლო

რატომ იყო Apple-ისთვის შეცდომა ყურსასმენის ჯეკის მოკვლა iPhone 7-ზე

რატომ იყო Apple-ისთვის შეცდომა ყურსასმენის ჯეკის მოკვლა iPhone 7-ზე

როგორც იწინასწარმეტყველეს, Apple-მა ახლახან ამ...