DeepMind ხდება არარეალური ახალი, სწრაფი სწავლის AI აგენტით

DeepMind - განმტკიცების სწავლა უკონტროლო დამხმარე ამოცანებით

Google-ის DeepMind-მა გამოუშვა ნაშრომი ამ კვირაში ე.წ განმამტკიცებელი სწავლა უკონტროლო დამხმარე ამოცანებით, რომელიც აღწერს ხელოვნური ინტელექტის სწავლის სიჩქარის გაზრდის მეთოდს და აგენტების — ან ბოტების საბოლოო ეფექტურობას. ეს მეთოდი მოიცავს ორი ძირითადი დამატებითი ამოცანის დამატებას, რომელიც უნდა შესრულდეს AI ვარჯიშის დროს და ეფუძნება სტანდარტულ სიღრმეს გაძლიერების სწავლის საფუძველი, რომელიც ძირითადად არის საცდელი და შეცდომის ჯილდო/დაჯილდოების მეთოდი, სადაც AI სწავლობს მისგან შეცდომები.

პირველი დამატებული ამოცანა ხელოვნური ინტელექტის სწავლის დასაჩქარებლად არის იმის გაგება, თუ როგორ აკონტროლოთ პიქსელები ეკრანზე. DeepMind-ის თანახმად, ეს მეთოდი ჰგავს იმას, თუ როგორ სწავლობს ბავშვი ხელების კონტროლს მათი მოძრაობით და ამ მოძრაობების ყურებით. ხელოვნური ინტელექტის შემთხვევაში, ბოტი გაიგებს ვიზუალურ შეყვანას პიქსელების კონტროლით, რაც გამოიწვევს უკეთეს ქულებს.

რეკომენდებული ვიდეოები

„განიხილეთ ბავშვი, რომელიც სწავლობს წითელი ფერის კუმულაციური რაოდენობის მაქსიმიზაციას, რომელსაც აკვირდება. ოპტიმალური მნიშვნელობის სწორად პროგნოზირებისთვის, ბავშვმა უნდა გაიგოს, როგორ გაზარდოს „სიწითლე“ სხვადასხვა გზით, მათ შორის მანიპულირებით (წითელი საგნის თვალებთან მიახლოება); მოძრაობა (წითელი ობიექტის წინ მოძრაობა); და კომუნიკაცია (ტირილი, სანამ მშობლები წითელ საგანს არ მოიტანენ),” ნათქვამია DeepMind-ის ნაშრომში. ”ეს ქცევები, სავარაუდოდ, განმეორდება მრავალი სხვა მიზნისთვის, რომელსაც ბავშვი შემდგომში შეიძლება წააწყდეს.”

დაკავშირებული

ეს ბოტი გაანადგურებს თქვენ Pictionary-ში. ეს ასევე დიდი ეტაპია A.I-სთვის.
Google-ის DeepMind ავარჯიშებს Waymo-ს თვითმართველ მანქანებს, როგორიცაა StarCraft II ბოტები
Google-მა იპოვა A.I. ქარის ენერგიის სარგებლიანობის გაზრდის მიზნით

მეორე დამატებული დავალება გამოიყენება ხელოვნური ინტელექტის მოსამზადებლად, რათა წინასწარ განსაზღვროს, თუ რა იქნება უშუალო ჯილდოები წინა ქმედებების მოკლე ისტორიაზე დაყრდნობით. ამის გასააქტიურებლად გუნდმა მოგვაწოდა წინა დაჯილდოების და არადაჯილდოების ისტორიების თანაბარი რაოდენობა. საბოლოო შედეგი ის არის, რომ AI-ს შეუძლია აღმოაჩინოს ვიზუალური მახასიათებლები, რომლებიც, სავარაუდოდ, უფრო სწრაფად გამოიწვევს ჯილდოებს, ვიდრე ადრე.

„უფრო ეფექტური სწავლისთვის, ჩვენი აგენტები იყენებენ გამოცდილების გამეორების მექანიზმს კრიტიკოსებისთვის დამატებითი განახლებების უზრუნველსაყოფად. როგორც ცხოველები უფრო ხშირად ოცნებობენ პოზიტიურად ან უარყოფითად დაჯილდოვებულ მოვლენებზე, ჩვენი აგენტები უპირატესად იმეორებენ ჯილდოს მოვლენებს შემცველ თანმიმდევრობებს“, - დასძენს ნაშრომი.

წინა A3C აგენტს დაემატა ეს ორი დამხმარე დავალება, შედეგად მიღებული ახალი აგენტი/ბოტი ეფუძნება იმას, რასაც გუნდი უწოდებს არარეალურს (გაუმტარებელი გაძლიერება და დამხმარე სწავლება). გუნდმა ვირტუალურად დაჯდა ეს ბოტი 57 Atari თამაშის წინ და ცალკე ვოლფენშტეინილაბირინთის მსგავსი თამაში, რომელიც შედგება 13 დონისგან. ყველა სცენარში, ბოტს მიენიჭა დაუმუშავებელი RGB გამომავალი სურათი, რაც უზრუნველყოფს პიქსელებზე პირდაპირ წვდომას 100 პროცენტიანი სიზუსტით. Unreal ბოტი დაჯილდოვდა მთელს დავალებისთვის ისეთი ამოცანებისთვის, როგორიცაა უცხოპლანეტელების ჩამოგდება კოსმოსური დამპყრობლები ვაშლის დაჭერა 3D ლაბირინთში.

იმის გამო, რომ Unreal ბოტს შეუძლია გააკონტროლოს პიქსელები და იწინასწარმეტყველოს, გამოიღებს თუ არა ქმედებები ჯილდოს, მას შეუძლია ისწავლოს 10-ჯერ უფრო სწრაფად, ვიდრე DeepMind-ის წინა საუკეთესო აგენტი (A3C). უფრო მეტიც, ის აწარმოებს უკეთეს შესრულებას, ვიდრე წინა ჩემპიონი.

„ახლა ჩვენ შეგვიძლია მივაღწიოთ ექსპერტი ადამიანთა მუშაობის 87 პროცენტს, რომელიც საშუალოდ არის განხილული ლაბირინთის დონეზე, ზოგიერთ მათგანზე სუპერადამიანური ეფექტურობით“, - აცხადებენ კომპანიაში. "Atari-ზე აგენტი ახლა საშუალოდ 9-ჯერ აღწევს ადამიანის ეფექტურობას."

DeepMind იმედისმომცემია რომ მუშაობა, რომელიც შევიდა Unreal ბოტში, საშუალებას მისცემს გუნდს გააფართოვოს ყველა მისი აგენტი/ბოტი, რათა გაუმკლავდეს კიდევ უფრო რთულ გარემოს უახლოეს მომავალში. მანამდე კი, იხილეთ ზემოთ ჩაშენებული ვიდეო, სადაც ჩანს, რომ ხელოვნური ინტელექტი მოძრაობს ლაბირინთებში და იტაცებს ვაშლებს თავისით ადამიანის ჩარევის გარეშე.

რედაქტორების რეკომენდაციები

ჭადრაკი. საფრთხე. წადი. რატომ ვიყენებთ თამაშებს, როგორც ეტალონს A.I.-სთვის?
გადახედეთ A.I.-ს აღზევებას: რამდენად შორს წავიდა ხელოვნური ინტელექტი 2010 წლის შემდეგ?
Google-ის DeepMind A.I. ამარცხებს ადამიანთა მოწინააღმდეგეებს Quake III-ში Capture the Flag

განაახლეთ თქვენი ცხოვრების წესიDigital Trends ეხმარება მკითხველს თვალყური ადევნონ ტექნოლოგიების სწრაფ სამყაროს ყველა უახლესი სიახლეებით, სახალისო პროდუქტების მიმოხილვებით, გამჭრიახი რედაქციებითა და უნიკალური თვალით.

DeepMind ხდება არარეალური ახალი, სწრაფი სწავლის AI აგენტით

რედაქტორების რეკომენდაციები

კატეგორიები

Ბოლო

Windows 10 Build 14291-ს მოაქვს გაფართოებები Edge-ზე

Dyaqua-ს უხილავი მზის პანელები გაშვებულია Indiegogo-ზე

Airbus ეძებს დრონებს თვითმფრინავების შემოწმების პროცესის გასაუმჯობესებლად