Гоогле робот се научи ходати за само два сата

Сећате ли се оне сцене у Волту Дизнију Бамби где титуларни лане учи да устане и хода под својом снагом? То је шармантна вињета у филму, која показује вештину коју многе бебе животиња - од свиња преко жирафе до, да, јелена - стекну у року од неколико минута након њиховог рођења. Током првих неколико сати живота, ове животиње брзо усавршавају своје моторичке вештине док не остваре потпуну контролу над сопственом локомоцијом. Људи, који науче да стоје држећи се за ствари са око седам месеци и који почињу да ходају са 15 месеци, у поређењу са њима су безнадежно спори.

Садржај

  • Позитивно појачање
  • Прављење бољих робота

Погодите који је најновији задатак у којем су нас роботи победили? У новој студији спровели истраживачи у Гуглу, инжењери су научили четвороножног Минитаур робота да пролази поред, па, не морају да га много уче. Уместо тога, користили су врсту вештачке интелигенције оријентисане ка циљу да направе четвороножног робота научите како да ходате напред, уназад, и скрени лево и десно потпуно самостално. Био је у стању да се успешно научи да то ради на три различита терена, укључујући равно тло, мекани душек и отирач са пукотинама.

Препоручени видео снимци

„Роботи са ногама могу имати велику мобилност јер су ноге неопходне за навигацију неасфалтираним путевима и местима дизајнираним за људе,“ Јие Тан, главни истраживач на пројекту и Гоогле-ов шеф за локомоцију, рекао је за Дигитал Трендс. „Заинтересовани смо да омогућимо роботима са ногама да се крећу кроз наше разнолико и сложено окружење у стварном свету, али је тешко ручно конструисати роботске контролере који могу да поднесу такву разноликост и сложеност. Зато је важно да роботи могу сами да уче. Овај рад је узбудљив јер је ово рана демонстрација да, са нашим системом, робот са ногама може успешно да научи да самостално хода.

Позитивно појачање

Учење ходања у стварном свету уз минималан људски напор

Технологија у корену овог конкретног пројекта је нешто што се зове учење са дубоким појачањем, а специфичан приступ дубоком учењу који је инспирисан бихевиористичком психологијом и покушајима и грешкама учење. Речено им да максимизирају одређену награду, софтверски агенти уче да предузимају радње у окружењу које ће постићи те резултате на најпрецизнији и ефикаснији могући начин. Моћ учења са поткрепљењем била је чувено демонстрирано 2013 када је Гоогле-ов ДеепМинд објавио рад који показује како је обучавао АИ. да играте класичне Атари видео игре. Ово је постигнуто без икаквих инструкција осим резултата на екрану и приближно 30.000 пиксела који су чинили сваки кадар видео игрица које је играо.

Видео игре, или барем симулације, често користе и истраживачи роботике. Симулација има савршеног смисла у теорији, јер омогућава роботичарима да тренирају своју машину у виртуелном свету пре него што изађу у стварни. То спашава роботе од неизбежних застоја и хабања којима ће се подвргнути док учи да обавља одређени задатак. Као аналогију, замислите да сте све ваше часове вожње изводили помоћу симулатора вожње. Могло би се изнети аргумент да бисте брже научили јер не бисте морали да будете толико опрезни да ризикујете своју физичку безбедност или оштетите свој аутомобил (или нечији други). Такође бисте могли да тренирате брже без потребе да чекате додељене лекције или да лиценцирани возач буде спреман да вас изведе.

Проблем са овим је у томе што је, као што ће свако ко је икада играо видео игрицу за вожњу, знати, прилично је тешко моделирати стварни свет на начин који изгледа као, па, стварни свет. Уместо тога, Гоогле-ови истраживачи су почели да развијају побољшане алгоритме који омогућавају њиховом роботу да учи брже са мање укључених суђења. Надовезујући се на претходни део Гоогле истраживања објављено 2018, њихов робот је успео да научи да хода за само неколико сати у овој најновијој демонстрацији.

Такође је у стању да то уради док наглашава опрезнији, сигурнији приступ учењу, који укључује мање падова. Као резултат тога, минимизира број људских интервенција које је потребно извршити да би се робот подигао и обрисао прашину сваки пут када се преврне.

Прављење бољих робота

Научити да ходате за два сата можда није баш јеленски ниво ефикасности учења за ходање, али је далеко од тога да инжењери морају експлицитно да програмирају како се робот обично учи да маневрира. (И, као што је наведено, много је боље него што људска беба могу да управљају у таквом временском оквиру!)

„Иако су многи алгоритми учења без надзора или учења са поткрепљењем демонстрирани у симулација, њихова примена на стварне роботе са ногама показује се невероватно тешком,” Тан објаснио. „Прво, учење са појачањем је гладно података, а прикупљање података о роботима је скупо. Наш претходни рад се бавио овим изазовом. Друго, обука захтева да неко проведе много времена надгледајући робота. Ако нам је потребна особа да надгледа робота и ручно га ресетује сваки пут када се спотакне — стотине или хиљаде пута — биће потребно много труда и много времена да се робот обучи. Што је дуже потребно, теже је проширити учење на многе роботе у много различитих окружења."

Једног дана ово истраживање би могло помоћи у стварању агилнијих робота који су брже способни да се прилагоде различитим теренима. „Потенцијалне апликације су бројне“, рекао је Тан. Међутим, Тан је нагласио да су ово „још увек рани дани и да има много изазова које тек треба да превазиђемо“.

У складу са темом учења поткрепљења, то је свакако награда коју вреди максимизирати!

Препоруке уредника

  • АИ је претворио Бреакинг Бад у аниме - и то је застрашујуће
  • Зашто АИ никада неће владати светом
  • Како ћемо знати када АИ заправо постаје свестан?
  • Смешна формула: Зашто је хумор генерисан машинама свети грал А.И.
  • Прочитајте сабласно лепе „синтетичке списе“ АИ. који мисли да је то Бог

Надоградите свој животни стилДигитални трендови помажу читаоцима да прате убрзани свет технологије са свим најновијим вестима, забавним рецензијама производа, проницљивим уводницима и јединственим кратким прегледима.