Роботът на Google се научава да ходи само за два часа

Спомняте ли си онази сцена от Уолт Дисни Бамби където титулярното еленче се научава да се изправя и да ходи със собствена сила? Това е очарователна винетка във филма, демонстрираща умение, което множество малки животни – от прасета през жираф до, да, елени – придобиват в рамките на минути след раждането си. През първите няколко часа от живота си тези животни бързо усъвършенстват двигателните си умения, докато придобият пълен контрол над собственото си движение. Хората, които се научават да стоят и се държат за нещата на около седем месеца и които започват да ходят на 15 месеца, са безнадеждно мудни в сравнение с тях.

Съдържание

Позитивна подкрепа
Изграждане на по-добри роботи

Познайте коя е последната задача, в която роботите са ни победили? В ново проучване извършено от изследователи в Google, инженерите са научили четириногия робот Минитавър да минава, без да се налага да го учат много. По-скоро те са използвали вид целенасочен изкуствен интелект, за да направят четириног робот научете как да вървите напред

, назад и се завърта наляво и надясно изцяло сам. То успя успешно да се научи да прави това на три различни терена, включително равна земя, мек матрак и изтривалка с пукнатини.

Препоръчани видеоклипове

„Роботите с крака могат да имат голяма мобилност, защото краката са от съществено значение за придвижване по неасфалтирани пътища и места, предназначени за хора,“ Джи Тан, главен изследовател на проекта и ръководител на усилията за придвижване на Google, каза пред Digital Trends. „Интересуваме се да позволим на роботи с крака да навигират в нашите разнообразни и сложни среди от реалния свят, но е трудно ръчно да се проектират роботизирани контролери, които могат да се справят с такова разнообразие и сложност. Затова е важно роботите да могат да се учат сами. Тази работа е вълнуваща, защото това е ранна демонстрация, че с нашата система един крак робот може успешно да се научи да ходи сам.

Позитивна подкрепа

Да се научим да ходим в реалния свят с минимални човешки усилия

Технологията в основата на този конкретен проект е нещо, наречено обучение с дълбоко укрепване, a специфичен подход към задълбочено обучение, вдъхновен от бихейвиористична психология и проба-грешка изучаване на. Казано да максимизират определена награда, софтуерните агенти се научават да предприемат действия в среда, която ще постигне тези резултати по възможно най-точния и ефективен начин. Силата на обучението за засилване беше известно демонстрирано през 2013 г когато DeepMind на Google публикува документ, показващ как е обучил A.I. да играете класически видеоигри Atari. Това беше постигнато без инструкции, различни от резултата на екрана и приблизително 30 000 пиксела, които съставляват всеки кадър от видеоигрите, които играе.

Видеоигрите или поне симулациите често се използват и от изследователите на роботиката. Симулацията има идеален смисъл на теория, тъй като позволява на роботиците да обучават машината си във виртуален свят, преди да излязат в реалния. Това спестява роботите от неизбежните провали и износване, на които биха претърпели, докато се научават да изпълняват конкретна задача. Като аналогия, представете си, че всичките ви уроци по шофиране са проведени с помощта на симулатор за шофиране. Аргументът може да бъде направен, че ще научите по-бързо, защото няма да е нужно да бъдете толкова предпазливи, за да рискувате физическата си безопасност или да повредите колата си (или тази на някой друг). Можете също така да тренирате по-бързо, без да се налага да чакате разпределените уроци или лицензиран шофьор да пожелае да ви изведе.

Проблемът с това е, че всеки, който някога е играл видео игра за шофиране, ще знае, че е адски трудно да се моделира реалният свят по начин, който да се чувства като, добре, реалния свят. Вместо това изследователите на Google започнаха да разработват подобрени алгоритми, които позволяват на техния робот да учи по-бързо с по-малко опити. Надграждане на предишно изследване на Google публикувана през 2018 г, техният робот успя да се научи да ходи само за няколко часа в тази последна демонстрация.

Също така е в състояние да направи това, като същевременно набляга на по-предпазлив, по-безопасен подход към ученето, включващ по-малко падания. В резултат на това минимизира броя на човешките намеси, които трябва да бъдат направени, за да вдигнат робота и да го почистят от праха всеки път, когато се претърпи.

Изграждане на по-добри роботи

Да се научиш да ходиш за два часа може и да не е много еленско ниво на ефективност на обучението за ходене, но е много далеч от инженерите, които трябва изрично да програмират как един робот обикновено се учи да маневрира. (И както беше отбелязано, това е много по-добре, отколкото човешките бебета могат да се справят в този вид времева рамка!)

„Въпреки че много неконтролирани алгоритми за учене или учене с подсилване са демонстрирани в симулация, прилагането им върху истински краки роботи се оказва невероятно трудно,” Тан обясни. „Първо, обучението с подсилване е гладно за данни и събирането на данни от роботи е скъпо. Предишната ни работа се справи с това предизвикателство. Второ, обучението изисква някой да отделя много време за наблюдение на робота. Ако се нуждаем от човек, който да наблюдава робота и да го нулира ръчно всеки път, когато се спъне - стотици или хиляди пъти - това ще отнеме много усилия и много дълго време, за да обучим робота. Колкото повече време отнема, толкова по-трудно е да се разшири обучението до много роботи в много различни среди.“

Един ден това изследване може да помогне за създаването на по-гъвкави роботи, които могат по-бързо да се адаптират към различни терени. „Потенциалните приложения са многобройни“, каза Тан. Тан обаче подчерта, че това е „все още рано и има много предизвикателства, които все още трябва да преодолеем“.

В съответствие с темата за обучение за засилване, това със сигурност е награда, която си струва да се увеличи максимално!

Препоръки на редакторите

AI превърна Breaking Bad в аниме – и то е ужасяващо
Защо AI никога няма да управлява света
Как ще разберем кога изкуственият интелект наистина ще стане разумен?
Забавната формула: Защо машинно генерираният хумор е свещеният граал на ИИ
Прочетете зловещо красивото „синтетично писание“ на A.I. който мисли, че е Бог

Надградете начина си на животDigital Trends помага на читателите да следят забързания свят на технологиите с всички най-нови новини, забавни ревюта на продукти, проницателни редакционни статии и единствени по рода си кратки погледи.

Роботът на Google се научава да ходи само за два часа

Позитивна подкрепа

Изграждане на по-добри роботи

Препоръки на редакторите

Категории

Скорошни

Историята на Hasselblad е това, което движи бъдещето му

Digital Trends интервюира оператора на "Wilfred" Брадфорд Липсън

Клавиристът на OAR Микел Парис говори за соло работа, техн