Robot Google uczy się chodzić w zaledwie dwie godziny

Czy pamiętasz tę scenę z Walta Disneya? Bambi gdzie tytułowy jelonek uczy się wstawać i chodzić o własnych siłach? To urocza winieta w filmie ukazująca umiejętności, które wiele młodych zwierząt – od świń, przez żyrafy, po, tak, jelenie – nabywa w ciągu kilku minut od urodzenia. W ciągu pierwszych kilku godzin życia zwierzęta te szybko doskonalą swoje zdolności motoryczne, aż do uzyskania pełnej kontroli nad własnym ruchem. Ludzie, którzy uczą się stać, trzymając się przedmiotów w wieku około siedmiu miesięcy i zaczynają chodzić w wieku 15 miesięcy, są w porównaniu z nimi beznadziejnie powolni.

Zawartość

  • Pozytywne wzmocnienie
  • Budowanie lepszych robotów

Zgadnijcie, w jakim ostatnim zadaniu pokonały nas roboty? W nowym badaniu przeprowadzili naukowcy z Googleinżynierowie nauczyli chodzić czworonożnego robota Minitaura, cóż, wcale nie musieli go uczyć zbyt wiele. Zamiast tego wykorzystali rodzaj sztucznej inteligencji zorientowanej na cel, aby stworzyć czworonożnego robota naucz się iść do przodu

, do tyłu i samodzielnie skręcać w lewo i w prawo. Był w stanie z powodzeniem nauczyć się tego na trzech różnych terenach, w tym na płaskim terenie, miękkim materacu i wycieraczce ze szczelinami.

Polecane filmy

„Roboty z nogami mogą charakteryzować się dużą mobilnością, ponieważ są niezbędne do poruszania się po nieutwardzonych drogach i miejscach przeznaczonych dla ludzi” Jie Tan, główny badacz projektu i szef działu lokomocji w Google, powiedział Digital Trends. „Jesteśmy zainteresowani umożliwieniem robotom nożnym poruszania się po naszych różnorodnych i złożonych środowiskach świata rzeczywistego, jednak trudno jest ręcznie zaprojektować sterowniki robotyczne, które poradzą sobie z taką różnorodnością złożoność. Dlatego ważne jest, aby roboty mogły uczyć się same. Ta praca jest ekscytująca, ponieważ stanowi wczesną demonstrację, że dzięki naszemu systemowi robot z nogami może z powodzeniem nauczyć się samodzielnie chodzić”.

Pozytywne wzmocnienie

Nauka chodzenia w prawdziwym świecie przy minimalnym wysiłku człowieka

Technologia leżąca u podstaw tego konkretnego projektu to coś, co nazywa się głębokim uczeniem się przez wzmacnianie, a specyficzne podejście do głębokiego uczenia się, inspirowane psychologią behawiorystyczną oraz próbami i błędami uczenie się. Powiedziano mu, aby zmaksymalizował określoną nagrodę, agenci oprogramowania uczą się podejmować działania w środowisku, które pozwoli osiągnąć te wyniki w możliwie najbardziej precyzyjny i efektywny sposób. Siła uczenia się przez wzmacnianie była co zademonstrowano w 2013 r kiedy firma Google DeepMind opublikowała artykuł pokazujący, w jaki sposób wyszkoliła sztuczną inteligencję. do grania w klasyczne gry wideo Atari. Osiągnięto to bez żadnych instrukcji poza wynikiem na ekranie i około 30 000 pikseli tworzących każdą klatkę granych gier wideo.

Gry wideo, a przynajmniej symulacje, są często wykorzystywane przez badaczy robotyki. Symulacja ma sens w teorii, ponieważ pozwala robotykom przeszkolić swoją maszynę w świecie wirtualnym, zanim przejdą do świata rzeczywistego. Chroni to roboty przed nieuniknionymi upadkami i zużyciem, którym ulegają, gdy uczą się wykonywać określone zadanie. Dla analogii wyobraź sobie, że wszystkie Twoje lekcje jazdy odbywały się przy użyciu symulatora jazdy. Można postawić argument, że uczyłbyś się szybciej, ponieważ nie musiałbyś być tak ostrożny, ryzykując swoje bezpieczeństwo fizyczne lub uszkodzenie samochodu (lub cudzego). Możesz także trenować szybciej, bez konieczności czekania na przydzielone lekcje lub na licencjonowanego kierowcę, który będzie chciał Cię zabrać.

Problem w tym, że – jak wie każdy, kto kiedykolwiek grał w grę samochodową – cholernie trudno jest modelować prawdziwy świat w sposób, który będzie przypominał, cóż, prawdziwy świat. Zamiast tego badacze Google zaczęli opracowywać ulepszone algorytmy, które umożliwiają ich robotowi szybsze uczenie się przy mniejszej liczbie prób. Opiera się na wynikach wcześniejszych badań Google opublikowany w 2018 rokupodczas najnowszej demonstracji ich robot nauczył się chodzić w ciągu zaledwie kilku godzin.

Może to również zrobić, kładąc nacisk na bardziej ostrożne i bezpieczniejsze podejście do nauki, obejmujące mniej upadków. W rezultacie minimalizuje liczbę interwencji człowieka, które należy wykonać, aby podnieść robota i odkurzyć go po każdym upadku.

Budowanie lepszych robotów

Nauka chodzenia w dwie godziny może nie jest aż tak rewelacyjna pod względem efektywności nauki chodzenia, ale daleko jej do sytuacji, w której inżynierowie musieliby wyraźnie programować sposób, w jaki robot zwykle uczy się manewrować. (I jak zauważono, jest to o wiele lepsze, niż ludzkie niemowlęta są w stanie wytrzymać w takim przedziale czasowym!)

„Chociaż zademonstrowano wiele algorytmów uczenia się bez nadzoru lub uczenia się przez wzmacnianie symulacji, zastosowanie ich na prawdziwych robotach na nogach okazuje się niezwykle trudne” – Tan wyjaśnione. „Po pierwsze, uczenie się przez wzmacnianie wymaga dużej ilości danych, a gromadzenie danych przez roboty jest kosztowne. Nasza poprzednia praca była odpowiedzią na to wyzwanie. Po drugie, szkolenie wymaga, aby ktoś spędził dużo czasu na nadzorowaniu robota. Jeśli potrzebujemy osoby do monitorowania robota i ręcznego resetowania go za każdym razem, gdy się potknie – setki lub tysiące razy – wyszkolenie robota będzie wymagało dużo wysiłku i bardzo dużo czasu. Im dłużej to trwa, tym trudniej jest zwiększyć skalę uczenia się dla wielu robotów w wielu różnych środowiskach”.

Pewnego dnia badania te mogą pomóc w stworzeniu bardziej zwinnych robotów, które będą w stanie szybciej przystosować się do różnych terenów. „Potencjalnych zastosowań jest wiele” – powiedział Tan. Tan podkreślił jednak, że „jest to jeszcze początek rozwoju i istnieje wiele wyzwań, które musimy jeszcze pokonać”.

Jednak zgodnie z motywem uczenia się przez wzmacnianie jest to z pewnością nagroda, którą warto maksymalnie wykorzystać!

Zalecenia redaktorów

  • Sztuczna inteligencja zamieniła Breaking Bad w anime – i to jest przerażające
  • Dlaczego sztuczna inteligencja nigdy nie będzie rządzić światem
  • Skąd będziemy wiedzieć, kiedy sztuczna inteligencja faktycznie stanie się świadoma?
  • Zabawna formuła: dlaczego humor generowany maszynowo jest świętym Graalem sztucznej inteligencji?
  • Przeczytaj niesamowicie piękne „syntetyczne pismo” AI. który myśli, że jest Bogiem

Ulepsz swój styl życiaDigital Trends pomaga czytelnikom śledzić szybko rozwijający się świat technologii dzięki najnowszym wiadomościom, zabawnym recenzjom produktów, wnikliwym artykułom redakcyjnym i jedynym w swoim rodzaju zajawkom.