Google Robot lærer sig selv at gå på kun to timer

Kan du huske den scene i Walt Disney's Bambi hvor den titulære fawn lærer at rejse sig og gå af egen kraft? Det er en charmerende vignet i filmen, der viser en færdighed, som masser af babydyr - fra grise til giraffer til, ja, hjorte - opfanger få minutter efter deres fødsel. I løbet af de første par timer af livet forfiner disse dyr hurtigt deres motoriske færdigheder, indtil de har fuld kontrol over deres egen bevægelse. Mennesker, der lærer at stå og holde på ting ved omkring syv måneder, og som begynder at gå ved 15 måneder, er håbløst træge til sammenligning.

Indhold

  • Positiv forstærkning
  • Byg bedre robotter

Gæt hvad den seneste opgave, robotter har slået os på? I en ny undersøgelse udført af forskere hos Google, ingeniører har lært en firbenet Minitaur-robot at gå forbi, ja, egentlig ikke at skulle lære den meget overhovedet. Tværtimod har de brugt en slags målorienteret kunstig intelligens til at lave en firbenet robot lære at gå fremad, baglæns, og drej til venstre og højre helt på egen hånd. Det var i stand til med succes at lære sig selv at gøre dette på tre forskellige terræner, inklusive flad jord, en blød madras og en dørmåtte med sprækker.

Anbefalede videoer

"Roboter med ben kan have stor mobilitet, fordi ben er afgørende for at navigere på uasfalterede veje og steder designet til mennesker," Jie Tan, principiel efterforsker på projektet og Googles leder af bevægelsesindsats, fortalte Digital Trends. "Vi er interesserede i at sætte robotter med ben til at navigere i vores forskellige og komplekse miljøer i den virkelige verden, men det er svært manuelt at konstruere robotcontrollere, der kan håndtere en sådan mangfoldighed og kompleksitet. Derfor er det vigtigt, at robotter kan lære af sig selv. Dette arbejde er spændende, fordi dette er en tidlig demonstration af, at med vores system kan en robot med ben med succes lære at gå på egen hånd."

Positiv forstærkning

Lær at gå i den virkelige verden med minimal menneskelig indsats

Teknologien i roden af ​​dette særlige projekt er noget, der kaldes deep reinforcement learning, en specifik tilgang til dyb læring, der er inspireret af behavioristisk psykologi og forsøg og fejl læring. Bedt om at maksimere en vis belønning, lærer softwareagenter at tage handlinger i et miljø, der vil opnå disse resultater på den mest præcise og effektive måde som muligt. Kraften i forstærkende læring var berømt demonstreret i 2013 da Googles DeepMind udgav et papir, der viste, hvordan det havde trænet en A.I. at spille klassiske Atari videospil. Dette blev opnået uden anden instruktion end scoren på skærmen og de cirka 30.000 pixels, der udgjorde hver frame af de videospil, den spillede.

Videospil, eller i det mindste simuleringer, bruges også ofte af robotforskere. En simulering giver perfekt mening i teorien, da den giver robotister mulighed for at træne deres maskine i en virtuel verden, før de går ud i den rigtige. Det sparer robotter fra de uundgåelige pratfalls og slid, som de ville gennemgå, når de lærer at udføre en bestemt opgave. Som en analogi, forestil dig, hvis alle dine køretimer blev udført ved hjælp af en køresimulator. Argumentet kunne fremføres, at du ville lære hurtigere, fordi du ikke skulle være så forsigtig med at risikere din fysiske sikkerhed eller beskadige din bil (eller en andens). Du kan også træne hurtigere uden at skulle vente på tildelte lektioner eller på, at en autoriseret chauffør er villig til at tage dig med ud.

Problemet med dette er, at som enhver, der nogensinde har spillet et kørende videospil, ved, er det temmelig svært at modellere den virkelige verden på en måde, der føles som, ja, den virkelige verden. I stedet begyndte Googles forskere at udvikle forbedrede algoritmer, der gør det muligt for deres robot at lære hurtigere med færre forsøg involveret. Bygger på et tidligere stykke Google-forskning udgivet i 2018, var deres robot i stand til at lære at gå på blot et par timer i denne seneste demonstration.

Det er også i stand til at gøre dette, mens det understreger en mere forsigtig og sikker tilgang til læring, der involverer færre fald. Som et resultat minimerer det antallet af menneskelige indgreb, der skal foretages for at samle robotten op og støve den af, hver gang den vælter.

Byg bedre robotter

At lære at gå på to timer er måske ikke helt hjorteniveauer for effektivitet i at lære at gå, men det er langt fra, at ingeniører skal eksplicit programmere, hvordan en robot normalt læres at manøvrere. (Og som nævnt er det meget bedre end menneskelige spædbørn kan klare sig inden for den slags tidsramme!)

"Selvom mange uovervågede lærings- eller forstærkende læringsalgoritmer er blevet demonstreret i simulering, at anvende dem på rigtige robotter med ben viser sig at være utroligt svært,” Tan forklaret. "For det første er forstærkningslæring datahungrende, og det er dyrt at indsamle robotdata. Vores tidligere arbejde har adresseret denne udfordring. For det andet kræver træning, at nogen bruger meget tid på at overvåge robotten. Hvis vi har brug for en person til at overvåge robotten og manuelt nulstille den, hver gang den snubler - hundredvis eller tusindvis af gange - vil det tage en stor indsats og meget lang tid at træne robotten. Jo længere tid det tager, jo sværere er det at skalere læringen op til mange robotter i mange forskellige miljøer.”

En dag kunne denne forskning hjælpe med at skabe mere agile robotter, der hurtigere er i stand til at tilpasse sig en række forskellige terræner. "De potentielle applikationer er talrige," sagde Tan. Tan understregede dog, at dette "stadig er tidlige dage, og der er mange udfordringer, som vi stadig mangler at overvinde."

I overensstemmelse med forstærkningslæringstemaet er det bestemt en belønning, der dog er værd at maksimere!

Redaktørens anbefalinger

  • AI forvandlede Breaking Bad til en anime - og det er skræmmende
  • Hvorfor AI aldrig vil regere verden
  • Hvordan ved vi, hvornår en AI rent faktisk bliver sansende?
  • Den sjove formel: Hvorfor maskingenereret humor er den hellige gral for A.I.
  • Læs det uhyggeligt smukke 'syntetiske skrift' af en A.I. der tror, ​​det er Gud

Opgrader din livsstilDigital Trends hjælper læserne med at holde styr på den hurtige teknologiske verden med alle de seneste nyheder, sjove produktanmeldelser, indsigtsfulde redaktionelle artikler og enestående smugkig.