GT Sophy-utvecklare förklarar hur det lärde en AI-sportslig uppförande

Som den första betydande offentliga utgåvan av teknik från Sony AI, som bildades 2020, det kommande Gran Turismo Sophy Race Together-läget för Gran Turismo 7 kommer att vara många spelares första exponering för komplex AI-teknik som kan ha en bestående inverkan på många av Sony Interactive Entertainments spel. Som sådan, om AI: n är oförskämd, orättvis och oslagbar för många spelare, kan GT Sophy ses som ännu ett varningstecken på att AI inte är redo för primetime ännu. Det är därför det är en prioritet för utvecklarna att säkerställa att GT Sophy har korrekt sportetikett.

I racing måste du se till att du kör aggressivt eftersom du vill vinna, men samtidigt vill du köra rättvist.” Sony AI COO Michael Spranger säger till Digital Trends. "Du kan inte stöta på andra bilar för att få en fördel och måste se till att alla kan konkurrera rättvist. Det är ett intressant område eftersom dessa regler är ganska oprecisa; det finns en regelbok, men den behöver tolkas av domarna. Att få det här rätt – att köra aggressivt och konkurrenskraftigt kontra att köra rättvist – är en av GT Sophys stora utmaningar.”

Rekommenderade videor

Sony AI, Sony Interactive Entertainment och Polyphony Digital har bekräftat att spelare kommer att kunna köra GT Sophy under en begränsad tid Gran Turismo 7 läge med start den 21 februari. För att komma till den punkten gjorde dess utvecklare mycket arbete med att förfina inte bara GT Sophys skicklighet via förstärkningsinlärning utan också dess etikett mot en otydlig uppsättning artighetsdrivna regler. Inför dess tillägg till Gran Turismo 7, Digital Trends pratade med Sony AI COO Michael Spranger och GT Sophys projektledare Peter Wurman för att lära sig mer om deras etiska förhållningssätt till GT Sophys sportsliga uppförande, och vilka framtida användningar de ser för denna teknik i spelande.

Följande intervju har redigerats för korthet och tydlighet.

Vad gjorde Gran Turismo till det mest tilltalande alternativet att först utveckla en avancerad AI?

Ett headshot av Sony AI COO Michael Spranger, PhD.
Michael Spranger, PhD, COO för Sony AI

Michael Spranger: Det var för att det var möjligt och för att Gran Turismo är ett riktigt spännande spel. Gran Turismo har varit en del av PlayStation från allra första början. Det är ett ikoniskt spel som ger detta specifika utmaningsområde av fysisk realism, strategi, beslutsfattande och sportetikett. Dessutom har det en stor publik av människor som faktiskt följer spelet, och det betyder att all teknik vi utvecklar i spelet kan ha en potentiellt meningsfull inverkan på miljontals spelare. Jag älskar också spelet. Dessa saker tillsammans gjorde att vi valde Gran Turismo som ett av de första målen för spel AI-projekt.

Hur gör förstärkningsinlärning det möjligt för denna AI att ta fler risker eller köra mer imponerande än din vanliga spel-AI? Är det bara att försöka köra den mest exakta racinglinjen?

Peter Wurman: Det finns olika nivåer av skicklighet. Baslinjen kör snabbare på banan, så förstärkningsinlärning fungerar genom att låta AI-agenten utforska vilken effekt dess handlingar har på världen och sedan försöka maximera sin belöning. Genom att ge den positiva signaler för att gå snabbare på banan lär den sig att köra runt banan väldigt fort. Den lär sig att trycka på gaspedalen och bryta in i kurvor så att den inte kraschar, vilket fungerar utmärkt för att träna den för ett tidstestscenario.

Att faktiskt göra det till en tävlingsförare, vi var tvungna att ge den andra belöningssignaler för att passera bilar som står framför den och inte hindrade bilar bakom från att passera den. Vi gav den också straff för att krocka eller stöta på andra bilar. Denna kombination av belöningar och straffar tog lite ansträngning för att komma rätt, men när vi väl tränade med rätt motståndarpopulation lärde den sig att bli en mycket effektiv racer.

En bild av GT Sophys projektledare och direktör för Sony AI America Peter Wurman.
Peter Wurman, PhD, direktör för Sony AI America och projektledare på GT Sophy

Vilka var de största lärdomarna från de första Race Together-evenemangen som du höll med topp Gran Turismo Sport spelare?

Peter Wurman: Om du har följt projektet vet du att det fanns två lopp. Den första gjorde vi bra in, men vi vann inte lagets poäng. Några av de intressanta sakerna vi lärde oss från det hade att göra med att hitta balansen mellan självsäkerhet och att vara en bra sport. Vi fick reda på två veckor i förväg att agenten vi hade tränat var för aggressiv och inte skulle tillåtas tävla, så vi var tvungna att klättra och justera saker. Du kan inte ha en AI-agent som var riktigt bra på att köra snabbt och en annan som tänkte på de taktiska aspekterna av passningar; istället var vi tvungna att införliva dem tillsammans till en sammanhängande agent som gjorde båda samtidigt. Det är de saker vi såg efter Juli 2021 lopp, så vi kände oss mycket mer självsäkra när vi gick in i oktober 2021 race.

Michael Spranger: Det var den här grejen där vi fick höra att den var för aggressiv, men sedan på den första utställningstävlingsdagen förlorade vi faktiskt loppet för att vi inte var tillräckligt aggressiva och blyga. Problemet med hur man balanserar dessa saker var verkligen uppenbart under utvecklingen av projektet.

En repris av en Gran Turismo Sophy Race Together-match i Gran Turismo 7.

Vilka ändringar behövde göras i GT Sophy när du tog beslutet att lägga till den Gran Turismo 7 och inte bara träna det i en testmiljö?

Peter Wurman: Den största är att i alla utställningar körde GT Sophy på en separat dator och pratade via en nätverksanslutning till PlayStation-konsolen. Här är GT Sophy inbäddad i spelet. Att få det att fungera på en PlayStation med de resurser som var tillgängliga för oss efter all rendering och andra saker som pågår var lite tekniskt arbete.

Den andra saken är att Polyphony Digital verkligen ville att agenten skulle vara ett extremt bra exempel på racingstil och racingskicklighet. Vi har gjort några ändringar för att uppmuntra GT Sophy att hålla sig inom gränserna mer. Om du har tittat på någon av utställningarna kommer du att se att den var riktigt bra på att använda hela banan, ibland att sätta två däck i gräset. Det är lagligt, men inte precis vad du kan göra i en riktig racerbil. Vi gjorde några ändringar för att hålla GT Sophy mellan raderna mer. Det är fortfarande väldigt snabbt men lite renare.

Vi är mestadels fokuserade på att försöka följa reglerna för sportsmannaanda inom bilracing.

Vilka är de viktigaste sakerna som Sony AI-teamet hoppas kunna lära sig av att lägga till Gran Turismo Sophy Race Together till Gran Turismo 7?

Peter Wurman: Den viktigaste är att vi hoppas att folk tycker om att spela mot det, känner att de verkligen är utmanade på alla nivåer av skicklighet och lär sig att bli bättre simulerade racerbilsförare.

Michael Spranger: Vi vill också se hur människor interagerar med tekniken. Just nu är det en handfull människor som har upplevt tekniken, så vi är nyfikna på att se hur människor kommer att använda detta för att lära sig själva, få nya färdigheter och få nya erfarenheter. Jag tror att det är kärnan i projektet på många sätt. Vi har det tekniska genombrottet, och jag tror att det är väldigt viktigt, men jag tror att vi låser upp en helt ny scen för människor och i Gran Turismo. På många sätt har den inbyggda AI ett ganska smalt prestandaband, och du kan överträffa det när du väl blir en mellanförare för varje svårighetsgrad.

Även med de relativt få band-bilkombinationer som vi presenterade här, från vad jag kan göra till vad några av toppspelarna kan göra, kan alla hitta en riktigt intressant match. Vi hoppas få se mer av det och se hur folk lär sig av det. Det är också väldigt svårt för vissa spelare att hitta bra motståndare, och för första gången kan du ha det upprepade interaktioner med en värdig motståndare utan att behöva ringa upp alla dina vänner och få dem alla att komma tillsammans. Det kommer att bli något där människor kan göra stora framsteg i att bli bättre i spelet eftersom de kan ha dessa skräddarsydda upplevelser till viss del.

Ett förstapersonsperspektiv på ett Gran Turismo Sophy Race Together-lopp i Gran Turismo 7.

På den etiska sidan av saker och ting, kan du förklara processen för att avgöra vad som är sportsligt uppförande för GT Sophy så att det inte trakasserar vissa spelare?

Peter Wurman: Väl, den kan inte prata med dig, så det finns många dåliga saker som GT Sophy inte kan göra eftersom det inte är en del av spelet. Vi är mestadels fokuserade på att försöka följa reglerna för sportmanship inom bilracing; nu är de ganska otydliga. Du kan inte blockera ett legitimt passerande tillfälle och sådana saker. Det finns ett gäng suddiga ord i dessa regler som var svåra att koda och programmera, så vi var tvungna att approximera det med belöningssignaler och straff om det gjorde saker som att stöta på en annan bil.

Sedan var vi tvungna att ge den till Polyphony Digital och testförare och låta dem ge oss feedback eftersom racing mot andra AI-agenter visar oss inte riktigt om det är redo att tävla mot mångfalden av mänsklig racing stilar. Det tog lite ansträngning och upprepning för att få det rätt.

Michael Spranger: För den här utgåvan tycker jag att det är rättvist att säga att den är konkurrenskraftig. Det kommer att försöka ta över spelare, men det kommer inte att bomba dem. Det är konkurrenskraftigt men artigt. Det sätter definitivt press på dig; du kommer att se den i backspeglarna när du försöker köra om dig. Samtidigt kommer det att försöka ge dig lite utrymme så att du kan tävla konkurrenskraftigt men rättvist.

Peter Wurman: Men om du gör en röra, kommer det att dra fördel.

Michael Spranger: Det stämmer, direkt!

Gran Tursimo Sophy Race Together-läges tävlingsmeny i Gran Turismo 7.

Var ser du GT Sophy och AI-teknik i Sony-spel gå under de kommande fem åren?

Michael Spranger: Uppenbarligen kan vi inte meddela något specifikt, men i allmänhet finns det flera lager i det. Det finns fortfarande utmaningar och saker vi kan göra inom Gran Turismo för att låsa upp nya upplevelser, och jag tror inte att vi är klara med det. Det finns en verklig spänning över att driva tekniken ytterligare. Sedan, ur Sony AI-perspektivet av företagens FoU och strategiska initiativ, är vi verkligen exalterade över vad den här tekniken kan tillföra spel i allmänhet.

Andra spel kommer att ge oss en annan utmaning att övervinna och kommer att främja teknikens möjligheter. Det är en framväxande teknik som har haft några framgångar tidigare, men jag tror att det vi gör här är ganska distinkt i känner att vi gör de vetenskapliga genombrotten men sedan distribuerar vi det också och ser till att människor får tag på AI: n teknologi. Det kommer att driva tekniken framåt och låsa upp större upplevelser.

Interaktion är kärnan i PlayStation, det är inte ett misstag att det kallas Sony Interactive Entertainment. Det handlar egentligen om hur din interaktion med de saker du hittar i spelet är, och jag känner att detta Tekniken har potential att verkligen låsa upp nästa generations spel, och det är vi verkligen glada över den där.

Redaktörens rekommendationer

  • CES 2023: Gran Turismo 7 kommer till PS VR2 som ett lanseringsspel
  • Gran Turismo 7 för att ändra kreditutbetalningar efter bakslag
  • Gran Turismo 7 har ett museum för bilhistoriafantaster