De ontwikkelaars van GT Sophy leggen uit hoe het een AI-sportief gedrag heeft geleerd

Als de eerste belangrijke publieke release van technologie van Sony AI, dat in 2020 werd opgericht, zal de komende Gran Turismo Sophy Race Together-modus voor Gran Turismo 7 zal voor veel spelers de eerste kennismaking zijn met complexe AI-technologie die een blijvende impact kan hebben op veel games van Sony Interactive Entertainment. Als de AI onbeleefd, oneerlijk en onverslaanbaar is voor veel spelers, kan GT Sophy worden gezien als het zoveelste waarschuwingssignaal dat AI nog niet klaar is voor primetime. Daarom is het een prioriteit voor de ontwikkelaars om ervoor te zorgen dat GT Sophy de juiste sportetiquette hanteert.

In de racerij moet je ervoor zorgen dat je agressief rijdt, omdat je wel wilt winnen, maar tegelijkertijd eerlijk wilt rijden.” Sony AI COO Michael Spranger vertelt Digital Trends. “Je kunt geen andere auto’s tegenkomen om een ​​voordeel te behalen en je moet ervoor zorgen dat iedereen eerlijk kan concurreren. Dat is een interessant gebied omdat deze regels nogal onnauwkeurig zijn; er is een regelboek, maar het heeft interpretatie van rechters nodig. Om dit goed te krijgen – agressief en competitief rijden versus eerlijk rijden – is een van de grote uitdagingen van GT Sophy.”

Aanbevolen video's

Sony AI, Sony Interactive Entertainment en Polyphony Digital hebben bevestigd dat spelers binnen een beperkte tijd tegen GT Sophy kunnen racen Gran Turismo 7 modus vanaf 21 februari. Om dat punt te bereiken, hebben de ontwikkelaars veel werk verricht door niet alleen de vaardigheden van GT Sophy te verfijnen via versterkend leren, maar ook de etiquette in de richting van een vage reeks op beleefdheid gebaseerde regels. Voorafgaand aan de toevoeging ervan aan Gran Turismo 7, Digital Trends sprak met Michael Spranger, COO van Sony AI en Peter Wurman, projectleider van GT Sophy, voor meer informatie hun ethische benadering van het sportieve gedrag van GT Sophy, en welke toekomstige toepassingen zij voor deze technologie zien gamen.

Het volgende interview is aangepast voor beknoptheid en duidelijkheid.

Wat maakte Gran Turismo tot de aantrekkelijkste optie om als eerste een geavanceerde AI te ontwikkelen?

Een portretfoto van Sony AI COO Michael Spranger, PhD.
Michael Spranger, PhD, COO van Sony AI

Michaël Spranger: Het was omdat het mogelijk was en omdat Gran Turismo een heel spannend spel is. Gran Turismo is vanaf het allereerste begin onderdeel van PlayStation. Het is een iconisch spel dat dit specifieke uitdagingsgebied van fysiek realisme, strategie, besluitvorming en sportetiquette biedt. Bovendien heeft het een groot publiek dat bestaat uit mensen die het spel daadwerkelijk volgen, en dat betekent dat elke technologie die we in het spel ontwikkelen een potentieel betekenisvolle impact kan hebben op miljoenen spelers. Ik hou ook van het spel. Deze dingen samen zorgden ervoor dat we Gran Turismo kozen als een van de eerste doelen voor gaming-AI-projecten.

Hoe zorgt versterkend leren ervoor dat deze AI meer risico's kan nemen of indrukwekkender kan rijden dan je standaard game-AI? Probeert het gewoon de meest precieze racelijn te rijden?

Peter Wurman: Er zijn verschillende vaardigheidsniveaus. De basislijn is sneller rijden op het circuit, dus versterkend leren werkt door de AI-agent te laten onderzoeken welk effect zijn acties op de wereld hebben en vervolgens te proberen de beloning ervan te maximaliseren. Door hem positieve signalen te geven om sneller op de baan te gaan, leert hij heel snel over de baan te rijden. Hij leert het gaspedaal in te trappen en in bochten te komen, zodat hij niet crasht, wat uitstekend werkt om hem te trainen voor een tijdritscenario.

Om er daadwerkelijk een competitieve racermoesten we hem andere beloningssignalen geven voor het passeren van auto's die ervoor rijden en niet voorkomen dat auto's erachter hem zouden passeren. We gaven hem ook straffen voor het botsen of botsen tegen andere auto's. Het kostte wat moeite om deze combinatie van beloningen en straffen goed te krijgen, maar toen we eenmaal met de juiste populatie tegenstanders hadden getraind, leerde het een zeer effectieve racer te zijn.

Een portretfoto van Peter Wurman, projectleider en directeur van Sony AI America, GT Sophy.
Peter Wurman, PhD, directeur van Sony AI America en projectleider van GT Sophy

Wat waren de grootste lessen uit de eerste paar Race Together-evenementen die je met top organiseerde? Gran Turismo Sport spelers?

Peter Wurman: Als je het project hebt gevolgd, weet je dat er twee races waren. De eerste hebben we goed gedaan, maar we hebben de teamscore niet gewonnen. Enkele van de interessante dingen die we daarvan hebben geleerd, hadden te maken met het vinden van de balans tussen assertiviteit en een goede sport zijn. We kwamen er twee weken van tevoren achter dat de agent die we hadden getraind te agressief was en niet mocht racen, dus moesten we dingen door elkaar gooien en aanpassen. Je kunt niet één AI-agent hebben die echt goed is in snel rijden en een andere die nadenkt over de tactische aspecten van het passeren; in plaats daarvan moesten we ze samenbrengen in één coherente agent die beide tegelijkertijd deed. Dat zijn de dingen die we zagen na de Race juli 2021, dus we voelden ons veel zelfverzekerder toen we de Race oktober 2021.

Michaël Spranger: Er was iets waarbij ons werd verteld dat het te agressief was, maar op de eerste oefenracedag verloren we de race eigenlijk omdat we niet agressief genoeg en timide waren. Het probleem van hoe je die dingen in evenwicht brengt, werd tijdens de ontwikkeling van het project heel duidelijk.

Een herhaling van een Gran Turismo Sophy Race Together-wedstrijd in Gran Turismo 7.

Welke wijzigingen moesten er in GT Sophy worden aangebracht toen u besloot het toe te voegen? Gran Turismo 7 en niet alleen trainen in een testomgeving?

Peter Wurman: Het grootste is dat GT Sophy bij alle tentoonstellingen op een aparte computer draaide en via een netwerkverbinding met de PlayStation-console sprak. Hier is GT Sophy ingebed in het spel. Het was een beetje technisch werk om het op een PlayStation te laten werken met de bronnen die voor ons beschikbaar waren na al het renderen en andere dingen die er aan de hand waren.

Het andere is dat Polyphony Digital echt wilde dat de agent een buitengewoon goed voorbeeld zou zijn van racestijl en racevaardigheid. We hebben wat veranderingen doorgevoerd om GT Sophy te stimuleren meer binnen de lijnen te blijven. Als je een van de tentoonstellingen hebt bekeken, zul je zien dat hij heel goed was in het benutten van de hele baan, waarbij hij soms twee banden in het gras zette. Dat is legaal, maar niet precies wat je in een echte raceauto zou kunnen doen. We hebben enkele wijzigingen aangebracht om GT Sophy meer tussen de lijnen te houden. Het is nog steeds erg snel, maar een beetje schoner.

We zijn vooral gefocust op het naleven van de regels van sportiviteit in de autoraces.

Wat zijn de belangrijkste dingen die het Sony AI-team hoopt te leren door Gran Turismo Sophy Race Together toe te voegen Gran Turismo 7?

Peter Wurman: De belangrijkste is dat we hopen dat mensen het leuk vinden om ertegen te spelen, het gevoel krijgen dat ze op alle vaardigheidsniveaus echt worden uitgedaagd en leren om beter gesimuleerde coureurs te worden.

Michaël Spranger: We willen ook zien hoe mensen omgaan met de technologie. Op dit moment is het een handvol mensen die de technologie hebben ervaren, dus we zijn benieuwd hoe mensen deze gaan gebruiken om voor zichzelf te leren, nieuwe vaardigheden op te doen en nieuwe ervaringen op te doen. Ik denk dat dit in veel opzichten de kern van het project is. We hebben een technologische doorbraak bereikt, en ik denk dat dat heel belangrijk is, maar ik denk dat we een gloednieuw podium voor mensen en in Gran Turismo ontgrendelen. In veel opzichten heeft de ingebouwde AI een vrij smalle prestatieband, en die kun je overtreffen als je op elke moeilijkheidsgraad een tussenliggende coureur wordt.

Zelfs met de relatief weinige baanautocombinaties die we hier hebben onthuld, kan iedereen, van wat ik kan doen tot wat sommige van de topspelers kunnen doen, een heel interessante match vinden. We hopen daar meer van te zien en te zien hoe mensen daarvan leren. Het is voor sommige spelers ook erg moeilijk om goede tegenstanders te vinden, en voor het eerst is dat ook mogelijk herhaalde interacties met een waardige tegenstander zonder dat je al je vrienden hoeft op te roepen en ze allemaal te laten komen samen. Het wordt iets waarbij mensen veel vooruitgang kunnen boeken om beter te worden in het spel, omdat ze tot op zekere hoogte deze op maat gemaakte ervaringen kunnen hebben.

Een first-person perspectief van een Gran Turismo Sophy Race Together-race in Gran Turismo 7.

Wat de ethische kant van de zaak betreft: kunt u uitleggen hoe wordt bepaald wat sportief gedrag is voor GT Sophy, zodat bepaalde spelers niet worden lastiggevallen?

Peter Wurman: Goed, het kan niet met je praten, dus er zijn veel slechte dingen die GT Sophy niet kan doen, omdat dat geen deel uitmaakt van het spel. We zijn vooral gefocust op het naleven van de regels van sportiviteit in de autoraces; nou, die zijn behoorlijk vaag. Je kunt een legitieme kans op passeren en dat soort dingen niet blokkeren. Er zitten een heleboel vage woorden in deze regels die moeilijk te coderen en te programmeren waren, dus we moesten het benaderen met beloningssignalen en straffen als het bijvoorbeeld tegen een andere auto botste.

Vervolgens moesten we het aan Polyphony Digital en testrijders geven en hen feedback laten geven tijdens het racen tegen andere AI-agenten laat ons niet echt zien of het klaar is om te racen tegen de verscheidenheid aan menselijke races stijlen. Het kostte wat moeite en iteratie om dat goed te krijgen.

Michaël Spranger: Voor deze release denk ik dat het eerlijk is om te zeggen dat deze competitief is. Het zal proberen spelers in te halen, maar het zal ze niet bombarderen. Het is competitief maar beleefd. Het legt zeker druk op je; je zult het in de achteruitkijkspiegels zien die je proberen in te halen. Tegelijkertijd zal het proberen je wat ruimte te geven, zodat je competitief maar eerlijk kunt racen.

Peter Wurman: Maar als je er een puinhoop van maakt, profiteert het ervan.

Michaël Spranger: Dat klopt, meteen!

Het race-optiemenu van Gran Tursimo Sophy Race Together in Gran Turismo 7.

Waar zie jij GT Sophy en AI-technologie in Sony-games de komende vijf jaar evolueren?

Michaël Spranger: Uiteraard kunnen we niets specifieks aankondigen, maar over het algemeen zijn er meerdere lagen aan verbonden. Er zijn nog steeds uitdagingen en dingen die we binnen Gran Turismo kunnen doen om nieuwe ervaringen te ontgrendelen, en ik denk niet dat we daarmee klaar zijn. Er is echte opwinding over het verder brengen van de technologie. Vanuit het Sony AI-perspectief van zakelijke R&D en strategische initiatieven zijn we erg enthousiast over wat deze technologie voor gaming in het algemeen kan betekenen.

Andere games zullen ons een andere uitdaging bieden die we moeten overwinnen en zullen de mogelijkheden van de technologie vergroten. Het is een opkomende technologie die in het verleden enkele successen heeft geboekt, maar ik denk wel dat wat we hier doen heel verschillend is in de Ik heb het gevoel dat we de wetenschappelijke doorbraken doen, maar we zetten het ook in en zorgen ervoor dat mensen de AI in handen krijgen technologie. Dat zal de technologie vooruit helpen en grotere ervaringen mogelijk maken.

Interactie vormt de kern van PlayStation, het is geen fout dat het Sony Interactive Entertainment heet. Het gaat echt om wat jouw interactie is met de dingen die je in de game aantreft, en ik denk dat dit ook zo is technologie heeft het potentieel om de volgende generatie games echt te ontgrendelen, en daar zijn we erg enthousiast over Dat.

Aanbevelingen van de redactie

  • CES 2023: Gran Turismo 7 komt als lanceringsgame naar PS VR2
  • Gran Turismo 7 wijzigt de kredietuitbetalingen na een reactie
  • Gran Turismo 7 beschikt over een museum voor liefhebbers van autogeschiedenis