Nvidia har nettopp annonsert en ny superdatamaskin som kan endre fremtiden til AI. DGX GH200, utstyrt med nesten 500 ganger mer minne enn systemene vi er kjent med nå, vil snart falle i hendene på Google, Meta og Microsoft.
Målet? Revolusjonerende generativ AI, anbefalingssystemer og databehandling i en skala vi aldri har sett før. Er språkmodeller som GPT kommer til nytte, og hva vil det bety for vanlige brukere?
Anbefalte videoer
Å beskrive Nvidias DGX GH200 krever bruk av termer de fleste brukere aldri trenger å forholde seg til. "Exaflop", for eksempel fordi superdatamaskinen gir 1 exaflop ytelse og 144 terabyte med delt minne. Nvidia bemerker at dette betyr nesten 500 ganger mer minne enn i et enkelt Nvidia DGX A100-system.
I slekt
- ChatGPT-produsenten OpenAI står overfor FTC-undersøkelse over forbrukerbeskyttelseslover
- ChatGPT-nettstedstrafikken har falt for første gang
- Apples ChatGPT-rival kan automatisk skrive kode for deg
La oss sirkle tilbake til 1 exaflop-figuren og bryte den litt ned. En exaflop tilsvarer en kvintillion flytende kommaoperasjoner per sekund (FLOPs). Til sammenligning, Nvidias
RTX 4090 kan treffe rundt 100 teraflops (TFLOPs) når den overklokkes. En TFLOP tilsvarer én trillion flyttalloperasjoner per sekund. Forskjellen er svimlende, men selvfølgelig RTX 4090 er ikke en datasenter GPU. DGX GH200, på den annen side, integrerer et betydelig antall av disse høyytelses GPUene som ikke hører hjemme i nærheten av en forbruker-PC.Datamaskinen drives av Nvidias GH200 Grace Hopper superchips. Det er totalt 256 av dem, som, takket være Nvidias NVLink-sammenkoblingsteknologi, alle er i stand til å fungere sammen som et enhetlig system, og i hovedsak skaper en massiv GPU.
GH200-superchippene som brukes her trenger heller ikke en tradisjonell PCIe-forbindelse mellom CPU og GPU. Nvidia sier at de allerede er utstyrt med en ARM-basert Nvidia Grace CP, U samt en H100 Tensor Core GPU. Nvidia har noen fancy chip-forbindelser på gang her også, denne gangen ved hjelp av NVLink-C2C. Som et resultat vil båndbredden mellom prosessoren og grafikkort sies å være betydelig forbedret (opptil 7 ganger) og mer strømeffektiv (opptil 5 ganger).
Det er imponerende nok å pakke over 200 av disse brikkene i en enkelt kraftpakke til en superdatamaskin, men det blir enda bedre når du tenker på at tidligere kun åtte GPUer kunne kobles sammen med NVLink på en tid. Et sprang fra åtte til 256 sjetonger gir absolutt Nvidia noen skryterettigheter.
Det er vanskelig å ikke forestille seg at DGX GH200 kan gi forbedringer i Bard, ChatGPT og Bing Chat.
Nå, hvor vil DGX GH200 ende opp og hva kan den tilby til verden? Nvidia bygger sin egen Helios Supercomputer som et middel til å fremme sin AI-forskning og -utvikling. Den vil omfatte fire DGX GH200-systemer, alle sammenkoblet med Nvidias Quantum-2 InfiniBand. Den forventer at den kommer på nettet innen utgangen av året.
Nvidia deler også sin nye utvikling med verden, og starter med Google Cloud, Meta og Microsoft. Hensikten er omtrent det samme - å utforske generative AI-arbeidsbelastninger.
Når det gjelder Google og Microsoft, er det vanskelig å ikke forestille seg at DGX GH200 kan forbedre forbedringer i Bard, ChatGPT, og Bing Chat.
Den betydelige beregningskraften som tilbys av et enkelt DGX GH200-system, gjør det godt egnet til å fremme opplæringen av sofistikerte språkmodeller. Det er vanskelig å si nøyaktig hva det kan bety uten kommentarer fra en av interessentene, men vi kan spekulere litt.
Mer kraft betyr større modeller, noe som betyr mer nyansert og nøyaktig tekst og et bredere spekter av data som de kan trenes på. Vi kan kanskje se bedre kulturell forståelse, mer kunnskap om kontekst og større sammenheng. Spesialiserte AI-chatbots kan også begynne å dukke opp, og erstatte mennesker ytterligere på områder som teknologi.
Bør vi være bekymret for potensiell forskyvning av jobb, eller bør vi være begeistret over fremskritt disse superdatamaskinene kan gi? Svaret er ikke enkelt. En ting er sikkert - Nvidias DGX GH200 kan riste opp i AI-verdenen, og Nvidia har nettopp videreførte sin AI-ledelse over AMD nok en gang.
Redaktørenes anbefalinger
- Google Bard kan nå snakke, men kan det overdøve ChatGPT?
- ChatGPTs rekordvekst ble nettopp detronisert av en ny viral app
- 81 % mener ChatGPT er en sikkerhetsrisiko, viser undersøkelsen
- Denne nettleseren integrerer ChatGPT på en fascinerende ny måte
- GPT-4: hvordan bruke AI-chatboten som gjør ChatGPT til skamme
Oppgrader livsstilen dinDigitale trender hjelper leserne å følge med på den fartsfylte teknologiverdenen med alle de siste nyhetene, morsomme produktanmeldelser, innsiktsfulle redaksjoner og unike sniktitter.