Nvidia ha appena annunciato un nuovo supercomputer che potrebbe cambiare il futuro dell'IA. Il DGX GH200, dotato di quasi 500 volte più memoria rispetto ai sistemi che conosciamo ora, cadrà presto nelle mani di Google, Meta e Microsoft.
L'obiettivo? Rivoluzionando IA generativa, sistemi di raccomandazione ed elaborazione dei dati su una scala mai vista prima. I modelli linguistici sono come GPT ne trarranno beneficio e cosa significherà per gli utenti regolari?
Video consigliati
Descrivere il DGX GH200 di Nvidia richiede l'uso di termini con cui la maggior parte degli utenti non ha mai a che fare. "Exaflop", ad esempio, perché il supercomputer fornisce 1 exaflop di prestazioni e 144 terabyte di memoria condivisa. Nvidia osserva che ciò significa quasi 500 volte più memoria rispetto a un singolo sistema Nvidia DGX A100.
Imparentato
- Il produttore di ChatGPT OpenAI affronta un'indagine FTC sulle leggi sulla protezione dei consumatori
- Il traffico del sito Web ChatGPT è diminuito per la prima volta
- Il rivale ChatGPT di Apple potrebbe scrivere automaticamente il codice per te
Torniamo alla cifra di 1 exaflop e scomponiamola un po'. Un exaflop equivale a un quintilione di operazioni in virgola mobile al secondo (FLOP). Per confronto, Nvidia RTX 4090 può raggiungere circa 100 teraflop (TFLOP) se overcloccato. Un TFLOP equivale a mille miliardi di operazioni in virgola mobile al secondo. La differenza è sbalorditiva, ma ovviamente il RTX 4090 non è una GPU per data center. Il DGX GH200, d'altra parte, integra un numero considerevole di queste GPU ad alte prestazioni che non appartengono a nessun PC consumer.
Il computer è alimentato dai superchip GH200 Grace Hopper di Nvidia. Ce ne sono 256 in totale, che, grazie alla tecnologia di interconnessione NVLink di Nvidia, sono tutti in grado di lavorare insieme come un sistema unificato, creando essenzialmente un'enorme GPU.
Anche i superchip GH200 utilizzati qui non necessitano di una tradizionale connessione PCIe tra CPU e GPU. Nvidia afferma di essere già equipaggiato con un Nvidia Grace CP, U basato su ARM e una GPU Tensor Core H100. Nvidia ha anche delle fantastiche interconnessioni di chip in corso qui, questa volta utilizzando NVLink-C2C. Di conseguenza, la larghezza di banda tra il processore e il scheda grafica si dice che sia notevolmente migliorato (fino a 7 volte) e più efficiente dal punto di vista energetico (fino a 5 volte).
Imballare oltre 200 di questi chip in una singola centrale elettrica di un supercomputer è abbastanza impressionante, ma lo è migliora ulteriormente se si considera che, in precedenza, solo otto GPU potevano essere unite con NVLink alla volta tempo. Un balzo da otto a 256 chip dà sicuramente a Nvidia alcuni diritti di vantarsi.
È difficile non immaginare che DGX GH200 possa potenziare miglioramenti in Bard, ChatGPT e Bing Chat.
Ora, dove andrà a finire il DGX GH200 e cosa può offrire al mondo? Nvidia sta costruendo il proprio supercomputer Helios come mezzo per far progredire la ricerca e lo sviluppo dell'IA. Comprenderà quattro sistemi DGX GH200, tutti interconnessi con Quantum-2 InfiniBand di Nvidia. Si aspetta che sia online entro la fine dell'anno.
Nvidia condivide anche il suo nuovo sviluppo con il mondo, a partire da Google Cloud, Meta e Microsoft. Lo scopo è più o meno lo stesso: esplorare i carichi di lavoro dell'IA generativa.
Quando si tratta di Google e Microsoft, è difficile non immaginare che il DGX GH200 potrebbe apportare miglioramenti in Bardo, ChatGPT, E Chat di Bing.
La significativa potenza computazionale fornita da un singolo sistema DGX GH200 lo rende adatto a far progredire l'addestramento di sofisticati modelli linguistici. È difficile dire cosa possa significare esattamente senza il commento di una delle parti interessate, ma possiamo speculare un po'.
Più potenza significa modelli più grandi, il che significa testo più sfumato e accurato e una gamma più ampia di dati su cui addestrarli. Potremmo vedere una migliore comprensione culturale, una maggiore conoscenza del contesto e una maggiore coerenza. Potrebbero anche iniziare a spuntare chatbot AI specializzati, sostituendo ulteriormente gli esseri umani in campi come la tecnologia.
Dovremmo essere preoccupati per il potenziale trasferimento di posti di lavoro o dovremmo essere entusiasti dei progressi che questi supercomputer potrebbero portare? La risposta non è semplice. Una cosa è certa: il DGX GH200 di Nvidia potrebbe scuotere le cose nel mondo dell'IA, e Nvidia ha appena ha rafforzato ancora una volta il vantaggio dell'IA su AMD.
Raccomandazioni della redazione
- Google Bard ora può parlare, ma può soffocare ChatGPT?
- La crescita record di ChatGPT è stata appena detronizzata da una nuova app virale
- L'81% pensa che ChatGPT sia un rischio per la sicurezza, rileva il sondaggio
- Questo browser web integra ChatGPT in un modo nuovo e affascinante
- GPT-4: come utilizzare il chatbot AI che fa vergognare ChatGPT
Aggiorna il tuo stile di vitaDigital Trends aiuta i lettori a tenere d'occhio il frenetico mondo della tecnologia con tutte le ultime notizie, recensioni divertenti sui prodotti, editoriali penetranti e anticipazioni uniche.