La supercomputadora de Nvidia puede traer una nueva era de ChatGPT

El CEO de Nvidia mostrando la computadora Grace Hopper de la compañía.
nvidia

Nvidia acaba de anunciar una nueva supercomputadora que puede cambiar el futuro de la IA. El DGX GH200, equipado con casi 500 veces más memoria que los sistemas con los que estamos familiarizados ahora, pronto caerá en manos de Google, Meta y Microsoft.

¿La meta? Revolucionando IA generativa, sistemas de recomendación y procesamiento de datos a una escala nunca antes vista. ¿Son modelos de lenguaje como GPT se beneficiará y qué significará eso para los usuarios habituales?

Vídeos recomendados

Describir la DGX GH200 de Nvidia requiere el uso de términos con los que la mayoría de los usuarios nunca tienen que lidiar. “Exaflop”, por ejemplo, porque la supercomputadora proporciona 1 exaflop de rendimiento y 144 terabytes de memoria compartida. Nvidia señala que esto significa casi 500 veces más memoria que en un solo sistema Nvidia DGX A100.

Relacionado

  • El fabricante de ChatGPT, OpenAI, enfrenta una investigación de la FTC sobre las leyes de protección al consumidor
  • El tráfico del sitio web de ChatGPT ha caído por primera vez
  • El rival ChatGPT de Apple puede escribir código automáticamente para usted

Volvamos a la cifra de 1 exaflop y dividámosla un poco. Un exaflop equivale a un quintillón de operaciones de coma flotante por segundo (FLOP). A modo de comparación, Nvidia RTX 4090 puede alcanzar alrededor de 100 teraflops (TFLOP) cuando se hace overclocking. Un TFLOP equivale a un billón de operaciones de punto flotante por segundo. La diferencia es asombrosa, pero por supuesto, la RTX 4090 no es una GPU de centro de datos. El DGX GH200, por otro lado, integra una cantidad sustancial de estas GPU de alto rendimiento que no pertenecen ni cerca de una PC de consumo.

Superchip Grace Hopper de Nvidia.
nvidia

La computadora funciona con los superchips GH200 Grace Hopper de Nvidia. Hay 256 de ellos en total, que, gracias a la tecnología de interconexión NVLink de Nvidia, pueden trabajar juntos como un sistema unificado, creando esencialmente una GPU masiva.

Los superchips GH200 utilizados aquí tampoco necesitan una conexión PCIe tradicional entre la CPU y la GPU. Nvidia dice que ya están equipados con un Nvidia Grace CP U basado en ARM, así como con una GPU H100 Tensor Core. Nvidia también tiene algunas interconexiones de chips elegantes, esta vez usando el NVLink-C2C. Como resultado, el ancho de banda entre el procesador y el tarjeta grafica se dice que ha mejorado significativamente (hasta 7 veces) y es más eficiente energéticamente (hasta 5 veces).

Empaquetar más de 200 de estos chips en una sola potencia de una supercomputadora es lo suficientemente impresionante, pero se vuelve aún mejor cuando considera que, anteriormente, solo se podían unir ocho GPU con NVLink a la vez tiempo. Un salto de ocho a 256 chips ciertamente le da a Nvidia algunos derechos de fanfarronear.

Es difícil no imaginar que el DGX GH200 podría impulsar mejoras en Bard, ChatGPT y Bing Chat.

Ahora bien, ¿dónde terminará la DGX GH200 y qué puede ofrecer al mundo? Nvidia está construyendo su propia Supercomputadora Helios como un medio para avanzar en su investigación y desarrollo de IA. Abarcará cuatro sistemas DGX GH200, todos interconectados con Quantum-2 InfiniBand de Nvidia. Se espera que entre en línea a finales de año.

Nvidia también está compartiendo su nuevo desarrollo con el mundo, comenzando con Google Cloud, Meta y Microsoft. El propósito es muy similar: explorar cargas de trabajo generativas de IA.

Cuando se trata de Google y Microsoft, es difícil no imaginar que la DGX GH200 podría impulsar mejoras en Bardo, ChatGPT, y Chat de Bing.

El director ejecutivo de Nvidia muestra la computadora Hopper de la compañía.
nvidia

La importante potencia computacional proporcionada por un solo sistema DGX GH200 lo hace ideal para avanzar en el entrenamiento de modelos de lenguaje sofisticados. Es difícil decir qué podría significar eso exactamente sin el comentario de una de las partes interesadas, pero podemos especular un poco.

Más poder significa modelos más grandes, lo que significa texto más matizado y preciso y una gama más amplia de datos para entrenarlos. Podríamos ver una mejor comprensión cultural, más conocimiento del contexto y una mayor coherencia. Los chatbots de IA especializados también podrían comenzar a aparecer, reemplazando aún más a los humanos en campos como la tecnología.

¿Deberíamos preocuparnos por el posible desplazamiento laboral o deberíamos estar entusiasmados con los avances que podrían traer estas supercomputadoras? La respuesta no es sencilla. Una cosa es segura: el DGX GH200 de Nvidia podría cambiar las cosas en el mundo de la IA, y Nvidia acaba de amplió su liderazgo en IA sobre AMD una vez más.

Recomendaciones de los editores

  • Google Bard ahora puede hablar, pero ¿puede ahogar a ChatGPT?
  • El crecimiento récord de ChatGPT acaba de ser destronado por una nueva aplicación viral
  • El 81% piensa que ChatGPT es un riesgo de seguridad, según una encuesta
  • Este navegador web integra ChatGPT de una forma nueva y fascinante
  • GPT-4: cómo usar el chatbot de IA que avergüenza a ChatGPT

Mejora tu estilo de vidaDigital Trends ayuda a los lectores a mantenerse al tanto del vertiginoso mundo de la tecnología con las últimas noticias, reseñas divertidas de productos, editoriales perspicaces y adelantos únicos.