Nvidia presume hasta 50 veces más capacidad por megavatio con sus sistemas GB300 NVL72 Blackwell Ultra

Tech16/02/2026

Nvidia reveló nuevos datos de rendimiento que muestran que sus sistemas GB300 NVL72 con GPU Blackwell Ultra ofrecen hasta 50 veces mayor capacidad de procesamiento por megavatio y 35 veces menor costo por token frente a la plataforma Hopper anterior de la compañía en cargas de trabajo de inteligencia artificial de baja latencia. Estas mejoras colocan al nuevo hardware como una de las soluciones más competitivas para el mercado en expansión de aplicaciones de IA agéntica y asistentes de programación.

El avance se sustenta en mejoras arquitectónicas y en una optimización constante del software. De acuerdo con el blog para desarrolladores de la empresa, los Ultra Tensor Cores de Blackwell proporcionan 1.5 veces más rendimiento de cómputo que las GPU Blackwell estándar, mientras que el procesamiento de capas de atención se ha duplicado mediante la aceleración de la ejecución de softmax. Estas optimizaciones apuntan directamente a los cuellos de botella en las capas de atención de los modelos transformer, fundamentales para sistemas de razonamiento con ventanas de contexto amplias.

En paralelo, la biblioteca de inferencia TensorRT-LLM ha registrado incrementos sostenidos en desempeño durante los últimos meses. Benchmarks citados por Nvidia indican que el throughput por GPU se ha duplicado en ciertos niveles de interactividad desde octubre de 2025. La combinación de avances en hardware y software ha permitido, según la compañía, un aumento de 10 veces en tokens por segundo por usuario y una mejora de 5 veces en tokens por segundo por megavatio en comparación con Hopper, lo que se traduce en un incremento total de 50 veces en la producción de la denominada “fábrica de IA”.

“A medida que la inferencia se convierte en el centro de la producción de IA, el rendimiento con contextos largos y la eficiencia de tokens se vuelven críticos”, señaló Chen Goldberg, vicepresidenta senior de ingeniería en CoreWeave, al destacar que la arquitectura Grace Blackwell NVL72 aborda ese desafío de manera directa.

Los grandes proveedores de servicios en la nube ya han comenzado a desplegar la nueva infraestructura. CoreWeave informó que fue el primer proveedor de nube especializado en IA en implementar sistemas GB300 NVL72 en producción, integrados con su pila basada en Kubernetes. Microsoft anunció la puesta en marcha de lo que describió como el primer superclúster GB300 NVL72 a gran escala, alcanzando más de 1.1 millones de tokens por segundo en un solo rack durante pruebas validadas por Signal65. Por su parte, Oracle Cloud Infrastructure también está desplegando estos sistemas, con planes de escalar sus superclústeres a más de 100 mil GPU Blackwell para responder a la creciente demanda de inferencia.

Las reducciones de costos asociadas a la nueva plataforma podrían transformar la economía del despliegue de inteligencia artificial. Proveedores de inferencia como Baseten, DeepInfra, Fireworks AI y Together AI han reportado reducciones de hasta 10 veces en costos utilizando la plataforma Blackwell estándar. Con Blackwell Ultra, Nvidia afirma que el costo por millón de tokens puede ser hasta 35 veces menor en cargas de baja latencia, lo que facilitaría el despliegue masivo de agentes de IA y asistentes de codificación con modelos de negocio más sostenibles.

La compañía también adelantó que su próxima plataforma, Rubin, ofrecerá otra mejora de rendimiento de hasta 10 veces sobre Blackwell, reforzando la competencia en el segmento de hardware para inteligencia artificial en un mercado donde la eficiencia energética y la economía por token se han convertido en factores decisivos.

Nvidia

Te puede interesar

Lo más visto

Nvidia presume hasta 50 veces más capacidad por megavatio con sus sistemas GB300 NVL72 Blackwell Ultra

Google convierte Now Playing de los Pixel en aplicación independiente

Amazon lanza “canvas” con IA agéntica para vendedores en EE.UU. y Reino Unido

Filtración revela el “MacBook Neo”, la posible laptop económica de Apple

Microsoft demuestra almacenamiento en vidrio capaz de preservar datos por 10,000 años

iBasso lanza el DX340, su reproductor de audio digital insignia con edición limitada en titanio

Apple lanza iOS 26.4 en beta sin las esperadas mejoras de Siri impulsadas por Apple Intelligence

Escasez mundial de chips de memoria dispara precios y sacude a la industria tecnológica

Apple convoca a un “Special Apple Experience” global el 4 de marzo y anticipa una oleada de lanzamientos

ChatGPT enfrenta ola de desinstalaciones tras acuerdo de OpenAI con el Pentágono

Bitcoin rebota hacia los 70 mil dólares, pero analistas advierten que el mercado bajista sigue intacto

Amazon lanza “canvas” con IA agéntica para vendedores en EE.UU. y Reino Unido

Google convierte Now Playing de los Pixel en aplicación independiente

Google lanza Gemini 3.1 Flash-Lite, su modelo más rápido y económico para cargas masivas de IA