NVIDIA mostra infraestrutura do Rubin Ultra: até 600.000 Watts por rack

Durante a GTC 2025, a NVIDIA apresentou mais detalhes sobre sua futura geração de infraestrutura de inteligência artificial de alto desempenho: o Rubin Ultra e o sistema de racks NVL576 Kyber.

Prevista para chegar ao mercado a partir de 2027, essa tecnologia pretende trazer um salto significativo na capacidade computacional, com servidores que podem consumir até 600 kW por rack.

A empresa já havia introduzido a linha Blackwell B200, que pode demandar cerca de 120 kW por rack. Com a evolução para o Vera Rubin, em 2026, e posteriormente para o Rubin Ultra, a expectativa é de um aumento exponencial na eficiência e na densidade de processamento dos servidores.

Segundo Jensen Huang, CEO da NVIDIA, os DataCenters do futuro poderão exigir MegaWatts por rack para atender às demandas crescentes da IA generativa e do aprendizado profundo.

A nova arquitetura Rubin Ultra e a infraestrutura Kyber

O Rubin Ultra será baseado na nova arquitetura da NVIDIA e trará inovações como o NVL576 Kyber, um sistema de racks projetado para suportar a altíssima demanda de energia e resfriamento desses servidores.

O sistema contará com quatro “pods” por rack, cada um equipado com 18 blades. Cada blade poderá conter oito GPUs Rubin Ultra e duas CPUs Vera, resultando em 176 GPUs por pod e 576 GPUs por rack.

A NVIDIA também confirmou que a próxima geração da NVLink, necessária para interconectar GPUs e CPUs, receberá melhorias significativas. As novas unidades terão três conexões NVLink de próxima geração, contra duas do modelo atual, proporcionando maior largura de banda e eficiência na comunicação entre os chips.

Reprodução/NVIDIA

Os Data Centers precisarão de muito mais energia do que imaginávamos há um ano. Essa demanda crescente exigirá arquiteturas mais robustas, como a do Rubin Ultra

Jensen Huang, CEO da NVIDIA

Escalando o desempenho: de Blackwell Ultra ao Rubin Ultra

A linha Blackwell Ultra GB300, anunciada para 2025, já representa um avanço em relação à geração anterior, com 288 GB de memória HBM3e e 20 petaflops de performance FP4 por GPU. Contudo, o grande salto virá com o Vera Rubin, programado para 2026, que terá 50 petaflops de FP4 por chip.

Reprodução/NVIDIA

O Rubin Ultra, previsto para 2027, dobrará esse número, atingindo 100 petaflops de FP4 por chip e 1 TB de memória. Um rack completo NVL576 Rubin Ultra poderá entregar 15 exaflops de inferência FP4 e 5 exaflops de treinamento FP8, representando um aumento de 14 vezes no desempenho em comparação com os racks Blackwell Ultra NVL72 de 2025.

Desafios energéticos e impacto nos Data Centers

O crescimento exponencial da demanda computacional levanta questões sobre eficiência energética e infraestrutura. Os servidores atuais já exigem enormes quantidades de eletricidade, e com a projeção de racks consumindo 600 kW ou mais, data centers precisarão de soluções avançadas de resfriamento e distribuição de energia.

Reprodução/NVIDIA

Além disso, especialistas discutem os impactos ambientais desse avanço. O aumento da capacidade computacional é necessária para aplicações avançadas de IA, mas o consumo energético deve ser gerenciado de forma sustentável.

Leia também:

O futuro: rumo à arquitetura Feynman

Além do Rubin Ultra, a NVIDIA já anunciou que sua próxima grande arquitetura, chamada Feynman, está programada para 2028. O nome homenageia Richard Feynman, renomado físico teórico, assim como Vera Rubin, astrônoma que deu nome à geração de 2026.

A NVIDIA continua liderando o setor de IA com avanços agressivos em hardware e infraestrutura. O desafio agora é equilibrar capacidade computacional, eficiência energética e sustentabilidade, garantindo que a evolução da IA seja suportada por data centers cada vez mais robustos e inovadores.

Fonte: NVIDIA

Adicionar aos favoritos o Link permanente.