Durante a GTC 2025, a NVIDIA apresentou mais detalhes sobre sua futura geração de infraestrutura de inteligência artificial de alto desempenho: o Rubin Ultra e o sistema de racks NVL576 Kyber.
Prevista para chegar ao mercado a partir de 2027, essa tecnologia pretende trazer um salto significativo na capacidade computacional, com servidores que podem consumir até 600 kW por rack.
A empresa já havia introduzido a linha Blackwell B200, que pode demandar cerca de 120 kW por rack. Com a evolução para o Vera Rubin, em 2026, e posteriormente para o Rubin Ultra, a expectativa é de um aumento exponencial na eficiência e na densidade de processamento dos servidores.
Segundo Jensen Huang, CEO da NVIDIA, os DataCenters do futuro poderão exigir MegaWatts por rack para atender às demandas crescentes da IA generativa e do aprendizado profundo.
A nova arquitetura Rubin Ultra e a infraestrutura Kyber
O Rubin Ultra será baseado na nova arquitetura da NVIDIA e trará inovações como o NVL576 Kyber, um sistema de racks projetado para suportar a altíssima demanda de energia e resfriamento desses servidores.
O sistema contará com quatro “pods” por rack, cada um equipado com 18 blades. Cada blade poderá conter oito GPUs Rubin Ultra e duas CPUs Vera, resultando em 176 GPUs por pod e 576 GPUs por rack.
A NVIDIA também confirmou que a próxima geração da NVLink, necessária para interconectar GPUs e CPUs, receberá melhorias significativas. As novas unidades terão três conexões NVLink de próxima geração, contra duas do modelo atual, proporcionando maior largura de banda e eficiência na comunicação entre os chips.

Os Data Centers precisarão de muito mais energia do que imaginávamos há um ano. Essa demanda crescente exigirá arquiteturas mais robustas, como a do Rubin Ultra
Jensen Huang, CEO da NVIDIA
Escalando o desempenho: de Blackwell Ultra ao Rubin Ultra
A linha Blackwell Ultra GB300, anunciada para 2025, já representa um avanço em relação à geração anterior, com 288 GB de memória HBM3e e 20 petaflops de performance FP4 por GPU. Contudo, o grande salto virá com o Vera Rubin, programado para 2026, que terá 50 petaflops de FP4 por chip.

O Rubin Ultra, previsto para 2027, dobrará esse número, atingindo 100 petaflops de FP4 por chip e 1 TB de memória. Um rack completo NVL576 Rubin Ultra poderá entregar 15 exaflops de inferência FP4 e 5 exaflops de treinamento FP8, representando um aumento de 14 vezes no desempenho em comparação com os racks Blackwell Ultra NVL72 de 2025.
Desafios energéticos e impacto nos Data Centers
O crescimento exponencial da demanda computacional levanta questões sobre eficiência energética e infraestrutura. Os servidores atuais já exigem enormes quantidades de eletricidade, e com a projeção de racks consumindo 600 kW ou mais, data centers precisarão de soluções avançadas de resfriamento e distribuição de energia.

Além disso, especialistas discutem os impactos ambientais desse avanço. O aumento da capacidade computacional é necessária para aplicações avançadas de IA, mas o consumo energético deve ser gerenciado de forma sustentável.
Leia também:
- NVIDIA Rubin Ultra chega em 2027 com 1TB de memórias HBM4e
- Jaqueta de couro de Jensen Huang, CEO da NVIDIA, custa US$ 9 mil
- NVIDIA anuncia os computadores pessoais de IA DGX Spark e DGX Station
O futuro: rumo à arquitetura Feynman
Além do Rubin Ultra, a NVIDIA já anunciou que sua próxima grande arquitetura, chamada Feynman, está programada para 2028. O nome homenageia Richard Feynman, renomado físico teórico, assim como Vera Rubin, astrônoma que deu nome à geração de 2026.
A NVIDIA continua liderando o setor de IA com avanços agressivos em hardware e infraestrutura. O desafio agora é equilibrar capacidade computacional, eficiência energética e sustentabilidade, garantindo que a evolução da IA seja suportada por data centers cada vez mais robustos e inovadores.
Fonte: NVIDIA