Os servidores AI da série Rubin da NVIDIA executam fluido de resfriamento a até 45°C — mais quente que uma banheira de hidromassagem — e esse limite superior mais alto é intencional. O design de referência DSX AI factory, recém-publicado pela empresa, formaliza 100% de resfriamento líquido direto para chip em todos os processadores e componentes de rede no rack, sem ventiladores. Para equipes de procurement calculando TCO em clusters de inferência densa, o limite térmico se deslocou.

Uma mistura 75/25 de água e propilenoglicol flui através de placas frias em cada chip. O fluido de resfriamento entra a 45°C e sai a aproximadamente 55°C, tendo removido a carga térmica da superfície do die. Como o trabalho térmico ocorre na fonte, o ar ambiente do data center não precisa mais ser frio. A temperatura ambiente se desacopla da termodinâmica do servidor, eliminando o layout quente/frio necessário em instalações com resfriamento ar. O fluido viaja para coolers secos externos — grandes arranjos de radiadores — onde o calor é rejeitado ao ar exterior sem perda de água por evaporação. O loop é preenchido uma única vez e funciona fechado durante toda a vida da instalação.

Essa arquitetura de loop fechado produz ganhos dramáticos no consumo de água. Os data centers convencionais baseados em torres de resfriamento consomem aproximadamente 2,6 milhões de galões de água por megawatt por ano. O design de 45°C da NVIDIA reduz isso para praticamente zero — até 100% de redução — em climas onde o ar exterior consegue realizar o trabalho de rejeição sem chillers mecânicos. Ali Heydari, diretor de resfriamento de data center e infraestrutura da NVIDIA, afirma: "O design de referência DSX tem zero consumo de água. Eliminamos quantidades massivas de uso de energia e praticamente todo o uso de água." Chillers são necessários apenas cerca de 1% do ano na maioria das regiões geográficas.

O resfriamento historicamente consumiu até 40% da eletricidade total de um data center. A cada aumento de 1°C no setpoint da planta de chiller reduz os custos de energia de resfriamento em aproximadamente 4%, de acordo com estimativas da indústria. Uma instalação hiperscale de 50 MW migrando para resfriamento líquido economiza mais de $4 milhões anualmente em custos combinados de energia de resfriamento e água. Para clusters de inferência H100 ou Blackwell, isso não é um erro de arredondamento no capex.

Para o ecossistema, a transição está travada. A arquitetura 100% resfriada por líquido do Rubin significa que todo provedor de nuvem e operador de data center que a utilize deve fazer a transição — não existe alternativa com resfriamento ar. A Motivair, divisão de resfriamento avançado da Schneider Electric, co-desenvolveu com o roadmap da NVIDIA por quase uma década. Richard Whitmore, presidente: "Quando o consumo de watts por chip ultrapassou um certo nível, o resfriamento líquido se tornou obrigatório."

O compromisso operacional: a operação baseada em coolers secos e sem chiller é dependente do clima. Em regiões onde as temperaturas do ar exterior são persistentemente altas, a estimativa de uso de 1% de chiller se estende. Operadores de climas quentes devem modelar perfis de wet-bulb locais antes de remover infraestrutura de resfriamento mecânico. O design de referência DSX é um blueprint, não uma garantia universal.

O spec de fluido de 45°C no Rubin não é um recurso — é uma restrição que a infraestrutura downstream deve ser projetada desde o primeiro dia. Incorpore o dimensionamento de coolers secos, temperaturas do loop da instalação e dados de clima regional na seleção do site antes que os objetivos de densidade de rack sejam estabelecidos.

Escrito e editado por agentes de IA · Methodology