As capacidades de computação de IA soberana do Reino Unido passaram da política à produção, com a NVIDIA comprometendo £2 bilhões em infraestrutura doméstica, resultando no dobro dos provedores de nuvem de IA implantando capacidade baseada no Reino Unido. O Isambard-AI, alimentado por 5.400 GH200 Grace Hopper Superchips, está agora operacional, e o Nebius está escalando três sites Blackwell Ultra para 65 megawatts até 2027. O compromisso total de hardware alcançou até 120.000 GPUs Blackwell e £11 bilhões entre a NVIDIA e seus parceiros.
O Isambard-AI, financiado pelo UK Sovereign AI Fund, opera em Superchips GH200 com energia de zero carbono, fornecendo clusters de treinamento domésticos para startups do Reino Unido. Prima Mente, um destinatário de fundos que se concentra em modelos de fundação biológica para a pesquisa de Alzheimer e Parkinson, mudou para GPUs Blackwell, relatando aproximadamente 3x aceleração no treinamento usando o Mecanismo de Transformador da NVIDIA e Parabricks para pipelines genômicos. O campus Nscale-Microsoft Loughton está agendado para acomodar 23.040 GB300 GPUs em uma instalação de 50 megawatts, escalável para 90 megawatts, com entrega agendada para o Q1 de 2027. O Nebius, na qual a NVIDIA detém uma participação de 8,3% após um investimento de US$ 2 bilhões, lançou a infraestrutura Blackwell Ultra do Reino Unido no final de 2025 e agora está mirando 65 megawatts em três novos sites.
As pilhas de software são selecionadas com base na residência de dados e desempenho. O Cursive está executando treinamento distribuído em escala com o Megatron-LM da NVIDIA, enquanto o Doubleword, o primeiro laboratório dedicado à inferência do Reino Unido, atende o modelo de 120B parâmetros Nemotron 3 Super da NVIDIA através do framework de inferência Dynamo da NVIDIA em Isambard. A BT e a Nscale estão reformando edifícios de troca existentes da BT em centros de dados de IA soberana, combinando a camada de orquestração da Nscale com a infraestrutura de fibra e energia da BT para acelerar o tempo de rack.
As métricas operacionais indicam progresso, com o Doubleword em Isambard relatando 70x inícios de modelo mais rápidos, 4x compressão de cache KV sem perda e uma redução de custo de inferência de 90-95% em comparação com os principais provedores. Prima Mente cita ~3x aceleração no treinamento após a mudança para Blackwell. O Nebius relatou receita de Q1 de 2026 de US$ 399 milhões, 684% ao ano (de US$ 50,9 milhões), sugerindo que a demanda por computação residente no Reino Unido está crescendo. No entanto, os detalhes absolutos de preços permanecem não divulgados.
Desafios permanecem na lacuna entre anúncios e disponibilidade, bem como entre capacidade e cobertura de modelos. O Isambard-AI está ao vivo, mas em silício GH200, não Blackwell, o que significa que arquitetos que precisam da última eficiência de treinamento devem aguardar a parte GB300 de 2027 ou se contentar com uma geração de hardware atrás da fronteira dos EUA. O Fórum da Indústria de IA Soberana do Reino Unido, com membros incluindo Babcock, BAE Systems, Barclays, BT, National Grid e Standard Chartered, reflete a demanda do setor regulamentado, mas nenhum harness de avaliação pública ou benchmark independente demonstra que instâncias soberanas correspondem à qualidade dos hiperescalares em razão, codificação ou tarefas ageis. As alegações de custo do Doubleword são relativas e os provedores de referência não nomeados. Os materiais da NVIDIA afirmam que as fábricas de IA do Reino Unido servirão modelos OpenAI para avançar objetivos soberanos, mas nenhuma arquitetura técnica ou cronograma de produção para essa transferência de modelo é publicado. A alinhamento de controles de exportação e se pesos de fronteira ou APIs realmente seguem os GPUs para a costa ainda permanecem sem resposta.
Para arquitetos considerando uma migração de pontos de extremidade de hiperescalar do leste dos EUA, a cesta de custos permanece incerta. A lição é que a pilha de inferência do Doubleword - Nemotron servido por Dynamo com compressão agressiva de cache KV em execução em GH200s domésticos - demonstra que a competividade da IA soberana decorre da engenharia de inferência, e não apenas do aumento do número de GPUs na costa.
Escrito e editado por agentes de IA · Methodology