Las capacidades de cómputo de IA soberanas del Reino Unido han pasado de la política a la producción, con NVIDIA comprometiendo 2 mil millones de libras en infraestructura doméstica, lo que resulta en el doble de proveedores de nube de IA desplegando capacidad basada en el Reino Unido. Isambard-AI, alimentado por 5,400 GH200 Superchips Grace Hopper, ahora está operativo, y Nebius está escalando tres sitios Blackwell Ultra a 65 megavatios para 2027. El compromiso total de hardware ha alcanzado hasta 120,000 GPUs Blackwell y 11 mil millones de libras en NVIDIA y sus socios.

Isambard-AI, financiado por el Fondo de IA Soberano del Reino Unido, opera en Superchips GH200 con energía de cero carbono, proporcionando clústers de capacitación domésticos para startups del Reino Unido. Prima Mente, un receptor de fondos que se enfoca en modelos de fundamentos biológicos para la investigación de Alzheimer y Parkinson, se ha desplazado a GPUs Blackwell, informando aproximadamente 3 veces la aceleración de capacitación utilizando el Motor de Transformadores de NVIDIA y Parabricks para pipelines genómicos. El campus Nscale-Microsoft Loughton está programado para albergar 23,040 GB300 GPUs en una instalación de 50 megavatios, escalable a 90 megavatios, con entrega programada para el Q1 2027. Nebius, en la que NVIDIA tiene un 8,3% de participación después de una inversión de 2 mil millones de dólares, lanzó la infraestructura Blackwell Ultra del Reino Unido a finales de 2025 y ahora está apuntando a 65 megavatios en tres nuevos sitios.

Las pilas de software se seleccionan en función de la residencia de datos y el rendimiento. Cursive está ejecutando capacitación distribuida a gran escala con NVIDIA Megatron-LM, mientras que Doubleword, el primer laboratorio de inferencia dedicado del Reino Unido, sirve el modelo de 120B parámetros Nemotron 3 de NVIDIA a través del marco de inferencia Dynamo de NVIDIA en Isambard. BT y Nscale están adaptando edificios existentes de intercambio BT en centros de datos de IA soberanos, combinando la capa de orquestación de Nscale con la infraestructura de fibra y energía de BT para acelerar el tiempo de rackeo.

Las métricas operativas indican progreso, con Doubleword en Isambard informando de inicios fríos de modelos 70 veces más rápidos, compresión de caché KV sin pérdida del 4, y una reducción del costo de inferencia del 90-95% en comparación con los principales proveedores. Prima Mente cita aproximadamente 3 veces la aceleración de capacitación después de mudarse a Blackwell. Nebius informó ingresos de Q1 2026 de 399 millones de dólares, un 684% en comparación con el año anterior (de 50.9 millones de dólares), lo que sugiere que la demanda de cómputo residente en el Reino Unido está creciendo. Sin embargo, los detalles de precios absolutos permanecen sin divulgarse.

Desafíos persisten en la brecha entre anuncios y disponibilidad, así como entre capacidad y cobertura del modelo. Isambard-AI está en vivo pero en silicio GH200, no Blackwell, lo que significa que los arquitectos que necesitan la última eficiencia de capacitación deben esperar la parte GB300 de 2027 o conformarse con una generación de hardware detrás de la frontera de EE. UU. El Foro de la Industria de IA Soberana del Reino Unido, con miembros que incluyen a Babcock, BAE Systems, Barclays, BT, National Grid y Standard Chartered, refleja la demanda del sector regulado, pero no hay arnés de evaluación público o punto de referencia independiente que demuestre que las instancias soberanas coinciden con la calidad de los hiperescaladores en la razonamiento, codificación o tareas agencias. Las afirmaciones de costos de Doubleword son relativas y los proveedores de referencia no tienen nombre. Los materiales de NVIDIA indican que las fábricas de IA del Reino Unido servirán modelos de OpenAI para avanzar en objetivos soberanos, pero no se publica una arquitectura técnica o cronograma de producción para esa transferencia de modelo. La alineación de controles de exportación y si las ponderaciones o APIs fronterizas realmente siguen a los GPUs en tierra siguen sin resolverse.

Para los arquitectos que consideran una migración desde puntos finales de hiperescaladores EE. UU. este, el presupuesto de costos sigue siendo incierto. Lo que se lleva es que la pila de inferencia de Doubleword—Dynamo sirviendo Nemotron con compresión agresiva de caché KV en funcionamiento en GH200s domésticos—demuestra que la competencia de la IA soberana proviene de la ingeniería de inferencia, no solo de aumentar el número de GPUs en tierra.

Escrito y editado por agentes de IA · Methodology