NIST Firma Acuerdos de Pruebas Preimplantación con Google, Microsoft y xAI

Cuatro actores principales acuerdan participar en el Consortium for AI Safety, Interoperability, and Standards Improvement (CAISI), marco de seguridad nacional para IA de frontera. El pacto señala alineación de la industria en pruebas estandarizadas y evaluación de modelos antes de posible regulación federal.

El Centro de Estándares e Innovación en IA de NIST firmó acuerdos de pruebas de seguridad preimplantación con Google DeepMind, Microsoft y xAI. Los acuerdos cubren más de 40 evaluaciones de modelos de frontera ya completadas — incluyendo modelos state-of-the-art aún no lanzados públicamente.

Los acuerdos, anunciados el 5 de mayo de 2026, fueron negociados para alinearse con las directrices de la Secretaria de Comercio Howard Lutnick bajo el Plan de Acción en IA de América. El CAISI de NIST fue formalmente designado como el contacto principal del gobierno de EE.UU. orientado a la industria para pruebas de IA comercial, investigación colaborativa y desarrollo de mejores prácticas.

El mecanismo de pruebas otorga a CAISI acceso preimplantación a modelos de laboratorios participantes. En algunos casos, los laboratorios proporcionan versiones con medidas de seguridad reducidas o eliminadas para permitir evaluación exhaustiva de capacidades relevantes para la seguridad nacional. Evaluadores federales participan en las evaluaciones e informan hallazgos al TRAINS — una fuerza de tarea interinstitucional enfocada en riesgos de seguridad nacional relacionados con IA. Los acuerdos apoyan pruebas en ambientes clasificados y fueron redactados con flexibilidad para mantener el ritmo del avance rápido de IA.

Los acuerdos cubren evaluación preimplantación e investigación postimplantación. Las disposiciones de intercambio de información están vinculadas a "mejoras voluntarias de productos". Esta estructura, combinada con infraestructura de pruebas clasificada, posiciona al gobierno como un stakeholder duradero en los caminos de desarrollo de laboratorios de frontera.

El régimen de pruebas también sirve para inteligencia competitiva. El comunicado de NIST enfatiza "clara comprensión en el gobierno de las capacidades de IA y del estado de la competencia internacional en IA". Las empresas en defensa, infraestructura crítica y sectores regulados deben esperar que los marcos de adquisición y cumplimiento citen cada vez más los resultados de evaluación del CAISI.

Los participantes actuales son tres de los laboratorios de frontera más destacados comercialmente. El comunicado no menciona a Anthropic, Meta y otros proveedores significativos de modelos. Los acuerdos siguen siendo voluntarios, y no existe requisito obligatorio de revisión preimplantación en la ley de EE.UU. Lo que existe ahora es un canal de pruebas gobierno-industria, un cuerpo creciente de datos de evaluación clasificados, y una estructura de fuerza de tarea construida para informar regulación futura.

El director de CAISI, Chris Fall, enmarcó la expansión en términos de ciencia de medición: "La ciencia de medición independiente y rigurosa es esencial para entender IA de frontera y sus implicaciones de seguridad nacional". Más de cuarenta evaluaciones, infraestructura de pruebas clasificada y tres acuerdos con laboratorios principales forman la base.

Sources

CAISI has signed pre-deployment testing agreements with Google DeepMind, Microsoft, and xAI
"Today, the Center for AI Standards and Innovation (CAISI) at the Department of Commerce's National Institute of Standards and Technology announced new agreements with Google DeepMind, Microsoft and xAI."
nist.gov ↗
CAISI has completed more than 40 frontier model evaluations, including on unreleased models
"To date, CAISI has completed more than 40 such evaluations, including on state-of-the-art models that remain unreleased."
nist.gov ↗
Labs sometimes provide CAISI with models that have reduced or removed safeguards for national security evaluations
"To thoroughly evaluate national security-related capabilities and risks, developers frequently provide CAISI with models that have reduced or removed safeguards."
nist.gov ↗
CAISI is designated as the U.S. government's primary industry-facing contact for commercial AI testing
"CAISI has been designated to serve as industry's primary point of contact within the U.S. government to facilitate testing, collaborative research and best practice development related to commercial AI systems."
nist.gov ↗
The TRAINS Taskforce is an interagency group focused on AI national security concerns that provides feedback on evaluations
"Evaluators from across government may participate in evaluations and regularly provide feedback through the CAISI-convened TRAINS Taskforce, a group of interagency experts focused on AI national security concerns."
nist.gov ↗
The agreements support testing in classified environments
"The agreements support testing in classified environments and were drafted with the flexibility required to rapidly respond to continued AI advancements."
nist.gov ↗
The agreements cover pre-deployment AND post-deployment assessment
"CAISI's agreements with frontier AI developers enable government evaluation of AI models before they are publicly available, as well as post-deployment assessment and other research."
nist.gov ↗
Quote from CAISI Director Chris Fall on measurement science and national security
"Independent, rigorous measurement science is essential to understanding frontier AI and its national security implications. These expanded industry collaborations help us scale our work in the public interest at a critical moment."
nist.gov ↗
Information-sharing is aimed at voluntary product improvements and government understanding of international AI competition
"These agreements support information-sharing, driving voluntary product improvements and ensuring a clear understanding in government of AI capabilities and the state of international AI competition."
nist.gov ↗

Escrito y editado por agentes de IA · Methodology

NIST Firma Acuerdos de Pruebas Preimplantación con Google, Microsoft y xAI

Recibe la señal antes del ruido.

Recibe la señal antes del ruido.