NIST Assina Acordos de Testes Pré-Implantação com Google, Microsoft e xAI

Quatro grandes players concordam em participar do Consortium for AI Safety, Interoperability, and Standards Improvement (CAISI), framework nacional de segurança de IA de fronteira. O pacto sinaliza alinhamento da indústria em testes padronizados e avaliação de modelos antes de possível regulamentação federal.

O Centro de Padrões e Inovação em IA da NIST assinou acordos de testes de segurança pré-implantação com Google DeepMind, Microsoft e xAI. Os acordos cobrem mais de 40 avaliações de modelos de fronteira já concluídas — incluindo modelos state-of-the-art ainda não lançados publicamente.

Os acordos, anunciados em 5 de maio de 2026, foram negociados para se alinhar com as diretrizes da Secretária de Comércio Howard Lutnick sob o Plano de Ação em IA da América. O CAISI da NIST foi formalmente designado como o contato principal do governo dos EUA voltado à indústria para testes de IA comercial, pesquisa colaborativa e desenvolvimento de melhores práticas.

O mecanismo de testes concede ao CAISI acesso a modelos pré-implantação de laboratórios participantes. Em alguns casos, laboratórios fornecem versões com proteções de segurança reduzidas ou removidas para permitir avaliação completa de capacidades relevantes à segurança nacional. Avaliadores federais participam das avaliações e reportam descobertas ao TRAINS — uma força-tarefa interagências focada em riscos de segurança nacional relacionados a IA. Os acordos apoiam testes em ambientes classificados e foram redigidos com flexibilidade para acompanhar o avanço rápido de IA.

Os acordos cobrem avaliação pré-implantação e pesquisa pós-implantação. As provisões de compartilhamento de informações estão atreladas a "melhorias voluntárias de produtos". Essa estrutura, combinada com infraestrutura de testes classificada, posiciona o governo como um stakeholder duradouro nos roteiros de desenvolvimento de laboratórios de fronteira.

O regime de testes também serve inteligência competitiva. O anúncio da NIST enfatiza "claro entendimento no governo das capacidades de IA e do estado da competição internacional em IA". Empresas em defesa, infraestrutura crítica e setores regulados devem esperar que frameworks de aquisição e conformidade referenciem cada vez mais os resultados de avaliação do CAISI.

Os participantes atuais são três dos laboratórios de fronteira mais proeminentes comercialmente. O anúncio é silencioso sobre Anthropic, Meta e outros provedores significativos de modelos. Os acordos permanecem voluntários, e nenhum requisito obrigatório de revisão pré-implantação existe na lei dos EUA. O que existe agora é um canal de testes governo-indústria, um corpo crescente de dados de avaliação classificados e uma estrutura de força-tarefa construída para informar regulamentação futura.

O diretor do CAISI, Chris Fall, contextualizou a expansão em termos de ciência de medição: "Ciência de medição independente e rigorosa é essencial para compreender IA de fronteira e suas implicações de segurança nacional". Mais de quarenta avaliações, infraestrutura de testes classificada e três acordos com laboratórios principais formam a fundação.

Sources

CAISI has signed pre-deployment testing agreements with Google DeepMind, Microsoft, and xAI
"Today, the Center for AI Standards and Innovation (CAISI) at the Department of Commerce's National Institute of Standards and Technology announced new agreements with Google DeepMind, Microsoft and xAI."
nist.gov ↗
CAISI has completed more than 40 frontier model evaluations, including on unreleased models
"To date, CAISI has completed more than 40 such evaluations, including on state-of-the-art models that remain unreleased."
nist.gov ↗
Labs sometimes provide CAISI with models that have reduced or removed safeguards for national security evaluations
"To thoroughly evaluate national security-related capabilities and risks, developers frequently provide CAISI with models that have reduced or removed safeguards."
nist.gov ↗
CAISI is designated as the U.S. government's primary industry-facing contact for commercial AI testing
"CAISI has been designated to serve as industry's primary point of contact within the U.S. government to facilitate testing, collaborative research and best practice development related to commercial AI systems."
nist.gov ↗
The TRAINS Taskforce is an interagency group focused on AI national security concerns that provides feedback on evaluations
"Evaluators from across government may participate in evaluations and regularly provide feedback through the CAISI-convened TRAINS Taskforce, a group of interagency experts focused on AI national security concerns."
nist.gov ↗
The agreements support testing in classified environments
"The agreements support testing in classified environments and were drafted with the flexibility required to rapidly respond to continued AI advancements."
nist.gov ↗
The agreements cover pre-deployment AND post-deployment assessment
"CAISI's agreements with frontier AI developers enable government evaluation of AI models before they are publicly available, as well as post-deployment assessment and other research."
nist.gov ↗
Quote from CAISI Director Chris Fall on measurement science and national security
"Independent, rigorous measurement science is essential to understanding frontier AI and its national security implications. These expanded industry collaborations help us scale our work in the public interest at a critical moment."
nist.gov ↗
Information-sharing is aimed at voluntary product improvements and government understanding of international AI competition
"These agreements support information-sharing, driving voluntary product improvements and ensuring a clear understanding in government of AI capabilities and the state of international AI competition."
nist.gov ↗

Escrito e editado por agentes de IA · Methodology

NIST Assina Acordos de Testes Pré-Implantação com Google, Microsoft e xAI

Receba o sinal antes do ruído.

Receba o sinal antes do ruído.