Teste red-team da NSA: Mythos da Anthropic penetrou sistemas classificados em horas, acionando primeira proibicao de exportacao de modelo de IA
No dia 11 de junho, o modelo de IA Mythos da Anthropic participou de um exercicio autorizado de teste red-team interno da NSA e supostamente obteve acesso a quase todos os sistemas classificados direcionados em horas, levando o Diretor da NSA General Joshua Rudd a informar legisladores sobre os resultados. No dia 12 de junho, a administracao Trump direcionou a Anthropic a restringir o acesso a Fable 5 e Mythos 5 exclusivamente aos cidadaos norte-americanos. Como a verificacao de nacionalidade em tempo real eh impraticavel, Anthropic desabilitou o acesso a esses modelos para todos os clientes.
Esta marca a primeira vez que os Estados Unidos aplicaram controles de exportacao diretamente a um modelo de IA em vez de ao hardware ou chips que o alimentam, um marco regulatorio sem precedentes na governanca de seguranca nacional de IA. Os governos aliados dentro da alianca Five Eyes (Australia, Gra-Bretanha, Canada, Nova Zelandia) foram pegos desprevenidos, com permissoes revogadas sem aviso. O Instituto de Seguranca de IA da Gra-Bretanha, o principal corpo mundial para testar modelos de IA frontier, tambem foi bloqueado.
Anthropic disputou a diretiva, dizendo que o governo citou preocupacoes de seguranca nacional mas nao forneceu detalhes especificos, embora acredite que o governo tomou conhecimento de um metodo de jailbreak que poderia contornar as guardas de seguranca do Fable 5. Anthropic caracterizou o jailbreak como estreito e afirmou que a mesma vulnerabilidade existe em outros modelos disponiveis publicamente como GPT-5.5 da OpenAI que nao enfrentam tais controles. O incidente destaca a visao crescente do governo sobre recursos de IA frontier—especialmente poder de ciberseguranca—como ativos de seguranca nacional de uso duplo requerendo controle direto.
Fontes
- Primary source
- Tom's Hardware: Mythos breach during NSA red-team test
“NSA Director Joshua Rudd told Senator Mark Warner that Mythos broke into almost all classified systems within hours during controlled red-team test. June 12 ban marked first export controls on AI model, not hardware.”
- CNN: Anthropic suspends Mythos and Fable after export control directive
“US government ordered Anthropic to suspend all access by foreign nationals to Mythos 5 and Fable 5. Anthropic disputes directive, says jailbreak is narrow and found in other models.”
- Cyber Security News: NSA classified systems breach
“Mythos infiltrated nearly all NSA classified systems during authorized red-team evaluation. Five Eyes partners caught off guard; Britain's AI Security Institute locked out.”