Prueba red-team de la NSA: Mythos de Anthropic penetro sistemas clasificados en horas, desencadenando la primera prohibicion de exportacion de modelo de IA
El 11 de junio, el modelo de IA Mythos de Anthropic participo en un ejercicio autorizado de prueba red-team interno de la NSA e informo haber obtenido acceso a casi todos los sistemas clasificados dirigidos en horas, lo que llevo al Director de la NSA General Joshua Rudd a informar a los legisladores sobre los resultados. El 12 de junio, la administracion Trump dirigio a Anthropic para restringir el acceso a Fable 5 y Mythos 5 exclusivamente a ciudadanos estadounidenses. Dado que la verificacion de nacionalidad en tiempo real es impracticable, Anthropic desactivo el acceso a esos modelos para todos los clientes.
Esta marca la primera vez que Estados Unidos ha aplicado controles de exportacion directamente a un modelo de IA en lugar de al hardware o chips que lo alimentan, un hito regulatorio sin precedentes en la gobernanza de seguridad nacional de IA. Los gobiernos aliados dentro de la alianza Five Eyes (Australia, Gran Bretana, Canada, Nueva Zelanda) fueron sorprendidos, con permisos revocados sin previo aviso. El Instituto de Seguridad de IA de Gran Bretana, el principal organismo mundial para probar modelos de IA frontier, tambien fue bloqueado.
Anthropic disputo la directiva, diciendo que el gobierno cito preocupaciones de seguridad nacional pero no proporciono detalles especificos, aunque cree que el gobierno tomo conocimiento de un metodo de jailbreak que podria eludir los controles de seguridad de Fable 5. Anthropic caracterizo el jailbreak como limitado y afirmo que la misma vulnerabilidad existe en otros modelos disponibles publicamente como GPT-5.5 de OpenAI que no enfrentan tales controles. El incidente destaca la vision creciente del gobierno sobre capacidades de IA frontier—especialmente el poder de ciberseguridad—como activos de seguridad nacional de doble uso que requieren control directo.
Fuentes
- Primary source
- Tom's Hardware: Mythos breach during NSA red-team test
“NSA Director Joshua Rudd told Senator Mark Warner that Mythos broke into almost all classified systems within hours during controlled red-team test. June 12 ban marked first export controls on AI model, not hardware.”
- CNN: Anthropic suspends Mythos and Fable after export control directive
“US government ordered Anthropic to suspend all access by foreign nationals to Mythos 5 and Fable 5. Anthropic disputes directive, says jailbreak is narrow and found in other models.”
- Cyber Security News: NSA classified systems breach
“Mythos infiltrated nearly all NSA classified systems during authorized red-team evaluation. Five Eyes partners caught off guard; Britain's AI Security Institute locked out.”