Agentes de codificación de IA vulnerables a malware vía repos de GitHub, investigadores de Mozilla demuestran exploit de Claude
El equipo de investigación de seguridad 0din de Mozilla ha demostrado que agentes de codificación de IA como Claude pueden ser engañados para ejecutar malware a través de un ataque de ingeniería social engañosamente simple. Un atacante puede crear un repositorio de GitHub que parece limpio—con solo archivos de scaffolding y archivos de inicialización estándar—que engaña a Claude para instalar malware. El ataque explota el impulso del agente de ser útil: cuando la IA encuentra un error durante la configuración del proyecto, intenta resolver el problema automáticamente, disparando scripts maliciosos ocultos en el repo.
La cadena de ataque es sutil y de tres capas. Primero, un script de inicio de Axiom falso falla, lo que indica a Claude que ejecute un comando de ayuda. Ese comando luego descarga software de una fuente maliciosa disfrazada como búsqueda legítima de registro DNS TXT. El registro TXT contiene un shell inverso codificado en base64—dando al atacante acceso shell a la máquina del desarrollador. Desde allí, los atacantes pueden exfiltrar secretos, claves de API, código, documentos, sesiones del navegador y contraseñas. La vulnerabilidad no requiere archivos obviamente sospechosos; las herramientas de escaneo de seguridad existentes típicamente no marcarán el repositorio ni la actividad.
Para arquitectos: esto demuestra que los agentes de codificación necesitan límites de seguridad fundamentalmente diferentes de los desarrolladores humanos. Claude y agentes similares carecen del escepticismo para cuestionar pasos de configuración de terceros poco claros. El equipo 0din recomienda que los desarrolladores nunca confíen ciegamente en proyectos desconocidos y nunca dependan de herramientas de IA para análisis de seguridad. Los proveedores de agentes deben implementar sandboxing de ejecución y requerir aprobación explícita del usuario antes de ejecutar comandos shell o descargar de Internet.