Google Confirma Primer Zero-Day Escrito por IA

Google's Threat Intelligence Group confirmó el primer zero-day desarrollado por IA. El actor malicioso lo implementó antes de que la detección del GTIG probablemente interrumpiera la campaña.

GTIG publicó sus hallazgos el 11 de mayo de 2026, basándose en respuesta a incidentes de Mandiant, telemetría de Gemini e investigación proactiva. Un actor malicioso usó un modelo de IA para descubrir y convertir en arma un bypass de autenticación de dos factores en una herramienta de administración web de código abierto. Google coordinó la divulgación con el proveedor, que ha parcheado la falla. GTIG se negó a nombrar la plataforma ni al atacante.

Los orígenes de IA del exploit fueron inconfundibles. El script Python contenía docstrings extensos, puntuación CVSS alucinada, menús de ayuda detallados y formato consistente con datos de entrenamiento de LLM. GTIG afirmó que tiene "alta confianza" de que un modelo de IA —no un humano— escribió el código. Google aclaró que sus modelos Gemini no estuvieron involucrados. Los errores de implementación probablemente limitaron la efectividad del exploit. Pero el analista jefe del GTIG John Hultquist fue directo: "Existe una idea errónea de que la carrera de vulnerabilidades de IA es inminente. La realidad es que ya comenzó. Por cada zero-day que podemos rastrear hasta IA, probablemente hay muchos más por ahí."

El patrón se extiende a actores vinculados a estados y criminales. El APT45 norcoreano envió miles de prompts repetitivos a modelos de IA para analizar recursivamente vulnerabilidades y validar pruebas de concepto. UNC2814 vinculado a China usó prompts jailbreak para forzar Gemini a investigar fallos de ejecución remota de código preautenticado en firmware TP-Link. Un actor separado vinculado a China desplegó frameworks agentic Hexstrike y Strix con el sistema de memoria Graphiti para probar autónomamente una firma tecnológica japonesa, pivotando entre herramientas de reconocimiento sin dirección humana.

Los grupos rusos adoptaron tácticas diferentes. Operation Overload usó clonación de voz con IA para fabricar vídeos falsos suplantando a periodistas para narrativas anti-Ucrania. Otros actores usaron código carnada generado por IA para ofuscar familias de malware incluyendo CANFAIL y LONGSTREAM. El backdoor Android PromptSpy integra llamadas a la API de Gemini para navegar dispositivos infectados autónomamente. En marzo, el grupo criminal TeamPCP comprometió LiteLLM, una biblioteca gateway de IA ampliamente utilizada, al incrustar un credential stealer a través de paquetes PyPI envenenados y pull requests maliciosos, luego monetizó claves AWS robadas y tokens de GitHub a través de asociaciones de ransomware.

Los equipos de seguridad empresarial enfrentan una brecha estructural. Los scanners tradicionales detectan fallos y corrupción de memoria pero no defectos de lógica semántica que parecen funcionalmente correctos a toda herramienta automatizada en producción. Los exploits generados por IA explotan esta brecha. La guía del GTIG para defensores: monitoree picos en herramientas de exploit automatizadas, telemetría consistente con generación de comandos orientada por modelos en logs de endpoint, intentos de extracción de modelos contra sistemas propietarios, y uso expandido de IA en ingeniería social.

Las medidas defensivas de Google incluyen Big Sleep, un agente de descubrimiento de vulnerabilidades que identificó al menos un fallo del mundo real inminentemente siendo convertido en arma, y CodeMender, un agente experimental que usa el razonamiento de Gemini para parchear automáticamente fallos críticos de código. GTIG está deshabilitando cuentas de Gemini identificadas como abusando de la plataforma para investigación adversarial.

La evaluación del GTIG de febrero de 2026 no encontró evidencia de que los APT hubieran alcanzado capacidades revolucionarias. Ese umbral ha sido cruzado ahora en el desarrollo de exploits. La carrera ha comenzado.

Sources

GTIG confirmed the first AI-developed zero-day exploit targeting a 2FA bypass in an open-source web administration tool
"GTIG said it has 'high confidence' that it recorded hackers using an AI model to find and exploit a zero-day vulnerability, or a software flaw unknown to developers, creating a way to bypass two-factor authentication."
cnbc.com ↗
Criminal threat actor planned a mass exploitation event; Google's proactive counter-discovery may have prevented its use
"The criminal threat actor planned to use it in a mass exploitation event but our proactive counter discovery may have prevented its use."
cloud.google.com ↗
Python exploit script contained educational docstrings, a hallucinated CVSS score, and LLM-characteristic formatting
"The script contains an abundance of educational docstrings, including a hallucinated CVSS score, and uses a structured, textbook Pythonic format highly characteristic of LLMs training data."
bleepingcomputer.com ↗
GTIG has high confidence that an AI model, not a human researcher, wrote the Python exploit script
"GTIG said it has 'high confidence' that it recorded hackers using an AI model to find and exploit a zero-day vulnerability"
cnbc.com ↗
GTIG chief analyst John Hultquist said the AI vulnerability race has already begun
"There's a misconception that the AI vulnerability race is imminent. The reality is that it's already begun. For every zero-day we can trace back to AI, there are probably many more out there."
siliconangle.com ↗
North Korean APT45 sent thousands of repetitive prompts to recursively analyze vulnerabilities and build an exploit arsenal at a scale impractical to do manually
"North Korean group APT45 has been sending thousands of repetitive prompts to AI models to recursively analyze vulnerabilities and build an exploit arsenal at a scale that would be impractical to do manually."
siliconangle.com ↗
China-linked actor UNC2814 used expert-persona jailbreak prompts to push Gemini into researching pre-auth RCE flaws in TP-Link router firmware
"An alleged China-linked actor, UNC2814, used expert-persona jailbreaking to push Gemini into researching pre-authentication remote code execution flaws in TP-Link router firmware and Odette File Transfer Protocol implementations."
siliconangle.com ↗
Russian Operation Overload used AI voice cloning to fabricate fake videos impersonating real journalists to promote anti-Ukraine narratives
"Google has also highlighted a Russian operation codenamed 'Overload,' where social engineering threat actors used AI voice cloning to impersonate real journalists in fake videos promoting the anti-Ukraine narrative."
bleepingcomputer.com ↗
TeamPCP compromised LiteLLM in March 2026 via poisoned PyPI packages and monetized stolen credentials through ransomware partnerships
"GTIG also flagged the March compromise of LiteLLM, a popular AI gateway utility, by criminal group TeamPCP. The actor embedded a credential stealer through poisoned packages on PyPI and malicious pull requests, extracting AWS keys and GitHub tokens that were monetized through ransomware partnerships."
siliconangle.com ↗
GTIG's report builds on a February 2026 assessment that found APTs had not yet achieved breakthrough capabilities; the May report documents first instances of AI-attributed exploit development
"While GTIG noted in February 2026 that it had not observed APTs achieving breakthrough capabilities that fundamentally alter the threat landscape, the May 2026 report documents first instances where GTIG attributes exploit development to AI-assisted processes."
letsdatascience.com ↗
Google's Big Sleep agent found a real-world vulnerability that was imminently going to be weaponized by threat actors
"Big Sleep has since found its first real-world security vulnerability and assisted in finding a vulnerability that was imminently going to be used by threat actors, which GTIG was able to cut off beforehand."
cloud.google.com ↗
Google introduced CodeMender, an AI-powered agent using Gemini's reasoning to automatically fix critical code vulnerabilities
"We recently introduced CodeMender, an experimental AI-powered agent using the advanced reasoning capabilities of our Gemini models to automatically fix critical code vulnerabilities."
cloud.google.com ↗
GTIG report synthesizes findings from Mandiant incident response engagements, Gemini telemetry, and proactive research
"According to Google Threat Intelligence Group (GTIG), its May 11, 2026 update synthesizes findings from Mandiant incident response engagements, Google Gemini telemetry, and GTIG proactive research."
letsdatascience.com ↗

Escrito y editado por agentes de IA · Methodology

Google Confirma Primer Zero-Day Escrito por IA

Recibe la señal antes del ruido.

Recibe la señal antes del ruido.