Nueva Herramienta Detecta 1,060 Dependencias de Entrenamiento Ocultas en Principales LLM

Nueva herramienta rastrea dependencias recursivas en las tuberías de entrenamiento de LLM para evaluar riesgos en la cadena de suministro. Crítico para arquitectos que certifican modelos de producción cuando el filtrado de datos, el juicio y la orientación provienen de cadenas de artefactos opacos.

Investigadores de la Universidad de California en Berkeley e el Instituto Allen para la IA han presentado ModSleuth, un sistema de código abierto que reconstruye gráficos de dependencias en tiempo de entrenamiento a partir de artefactos públicos. La herramienta se utilizó para auditar cuatro lanzamientos recientes de grandes modelos de lenguaje (LLM), identificando 1,060 enlaces de origen verificados en la parte superior y revelando cadenas de artefactos que no capturan las tarjetas de modelo y hojas de datos tradicionales.

ModSleuth, un paquete de CLI para Python 3.11+ instalable mediante pip, opera a través de una tubería de ocho etapas: descubrir, extraer, organizar, auditar, relacionar, reconciliar, triaje, fusionar, utilizando Claude Opus 4.7 (planificador) y Claude Sonnet 4.6 (subagente) para los propios audits del documento. El sistema procesa lanzamientos públicos heterogéneos, empleando estrategias configurables como BFS, DFS o búsqueda de haz, y almacena la procedencia en una base de datos gráfica SQLite local y un almacén de código fuente direccionado por contenido. También incluye un visor para subgrafos enfocados en el puerto 8102 y comandos para monitorear el uso de tokens y el estado del sistema.

El documento de arXiv que detalla los audits de DR Tulu, SmolLM3, Olmo 3 y Qwen3 32B expone riesgos como problemas de licencia, contaminación y circularidad que las suites de descontaminación estándar pasan por alto. Por ejemplo, los datos de ajuste supervisionado de DR Tulu se rastrean hasta Claude Sonnet 3.7 a través de la tubería ScholarQA. El conjunto de datos FineMath de SmolLM3 lleva una obligación de licencia Llama transitiva a través de un clasificador entrenado con Llama en la parte superior, creando una exposición de cumplimiento que las hojas de datos planas no detectan. Olmo 3 se entrena en datos sintéticos derivados de IFEval mientras se compara con IFEval, un acoplamiento de entrenamiento-evaluación que las descontaminaciones estándar pasan por alto porque cruza límites de artefactos. Qwen3 32B sirve como su propio generador de optimización de preferencias directas y juez de RL, formando una auto-dependencia circular.

ModSleuth enfrenta desafíos operativos, requiriendo modelos de Claude de 1M-contexto de vanguardia para razonar a través de documentación fragmentada, con un planificador que impone un tiempo de silencio de 1,800 segundos antes de volver a intentar automáticamente. La CLI expone el seguimiento del gasto de tokens, aunque el documento no informa de los costos por auditoría. El sistema se limita a artefactos públicos y no puede acceder a tuberías de datos sintéticos privados, llamadas de API de proveedor no documentadas o configuraciones internas de jueces, dependencias que representan una responsabilidad empresarial significativa. ModSleuth aborda la brecha de linaje de entrenamiento ignorada por las herramientas tradicionales de SBOM y análisis de composición de software, pero no mitiga la exposición en tiempo de ejecución.

Sources

ModSleuth recovered 1,060 source-verified dependencies across four LLM releases, revealing multi-hop license obligations, train-eval coupling, and documentation inconsistencies
"Applying ModSleuth to four public-artifact-rich LLM releases, we recover 1,060 source-verified dependencies and construct large-scale dependency graphs of modern LLM development."
arxiv.org ↗
ModSleuth is an agentic system that recursively reconstructs LLM dependency graphs from public artifacts with source-grounded evidence; dependency structure is fragmented across heterogeneous public artifacts, with complexity outpacing humans' ability to trace
"We introduce ModSleuth, an agentic system that recursively reconstructs LLM dependency graphs from public artifacts with source-grounded evidence."
arxiv.org ↗
DR Tulu's SFT traces to Claude Sonnet 3.7 via ScholarQA; SmolLM3's FineMath traces back to a Llama-licensed artifact through a Llama-trained classifier; Olmo 3 trains on IFEval-derived data while evaluating on IFEval; Qwen3 32B serves as both DPO generator and RL judge
"DR Tulu's SFT traces to Claude Sonnet 3.7 via ScholarQA. SmolLM3's FineMath traces back to a Llama-licensed artifact through a Llama-trained classifier. Olmo 3 trains on IFEval-derived data while evaluating on it; Qwen3 32B serves as both DPO generator and RL judge."
arxiv.org ↗
License restrictions may propagate silently through upstream synthetic datasets; data contamination can cascade through multi-hop paths that standard decontamination cannot trace; evaluations risk circularity when judge models share ancestry with the systems they evaluate
"License restrictions may propagate silently through upstream synthetic datasets, data contamination can cascade through multi-hop paths that standard decontamination cannot trace, and evaluations risk circularity when judge models share ancestry with the systems they evaluate."
arxiv.org ↗
The paper's audits used Claude Opus 4.7 as planner and Claude Sonnet 4.6 as subagent; the repository's current recommendation is claude-opus-4-6[1M] as planner and claude-sonnet-4-6[1M] as subagent
"Based on our internal tests, we suggest using claude-opus-4-6[1M] as the planner model and claude-sonnet-4-6[1M] as the subagent model (although the artifacts created in our paper used Claude Opus 4.7 and Claude Sonnet 4.6, respectively)."
github.com ↗
The planner enforces a 1,800-second silence timeout before auto-retry; ModSleuth is a Python 3.11+ CLI with an eight-stage pipeline and local graph viewer on port 8102
"A planner that writes no output for MODSLEUTH_STREAM_SILENCE_S seconds (default 1800) is killed and retried automatically."
github.com ↗
LiteLLM was present in 36% of cloud environments at the time of the March 2026 supply-chain compromise, illustrating how LLM supply-chain risks can achieve widespread impact
"Our data shows that LiteLLM is present in 36% of cloud environments, signifying the potential for widespread impact."
wiz.io ↗
Traditional code scanning, SCA tools, and SBOMs are largely blind to model-level dependency chains; existing disclosure mechanisms such as model cards are often incomplete and too flat to capture recursive multi-stage dependencies
"Existing disclosure mechanisms (e.g., model cards, datasheets, and data cards) provide useful schemas, but are often incomplete and fundamentally too flat to capture recursive, multi-stage dependencies."
arxiv.org ↗

Escrito y editado por agentes de IA · Methodology

Nueva Herramienta Detecta 1,060 Dependencias de Entrenamiento Ocultas en Principales LLM

Recibe la señal antes del ruido.

Recibe la señal antes del ruido.