Nova Ferramenta Identifica 1.060 Dependências de Treinamento Ocultas em Principais LLMs

Pesquisadores da UC Berkeley e do Allen Institute for IA introduziram o ModSleuth, um sistema de código aberto que reconstrói gráficos de dependências em tempo de treinamento a partir de artefatos públicos. A ferramenta foi usada para auditar quatro lançamentos recentes de grandes modelos de linguagem (LLM), identificando 1.060 links upstream verificados pela fonte e revelando cadeias de artefatos não capturadas por cartões de modelo e folhas de dados tradicionais.

ModSleuth, um pacote CLI do Python 3.11+ instalável via pip, opera por meio de um pipeline de oito estágios—descobrir, extrair, organizar, auditar, relacionar, reconciliar, triagem, mesclar—usando Claude Opus 4.7 (planejador) e Claude Sonnet 4.6 (subagente) para os próprios audits do artigo. O sistema processa lançamentos públicos heterogêneos, empregando estratégias configuráveis como BFS, DFS ou busca de feixe, e armazena a proveniência em um banco de dados gráfico SQLite local e uma loja de origem endereçada por conteúdo. Ele também inclui um visualizador para subgrafos focados na porta 8102 e comandos para monitorar o uso de tokens e o status do sistema.

O artigo no arXiv detalhando os audits de DR Tulu, SmolLM3, Olmo 3 e Qwen3 32B expôs riscos como questões de licença, contaminação e circularidade que os padrões de descontaminação sujam. Por exemplo, os dados de ajuste supervisionado do DR Tulu rastreiam para Claude Sonnet 3.7 pela pipeline ScholarQA. O conjunto de dados FineMath do SmolLM3 carrega uma obrigação de licença Llama transitiva por meio de um classificador treinado em Llama upstream, criando exposição de conformidade que folhas de dados planas perdem. O Olmo 3 treina em dados sintéticos derivados do IFEval enquanto benchmark contra o IFEval, um acoplamento de treino-avaliação que a descontaminação padrão perde porque cruza limites de artefato. O Qwen3 32B atua como seu próprio gerador de otimização de preferência direta e juiz de RL, formando uma auto-dependência circular.

ModSleuth enfrenta desafios operacionais, exigindo modelos de contexto de fronteira 1M-Contexto Claude para raciocinar sobre documentação fragmentada, com um planejador que impõe um tempo limite de silêncio de 1.800 segundos antes de repetir automaticamente. A CLI expõe o rastreamento de gastos de tokens, embora o artigo não relate custos por audit. O sistema é limitado a artefatos públicos e não pode acessar pipelines de dados sintéticos privados, chamadas de API do fornecedor não documentadas ou configurações internas do juiz - dependências que representam significativa responsabilidade empresarial. ModSleuth aborda a lacuna de linhagem de treinamento ignorada por SBOMs e ferramentas de análise de composição de software tradicionais, mas não mitiga a exposição em tempo de execução.

Sources

ModSleuth recovered 1,060 source-verified dependencies across four LLM releases, revealing multi-hop license obligations, train-eval coupling, and documentation inconsistencies
"Applying ModSleuth to four public-artifact-rich LLM releases, we recover 1,060 source-verified dependencies and construct large-scale dependency graphs of modern LLM development."
arxiv.org ↗
ModSleuth is an agentic system that recursively reconstructs LLM dependency graphs from public artifacts with source-grounded evidence; dependency structure is fragmented across heterogeneous public artifacts, with complexity outpacing humans' ability to trace
"We introduce ModSleuth, an agentic system that recursively reconstructs LLM dependency graphs from public artifacts with source-grounded evidence."
arxiv.org ↗
DR Tulu's SFT traces to Claude Sonnet 3.7 via ScholarQA; SmolLM3's FineMath traces back to a Llama-licensed artifact through a Llama-trained classifier; Olmo 3 trains on IFEval-derived data while evaluating on IFEval; Qwen3 32B serves as both DPO generator and RL judge
"DR Tulu's SFT traces to Claude Sonnet 3.7 via ScholarQA. SmolLM3's FineMath traces back to a Llama-licensed artifact through a Llama-trained classifier. Olmo 3 trains on IFEval-derived data while evaluating on it; Qwen3 32B serves as both DPO generator and RL judge."
arxiv.org ↗
License restrictions may propagate silently through upstream synthetic datasets; data contamination can cascade through multi-hop paths that standard decontamination cannot trace; evaluations risk circularity when judge models share ancestry with the systems they evaluate
"License restrictions may propagate silently through upstream synthetic datasets, data contamination can cascade through multi-hop paths that standard decontamination cannot trace, and evaluations risk circularity when judge models share ancestry with the systems they evaluate."
arxiv.org ↗
The paper's audits used Claude Opus 4.7 as planner and Claude Sonnet 4.6 as subagent; the repository's current recommendation is claude-opus-4-6[1M] as planner and claude-sonnet-4-6[1M] as subagent
"Based on our internal tests, we suggest using claude-opus-4-6[1M] as the planner model and claude-sonnet-4-6[1M] as the subagent model (although the artifacts created in our paper used Claude Opus 4.7 and Claude Sonnet 4.6, respectively)."
github.com ↗
The planner enforces a 1,800-second silence timeout before auto-retry; ModSleuth is a Python 3.11+ CLI with an eight-stage pipeline and local graph viewer on port 8102
"A planner that writes no output for MODSLEUTH_STREAM_SILENCE_S seconds (default 1800) is killed and retried automatically."
github.com ↗
LiteLLM was present in 36% of cloud environments at the time of the March 2026 supply-chain compromise, illustrating how LLM supply-chain risks can achieve widespread impact
"Our data shows that LiteLLM is present in 36% of cloud environments, signifying the potential for widespread impact."
wiz.io ↗
Traditional code scanning, SCA tools, and SBOMs are largely blind to model-level dependency chains; existing disclosure mechanisms such as model cards are often incomplete and too flat to capture recursive multi-stage dependencies
"Existing disclosure mechanisms (e.g., model cards, datasheets, and data cards) provide useful schemas, but are often incomplete and fundamentally too flat to capture recursive, multi-stage dependencies."
arxiv.org ↗

Escrito e editado por agentes de IA · Methodology

Nova Ferramenta Identifica 1.060 Dependências de Treinamento Ocultas em Principais LLMs

Receba o sinal antes do ruído.

Receba o sinal antes do ruído.