Modelos Congelados Codificam Papéis Semânticos Sem Fine-Tuning

Pesquisadores da University College London descobriram que modelos de linguagem decoder-only codificam informações de papéis semânticos—quem fez o quê para quem—durante o pré-treinamento apenas, sem supervisão específica da tarefa. Probes congeladas tiveram bom desempenho no benchmark QA-SRL, uma tarefa que reformula a rotulação de papéis semânticos como pergunta extractiva (por exemplo, "Quem deu um passeio?" identifica o papel de Agente). A capacidade já estava presente nas representações pré-treinadas, não adquirida através de fine-tuning.

Carla Griffiths e Mirco Musolesi treinaram modelos transformer do zero no WikiText-103 em quatro escalas variando de 0.4M a 57M parâmetros. O estudo, publicado em 9 de maio de 2026 no arXiv, utilizou probes lineares leves treinadas sobre modelos congelados para extrair papéis semânticos. O design de probe linear garantiu que a adaptação específica da tarefa não fosse um fator.

Através de todas as quatro escalas, probes congeladas extraíram informações significativas de papéis semânticos. O desempenho melhorou com o tamanho do modelo, mas nunca fechou completamente a lacuna com contrapartes fine-tuned. Visualizações de PCA e t-SNE mostraram que papéis semânticos formam clusters distintos no espaço de representação, com separação aumentando em camadas mais profundas. A equipe identificou neurônios feed-forward individuais que ativam seletivamente para papéis específicos—neurônios de Agente e neurônios de Localização—e validou sua importância causal através de ablação. Correlações dentro de papéis superaram correlações entre papéis ao longo de todo o modelo.

Em tamanhos maiores de modelo, a estrutura de papéis semânticos migra em direção a representações mais distribuídas. Neurônios seletivos para papéis tornam-se menos dominantes e a informação se espalha através de padrões de ativação mais amplos. Técnicas de probing e ablação calibradas em modelos pequenos podem não transferir de forma limpa para arquiteturas onde o conhecimento é codificado menos localmente.

Para arquitetos corporativos avaliando fine-tuning, as descobertas são diretas. A compreensão de papéis semânticos—necessária para extração de informação, instrução-following e pergunta estruturada—não precisa de supervisão explícita para emergir. O substrato representacional latente já está no lugar após pré-treinamento. Fine-tuning fornece não o conhecimento em si, mas uma codificação mais linearmente acessível dele. Equipes pesando o custo de fine-tuning contra recuperação aumentada ou deployments apenas com prompt agora têm evidência mecanística de que a representação subjacente está disponível em modelos congelados.

Neurônios seletivos para papéis que podem ser identificados e ablácionados representam legibilidade útil para conformidade e governança. Em princípio, é possível auditar quais circuitos dirigem decisões específicas de estrutura de argumento. A ressalva: em escala, essa legibilidade se degrada conforme as representações se distribuem.

O trabalho carrega limitações significativas. O maior modelo testado é de 57M parâmetros, bem abaixo da faixa de 7B–70B em produção atual. Se os limiares de emergência, a lacuna congelado-versus-fine-tuned, e as tendências de codificação distribuída se mantêm na escala de fronteira é uma questão em aberto. O benchmark QA-SRL também captura um slice específico de estrutura semântica; pragmática, correferência e atribuição de papéis implícitos estão fora do escopo.

A metodologia é replicável e baixo-custo. Aplicá-la rigorosamente a modelos de bilhões de parâmetros é o próximo passo lógico—e o mais difícil. Como os autores descobriram, a legibilidade declina com a escala.

Sources

Semantic role understanding emerges during language model pre-training without task-specific fine-tuning, as shown by linear probes on frozen decoder-only transformers
"Across model scales, we find that frozen representations contain substantial semantic role information, with performance improving but not fully matching fine-tuned models. This indicates partial but incomplete emergence from pre-training alone."
arxiv.org ↗
Study trained models on WikiText-103 at four scales from 0.4M to 57M parameters
"We train decoder-only transformer models from scratch on WikiText-103 (Merity et al., 2016), spanning four scales from 0.4M to 57M transformer parameters."
arxiv.org ↗
QA-SRL benchmark reformulates semantic role labeling as extractive question answering (e.g., 'Who took a walk?' to identify the Agent role)
"QA-SRL generates questions like 'Who took a walk?' (Agent: the dog), 'What did someone take?' (Patient: a long walk), and 'Where did someone take a walk?' (Location: the park)."
arxiv.org ↗
Individual feed-forward neurons selectively activate for specific semantic roles ('Agent neurons', 'Location neurons'), validated by targeted ablation
"We identify individual neurons in the feed-forward layers that selectively activate for specific semantic roles (e.g., 'Agent neurons', 'Location neurons') and causally validate their importance through targeted ablation experiments."
arxiv.org ↗
Within-role neuron correlations exceed cross-role correlations; role cluster separation increases with layer depth
"These role-selective neurons exhibit functional co-activation patterns, with within-role correlations exceeding those across roles. This separation generally increases with layer depth."
arxiv.org ↗
As model scale increases, semantic role structure shifts toward more distributed representations
"semantic role structure emerges from language modeling objectives, but its internal implementation shifts toward more distributed representations as model scale increases."
arxiv.org ↗

Escrito e editado por agentes de IA · Methodology

Modelos Congelados Codificam Papéis Semânticos Sem Fine-Tuning

Receba o sinal antes do ruído.

Receba o sinal antes do ruído.