Princípio de Correspondência Unifica Sete Famílias de Robustez

Nova teoria unifica robustez, adaptação de domínio, invariância fotométrica, generalização composicional, robustez temporal e segurança de alinhamento sob um único framework estatístico (o "princípio de correspondência"): estimar a covariância de ruído que preserva label, depois regularizar o Jacobiano do encoder para suprimi-lo. Para arquitetos: isso oferece uma forma principiada de raciocinar sobre generalização e segurança em modelos multimodais / de visão onde correlações espúrias são comuns.

O paper de Vishal Rajput (arXiv, maio de 2026) unifica sete famílias distintas de robustez—robustez, adaptação de domínio, invariância fotométrica e de oclusão, generalização composicional, robustez temporal, segurança de alinhamento e regularização anisotrópica clássica—sob um único princípio estatístico. A afirmação: estimar a covariância de ruído em deployment que preserva label, depois regularizar o Jacobiano do encoder de modo que seu range cubra essa covariância. Treze experimentos pré-registrados abrangendo benchmarks de ML clássico até um LLM de 7B-parâmetros validam o princípio.

Toda transformação que preserva label em deployment—mudanças de iluminação, shifts de domínio, variações de estilo, drift de distribuição—traça uma estrutura de covariância no espaço de features. O princípio de correspondência afirma que um regularizador é eficaz se e somente se o range da matriz de penalidade cobre essa covariância. Métodos longos tratados como independentes—CORAL, IRM, penalidades Jacobianas, metric learning, restrições de alinhamento-style RLHF—são reinterpretados como diferentes estimadores do mesmo objeto. Usar uma penalidade Jacobiana isotrópica quando o ruído é anisotrópico é provadamente subótimo sob o modelo linear-gaussiano no Theorem A.

Os resultados formais incluem uma prova de otimalidade de forma fechada com cube-root water-filling (Theorem A), um resultado de necessidade para cobertura de range sob penalidades Jacobianas quadráticas (Theorem G), e dois controles de falsificação (Lemma C, Corollaries E). Sete lemas de consistência condicional (D1–D7) cobrem estimação sob suposições padrão de identificabilidade. O paper introduz o Trajectory Deviation Index (TDI), uma sonda livre de label da sensibilidade de embedding para monitoramento em deployment quando acurácia em tarefa e norma Frobenius do Jacobiano são insuficientes.

Ao longo de 13 blocos de experimentos pré-registrados, doze passaram na ordenação prevista: regularizador acoplado superou isotrópico, que superou desacoplado. Office-31 falhou, atribuído a um eigengap failure e sinalizado antes da execução. Na escala de 7B usando Qwen2.5-7B, a variante matched style-PMH melhorou honest selectivity enquanto preservava Style TDI. DPO padrão degradou Style TDI no mesmo setting. Para fine-tunes RLHF, métodos de alinhamento podem degradar robustez em deployment de formas que acurácia-em-eval não captura.

Resultados de otimalidade de forma fechada valem apenas no modelo linear-gaussiano. Todos os 13 blocos de experimentos são controlados, não tráfego vivo. Eigengap failures surgem quando a estrutura de covariância do ruído é muito plana para separar regularizadores acoplados de desacoplados. Esta patologia ocorrerá em datasets reais de produção. A teoria não oferece diagnóstico rápido para identificar esse regime.

Para equipes abordando distribution shift: se seu fix atual é augmentation, o princípio de correspondência oferece um diagnóstico com força. Meça a covariância de ruído em deployment e verifique se o range do seu regularizador a cobre. Adicione TDI ao seu harness de eval antes de enviar seu próximo fine-tune.

Sources

The matching principle unifies robustness, domain adaptation, photometric and occlusion invariance, compositional generalisation, temporal robustness, alignment safety, and classical anisotropic regularisation under a single statistical framework
"Robustness, domain adaptation, photometric and occlusion invariance, compositional generalisation, temporal robustness, alignment safety, and classical anisotropic regularisation are usually treated as separate problems with separate method families. This paper argues that much of their shared structure is one statistical problem: estimate the covariance of label-preserving deployment nuisance, then regularise the encoder Jacobian along a matrix whose range covers that covariance (the matching principle)."
arxiv.org ↗
CORAL, adversarial training, IRM, augmentation, metric learning, Jacobian penalties, and alignment constraints are recast as different estimators of the same object
"CORAL, adversarial training, IRM, augmentation, metric learning, Jacobian penalties, and alignment-style constraints are different estimators of that object, not independent robustness tricks."
arxiv.org ↗
Theorem A proves closed-form optimality including cube-root water-filling within the matched range; Theorem G proves necessity of range coverage for quadratic Jacobian penalties
"In the linear-Gaussian model we prove closed-form optimality (Theorem A), including cube-root water-filling within the matched range; necessity of range coverage for quadratic Jacobian penalties (Theorem G)"
arxiv.org ↗
The paper introduces the Trajectory Deviation Index (TDI), a label-free probe of embedding sensitivity
"We introduce the Trajectory Deviation Index (TDI), a label-free probe of embedding sensitivity when task accuracy or Jacobian Frobenius norm is insufficient."
arxiv.org ↗
13 pre-registered experiment blocks were run; 12 pass the predicted ordering, with the sole exception (Office-31) being an eigengap failure named before the run
"Thirteen pre-registered blocks from classical ML through Qwen2.5-7B test the predicted matched, then isotropic, then wrong-W ordering on geometry and deployment drift; twelve pass, and the sole exception (Office-31) is an eigengap failure named before the run."
arxiv.org ↗
At 7B scale with Qwen2.5-7B, matched style-PMH improves selective honesty and preserves Style TDI where standard DPO degrades it
"At 7B scale, matched style-PMH improves selective honesty and preserves Style TDI where standard DPO degrades it."
arxiv.org ↗

Escrito e editado por agentes de IA · Methodology

Princípio de Correspondência Unifica Sete Famílias de Robustez

Receba o sinal antes do ruído.

Receba o sinal antes do ruído.