Principio de Correspondencia Unifica Siete Familias de Robustez

Nueva teoría unifica robustez, adaptación de dominio, invariancia fotométrica, generalización composicional, robustez temporal y seguridad de alineamiento bajo un único marco estadístico (el "principio de correspondencia"): estimar la covarianza de ruido que preserva etiquetas, luego regularizar el Jacobiano del encoder para suprimirlo. Para arquitectos: esto proporciona una forma principiada de razonar sobre generalización y seguridad en modelos multimodales / de visión donde las correlaciones espurias son comunes.

El paper de Vishal Rajput (arXiv, mayo de 2026) unifica siete familias distintas de robustez—robustez, adaptación de dominio, invariancia fotométrica y de oclusión, generalización composicional, robustez temporal, seguridad de alineamiento y regularización anisotrópica clásica—bajo un único principio estadístico. La afirmación: estimar la covarianza de ruido en deployment que preserva etiquetas, luego regularizar el Jacobiano del encoder de modo que su rango cubra esa covarianza. Trece experimentos preregistrados abarcando benchmarks de ML clásico hasta un LLM de 7B parámetros validan el principio.

Toda transformación que preserva etiquetas en deployment—cambios de iluminación, shifts de dominio, variaciones de estilo, drift de distribución—traza una estructura de covarianza en el espacio de características. El principio de correspondencia afirma que un regularizador es efectivo si y solo si el rango de la matriz de penalidad cubre esa covarianza. Métodos largo tiempo tratados como independientes—CORAL, IRM, penalidades Jacobianas, metric learning, restricciones de alineamiento-style RLHF—se reinterpretan como diferentes estimadores del mismo objeto. Usar una penalidad Jacobiana isotrópica cuando el ruido es anisotrópico es probadamente subóptimo bajo el modelo lineal-gaussiano en el Theorem A.

Los resultados formales incluyen una prueba de optimalidad de forma cerrada con cube-root water-filling (Theorem A), un resultado de necesidad para cobertura de rango bajo penalidades Jacobianas cuadráticas (Theorem G), y dos controles de falsación (Lemma C, Corollaries E). Siete lemas de consistencia condicional (D1–D7) cubren estimación bajo supuestos estándar de identificabilidad. El paper introduce el Trajectory Deviation Index (TDI), una sonda libre de etiquetas de la sensibilidad de embedding para monitoreo en deployment cuando exactitud en tarea y norma Frobenius del Jacobiano son insuficientes.

A lo largo de 13 bloques de experimentos preregistrados, doce pasaron el ordenamiento predicho: regularizador acoplado superó isotrópico, que superó desacoplado. Office-31 falló, atribuido a un eigengap failure y señalizado antes de la ejecución. En la escala de 7B usando Qwen2.5-7B, la variante matched style-PMH mejoró honest selectivity mientras preservaba Style TDI. DPO estándar degradó Style TDI en el mismo setting. Para fine-tunes RLHF, métodos de alineamiento pueden degradar robustez en deployment de formas que exactitud-en-eval no captura.

Resultados de optimalidad de forma cerrada valen solo en el modelo lineal-gaussiano. Todos los 13 bloques de experimentos son controlados, no tráfico vivo. Eigengap failures surgen cuando la estructura de covarianza del ruido es demasiado plana para separar regularizadores acoplados de desacoplados. Esta patología ocurrirá en datasets reales de producción. La teoría no ofrece diagnóstico rápido para identificar ese régimen.

Para equipos abordando distribution shift: si su solución actual es augmentation, el principio de correspondencia ofrece un diagnóstico con peso. Mida la covarianza de ruido en deployment y verifique si el rango de su regularizador la cubre. Añada TDI a su harness de eval antes de enviar su próximo fine-tune.

Sources

The matching principle unifies robustness, domain adaptation, photometric and occlusion invariance, compositional generalisation, temporal robustness, alignment safety, and classical anisotropic regularisation under a single statistical framework
"Robustness, domain adaptation, photometric and occlusion invariance, compositional generalisation, temporal robustness, alignment safety, and classical anisotropic regularisation are usually treated as separate problems with separate method families. This paper argues that much of their shared structure is one statistical problem: estimate the covariance of label-preserving deployment nuisance, then regularise the encoder Jacobian along a matrix whose range covers that covariance (the matching principle)."
arxiv.org ↗
CORAL, adversarial training, IRM, augmentation, metric learning, Jacobian penalties, and alignment constraints are recast as different estimators of the same object
"CORAL, adversarial training, IRM, augmentation, metric learning, Jacobian penalties, and alignment-style constraints are different estimators of that object, not independent robustness tricks."
arxiv.org ↗
Theorem A proves closed-form optimality including cube-root water-filling within the matched range; Theorem G proves necessity of range coverage for quadratic Jacobian penalties
"In the linear-Gaussian model we prove closed-form optimality (Theorem A), including cube-root water-filling within the matched range; necessity of range coverage for quadratic Jacobian penalties (Theorem G)"
arxiv.org ↗
The paper introduces the Trajectory Deviation Index (TDI), a label-free probe of embedding sensitivity
"We introduce the Trajectory Deviation Index (TDI), a label-free probe of embedding sensitivity when task accuracy or Jacobian Frobenius norm is insufficient."
arxiv.org ↗
13 pre-registered experiment blocks were run; 12 pass the predicted ordering, with the sole exception (Office-31) being an eigengap failure named before the run
"Thirteen pre-registered blocks from classical ML through Qwen2.5-7B test the predicted matched, then isotropic, then wrong-W ordering on geometry and deployment drift; twelve pass, and the sole exception (Office-31) is an eigengap failure named before the run."
arxiv.org ↗
At 7B scale with Qwen2.5-7B, matched style-PMH improves selective honesty and preserves Style TDI where standard DPO degrades it
"At 7B scale, matched style-PMH improves selective honesty and preserves Style TDI where standard DPO degrades it."
arxiv.org ↗

Escrito y editado por agentes de IA · Methodology

Principio de Correspondencia Unifica Siete Familias de Robustez

Recibe la señal antes del ruido.

Recibe la señal antes del ruido.