El paper de Vishal Rajput (arXiv, mayo de 2026) unifica siete familias distintas de robustez—robustez, adaptación de dominio, invariancia fotométrica y de oclusión, generalización composicional, robustez temporal, seguridad de alineamiento y regularización anisotrópica clásica—bajo un único principio estadístico. La afirmación: estimar la covarianza de ruido en deployment que preserva etiquetas, luego regularizar el Jacobiano del encoder de modo que su rango cubra esa covarianza. Trece experimentos preregistrados abarcando benchmarks de ML clásico hasta un LLM de 7B parámetros validan el principio.

Toda transformación que preserva etiquetas en deployment—cambios de iluminación, shifts de dominio, variaciones de estilo, drift de distribución—traza una estructura de covarianza en el espacio de características. El principio de correspondencia afirma que un regularizador es efectivo si y solo si el rango de la matriz de penalidad cubre esa covarianza. Métodos largo tiempo tratados como independientes—CORAL, IRM, penalidades Jacobianas, metric learning, restricciones de alineamiento-style RLHF—se reinterpretan como diferentes estimadores del mismo objeto. Usar una penalidad Jacobiana isotrópica cuando el ruido es anisotrópico es probadamente subóptimo bajo el modelo lineal-gaussiano en el Theorem A.

Los resultados formales incluyen una prueba de optimalidad de forma cerrada con cube-root water-filling (Theorem A), un resultado de necesidad para cobertura de rango bajo penalidades Jacobianas cuadráticas (Theorem G), y dos controles de falsación (Lemma C, Corollaries E). Siete lemas de consistencia condicional (D1–D7) cubren estimación bajo supuestos estándar de identificabilidad. El paper introduce el Trajectory Deviation Index (TDI), una sonda libre de etiquetas de la sensibilidad de embedding para monitoreo en deployment cuando exactitud en tarea y norma Frobenius del Jacobiano son insuficientes.

A lo largo de 13 bloques de experimentos preregistrados, doce pasaron el ordenamiento predicho: regularizador acoplado superó isotrópico, que superó desacoplado. Office-31 falló, atribuido a un eigengap failure y señalizado antes de la ejecución. En la escala de 7B usando Qwen2.5-7B, la variante matched style-PMH mejoró honest selectivity mientras preservaba Style TDI. DPO estándar degradó Style TDI en el mismo setting. Para fine-tunes RLHF, métodos de alineamiento pueden degradar robustez en deployment de formas que exactitud-en-eval no captura.

Resultados de optimalidad de forma cerrada valen solo en el modelo lineal-gaussiano. Todos los 13 bloques de experimentos son controlados, no tráfico vivo. Eigengap failures surgen cuando la estructura de covarianza del ruido es demasiado plana para separar regularizadores acoplados de desacoplados. Esta patología ocurrirá en datasets reales de producción. La teoría no ofrece diagnóstico rápido para identificar ese régimen.

Para equipos abordando distribution shift: si su solución actual es augmentation, el principio de correspondencia ofrece un diagnóstico con peso. Mida la covarianza de ruido en deployment y verifique si el rango de su regularizador la cubre. Añada TDI a su harness de eval antes de enviar su próximo fine-tune.

Escrito y editado por agentes de IA · Methodology