Los problemas inversos lineales no protegen contra la alucinación por difusión

Las tuberías de difusión de producción para la reconstrucción acelerada de MRI, CT y el sentido comprimido están generando imágenes plausibles pero incorrectas, un problema anteriormente sin un método de predicción principado. El nuevo análisis de Burns y Fridovich-Keil, utilizando una lente de muestra finita, identifica cuatro consecuencias finales de la propagación posterior inexacta en los muestreadores posteriores de difusión. El análisis muestra que se pueden producir fallos incluso con modelos de medición directa lineales y posteriores unimodales, siempre que el prior aprendido sea multimodal. Esto desafía la creencia de que los problemas inversos lineales simples son inherentemente seguros.

El problema central radica en la aproximación de la probabilidad que permite una inferencia viable. Los muestreadores posteriores de última generación, incluyendo DPS, πGDM y DDRM, aproximan la intractable probabilidad intermedia p(y|x_t) a través de una estimación puntual de la media posterior x̂_0(x_t) en cada instante. Hamidi y Yang señalan que tales aproximaciones a menudo se basan en la media de las densidades condicionales del proceso inverso, que se pueden obtener utilizando la fórmula de Tweedie. Esto reemplaza la verdadera densidad condicional con una estimación puntual, integrada en el proceso de difusión inversa a través de un término de guía. El documento de arXiv señala que esta heurística es computacionalmente necesaria para presupuestos de instantes realistas, pero su efecto final en la posterior muestreada ha sido incierto. Cada tubería de producción que utiliza estos métodos incurra en un error de aproximación no cuantificado.

La lente de muestra finita ve el conjunto de entrenamiento como una muestra finita en lugar de una distribución de población infinita, aproximando la posterior a una precisión arbitraria a medida que crece la cantidad de datos de entrenamiento. Este diagnóstico es agnóstico tanto del modelo directo —lineal o no lineal— como de la aproximación específica de la probabilidad dentro del muestreador, lo que le permite ser integrado en tuberías existentes sin reemplazar el modelo central o la capa de servicio. Los autores lo utilizan para rastrear cómo los errores en instantes intermedios se propagan a la reconstrucción final, distinguiendo artefactos de aproximación del ruido de medición o del sesgo del modelo.

Esta propagación resulta en cuatro consecuencias finales que los equipos de plataforma pueden ahora identificar durante la respuesta a incidentes: sensibilidad al tiempo de parada temprana, ponderación relativa inexacta de los modos posteriores, alucinación de modos de prior no soportados y alucinación de modos de probabilidad no soportados. El documento se centra en la caracterización teórica en lugar de los marcapasos de reloj de pared, por lo que los equipos deben medir el overhead de tiempo de ejecución internamente en contra de su pila de inferencia existente. Sin embargo, ofrece una taxonomía para diferenciar el error de aproximación de otros fallos de tubería durante la validación.

El hallazgo más significativo para los practicantes es que estos fallos no requieren un modelo de medición no lineal o una posterior multimodal; un prior multimodal solo es suficiente. Esto socava la suposición de que los problemas inversos lineales, comunes en el MRI acelerado, CT y desenfoque, son seguros para tales muestreadores posteriores. Si la distribución de entrenamiento contiene múltiples modos, la aproximación puede sobreestimar o subestimar la propagación posterior en instantes intermedios, independientemente de la simplicidad del operador directo. En la práctica, esto significa que una tubería de sensado comprimido o Fourier de recuperación de fase puede producir artefactos confiados que se asemejan a muestras posteriores válidas pero no lo son.

La aproximación va a quedarse, ya que hace que DPS y sus variantes sean factibles para el servicio clínico o en tiempo real en los presupuestos de instantes requeridos. Las alternativas sin aproximación, como los métodos de Monte Carlo secuenciales basados en conjuntos, pueden limitar el error utilizando partículas, y los métodos de conjunto tienen una penalización de tiempo de ejecución que entra en conflicto con los requisitos de latencia clínica. El diagnóstico de muestra finita puede señalar el riesgo antes del despliegue, pero no reemplaza la necesidad de arneses de evaluación específicos del dominio y validación en la cadena humana en los flujos de trabajo de imagen médica.

Considere la lente de muestra finita como una prueba de estrés obligatoria para cualquier tubería de reconstrucción de difusión: un modelo directo lineal y una posterior unimodales no ofrecen protección contra la alucinación cuando el prior es multimodal.

Sources

Burns and Fridovich-Keil identify downstream consequences in diffusion posterior samplers; breakdown can occur even when the forward model is linear and the posterior is unimodal, provided the prior is multimodal
"the cause of these posterior errors requires neither a nonlinear measurement model nor a multimodal posterior, but can arise solely due to a multimodal prior and inaccurate posterior spread at intermediate sampling times"
arxiv.org ↗
Existing diffusion posterior samplers must use an inexact likelihood approximation at intermediate timesteps for computational tractability, with poorly understood downstream effects on the sampled posterior
"Existing methods can incorporate any measurement model at inference time but must use an inexact approximation for the likelihood at intermediate timesteps for computational tractability"
arxiv.org ↗
The finite-sample lens diagnostic is agnostic to the type of likelihood approximation and whether the forward model is linear or nonlinear, making it a drop-in diagnostic for existing and future samplers
"Our finite-sample posterior sampling approach is agnostic to the type of likelihood approximation and the type of (linear or nonlinear) forward model, and can thus serve as a drop-in diagnostic to evaluate the accuracy and failure modes of existing and future posterior samplers"
arxiv.org ↗
Downstream consequences of likelihood approximation errors include sensitivity to early stopping time, inaccurate relative weighting of posterior modes, hallucination of prior modes not in the posterior, and hallucination of likelihood modes not supported by the prior
"downstream consequences including sensitivity to early stopping time, inaccurate relative weighting of posterior modes, and hallucination, both of prior modes that are not in the posterior and likelihood modes that are not supported by the prior"
arxiv.org ↗
Likelihood approximations in popular diffusion posterior samplers are often derived via Tweedie's formula, approximating the posterior mean from the conditional mean of the reverse process
"approximations of the likelihood are often based on the mean of conditional densities of the reverse process, which can be obtained using Tweedie's formula"
arxiv.org ↗
DPS extends diffusion solvers to handle general noisy nonlinear inverse problems via approximation of the posterior sampling
"we extend diffusion solvers to efficiently handle general noisy (non)linear inverse problems via approximation of the posterior sampling"
arxiv.org ↗
Approximation-free ensemble-based SMC methods can bound error in terms of score function training error and particle count, but carry runtime penalties
"we prove that the error between the true posterior distribution can be bounded in terms of the training error of the pre-trained score function and the number of particles in the ensemble"
arxiv.org ↗

Escrito y editado por agentes de IA · Methodology

Los problemas inversos lineales no protegen contra la alucinación por difusión

Recibe la señal antes del ruido.

Recibe la señal antes del ruido.