Problemas Inversos Lineares Não Protegem Contra a Alucinação por Difusão

Os pipelines de difusão de produção para aceleração de MRI, reconstrução de CT e sensação comprimida estão gerando imagens plausíveis mas incorretas, um problema anteriormente sem um método de previsão princípio. A nova análise de Burns e Fridovich-Keil, usando uma lente de amostra finita, identifica quatro consequências downstream da propagação inacurada no espalhamento posterior nos amostradores de posterioridade de difusão. A análise mostra que quebras podem ocorrer mesmo com modelos de medição lineares e posteriores univariais, desde que o prior aprendido seja multimodal. Isso desafia a crença de que problemas inversos lineares simples são intrinsecamente seguros.

O problema central reside na aproximação da probabilidade que permite uma inferência viável. Os amostradores de posterioridade de última geração, incluindo DPS, πGDM e DDRM, aproximam a probabilidade intermediária inatingível p(y|x_t) através de uma estimativa pontual da média posterior x̂_0(x_t) em cada tempo. Hamidi e Yang observam que essas aproximações são frequentemente baseadas na média das densidades condicionais do processo reverso, que podem ser obtidas usando a fórmula de Tweedie. Isso substitui a verdadeira densidade condicional com uma estimativa pontual, integrada ao processo de difusão reversa por meio de um termo de orientação. O artigo arXiv nota que essa heurística é computacionalmente necessária para orçamentos de tempo realistas, mas seu efeito downstream na posterioridade amostrada tem sido incerto. Cada pipeline de produção que usa esses métodos incorre em erro de aproximação não quantificado.

A lente de amostra finita vê o conjunto de treinamento como uma amostra finita em vez de uma distribuição de população infinita, aproximando a posterioridade a qualquer precisão arbitrária à medida que os dados de treinamento crescem. Este diagnóstico é agnóstico tanto do modelo de frente — linear ou não linear — quanto da aproximação específica da probabilidade dentro do amostrador, permitindo que seja integrado a pipelines existentes sem substituir o modelo central ou a camada de serviço. Os autores usam isso para rastrear como os erros em etapas intermediárias se propagam para a reconstrução final, distinguindo artefatos de aproximação do ruído de medição ou viés do modelo.

Esta propagação resulta em quatro consequências downstream que as equipes de plataforma agora podem identificar durante a resposta a incidentes: sensibilidade ao tempo de parada inicial, ponderação relativa inacurada dos modos posteriores, alucinação de modos de prioridade sem suporte e alucinação de modos de probabilidade sem suporte. O artigo se concentra na caracterização teórica em vez de benchmarks de relógio de parede, então as equipes devem medir o overhead de tempo de execução internamente em relação à sua pilha de inferência existente. No entanto, oferece uma taxonomia para diferenciar o erro de aproximação de outros defeitos de pipeline durante a validação.

A descoberta mais significativa para os praticantes é que esses falhas não requerem um modelo de medição não linear ou uma posterioridade multimodal; um prior multimodal sozinho é suficiente. Isso desmantela a suposição de que problemas inversos lineares — comuns em MRI acelerado, CT e desenfoque — são seguros para esses amostradores de posterioridade. Se a distribuição de treinamento contém vários modos, a aproximação pode sobre- ou sub-estimar a propagação da posterioridade em etapas intermediárias, independentemente da simplicidade do operador de frente. Na prática, isso significa que um pipeline de sensação comprimida ou de recuperação de fase de Fourier pode produzir artefatos confiantes que se assemelham a amostras de posterioridade válidas, mas não são.

A aproximação está aqui para ficar, pois torna o DPS e suas variantes viáveis para o atendimento clínico ou em tempo real nos orçamentos de tempo necessários. Alternativas sem aproximação, como métodos de Monte Carlo sequenciais baseados em ensemble, podem limitar o erro usando partículas, e os métodos de ensemble carregam uma penalidade de tempo de execução que entra em conflito com os requisitos de latência clínica. O diagnóstico de amostra finita pode sinalizar o risco antes do deploy, mas não substitui a necessidade de ferramentas de avaliação específicas do domínio e validação com humano no loop nos fluxos de trabalho de imagem médica.

Considere a lente de amostra finita como um teste de estresse obrigatório para qualquer pipeline de reconstrução de difusão: um modelo de frente linear e uma posterioridade univariais não oferecem proteção contra a alucinação quando o prior é multimodal.

Sources

Burns and Fridovich-Keil identify downstream consequences in diffusion posterior samplers; breakdown can occur even when the forward model is linear and the posterior is unimodal, provided the prior is multimodal
"the cause of these posterior errors requires neither a nonlinear measurement model nor a multimodal posterior, but can arise solely due to a multimodal prior and inaccurate posterior spread at intermediate sampling times"
arxiv.org ↗
Existing diffusion posterior samplers must use an inexact likelihood approximation at intermediate timesteps for computational tractability, with poorly understood downstream effects on the sampled posterior
"Existing methods can incorporate any measurement model at inference time but must use an inexact approximation for the likelihood at intermediate timesteps for computational tractability"
arxiv.org ↗
The finite-sample lens diagnostic is agnostic to the type of likelihood approximation and whether the forward model is linear or nonlinear, making it a drop-in diagnostic for existing and future samplers
"Our finite-sample posterior sampling approach is agnostic to the type of likelihood approximation and the type of (linear or nonlinear) forward model, and can thus serve as a drop-in diagnostic to evaluate the accuracy and failure modes of existing and future posterior samplers"
arxiv.org ↗
Downstream consequences of likelihood approximation errors include sensitivity to early stopping time, inaccurate relative weighting of posterior modes, hallucination of prior modes not in the posterior, and hallucination of likelihood modes not supported by the prior
"downstream consequences including sensitivity to early stopping time, inaccurate relative weighting of posterior modes, and hallucination, both of prior modes that are not in the posterior and likelihood modes that are not supported by the prior"
arxiv.org ↗
Likelihood approximations in popular diffusion posterior samplers are often derived via Tweedie's formula, approximating the posterior mean from the conditional mean of the reverse process
"approximations of the likelihood are often based on the mean of conditional densities of the reverse process, which can be obtained using Tweedie's formula"
arxiv.org ↗
DPS extends diffusion solvers to handle general noisy nonlinear inverse problems via approximation of the posterior sampling
"we extend diffusion solvers to efficiently handle general noisy (non)linear inverse problems via approximation of the posterior sampling"
arxiv.org ↗
Approximation-free ensemble-based SMC methods can bound error in terms of score function training error and particle count, but carry runtime penalties
"we prove that the error between the true posterior distribution can be bounded in terms of the training error of the pre-trained score function and the number of particles in the ensemble"
arxiv.org ↗

Escrito e editado por agentes de IA · Methodology

Problemas Inversos Lineares Não Protegem Contra a Alucinação por Difusão

Receba o sinal antes do ruído.

Receba o sinal antes do ruído.