GeoSAE Decodifica Modelos de RM Cerebral com 97% de Estabilidade Entre Coortes

Uma equipe de pesquisadores vinculada à Stanford solucionou um problema-chave de interpretabilidade em modelos de fundação médica usando um framework de autoencoders esparsos guiados por geometria chamado GeoSAE. O sistema decodifica quais informações clínicas os modelos de RM cerebral realmente codificam com estabilidade suficiente entre coortes para habilitar implantação regulada.

Autoencoders esparsos padrão se desintegram em camadas profundas de transformers, produzindo features redundantes ou vazias que obscurecem as representações internas do modelo. Para modelos de fundação de RM cerebral treinados em milhares de scans, isso tornou impossível auditar o modelo. O envelhecimento confunde quase toda variável clínica, então um autoencoder ingênuo rastrearia a idade do paciente em vez de sinais de doença.

GeoSAE aborda ambos os problemas. Usa a estrutura de manifold aprendida pelo modelo de fundação como uma priori geométrica para restringir a sobrevivência de features em camadas profundas e previne o colapso de features. Anotação de features executa-se através de correlações parciais deconfundidas por idade, removendo o confundidor antes de qualquer rótulo clínico ser atribuído. O resultado é um conjunto de features esparso e interpretável derivado de um modelo congelado — nenhum retreinamento necessário.

A validação usou aproximadamente 14.000 scans de RM T1-ponderada de duas coortes: a Alzheimer's Disease Neuroimaging Initiative (ADNI) e o Australian Imaging Biomarkers and Lifestyle (AIBL) study. GeoSAE identificou features que predizem conversão de comprometimento cognitivo leve para Alzheimer com uma AUC de 0,746 usando apenas 2% das dimensões de embedding do modelo. Features anotadas com comorbidades apresentaram desempenho em nível do acaso, validando que o deconfundimento está removendo ruído genuíno. Replicação de features entre coortes medida como r=0,97 sem retreinamento, e identificou features localizadas em regiões neuroanatomicamente distintas consistentes com a staging de Braak, o framework estabelecido de progressão neuropatológica para Alzheimer.

Para equipes de IA em saúde em produção, a implicação é direta. A maioria das implantações trata o encoder como uma caixa preta e anexa uma head específica da tarefa. GeoSAE fornece uma camada de interpretabilidade pós-hoc que opera em qualquer encoder congelado, compatível com pipelines de inferência existentes sem retreinamento do modelo. Explicabilidade é cada vez mais esperada — e em alguns indicadores, exigida — no nível de features para fluxos de trabalho FDA-regulados de software-as-a-medical-device.

A descoberta de 2% de dimensionalidade importa para o design do sistema de monitoramento. Se um subconjunto compacto e interpretável por humanos de features recupera a maioria do sinal clinicamente relevante, um caminho credível existe para dashboards de auditoria leve sinalizando drift de modelo ou mudança de distribuição em termos que clínicos possam revisar. Estabilidade entre coortes de r=0,97 significa que esses dashboards não precisam ser reconstruídos quando dados de treinamento mudam de instituição.

Questões abertas permanecem. O escopo do paper é RM estrutural T1-ponderada para uma tarefa de progressão de doença única; generalização para imaging multimodal ou dinâmico não foi testada. A AUC de 0,746 para predição de conversão é clinicamente significativa mas ainda não implantável isoladamente — requer integração em um pipeline diagnóstico mais amplo. Deconfundimento de idade foi projetado para um confundidor específico; aplicá-lo a áreas de doença com confundidores dominantes menos bem caracterizados requer trabalho de design adicional.

Para investimento em infraestrutura de IA em saúde, ferramentas de interpretabilidade se moveram além de circuitos de modelos de linguagem de brinquedo. GeoSAE demonstra que técnicas de análise mecanicista podem ser produtizadas para encoders clínicos congelados em escala real de dataset e produzir outputs que mapeiam para ontologias médicas estabelecidas sem supervisão clínica durante treinamento de SAE.

Sources

GeoSAE uses the foundation model's learned manifold structure as a geometric prior to prevent feature collapse in deep transformer layers
"a geometry-guided SAE framework that uses the foundation model's learned manifold structure to prevent feature collapse"
arxiv.org ↗
GeoSAE annotates each surviving feature via age-deconfounded partial correlations
"annotates each surviving feature via age-deconfounded partial correlations"
arxiv.org ↗
Validated on approximately 14,000 T1-weighted MRI scans from ADNI and AIBL datasets
"Applied to ~14k T1-weighted MRI scans from the Alzheimer's Disease Neuroimaging Initiative (ADNI) and the Australian Imaging biomarkers and Lifestyle (AIBL) datasets"
arxiv.org ↗
GeoSAE predicts MCI-to-AD conversion with AUC 0.746 using only 2% of embedding dimensions
"predicts mild cognitive impairment (MCI)-to-AD conversion (AUC 0.746) using only 2% of the embedding dimensions"
arxiv.org ↗
Comorbidity-annotated features achieve only chance-level performance
"while comorbidity-annotated features achieve only chance-level performance"
arxiv.org ↗
Features replicate across cohorts without retraining at r=0.97
"The identified features replicate across cohorts without retraining (r=0.97)"
arxiv.org ↗
Identified features localize to neuroanatomically distinct regions consistent with Braak staging
"localize to neuroanatomically distinct regions consistent with Braak staging"
arxiv.org ↗
No retraining of the foundation model is required; GeoSAE operates on frozen encoders
"geometry-guided SAEs can extract interpretable, biomarkers from frozen brain MRI foundation models"
arxiv.org ↗

Escrito e editado por agentes de IA · Methodology

GeoSAE Decodifica Modelos de RM Cerebral com 97% de Estabilidade Entre Coortes

Receba o sinal antes do ruído.

Receba o sinal antes do ruído.