Modelos de IA Médica Subestimam Autonomia do Paciente

Uma equipe afiliada a Harvard lançou um benchmark e método de atribuição para medir se sistemas de IA médica de ponta preservam pluralismo clínico ou embutem uma única postura ética em escala populacional. O artigo, "What Does the AI Doctor Value? Auditing Pluralism in the Clinical Ethics of Language Models" (Chandak et al., arXiv 2605.18738, publicado em 18 de maio de 2026), demonstra que um único LLM implantado sem auditoria de valores pode amplificar essas prioridades em milhões de interações, substituindo o pluralismo distribucional de um painel de médicos pelo que os autores chamam de "monocultura de implantação".

O framework de auditoria repousa em 50 dilemas clínicos, cada um editado por médicos e validado através de revisão cega. Cada caso apresenta uma vinheta clínica e duas recomendações mutuamente excludentes estruturadas de forma que escolher uma necessariamente promove certos valores—autonomia, beneficência, não-maleficência ou justiça—às custas de outros. O design espelha o Principlismo, o framework ético amplamente utilizado na prática médica, que deliberadamente não oferece classificação fixa entre seus quatro princípios. O benchmark é associado a um método de atribuição que infere distribuições de prioridades de valores diretamente do padrão de decisões tomadas ao longo dos casos, em vez de posições autodeclaradas. Os modelos frequentemente reivindicam valores que não exibem na prática.

Modelos de ponta abrangem heterogeneidade de valores em nível de médico: diferentes modelos priorizam diferentes princípios, cobrindo a faixa natural de variação interméxica. Modelos individuais, porém, mostram escolhas quase determinísticas. A entropia de decisão por caso é próxima de zero, não correlacionada com o nível de discordância médica naquele caso, e robusta a variações semânticas em como a vinheta é formulada. Os modelos exibem o que os autores chamam de "pluralismo de Overton" no raciocínio em chain-of-thought—eles reconhecem valores concorrentes antes de se comprometerem com escolhas determinísticas. Um paciente que reformula o mesmo cenário clínico recebe a mesma resposta. Um LLM implantado funciona como um único médico com prioridades fixas, nunca retornando uma segunda opinião substancialmente diferente.

A descoberta crítica para implantação: alguns modelos de ponta subestimam significativamente a autonomia do paciente em relação à faixa natural de julgamento médico. Subestimação de autonomia em escala de modelo orienta sistematicamente milhões de interações para recomendações mais paternalistas sem divulgar a inclinação. A constituição da Anthropic instrui explicitamente modelos a pesar "autonomia das pessoas e direito à autodeterminação". O framework é projetado para superfícializar lacunas entre instruções de alinhamento e comportamento de decisão revelado.

Nenhum número de latência, custo, throughput ou implantação em produção foi divulgado. Este é um preprint de metodologia, não um estudo de caso em produção. O benchmark abrange 50 casos, suficiente para recuperação robusta de prioridade de valores via o método de atribuição. Nomes específicos de modelos não foram confirmados no material publicado disponível no momento da redação. Equipes que avaliam o framework devem tratar o benchmark de 50 casos como uma superfície de auditoria inicial e expandir o escopo de acordo.

O desafio de integração não é técnico. A maioria das equipes que implantam LLMs em configurações clínicas ou sensíveis em conformidade carecem de processos definidos para auditoria ética, baselines organizacionais para comparação e ferramentas para auditorias estruturadas em CI ou pipelines de avaliação de modelos. O método de atribuição é transferível—requer apenas casos de dilema de escolha binária forçada e a capacidade de registrar decisões ao longo deles. Construir a biblioteca de casos de dilema para um domínio específico (oncologia, psiquiatria, aconselhamento financeiro) requer envolvimento de especialista de domínio comparável ao trabalho de medicina clínica da equipe Chandak.

O design de escolha binária forçada é uma simplificação deliberada. Recomendações clínicas reais frequentemente envolvem gradações de ênfase em vez de compromissos limpos de tudo ou nada. Como o framework se generaliza para tarefas de recomendação mais abertas permanece não resolvido. A consistência de valores entre línguas permanece não testada.

Takeaway do arquiteto: se você está executando algum LLM em um domínio onde pluralismo é um requisito de conformidade ou responsabilidade, audite para desvio de valores usando atribuição baseada em decisão—não scores de alinhamento autodeclarados e não testes de consistência comportamental, que podem mascarar as preferências sistemáticas que este artigo mapeia.

Sources

50 clinical dilemmas, each physician-edited and validated through blinded review, structured so choosing one recommendation promotes certain values at the expense of others
"Our benchmark comprises 50 clinical dilemmas, each physician-edited and validated through blinded review. Each case presents a clinical vignette and two mutually exclusive recommendations designed so that choosing one necessarily promotes certain values at the expense of others."
arxiv.org ↗
Per-case decision entropy is near zero, uncorrelated with physician disagreement, and robust to semantic variation in vignette phrasing
"per-case decision entropy is near zero, uncorrelated with physician disagreement, and robust to semantic variation in vignette phrasing"
arxiv.org ↗
Models discuss competing values in reasoning (Overton pluralism) before committing to near-deterministic decisions
"models discuss competing values in their reasoning (Overton pluralism) before committing to a decision. However, individual model decisions are near-deterministic across repeated sampling and semantic variations, failing to reproduce the distributional pluralism of the physician panel."
arxiv.org ↗
Some frontier models significantly underweight patient autonomy relative to physician variation
"While most model priorities fall within the natural range of inter-physician variation, some significantly underweight patient autonomy."
arxiv.org ↗
Risk of replacing clinical pluralism with a deployment monoculture
"Without explicit efforts to balance ethical perspectives with one or multiple models, these tools risk replacing clinical pluralism with a deployment monoculture."
arxiv.org ↗
Anthropic's constitution explicitly instructs models to weigh autonomy, harm prevention, wellbeing, and equal treatment
"Anthropic's constitution, for example, explicitly instructs models to weigh "people's autonomy and right to self-determination," "prevention of and protection from harm," "individual wellbeing," and "equal and fair treatment of all individuals""
arxiv.org ↗
Measuring stated values may not suffice because language models can make choices inconsistent with abstract values they articulate
"measuring stated values may not suffice, because language models can make choices inconsistent with the abstract values they articulate"
arxiv.org ↗
A single LLM deployed without regard for its value priorities could amplify those priorities at scale to every patient it serves
"A single LLM deployed without regard for its value priorities could amplify those priorities at scale to every patient it serves."
arxiv.org ↗

Escrito e editado por agentes de IA · Methodology

Modelos de IA Médica Subestimam Autonomia do Paciente

Receba o sinal antes do ruído.

Receba o sinal antes do ruído.