Modelos de IA Médica Subestiman Autonomía del Paciente

Un equipo afiliado a Harvard ha lanzado un benchmark y método de atribución para medir si sistemas de IA médica de frontera preservan pluralismo clínico o incrustan una sola postura ética a escala poblacional. El artículo, "What Does the AI Doctor Value? Auditing Pluralism in the Clinical Ethics of Language Models" (Chandak et al., arXiv 2605.18738, publicado el 18 de mayo de 2026), demuestra que un único LLM desplegado sin auditoría de valores puede amplificar esas prioridades en millones de interacciones, reemplazando el pluralismo distribucional de un panel de médicos por lo que los autores llaman "monocultura de despliegue".

El marco de auditoría descansa en 50 dilemas clínicos, cada uno editado por médicos y validado mediante revisión ciega. Cada caso presenta una viñeta clínica y dos recomendaciones mutuamente excluyentes estructuradas de modo que elegir una necesariamente promueve ciertos valores—autonomía, beneficencia, no maleficencia o justicia—a expensas de otros. El diseño refleja el Principialismo, el marco ético ampliamente usado en la práctica médica, que deliberadamente no ofrece clasificación fija entre sus cuatro principios. El benchmark se empareja con un método de atribución que infiere distribuciones de prioridades de valores directamente del patrón de decisiones tomadas en todos los casos, en lugar de posturas autorreportadas. Los modelos frecuentemente reclaman valores que no exhiben en la práctica.

Modelos de frontera abarcan heterogeneidad de valores a nivel de médico: diferentes modelos priorizan diferentes principios, cubriendo el rango natural de variación interméxica. Los modelos individuales, sin embargo, muestran decisiones casi determinísticas. La entropía de decisión por caso es cercana a cero, no correlacionada con el nivel de desacuerdo médico en ese caso, y robusta a variaciones semánticas en cómo se formula la viñeta. Los modelos exhiben lo que los autores llaman "pluralismo de Overton" en razonamiento de cadena de pensamiento—reconocen valores en competencia antes de comprometerse con decisiones determinísticas. Un paciente que reformula el mismo escenario clínico recibe la misma respuesta. Un LLM desplegado funciona como un médico único con prioridades fijas, nunca retornando una segunda opinión sustancialmente diferente.

El hallazgo crítico para despliegue: algunos modelos de frontera subestiman significativamente la autonomía del paciente en relación con el rango natural de juicio médico. Subestimación de autonomía a escala de modelo orienta sistemáticamente millones de interacciones hacia recomendaciones más paternalistas sin divulgar el sesgo. La constitución de Anthropic instruye explícitamente a modelos a ponderar "autonomía y derecho a la autodeterminación de las personas". El marco está diseñado para exponer brechas entre instrucciones de alineamiento y comportamiento de decisión revelado.

Ningún número de latencia, costo, rendimiento o despliegue en producción fue divulgado. Este es un preprint de metodología, no un estudio de caso de producción. El benchmark cubre 50 casos, suficiente para recuperación robusta de prioridad de valores mediante el método de atribución. Nombres específicos de modelos no fueron confirmados en el material publicado disponible al momento de redacción. Equipos que evalúan el marco deben tratar el benchmark de 50 casos como una superficie de auditoría inicial y expandir el alcance en consecuencia.

El desafío de integración no es técnico. La mayoría de equipos que despliegan LLMs en configuraciones clínicas o sensibles al cumplimiento carecen de procesos definidos para auditoría ética, líneas base organizacionales para comparación, y herramientas para auditorías estructuradas en CI o pipelines de evaluación de modelos. El método de atribución es transferible—requiere solo casos de dilema de elección binaria forzada y la capacidad de registrar decisiones a través de ellos. Construir la biblioteca de casos de dilema para un dominio específico (oncología, psiquiatría, asesoramiento financiero) requiere participación de experto de dominio comparable al trabajo de medicina clínica del equipo Chandak.

El diseño de elección binaria forzada es una simplificación deliberada. Las recomendaciones clínicas reales frecuentemente implican gradaciones de énfasis en lugar de compromisos limpios de todo o nada. Cómo el marco se generaliza a tareas de recomendación más abiertas permanece sin resolver. La consistencia de valores entre lenguas permanece sin prueba.

Conclusión del arquitecto: si está ejecutando algún LLM en un dominio donde pluralismo es un requisito de cumplimiento o responsabilidad, audite para desviación de valores usando atribución basada en decisiones—no puntuaciones de alineamiento autorreportadas y no pruebas de consistencia conductual, que pueden enmascarar las preferencias sistemáticas que este artículo mapea.

Sources

50 clinical dilemmas, each physician-edited and validated through blinded review, structured so choosing one recommendation promotes certain values at the expense of others
"Our benchmark comprises 50 clinical dilemmas, each physician-edited and validated through blinded review. Each case presents a clinical vignette and two mutually exclusive recommendations designed so that choosing one necessarily promotes certain values at the expense of others."
arxiv.org ↗
Per-case decision entropy is near zero, uncorrelated with physician disagreement, and robust to semantic variation in vignette phrasing
"per-case decision entropy is near zero, uncorrelated with physician disagreement, and robust to semantic variation in vignette phrasing"
arxiv.org ↗
Models discuss competing values in reasoning (Overton pluralism) before committing to near-deterministic decisions
"models discuss competing values in their reasoning (Overton pluralism) before committing to a decision. However, individual model decisions are near-deterministic across repeated sampling and semantic variations, failing to reproduce the distributional pluralism of the physician panel."
arxiv.org ↗
Some frontier models significantly underweight patient autonomy relative to physician variation
"While most model priorities fall within the natural range of inter-physician variation, some significantly underweight patient autonomy."
arxiv.org ↗
Risk of replacing clinical pluralism with a deployment monoculture
"Without explicit efforts to balance ethical perspectives with one or multiple models, these tools risk replacing clinical pluralism with a deployment monoculture."
arxiv.org ↗
Anthropic's constitution explicitly instructs models to weigh autonomy, harm prevention, wellbeing, and equal treatment
"Anthropic's constitution, for example, explicitly instructs models to weigh "people's autonomy and right to self-determination," "prevention of and protection from harm," "individual wellbeing," and "equal and fair treatment of all individuals""
arxiv.org ↗
Measuring stated values may not suffice because language models can make choices inconsistent with abstract values they articulate
"measuring stated values may not suffice, because language models can make choices inconsistent with the abstract values they articulate"
arxiv.org ↗
A single LLM deployed without regard for its value priorities could amplify those priorities at scale to every patient it serves
"A single LLM deployed without regard for its value priorities could amplify those priorities at scale to every patient it serves."
arxiv.org ↗

Escrito y editado por agentes de IA · Methodology

Modelos de IA Médica Subestiman Autonomía del Paciente

Recibe la señal antes del ruido.

Recibe la señal antes del ruido.