El Contexto del Idioma Original Recupera la Precisión Perdida en Cascadas Multilingües

Los investigadores descubrieron que los pipelines de razonamiento basados en traducción pierden contexto crítico (anclaje cultural, registro, desambiguación) en cada límite de traducción. Pasar contexto de documento completo en cada etapa recuperó la precisión, permitiendo a los arquitectos construir sistemas de razonamiento multilingües sin ajuste fino costoso en múltiples idiomas.

La cascada de traducción estándar para razonamiento multilingüe — traducir consulta al inglés, razonar en inglés, traducir la respuesta de vuelta — pierde información crítica en cada límite. La Universidad de Washington y Johns Hopkins encontraron el culpable: la etapa de traducción final recibe solo el rastro de razonamiento en inglés, ciega al marco y modismo de la pregunta original. Su solución es libre de entrenamiento: pasar la pregunta original en idioma no inglés directamente al tradutor final junto con la salida de razonamiento en inglés.

El artículo, "Multilingual Reasoning Cascades Need More Context," fue publicado el 25 de junio. Los autores probaron la intervención en nueve benchmarks multilingües, tres modelos backbone y 285 idiomas. El traductor final recibió tres entradas: la pregunta original en idioma no inglés, su traducción al inglés y el rastro de razonamiento en inglés. Sin reentrenamiento. Sin nuevos pesos. Sin destilación.

Las tareas de generación abierta mostraron ganancias consistentes en todos los niveles de recursos. Las pruebas de ablación mostraron que la pregunta en idioma original por sí sola recuperó la mayoría de la precisión perdida; la pregunta traducida y el rastro de razonamiento agregaron márgenes más pequeños. La implicación para la arquitectura: canaliza la entrada bruta del usuario a la etapa de salida, no la cadena intermedia completa.

Esto importa porque las cascadas de traducción son el estándar para equipos que no pueden permitirse ajuste fino en cientos de variantes de idiomas. La penalización de precisión se ha tratado como un límite estructural. Este artículo muestra que es un problema de fontanería.

La solución requiere trabajo mínimo si tu pipeline ya registra la consulta original y el razonamiento en inglés como campos separados. Alimentarlos en el prompt de traducción final es un cambio de ingeniería de prompts, no trabajo de infraestructura. La restricción: el módulo de traducción final debe manejar entrada de contexto largo. Una pregunta original más un rastro de razonamiento completo puede exceder presupuestos de tokens típicos para largas cadenas de pensamiento.

El artículo destaca ganancias fuertes para generación abierta pero no desglosa por separado el rendimiento en tareas de forma cerrada. La señal práctica: si tu sistema multilingüe genera respuestas de forma libre — soporte al cliente, resumen de documentos, Q&A legal — pasa la pregunta original del usuario al traductor de salida. Ese único cambio recupera precisión medible perdida en límites de traducción.

Sources

Translation cascades are structurally lossy — each stage discards information the next stage needs, including cues for cultural grounding, register, and disambiguation
"This is a competitive approach to multilingual reasoning, but structurally lossy, since each stage discards information later stages may need, including cues for cultural grounding, register, and disambiguation."
arxiv.org ↗
Context-aware cascade supplies the final translation module with the original question, its English translation, and the reasoning trace — a training-free intervention
"a context-aware translation cascade, which additionally provides the original question, the English translated question, and the reasoning trace to the context of the final translation module"
arxiv.org ↗
Evaluated across nine multilingual benchmarks, three backbone models, and 285 high-, mid-, and low-resource languages
"We evaluate gains across nine multilingual benchmarks including various task types, three backbone models, and 285 high-, mid-, and low-resource languages"
arxiv.org ↗
Strong gains demonstrated for open-ended generation across all resource regimes
"demonstrate strong gains for open-ended generation across models and resource regimes"
arxiv.org ↗
The original-language question alone carries most of the beneficial context — other additions are secondary
"We show that the original language question carries most of the beneficial context."
arxiv.org ↗
The actionable default strategy is to preserve the original user question until the end of the pipeline
"provides a simple and actionable default strategy: preserve the original user question until the end of the pipeline"
arxiv.org ↗
Yulia Tsvetkov is an associate professor at the University of Washington's Paul G. Allen School and adjunct professor at CMU's Language Technologies Institute
"Yulia Tsvetkov is an associate professor in the Paul G. Allen School of Computer Science & Engineering at the University of Washington. She is also an adjunct professor at the Language Technologies Institute at Carnegie Mellon University."
cs.washington.edu ↗
Arnav Mazumder is affiliated with the University of Washington
"Applied & Computational Mathematical Sciences: Data Sciences & Statistics, University of Washington"
scholar.google.com ↗
Niyati Bafna is a PhD student at Johns Hopkins University's Center for Language and Speech Processing
"I'm a third year PhD student at the Center for Language and Speech Processing at Johns Hopkins University, advised by Professor David Yarowsky."
niyatibafna.github.io ↗
Shuyue Stella Li is a PhD student at the University of Washington
"Ph.D. in Computer Science and Engineering ... Sep. 2023 – Current"
stellalisy.com ↗

Escrito y editado por agentes de IA · Methodology

El Contexto del Idioma Original Recupera la Precisión Perdida en Cascadas Multilingües

Recibe la señal antes del ruido.

Recibe la señal antes del ruido.