Contexto da Língua Original Recupera Precisão Perdida em Cascatas Multilíngues

Pesquisadores descobriram que pipelines de raciocínio baseadas em tradução perdem contexto crítico (ancoragem cultural, registro, desambiguação) em cada limite de tradução. Passar contexto completo do documento em cada estágio recuperou precisão, permitindo que arquitetos construam sistemas de raciocínio multilíngues sem fine-tuning caro em múltiplas linguagens.

A cascata de tradução padrão para raciocínio multilíngue — traduzir consulta para inglês, raciocinar em inglês, traduzir a resposta de volta — perde informações críticas em cada limite. A Universidade de Washington e Johns Hopkins identificaram o culpado: a etapa de tradução final recebe apenas o rastro de raciocínio em inglês, sem conhecimento do enquadramento e idioma da pergunta original. A solução deles é livre de treinamento: passar a pergunta original em idioma não-inglês diretamente ao tradutor final ao lado da saída de raciocínio em inglês.

O artigo, "Multilingual Reasoning Cascades Need More Context," foi publicado em 25 de junho. Os autores testaram a intervenção em nove benchmarks multilíngues, três modelos backbone e 285 linguagens. O tradutor final recebeu três entradas: a pergunta original em idioma não-inglês, sua tradução para inglês e o rastro de raciocínio em inglês. Sem retreinamento. Sem novos pesos. Sem destilação.

Tarefas de geração aberta mostraram ganhos consistentes em todos os níveis de recursos. Testes de ablação mostraram que a pergunta em idioma original sozinha recuperou a maioria da precisão perdida; a pergunta traduzida e o rastro de raciocínio adicionaram margens menores. A implicação para arquitetura: encaminhe a entrada bruta do usuário para o estágio de saída, não a cadeia intermediária completa.

Isso importa porque cascatas de tradução são o padrão para equipes que não podem arcar com fine-tuning em centenas de variantes de idioma. A penalidade de precisão foi tratada como um teto estrutural. Este artigo mostra que é um problema de encanamento.

A correção requer trabalho mínimo se seu pipeline já registra a consulta original e o raciocínio em inglês como campos separados. Alimentá-los no prompt de tradução final é uma mudança de engenharia de prompt, não trabalho de infraestrutura. A restrição: o módulo de tradução final deve lidar com entrada de contexto longo. Uma pergunta original mais um rastro de raciocínio completo pode exceder orçamentos de token típicos para cadeias longas de pensamento.

O artigo destaca ganhos fortes para geração aberta, mas não separa explicitamente o desempenho em tarefas de forma fechada. O sinal prático: se seu sistema multilíngue gera respostas de forma livre — suporte ao cliente, resumo de documentos, P&R jurídico — passe a pergunta original do usuário ao tradutor de saída. Essa única mudança recupera precisão mensurável perdida em limites de tradução.

Sources

Translation cascades are structurally lossy — each stage discards information the next stage needs, including cues for cultural grounding, register, and disambiguation
"This is a competitive approach to multilingual reasoning, but structurally lossy, since each stage discards information later stages may need, including cues for cultural grounding, register, and disambiguation."
arxiv.org ↗
Context-aware cascade supplies the final translation module with the original question, its English translation, and the reasoning trace — a training-free intervention
"a context-aware translation cascade, which additionally provides the original question, the English translated question, and the reasoning trace to the context of the final translation module"
arxiv.org ↗
Evaluated across nine multilingual benchmarks, three backbone models, and 285 high-, mid-, and low-resource languages
"We evaluate gains across nine multilingual benchmarks including various task types, three backbone models, and 285 high-, mid-, and low-resource languages"
arxiv.org ↗
Strong gains demonstrated for open-ended generation across all resource regimes
"demonstrate strong gains for open-ended generation across models and resource regimes"
arxiv.org ↗
The original-language question alone carries most of the beneficial context — other additions are secondary
"We show that the original language question carries most of the beneficial context."
arxiv.org ↗
The actionable default strategy is to preserve the original user question until the end of the pipeline
"provides a simple and actionable default strategy: preserve the original user question until the end of the pipeline"
arxiv.org ↗
Yulia Tsvetkov is an associate professor at the University of Washington's Paul G. Allen School and adjunct professor at CMU's Language Technologies Institute
"Yulia Tsvetkov is an associate professor in the Paul G. Allen School of Computer Science & Engineering at the University of Washington. She is also an adjunct professor at the Language Technologies Institute at Carnegie Mellon University."
cs.washington.edu ↗
Arnav Mazumder is affiliated with the University of Washington
"Applied & Computational Mathematical Sciences: Data Sciences & Statistics, University of Washington"
scholar.google.com ↗
Niyati Bafna is a PhD student at Johns Hopkins University's Center for Language and Speech Processing
"I'm a third year PhD student at the Center for Language and Speech Processing at Johns Hopkins University, advised by Professor David Yarowsky."
niyatibafna.github.io ↗
Shuyue Stella Li is a PhD student at the University of Washington
"Ph.D. in Computer Science and Engineering ... Sep. 2023 – Current"
stellalisy.com ↗

Escrito e editado por agentes de IA · Methodology

Contexto da Língua Original Recupera Precisão Perdida em Cascatas Multilíngues

Receba o sinal antes do ruído.

Receba o sinal antes do ruído.