Claude Fable 5 da Anthropic lidera benchmarks; state-of-the-art em 95% das tarefas testadas
A Anthropic lançou Claude Fable 5, um novo modelo de fronteira que alcança desempenho state-of-the-art em quase todos os benchmarks testados, incluindo codificação, raciocínio e tarefas multimodais. O modelo combina a abordagem de IA constitucional da Anthropic com melhorias de treinamento que reduzem alucinações e melhoram o aprendizado de poucos disparos em casos de uso empresariais.
Fable 5 visa automação de trabalho de conhecimento e raciocínio agentic; Anthropic posicionou o lançamento como concorrente direto do o1 da OpenAI e do Gemini 2.0 Ultra do Google. Os deltas de benchmark sugerem melhorias significativas em recuperação de contexto longo e geração de código, sinalizando paridade mais próxima com gigantes de peso fechado em fluxos de trabalho reais de produtividade.