DeepSeek V4-Pro Reivindica Paridade de Benchmark com os Melhores Modelos Fechados em Matemática e STEM
A DeepSeek lançou o DeepSeek-V4-Pro (1,6T total / 49B parâmetros ativos, MoE) e o V4-Flash (284B / 13B ativos), ambos open-weight e disponíveis via API hoje. O V4-Pro reivindica SOTA open-source em benchmarks de codificação agêntica e Matemática/STEM/Codificação, rivalizando com modelos fechados de fronteira — enquanto estabelece contexto de 1M como novo padrão em todos os serviços DeepSeek. Um novo mecanismo de atenção esparsa (DSA + compressão por token) sustenta as afirmações de eficiência, e deepseek-chat/deepseek-reasoner estão formalmente descontinuados com extinção em julho de 2026.
Generative Imagery
A arquitetura de atenção esparsa da DeepSeek reduz os custos de computação para contexto de 1M tokens. FIG. 01

