DeepSeek V4-Pro Reivindica Paridad en Benchmarks con los Mejores Modelos Cerrados en Matemáticas y STEM
DeepSeek ha lanzado DeepSeek-V4-Pro (1,6T total / 49B parámetros activos, MoE) y V4-Flash (284B / 13B activos), ambos open-weight y disponibles vía API hoy. V4-Pro reclama SOTA open-source en benchmarks de codificación agéntica y Matemáticas/STEM/Codificación, rivalizando con modelos cerrados de frontera — mientras establece 1M de contexto como nuevo estándar en todos los servicios DeepSeek. Un novedoso mecanismo de atención dispersa (DSA + compresión por token) sustenta las afirmaciones de eficiencia, y deepseek-chat/deepseek-reasoner están formalmente obsoletos con fin de vida en julio de 2026.
Generative Imagery
La arquitectura de atención dispersa de DeepSeek reduce los costos de cómputo para el contexto de 1M tokens. FIG. 01

