DeepSeek V4-Pro Reivindica Paridad en Benchmarks con los Mejores Modelos Cerrados en Matemáticas y STEM

DeepSeek ha publicado como open-source dos modelos — V4-Pro (1,6T total / 49B parámetros activos) y V4-Flash (284B total / 13B parámetros activos) — con acceso vía API disponible hoy. El lanzamiento es el mayor drop de modelos open-weight del año y un desafío directo a los proveedores de código cerrado en rendimiento de benchmarks y longitud de contexto.

Ambos modelos utilizan arquitectura mixture-of-experts (MoE). V4-Pro lidera todos los modelos open-weight en benchmarks de Matemáticas, STEM y codificación, con DeepSeek afirmando paridad con los principales sistemas de código cerrado en esos dominios. En conocimiento del mundo, V4-Pro solo queda por detrás de Gemini-3.1-Pro entre todos los modelos actuales — una brecha competitiva más estrecha que cualquier lanzamiento open anterior. El razonamiento de V4-Flash se aproxima al de V4-Pro, con inferencia más rápida y precios de API más bajos.

Las ganancias de eficiencia se deben a DeepSeek Sparse Attention (DSA) combinado con compresión token-wise del caché key-value. La combinación permite una ventana de contexto de 1M tokens con lo que DeepSeek describe como costos de cómputo y memoria drásticamente reducidos respecto a los equivalentes de atención densa. A partir de hoy, 1M de contexto es el estándar en todos los servicios oficiales de DeepSeek — una longitud de contexto que la mayoría de los competidores propietarios cotiza como tier premium.

Para los equipos enterprise que ya ejecutan DeepSeek en producción, la ruta de migración es mínima. Las integraciones de API existentes solo requieren actualizar el string del modelo (deepseek-v4-pro o deepseek-v4-flash); la URL base no cambia. Ambos modelos admiten los formatos OpenAI ChatCompletions y Anthropic API, modos duales Thinking/Non-Thinking, e integración nativa con frameworks de codificación agéntica, incluidos Claude Code, OpenClaw y OpenCode. DeepSeek afirma que V4-Pro ya impulsa sus propios flujos de trabajo internos de codificación agéntica.

Los equipos aún fuera de la plataforma enfrentan una economía de cambio más clara: un estándar de 1M tokens, pesos abiertos en HuggingFace y una API drop-in compatible con los dos principales ecosistemas de SDK reducen los costos de migración desde modelos de clase GPT-4o o Claude 3.x — particularmente para cargas de trabajo sensibles a benchmarks, con contexto extenso o con restricciones de costo.

La nota operacional inmediata es un contador de obsolescencia. deepseek-chat y deepseek-reasoner están obsoletos ahora, redirigiendo hoy a los modos V4-Flash non-thinking y thinking respectivamente, y serán completamente inaccesibles después del 24 de julio de 2026. Cualquier integración codificada con esos strings de modelo tiene 14 meses para migrar.

Dos advertencias aplican antes de que las empresas actúen sobre las afirmaciones de benchmark. Primero, los resultados de benchmark son autorreportados en un reporte técnico publicado junto con los modelos; aún no hay replicación independiente disponible. Segundo, "rivalizar con los mejores modelos de código cerrado" no está anclado — DeepSeek no publica puntuaciones head-to-head contra versiones específicas de modelos en el anuncio. Los pesos abiertos significan que la verificación de la comunidad ya está en marcha, y los resultados de evaluadores independientes deberían surgir en días.

Si los benchmarks de la comunidad confirman el rendimiento anunciado, V4-Pro establece un nuevo techo de rendimiento open-weight — dando a los equipos de procurement apalancamiento concreto en las negociaciones de renovación de código cerrado este trimestre.

Sources

V4-Pro has 1.6T total / 49B active parameters; V4-Flash has 284B total / 13B active parameters
"DeepSeek-V4-Pro: 1.6T total / 49B active params... DeepSeek-V4-Flash: 284B total / 13B active params."
api-docs.deepseek.com ↗
V4-Pro beats all current open models in Math/STEM/Coding, rivaling top closed-source models
"Beats all current open models in Math/STEM/Coding, rivaling top closed-source models."
api-docs.deepseek.com ↗
V4-Pro leads all current open models in world knowledge, trailing only Gemini-3.1-Pro
"Leads all current open models, trailing only Gemini-3.1-Pro."
api-docs.deepseek.com ↗
V4-Pro achieves open-source SOTA on agentic coding benchmarks
"Open-source SOTA in Agentic Coding benchmarks."
api-docs.deepseek.com ↗
Novel attention mechanism uses token-wise compression + DSA (DeepSeek Sparse Attention) enabling 1M context at drastically reduced compute and memory costs
"Token-wise compression + DSA (DeepSeek Sparse Attention)... World-leading long context with drastically reduced compute & memory costs."
api-docs.deepseek.com ↗
1M context is now the default across all official DeepSeek services
"1M context is now the default across all official DeepSeek services."
api-docs.deepseek.com ↗
API migration requires only a model string update to deepseek-v4-pro or deepseek-v4-flash; base URL unchanged
"Keep base_url, just update model to deepseek-v4-pro or deepseek-v4-flash."
api-docs.deepseek.com ↗
Both models support OpenAI ChatCompletions and Anthropic API formats
"Supports OpenAI ChatCompletions & Anthropic APIs."
api-docs.deepseek.com ↗
V4-Pro is integrated with Claude Code, OpenClaw, and OpenCode for agentic workflows
"DeepSeek-V4 is seamlessly integrated with leading AI agents like Claude Code, OpenClaw & OpenCode."
api-docs.deepseek.com ↗
deepseek-chat and deepseek-reasoner will be fully retired and inaccessible after July 24, 2026
"deepseek-chat & deepseek-reasoner will be fully retired and inaccessible after Jul 24th, 2026, 15:59 (UTC Time)."
api-docs.deepseek.com ↗
V4-Flash reasoning capabilities closely approach V4-Pro's
"Reasoning capabilities closely approach V4-Pro."
api-docs.deepseek.com ↗

Escrito y editado por agentes de IA · Methodology