EN VIVO · SÁB, 20 JUN 2026 --:--:-- ET
Edición Nº 60 GASTO TOTAL $14462.86 ARTÍCULOS HOY 12 TOKENS TOTAL 9.04B
aiexpert
En vivo
Research Claude Fable 5 alcanza 95% en SWE-bench Verified, superior en todos los benchmarks excepto GPT-5.5 Funding 201 Ventures planea segundo fondo de defensa europeo mientras tensiones geopolíticas impulsan inversiones en IA y autonomía Funding Twenty Technologies alcanza valuación de US$ 1B; startup de cibercombate de defensa cierra Serie B de US$ 100M Policy Los requisitos de transparencia de la Ley de IA de la UE entran en vigor el 2 de agosto de 2026 Breaking Controles de exportación de EE.UU. fuerzan a Anthropic a suspender Claude Fable 5 para todos los usuarios Policy Canadá acelera la estrategia de semiconductores de defensa en medio del impulso de gasto de la OTAN Research OpenAI mejora inteligencia de salud en ChatGPT; GPT-5.5 Instant alcanza desempeño del modelo de frontera en evaluaciones médicas Breaking CircleCI lanza Chunk Sidecars: validación en-loop para agentes de codificación IA, capturando problemas antes de commit Policy Canadá invierte $900M en estrategia de industria de defensa, respaldando startups de semiconductores y tecnología cuántica Chips AMD restablece encriptación de memoria (TSME) en CPUs Ryzen 9000 a través de actualización BIOS de julio Chips Atom Computing asegura $100M Serie C más apoyo $100M CHIPS Act para escala quántica de átomos neutros Policy FERC emite órdenes de interconexón de carga grande personalizadas para centros de datos de IA; operadores de centros de datos soportan costos de mejora Funding Qualcomm en conversaciones para adquirir Tenstorrent por $8-10B, apuesta en chips de IA RISC-V Breaking Empleados de Amazon enfrentan disciplina por testificar contra centros de datos; se presentan denuncias de represalia Chips Capex de TSMC en 2026 alcanza récord de $52-56B; 90% de los chips avanzados del mundo concentrados en una isla Funding Qualcomm en negociaciones para adquirir Tenstorrent por $8–10B; desafío de chip AI RISC-V a Nvidia Research MosaicLeaks: Agentes de investigación filtran datos privados a través de patrones de consultas; el entrenamiento PA-DR reduce filtraciones al 9,9% Funding Anthropic cierra Serie H de $65B en $965B, supera OpenAI como startup de IA más valiosa Chips Trump anuncia asociación Apple-Intel para diseño y fabricación de chips en EE. UU. Policy Bernie Sanders presenta proyecto de propiedad pública de IA; propone impuesto del 50% en acciones, dividendos anuales de $1K Research Claude Fable 5 alcanza 95% en SWE-bench Verified, superior en todos los benchmarks excepto GPT-5.5 Funding 201 Ventures planea segundo fondo de defensa europeo mientras tensiones geopolíticas impulsan inversiones en IA y autonomía Funding Twenty Technologies alcanza valuación de US$ 1B; startup de cibercombate de defensa cierra Serie B de US$ 100M Policy Los requisitos de transparencia de la Ley de IA de la UE entran en vigor el 2 de agosto de 2026 Breaking Controles de exportación de EE.UU. fuerzan a Anthropic a suspender Claude Fable 5 para todos los usuarios Policy Canadá acelera la estrategia de semiconductores de defensa en medio del impulso de gasto de la OTAN Research OpenAI mejora inteligencia de salud en ChatGPT; GPT-5.5 Instant alcanza desempeño del modelo de frontera en evaluaciones médicas Breaking CircleCI lanza Chunk Sidecars: validación en-loop para agentes de codificación IA, capturando problemas antes de commit Policy Canadá invierte $900M en estrategia de industria de defensa, respaldando startups de semiconductores y tecnología cuántica Chips AMD restablece encriptación de memoria (TSME) en CPUs Ryzen 9000 a través de actualización BIOS de julio Chips Atom Computing asegura $100M Serie C más apoyo $100M CHIPS Act para escala quántica de átomos neutros Policy FERC emite órdenes de interconexón de carga grande personalizadas para centros de datos de IA; operadores de centros de datos soportan costos de mejora Funding Qualcomm en conversaciones para adquirir Tenstorrent por $8-10B, apuesta en chips de IA RISC-V Breaking Empleados de Amazon enfrentan disciplina por testificar contra centros de datos; se presentan denuncias de represalia Chips Capex de TSMC en 2026 alcanza récord de $52-56B; 90% de los chips avanzados del mundo concentrados en una isla Funding Qualcomm en negociaciones para adquirir Tenstorrent por $8–10B; desafío de chip AI RISC-V a Nvidia Research MosaicLeaks: Agentes de investigación filtran datos privados a través de patrones de consultas; el entrenamiento PA-DR reduce filtraciones al 9,9% Funding Anthropic cierra Serie H de $65B en $965B, supera OpenAI como startup de IA más valiosa Chips Trump anuncia asociación Apple-Intel para diseño y fabricación de chips en EE. UU. Policy Bernie Sanders presenta proyecto de propiedad pública de IA; propone impuesto del 50% en acciones, dividendos anuales de $1K
Research

Claude Fable 5 alcanza 95% en SWE-bench Verified, superior en todos los benchmarks excepto GPT-5.5

Anthropic lanzó Claude Fable 5 el 9 de junio de 2026, el primer modelo disponible públicamente de su nivel Mythos-class (históricamente restringido a socios de ciberseguridad y biología). Fable 5 logra 95.0% en SWE-bench Verified, el benchmark estandarizado más difícil para generación de código del mundo real, y lidera o empataa en 18 de 19 benchmarks publicados. Solo GPT-5.5 lo supera en un puñado de tareas de razonamiento específicas del dominio. Esta es la primera vez que Anthropic lanza un modelo Mythos-class para uso general.

Fable 5 es el mismo modelo subyacente que Claude Mythos 5 (versión restringida) con protecciones en vigor: el modelo se remite silenciosamente a Claude Opus 4.8 para solicitudes que toquen ciberseguridad, biología, química o destilación de modelos, donde las capacidades sin restricciones de Mythos 5 (78% en evaluaciones de ciberseguridad vs. 40% para Opus 4.8) presentan riesgo de abuso. Este diseño de seguridad por fallback permite implementación a escala manteniendo límites de alineación. Fable 5 también muestra eficiencia de tokens mejorada: resolviendo los mismos problemas con menos tokens que generaciones previas de Claude, lo que se agrava con ventajas de costo a escala.

La subida del SWE-bench Verified de 33.4% (Claude 3.5 Sonnet, junio de 2024) a 95.0% (Fable 5, junio de 2026) en dos años refleja tanto capacidad del modelo como saturación del benchmark: el conjunto Verified público ahora tiene un historial conocido de contaminación de datos de entrenamiento. Scale AI's SWE-bench Pro (1.865 tareas en bases de código comerciales) es el benchmark más difícil y más defensible; Fable 5 lidera con 80.3% en el conjunto público, 11 puntos por delante del competidor más cercano (GPT-5.5).

Para arquitectos: el costo de Fable 5 es 2x el nivel Opus en Claude.ai; el precio por token (~$20/M input, $60/M output) es de nivel fronterizo. El verdadero valor está en codificación autónoma de largo horizonte: las pruebas de Stripe informaron que Fable 5 completaba una migración de base de código de 50 millones de líneas en un día. Los equipos que construyen canalizaciones de codificación agenética deben probar Fable 5 en sus bases de código específicas (la saturación verificada es real); SWE-bench Pro es el diferenciador más creible. Las protecciones en ciberseguridad significan que los agentes de reparación de seguridad de producción silenciosamente se degradarán a Opus 4.8 para ciertas tareas.

Fuentes