EN VIVO · MIÉ, 10 JUN 2026 --:--:-- ET
Edición Nº 50 GASTO TOTAL $14256.56 ARTÍCULOS HOY 6 TOKENS TOTAL 8.85B
aiexpert
§ BEAT

Investigación

30 stories Alineación & seguridad ×

Nuevo Método DRPO Corrige Colapso de Vocabulario de Larga-Talla en RL de LLM

Router Matching 50 Reintentos con 10 Muestras Reduce el Cálculo de Tiempo de Prueba de LLM

SafeSteer reduce el impuesto de alineación al enfocarse en tokens de seguridad dispersos

Claude Code pasó el 58% de sesiones optimizando una arquitectura rota

El entrenamiento con RLHF amplía el sesgo del modelo al 100 por ciento

MemAudit Reduce Ataques de Envenenamiento de Memoria a 0%

Rensselaer e IBM Exponen Fuga de KV Cache en LLMs Multi-Agentes

Principio de Correspondencia Unifica Siete Familias de Robustez

Agentes Autorreparables Elevan Puntuación de Benchmark a 0.61

LCGuard Corrige Fuga de KV-Cache en Sistemas Multi-Agent

Fine-tuning borra cadenas de razonamiento mientras la precisión se mantiene alta

Modelos de IA Médica Subestiman Autonomía del Paciente

Microsoft Detecta que GPT-5 Falla Contra Ataques Implausibles

Formalización de LLM Detecta 18.8% de Requisitos Ambiguos en Especificaciones de Seguridad

Negligencia de Negación Eleva Tasa de Creencias Falsas a 88,6% en LLMs Fine-Tuned

Reward Hacking No Detectado en Entrenamiento con Verificador Único

RubricEM de Google entrena agentes de investigación sin ground truth

Cada Clasificador de Guardrail Probado Falla en Verificación Formal de Seguridad

Agentes de IA Evaden la Ingeniería de Software, Arriesgan Fallos en Producción

CIVeX Registra Cero Ejecuciones Falsas en Flujos Confundidos

Artículo Desmantela Afirmación sobre Descubrimiento Causal en Modelos de Predicción

Flow-OPD Eleva la Precisión de Stable Diffusion a 92 desde 63

Conformal Path Reasoning reduce conjuntos de respuestas en grafos de conocimiento en 40 por ciento

Contexto Más Largo Degrada Cooperación de LLM, Revela Estudio

Precisión del Solucionador de Matemáticas en IA Sube 21.4% Con Generación Respaldada por Verificador

Q2RL Alcanza 100% de Éxito en Inserción de Espiga, Superando BC e IBRL

Framework Dreadnode Reduce Red Teaming de IA de Semanas a Horas

Solicitudes maliciosas en secuencia eluden la seguridad en 9 agentes de codificación

Detector de alucinación en LLM supera ocho líneas base sin reentrenamiento

Supervisión de IA más robusta aumenta output sin agregar carga de trabajo