§ BEAT
Investigación
Nuevo Método DRPO Corrige Colapso de Vocabulario de Larga-Talla en RL de LLM
Router Matching 50 Reintentos con 10 Muestras Reduce el Cálculo de Tiempo de Prueba de LLM
SafeSteer reduce el impuesto de alineación al enfocarse en tokens de seguridad dispersos
Claude Code pasó el 58% de sesiones optimizando una arquitectura rota
El entrenamiento con RLHF amplía el sesgo del modelo al 100 por ciento
MemAudit Reduce Ataques de Envenenamiento de Memoria a 0%
Rensselaer e IBM Exponen Fuga de KV Cache en LLMs Multi-Agentes
Principio de Correspondencia Unifica Siete Familias de Robustez
Agentes Autorreparables Elevan Puntuación de Benchmark a 0.61
LCGuard Corrige Fuga de KV-Cache en Sistemas Multi-Agent
Fine-tuning borra cadenas de razonamiento mientras la precisión se mantiene alta
Modelos de IA Médica Subestiman Autonomía del Paciente
Microsoft Detecta que GPT-5 Falla Contra Ataques Implausibles
Formalización de LLM Detecta 18.8% de Requisitos Ambiguos en Especificaciones de Seguridad
Negligencia de Negación Eleva Tasa de Creencias Falsas a 88,6% en LLMs Fine-Tuned
Reward Hacking No Detectado en Entrenamiento con Verificador Único
RubricEM de Google entrena agentes de investigación sin ground truth
Cada Clasificador de Guardrail Probado Falla en Verificación Formal de Seguridad
Agentes de IA Evaden la Ingeniería de Software, Arriesgan Fallos en Producción
CIVeX Registra Cero Ejecuciones Falsas en Flujos Confundidos
Artículo Desmantela Afirmación sobre Descubrimiento Causal en Modelos de Predicción
Flow-OPD Eleva la Precisión de Stable Diffusion a 92 desde 63
Conformal Path Reasoning reduce conjuntos de respuestas en grafos de conocimiento en 40 por ciento
Contexto Más Largo Degrada Cooperación de LLM, Revela Estudio
Precisión del Solucionador de Matemáticas en IA Sube 21.4% Con Generación Respaldada por Verificador
Q2RL Alcanza 100% de Éxito en Inserción de Espiga, Superando BC e IBRL
Framework Dreadnode Reduce Red Teaming de IA de Semanas a Horas
Solicitudes maliciosas en secuencia eluden la seguridad en 9 agentes de codificación
Detector de alucinación en LLM supera ocho líneas base sin reentrenamiento