§ BEAT
Pesquisa
Novo Método DRPO Corrige Colapso de Vocabulário de Longo-Cabeça em RL de LLM
Router Correspondência de 50 Novas Tentativas com 10 Amostras Corta Computação de Teste de LLM
SafeSteer reduz o imposto de alinhamento ao visar tokens de segurança esparsos
Claude Code Gastou 58% das Sessões Otimizando uma Arquitetura Quebrada
Treinamento RLHF Amplifica o Vies do Modelo para 100 Por cento
MemAudit Reduz Ataques de Envenenamento de Memória a 0%
Rensselaer e IBM Expõem Vazamento de KV Cache em LLMs Multi-Agentes
Princípio de Correspondência Unifica Sete Famílias de Robustez
Agentes Auto-Modificáveis Aumentam Pontuação de Benchmark para 0.61
LCGuard Corrige Vazamento de KV-Cache em Sistemas Multi-Agent
Fine-tuning apaga cadeias de raciocínio enquanto precisão se mantém alta
Modelos de IA Médica Subestimam Autonomia do Paciente
Microsoft Detecta que GPT-5 Falha Contra Ataques Implausíveis
Formalização de LLM Detecta 18.8% de Requisitos Ambíguos em Especificações de Segurança
Negligência de Negação Eleva Taxa de Crenças Falsas para 88,6% em LLMs Fine-Tuned
Reward Hacking Não Detectado no Treinamento com Verificador Único
RubricEM do Google treina agentes de pesquisa sem ground truth
Cada Classificador de Guardrail Testado Falha em Verificação Formal de Segurança
Agentes de IA Contornam Engenharia de Software, Arriscam Falhas em Produção
CIVeX Registra Zero Execuções Falsas em Workflows Confundidos
Artigo Desmonta Alegação sobre Descoberta Causal em Modelos de Previsão
Flow-OPD Eleva Precisão do Stable Diffusion para 92 de 63
Conformal Path Reasoning reduz conjuntos de respostas em grafos de conhecimento em 40 por cento
Contexto Mais Longo Degrada Cooperação de LLM, Revela Estudo
Precisão do Resolvedor de Matemática em IA Sobe 21.4% Com Geração Baseada em Verificador
Q2RL Atinge 100% de Sucesso em Inserção de Pino, Superando BC e IBRL
Framework Dreadnode Reduz Red Teaming de IA de Semanas para Horas
Solicitações maliciosas em sequência contornam a segurança em 9 agentes de codificação
Detector de alucinação em LLM supera oito modelos de referência sem retreinamento