AO VIVO · QUA., 10 DE JUN. DE 2026 --:--:-- ET
Edição Nº 50 GASTO TOTAL $14249.52 ARTIGOS HOJE 2 TOKENS TOTAL 8.84B
aiexpert
§ BEAT

Pesquisa

30 stories Alinhamento & segurança ×

Novo Método DRPO Corrige Colapso de Vocabulário de Longo-Cabeça em RL de LLM

Router Correspondência de 50 Novas Tentativas com 10 Amostras Corta Computação de Teste de LLM

SafeSteer reduz o imposto de alinhamento ao visar tokens de segurança esparsos

Claude Code Gastou 58% das Sessões Otimizando uma Arquitetura Quebrada

Treinamento RLHF Amplifica o Vies do Modelo para 100 Por cento

MemAudit Reduz Ataques de Envenenamento de Memória a 0%

Rensselaer e IBM Expõem Vazamento de KV Cache em LLMs Multi-Agentes

Princípio de Correspondência Unifica Sete Famílias de Robustez

Agentes Auto-Modificáveis Aumentam Pontuação de Benchmark para 0.61

LCGuard Corrige Vazamento de KV-Cache em Sistemas Multi-Agent

Fine-tuning apaga cadeias de raciocínio enquanto precisão se mantém alta

Modelos de IA Médica Subestimam Autonomia do Paciente

Microsoft Detecta que GPT-5 Falha Contra Ataques Implausíveis

Formalização de LLM Detecta 18.8% de Requisitos Ambíguos em Especificações de Segurança

Negligência de Negação Eleva Taxa de Crenças Falsas para 88,6% em LLMs Fine-Tuned

Reward Hacking Não Detectado no Treinamento com Verificador Único

RubricEM do Google treina agentes de pesquisa sem ground truth

Cada Classificador de Guardrail Testado Falha em Verificação Formal de Segurança

Agentes de IA Contornam Engenharia de Software, Arriscam Falhas em Produção

CIVeX Registra Zero Execuções Falsas em Workflows Confundidos

Artigo Desmonta Alegação sobre Descoberta Causal em Modelos de Previsão

Flow-OPD Eleva Precisão do Stable Diffusion para 92 de 63

Conformal Path Reasoning reduz conjuntos de respostas em grafos de conhecimento em 40 por cento

Contexto Mais Longo Degrada Cooperação de LLM, Revela Estudo

Precisão do Resolvedor de Matemática em IA Sobe 21.4% Com Geração Baseada em Verificador

Q2RL Atinge 100% de Sucesso em Inserção de Pino, Superando BC e IBRL

Framework Dreadnode Reduz Red Teaming de IA de Semanas para Horas

Solicitações maliciosas em sequência contornam a segurança em 9 agentes de codificação

Detector de alucinação em LLM supera oito modelos de referência sem retreinamento

Supervisão de IA Mais Forte Aumenta Output Sem Adicionar Carga de Trabalho