§ BEAT
Pesquisa
Camada Linear Única Supera Porta de 1M-Parâmetros no Teste de Aceleração de MTP
Real EHR Benchmark Exposta Limites dos LLMs em Ações Clínicas
AHA-WAM alcança controle de robô 4.59 vezes mais rápido desacoplando Transformadores de Difusão
FASE Reduz Detecção de Alucinações para 333x Velocidade
Novo Método DRPO Corrige Colapso de Vocabulário de Longo-Cabeça em RL de LLM
FASE Reduz Custo de Detecção de Alucinações para 0,3% dos Concorrentes
SIGA Acelera Agentes de Codificação em Simuladores Científicos por 36×
Echo-Memory Mostra que Modelos de Mundo Falham no Teste de Revisão
Pesquisadores de Waterloo reduzem custo de quantificação de incerteza em 99,7% com FASE
Esquema EvalCards Expõe Falhas Sistematizadas em Metadados de Benchmarks de IA
Perplexidade IA Agênica Reduz Tempo de Tarefa 87% em Estudo de Produção
64 Por cento dos Conflitos de Áudio-Texto nos Modelos de IA São Corrigíveis
Router Correspondência de 50 Novas Tentativas com 10 Amostras Corta Computação de Teste de LLM
StreamMA Reduz Latência de Raciocínio Multi-Agente em 26,9×
Alibaba Desenvolve Skill-RM para Avaliação Unificada de Recompensas de LLM
Painéis de Julgamento Diversificados por Fornecedor Eliminam Vies em Avaliações de Modelos de Linguagem
LLMs Podem Induzir Regras Ocultas, mas Execução Procedimental Continua Sem Solução
AdaCodec reduz carga de token de vídeo em 7× com codificação preditiva
SafeSteer reduz o imposto de alinhamento ao visar tokens de segurança esparsos
Formato de Saída Leva à Perda de Precisão Mais Rápida do que a Mudança de Domínio em LLM Multimodais
SubFit Mantem 84,6% de Precisão Enquanto Reduz Camadas de LLM em 25% de Esparsidade
Claude Code Gastou 58% das Sessões Otimizando uma Arquitetura Quebrada
Precisão de Manipulação de Robôs Salta 22,5% com Codificador Consciente de Movimento
Problemas Inversos Lineares Não Protegem Contra a Alucinação por Difusão
Método HullFT Reduz Latência de Finetuning em Tempo de Teste em Comparação com SIFT
Conjunto de Dados GPIC Desbanca ImageNet-1K como Corpus Padrão de Treinamento
Modelos de Visão-Linguagem Sem Vantagem em Alinhamento Apenas de Texto
Omega-QVLA Reduz Memória do Modelo de Visão de Robô em 71% Sem Retreinamento
Testes de Hardware de Produção Necessários Antes que OFT Substitua LoRA em Escala