§ BEAT
Pesquisa
Camada Linear Única Supera Porta de 1M-Parâmetros no Teste de Aceleração de MTP
AHA-WAM alcança controle de robô 4.59 vezes mais rápido desacoplando Transformadores de Difusão
Pesquisadores de Waterloo reduzem custo de quantificação de incerteza em 99,7% com FASE
StreamMA Reduz Latência de Raciocínio Multi-Agente em 26,9×
Alibaba Desenvolve Skill-RM para Avaliação Unificada de Recompensas de LLM
Precisão de Manipulação de Robôs Salta 22,5% com Codificador Consciente de Movimento
Método HullFT Reduz Latência de Finetuning em Tempo de Teste em Comparação com SIFT
Busca Evolucionária Bidirecional Escapa dos Limites Autorregressivos na Razão
Modelo de Mistura de Profundidades de 30B do Mistral permanece não confirmado, mas preencheria uma lacuna na pilha de código
LoopMDM Reduz FLOPs de Treinamento 3.3× ao Reciclar Camadas Transformer
VeriTrace Melhora Agentes de Pesquisa Sem Escalar Modelos
Escala de Modelo Não Prevê Desempenho de Habilidades Extraídas
Gated DeltaNet-2 Supera Baselines Lineares em Recuperação de Contexto Longo
Vector Policy Optimization supera GRPO em amostragem diversa
Equilibrium Reasoners elevam precisão do Sudoku de 2,6% para 99% via test-time scaling
EnvFactory eleva precisão de chamada de ferramentas do Qwen3 em 15% com dados sintéticos
FORGE Reduz Falhas de Agentes para 1% Sem Fine-Tuning do Modelo
Por que Agentes em Produção Falham Sem Infraestrutura de Harness
KV-Fold Estende Contexto de Transformers até 128K Sem Retreinamento
Modelo Attractor de 27M Supera GPT o3 em Quebra-Cabeças de Lógica
Aprendizado Sparse-to-Dense Eleva Scores MATH para 78.5% em Modelos Pequenos
Perdas padrão de balanceamento de carga degradam especialização de experts em SMoE em 3x
VECA Reduz Custo de Inferência em Vision Transformers para Tempo Linear
Time de Los Alamos Treina Modelo de 8B que Generaliza em Benchmarks de Raciocínio
AutoTTS Reduz Custos de Inferência em 69,5% com Scaling Adaptativo em Tempo de Teste
ActCam Controla Câmeras de Vídeo e Personagens Sem Fine-Tuning
SIRA Supera Recuperação Densa Sem Treinamento ou Infraestrutura GPU