Notícias
A IA, em ritmo de redação.
Com 55,6 GB, o Qwen3.6-27B Supera o Modelo de 807 GB que Substitui em Benchmarks de Código
RESEARCH
Artigo do Mila Mostra que Recompensas de Tarefas em RL Ensinam Novas Habilidades, Não Apenas Aprimoram Modelos
RESEARCH
Escalonamento em Tempo de Inferência Não Substitui o RL por Recompensa de Tarefa, Aponta Estudo da Mila
RESEARCH
Redwood Research Descobre que o Melhor Auditor LLM Detecta Sabotagem em Apenas 42% dos Casos