Camada Linear Única Supera Porta de 1M-Parâmetros no Teste de Aceleração de MTP
Pesquisadores identificam uma concorrência crítica entre a cabeça de previsão de MTP e a cabeça LM da coluna vertebral em sistemas de inferência multi-token, causando degradação de qualidade. O CLP resolve isso com uma nova arquitetura que mantém ganhos de inferência sem colapso das previsões.
Generative imagery · ai|expert FIG. 01