Noam Shazeer, co-autor de Transformer, deixa Google pela OpenAI; menos de 2 anos após aqui-contratação de $2.7B
Noam Shazeer, co-autor do artigo 'Attention Is All You Need' de 2017 que introduziu a arquitetura Transformer e VP de Engenharia do Google DeepMind & co-lêder de Gemini, anunciou em 18 de junho que está se juntando ao OpenAI como Lêder de Pesquisa de Arquitetura. Sua saída vem menos de dois anos após o Google pagar aproximadamente $2,7 bilhões em agosto de 2024 para licenciar a tecnologia da Character.AI e trazer Shazeer de volta da startup que co-fundou. O timing sublinha a dificuldade que até as maiores empresas de tecnologia enfrentam ao reter pesquisadores de IA de elite em um mercado de talentos superaquecido.
O conhecimento institucional de Shazeer é difícil de quantificar, mas impossível de substituir rapidamente. Ele passou mais de duas décadas no Google (2000-2021), foi autor do artigo que se tornou a base de praticamente todo modelo de linguagem moderno (GPT, Gemini, Claude), desenhou arquiteturas de Mixture-of-Experts e Multi-Query Attention agora incorporadas em modelos fronteiriços e foi instrumental em melhorar a qualidade de Gemini durante 2024-2026. Na OpenAI, seu mandato—explorando arquiteturas de próxima geração—sinaliza que a empresa está olhando além de melhorias incrementais para sua linha GPT. Execuções de treinamento em escala fronteiriça levam meses; modificações arquiteturais requerem validação extensa. Mas o entendimento profundo de Shazeer sobre o que funciona em escala e onde os ganhos de eficiência são mais provavelmente é não capturado em artigos.
Para o Google, a perda se soma a um padrão preocupante: vários co-autores do artigo original de Transformer agora deixaram para se juntar a empreendimentos concorrentes. A resposta do Google à saída de Shazeer foi uma breve declaração agradecendo suas contribuições, sem comentário público sobre o roteiro de Gemini que ele estava liderando. Para OpenAI, apenas 10 dias após seu arquivo S-1 confidencial de IPO visando uma avaliação potencial de $1 trilhão, contratar o arquiteto Transformer envia um sinal: a corrida de IA fronteiriça não se trata apenas de quem tem os melhores modelos hoje, mas de quem pode construir as arquiteturas que definem a próxima geração.