Noam Shazeer, co-autor de Transformer, deja Google por OpenAI; menos de 2 años después de la aqui-contratación de $2.7B
Noam Shazeer, co-autor del documento 'Attention Is All You Need' de 2017 que introdujo la arquitectura Transformer y VP de Ingeniería de Google DeepMind & co-líder de Gemini, anunció el 18 de junio que se une a OpenAI como Líder de Investigación de Arquitectura. Su salida llega menos de dos años después de que Google pagara aproximadamente $2.7 mil millones en agosto de 2024 para licenciar la tecnología de Character.AI y traer de vuelta a Shazeer de la startup que co-fundó. El tiempo subraya la dificultad que incluso las compañías tecnológicas más grandes enfrentan para retener investigadores de IA de élite en un mercado de talento sobrecalentado.
El conocimiento institucional de Shazeer es difícil de cuantificar pero imposible de reemplazar rápidamente. Pasó más de dos décadas en Google (2000-2021), fue autor del documento que se convirtió en la base de prácticamente todo modelo de lenguaje moderno (GPT, Gemini, Claude), diseñó las arquitecturas Mixture-of-Experts y Multi-Query Attention ahora incorporadas en modelos fronterizos, y fue instrumental en mejorar la calidad de Gemini durante 2024-2026. En OpenAI, su mandato—explorando arquitecturas de próxima generación— señala que la empresa está mirando más allá de mejoras incrementales a su línea GPT. Las ejecuciones de entrenamiento a escala fronteriza tardan meses; las modificaciones arquitectónicas requieren validación extensa. Pero la comprensión profunda de Shazeer sobre qué funciona a escala y dónde es más probable que vengan las ganancias de eficiencia no se captura en documentos.
Para Google, la pérdida se suma a un patrón preocupante: varios co-autores del documento de Transformer original ahora han dejado para unirse a empresas competidoras. La respuesta de Google a la salida de Shazeer fue una breve declaración agradeciéndole sus contribuciones, sin comentarios públicos sobre el hoja de ruta de Gemini que lideraba. Para OpenAI, apenas 10 días después de su presentación confidencial de S-1 de OPI apuntando a una valoración potencial de $1 billón, contratar al arquitecto de Transformer envía una señal: la carrera fronteriza de IA no se trata solo de quién tiene los mejores modelos hoy, sino de quién puede construir las arquitecturas que definen la próxima generación.