GPT-Realtime-2 acessível via API WebRTC, mas ainda ausente do app ChatGPT, levando a soluções alternativas de desenvolvedores
O GPT-Realtime-2 da OpenAI — divulgado como 'o primeiro modelo de voz com raciocínio de classe GPT-5' com cutoff de conhecimento de 30 de setembro de 2024 — está disponível através da Realtime API WebRTC da empresa há semanas, mas ainda não aparece no app ChatGPT consumer ou no cliente iPhone. A lacuna é suficientemente grande para que desenvolvedores criem soluções alternativas.
Simon Willison atualizou seu playground OpenAI-WebRTC de código aberto para expor seleção de modelos, permitindo que usuários escolham GPT-Realtime-2 diretamente e colem contexto de documentos arbitrários para conversas de áudio baseadas em navegador. O episódio evidencia um ponto de atrito recorrente: os lançamentos de modelos nos níveis de API e produto da OpenAI seguindo cronogramas notavelmente diferentes, deixando desenvolvedores construírem suas próprias interfaces para acessar capacidades que assinantes pagos do ChatGPT ainda não podem alcançar.