GPT-Realtime-2 accesible a través de API WebRTC pero aún ausente de la app ChatGPT, impulsando soluciones alternativas de desarrolladores
GPT-Realtime-2 de OpenAI —publicitado como 'el primer modelo de voz con razonamiento de clase GPT-5' con corte de conocimiento del 30 de septiembre de 2024— está disponible a través de la Realtime API WebRTC de la empresa desde hace semanas, pero aún no aparece en la app ChatGPT consumer ni en el cliente iPhone. La brecha es lo suficientemente amplia para que los desarrolladores busquen soluciones alternas.
Simon Willison actualizó su playground OpenAI-WebRTC de código abierto para exponer la selección de modelos, permitiendo que los usuarios seleccionen GPT-Realtime-2 directamente y peguen contexto de documentos arbitrarios para conversaciones de audio basadas en navegador. El episodio destaca un punto de fricción recurrente: los lanzamientos de modelos en los niveles de API y producto de OpenAI funcionan en cronogramas notablemente diferentes, dejando a los desarrolladores construir sus propias interfaces para acceder a capacidades que los suscriptores pagos de ChatGPT aún no pueden alcanzar.