Together AI recauda $305M Series B conforme la demanda de razonamiento DeepSeek impulsa el gasto de infraestructura
Together AI anunció una ronda de financiamiento Series B de $305 millones liderada por General Catalyst y co-liderada por Prosperity7, mientras la plataforma de inferencia de código abierto capitaliza la demanda que surge por modelos de razonamiento como DeepSeek-R1. La ronda refleja demanda estructural de empresas construyendo con modelos abiertos, que requiere infraestructura dedicada para manejar cargas de trabajo de inferencia de razonamiento de larga duración que pueden durar 2-3 minutos por solicitud.
Contrario a los temores iniciales de que el razonamiento avanzado reduciría la demanda de infraestructura, el crecimiento de Together AI muestra lo opuesto: los modelos de razonamiento de código abierto están consumiendo MÁS computo. DeepSeek-R1 es caro de servir en 671 mil millones de parámetros que requieren distribución multi-servidor; la calidad del modelo más alta crea demanda en el extremo premium, requiriendo más capacidad general. La infraestructura de Together AI se expandió para soportar esta demanda, y la plataforma ahora sirve DeepSeek-R1 en 85 tokens por segundo versus 7 tokens por segundo en proveedores de nube competidores—una brecha de 12x de rendimiento.
La empresa también está enviando nuevas herramientas para la onda de razonamiento: lanzó 'reasoning clusters' que provisionan capacidad dedicada (128 a 2.000 chips) para ejecutar modelos en rendimiento óptimo, y lanzó DeepSeek V4 Pro con una ventana de contexto de 512K tokens en endpoints sin servidor y dedicados. Together AI también recaudó $800 millones previamente para acelerar el cambio de código abierto, fundamentando su posición de mercado contra plataformas de IA de hiperscaler.
Para arquitectos de infraestructura: la tesis de Together AI es que el razonamiento de código abierto—no el bloqueo de nube cerrada de modelo cerrado—dominará las cargas de trabajo de producción. Si es correcto, este cambio favorece proveedores de inferencia especializados sobre plataformas de nube generalista. La brecha de 12x de rendimiento entre Together y Azure en el mismo modelo señala que la optimización de inferencia se ha convertido en un fóso competitivo, y las empresas están eligiendo rendimiento sobre conveniencia—una reversión de décadas de lógica de consolidación de nube.
Fuentes
- Primary source
- venturebeat.com
“Today the company announced a $305 million series B round of funding, led by General Catalyst and co-led by Prosperity7.”
- venturebeat.com
“It's a fairly expensive model to run inference on. It has 671 billion parameters and you need to distribute it over multiple servers. And because the quality is higher, there's generally more demand on the top end, which means you need more capacity.”
- venturebeat.com
“For instance, we serve the DeepSeek-R1 model at 85 tokens per second and Azure serves it at 7 tokens per second. There is a fairly widening gap in the performance and cost that we can provide to our customers.”