Together AI levanta $305M Series B conforme demanda de raciocínio DeepSeek impulsiona gastos de infraestrutura
Together AI anunciou uma rodada de financiamento Series B de $305 milhões liderada por General Catalyst e co-liderada por Prosperity7, enquanto a plataforma de inferência open-source capitaliza a demanda surging por modelos de raciocínio como DeepSeek-R1. A rodada reflete demanda estrutural de empresas construindo com modelos abertos, que requer infraestrutura dedicada para lidar com cargas de trabalho de inferência de raciocínio de longa duração que podem durar 2-3 minutos por solicitação.
Contrariamente aos medos iniciais de que raciocínio avançado reduziria a demanda de infraestrutura, o crescimento da Together AI mostra o oposto: modelos de raciocínio open-source estão consumindo MAIS computação. DeepSeek-R1 é caro para servir em 671 bilhões de parâmetros requerendo distribuição multi-servidor; a qualidade do modelo mais alta cria demanda na ponta premium, requerendo mais capacidade geral. A infraestrutura da Together AI expandiu para suportar essa demanda, e a plataforma agora serve DeepSeek-R1 em 85 tokens por segundo versus 7 tokens por segundo em provedores de nuvem concorrentes—uma lacuna de 12x de desempenho.
A empresa também está enviando novas ferramentas para a onda de raciocínio: lançou 'reasoning clusters' que provisionam capacidade dedicada (128 a 2.000 chips) para executar modelos em desempenho ótimo, e liberou DeepSeek V4 Pro com uma janela de contexto de 512K tokens em endpoints serverless e dedicados. Together AI também levantou $800 milhões previamente para acelerar a mudança open-source, fundamentando sua posição de mercado contra plataformas de IA de hiperscaler.
Para arquitetos de infraestrutura: a tese da Together AI é que raciocínio open-source—não lock-in de nuvem fechada de modelo fechado—vai dominar cargas de trabalho de produção. Se correto, essa mudança favorece provedores de inferência especializados sobre plataformas de nuvem generalista. A lacuna de 12x de desempenho entre Together e Azure no mesmo modelo sinaliza que otimização de inferência se tornou um fosso competitivo, e empresas estão escolhendo desempenho sobre conveniência—uma reversão de décadas de lógica de consolidação de nuvem.
Fontes
- Primary source
- venturebeat.com
“Today the company announced a $305 million series B round of funding, led by General Catalyst and co-led by Prosperity7.”
- venturebeat.com
“It's a fairly expensive model to run inference on. It has 671 billion parameters and you need to distribute it over multiple servers. And because the quality is higher, there's generally more demand on the top end, which means you need more capacity.”
- venturebeat.com
“For instance, we serve the DeepSeek-R1 model at 85 tokens per second and Azure serves it at 7 tokens per second. There is a fairly widening gap in the performance and cost that we can provide to our customers.”