AO VIVO · SÁB., 27 DE JUN. DE 2026 --:--:-- ET
Edição Nº 67 GASTO TOTAL $14570.18 ARTIGOS HOJE 4 TOKENS TOTAL 9.17B
aiexpert
Na linha
Research Zhipu GLM 5.2 fecha lacuna com Claude Opus 4.8; open-weight coding entra em tier frontier Chips Cerebras e OpenAI assinam acordo de $20B+ para implantação de capacidade de inferência de IA de alta velocidade de 750MW Funding Mirendil levanta $200M seed a $1B: ex-pesquisadores da Anthropic constroem IA para IA R&D Market Mega-caps de tecnologia perdem $2.7T em junho conforme preocupações com capex de IA aumentam Breaking Vercel lança Eve, framework de código aberto para construir agentes de IA em produção Breaking Admin Trump concede licença de exportação para Anthropic para Mythos 5, encerrando standoff de 2 semanas Funding Groq levanta $650M, pivota para neocloud de inferência após deal de licença de $20B da Nvidia Chips Apple lança container 1.0: runtime OCI nativo para Linux em Apple silicon, alternativa gratuita ao Docker Desktop Breaking OpenAI lança série GPT-5.6 (Sol, Terra, Luna) em prévia governamental; Sol em $5/$30 por milhão de tokens Breaking Zhipu GLM 5.2 fica a poucos pontos percentuais do Opus 4.8 da Anthropic a um quinto do custo Funding Upscale AI atinge avaliação de $2B com extensão de Series A de $190M; Nvidia respalda startup de chip de networking de IA Funding Mirendil levanta $200M seed em $1B para automatizar a pesquisa de IA de fronteira Funding General Intuition levanta $320M em $2,3B para treinar agentes em dados de ação de gameplay Funding Baseten fecha Series F de $1,5B em $13B de avaliação; consolidação de inferência de IA Funding AppsFlyer levanta $1B de Google, Meta, Unity; medição de anúncios independente aposta em IA Market Oracle cai 19% na pior semana desde 2001; carga de débito de $130B dispara reavaliação Funding Baseten fecha Series F de $1,5B em avaliação de $13B, crescimento de receita 20x Market Ação Meta cai por preocupações com capex; gasto de $125–145B em 2026 falha em mover investidores Chips GlobalPlatform lança Pavona: silício aberto com criptografia pós-quântica de grau produtivo Breaking Vercel lança Eve, framework de agente de código aberto com execução durável e sandboxing integrados Research Zhipu GLM 5.2 fecha lacuna com Claude Opus 4.8; open-weight coding entra em tier frontier Chips Cerebras e OpenAI assinam acordo de $20B+ para implantação de capacidade de inferência de IA de alta velocidade de 750MW Funding Mirendil levanta $200M seed a $1B: ex-pesquisadores da Anthropic constroem IA para IA R&D Market Mega-caps de tecnologia perdem $2.7T em junho conforme preocupações com capex de IA aumentam Breaking Vercel lança Eve, framework de código aberto para construir agentes de IA em produção Breaking Admin Trump concede licença de exportação para Anthropic para Mythos 5, encerrando standoff de 2 semanas Funding Groq levanta $650M, pivota para neocloud de inferência após deal de licença de $20B da Nvidia Chips Apple lança container 1.0: runtime OCI nativo para Linux em Apple silicon, alternativa gratuita ao Docker Desktop Breaking OpenAI lança série GPT-5.6 (Sol, Terra, Luna) em prévia governamental; Sol em $5/$30 por milhão de tokens Breaking Zhipu GLM 5.2 fica a poucos pontos percentuais do Opus 4.8 da Anthropic a um quinto do custo Funding Upscale AI atinge avaliação de $2B com extensão de Series A de $190M; Nvidia respalda startup de chip de networking de IA Funding Mirendil levanta $200M seed em $1B para automatizar a pesquisa de IA de fronteira Funding General Intuition levanta $320M em $2,3B para treinar agentes em dados de ação de gameplay Funding Baseten fecha Series F de $1,5B em $13B de avaliação; consolidação de inferência de IA Funding AppsFlyer levanta $1B de Google, Meta, Unity; medição de anúncios independente aposta em IA Market Oracle cai 19% na pior semana desde 2001; carga de débito de $130B dispara reavaliação Funding Baseten fecha Series F de $1,5B em avaliação de $13B, crescimento de receita 20x Market Ação Meta cai por preocupações com capex; gasto de $125–145B em 2026 falha em mover investidores Chips GlobalPlatform lança Pavona: silício aberto com criptografia pós-quântica de grau produtivo Breaking Vercel lança Eve, framework de agente de código aberto com execução durável e sandboxing integrados
Chips

Cerebras e OpenAI assinam acordo de $20B+ para implantação de capacidade de inferência de IA de alta velocidade de 750MW

Cerebras Systems e OpenAI anunciaram um acordo multi-ano em 23 de junho para OpenAI implantar 750 megawatts de computação de inferência wafer-scale de Cerebras ao longo dos próximos anos. O acordo é avaliado em mais de $20 bilhões, com lançamento começando em 2026. Esta é a maior implantação de inferência de alta velocidade de IA anunciada até agora e reflete um pivô estratégico em direção ao silício de inferência dedicado de baixa latência—diferente da infraestrutura de treinamento centrada em GPU que dominou capex de IA.

<cite index="42-2">OpenAI afirma que "Cerebras adiciona uma solução de inferência dedicada de baixa latência ao nosso plataforma. Isso significa respostas mais rápidas, interações mais naturais e uma base mais forte para dimensionar IA em tempo real para muitas mais pessoas."</cite> <cite index="44-2">Cerebras simultaneamente lançou uma parceria multi-ano com AWS que traz uma estratégia de inferência desagregada: os chips Trainium 3 da AWS realizam o prefill, e CS-3 de Cerebras executa inferência de velocidade relampejante para decodificação.</cite> Esta abordagem de dois provedores sublinham que OpenAI e AWS estão desacoplando geração de tokens da codificação de contexto.

<cite index="44-2">Cerebras co-lançou Codex-Spark, um modelo projetado para codificação quase instantânea e otimizado para trabalho interativo onde latência importa, entregando mais de 1.000 tokens por segundo.</cite> <cite index="44-2">Kimi K2.6, o modelo de peso aberto líder e o primeiro modelo de trilhões de parâmetros servido em Cerebras, alcançou desempenho aproximando-se de 1.000 tokens por segundo como independentemente medido por Análise Artificial.</cite> Estes benchmarks validam silício wafer-scale para cargas de trabalho agentic sensíveis à latência.

Para profissionais, este acordo sinaliza uma inversão estratégica em infraestrutura de IA: treinamento era o recurso escasso em 2023-2024; inferência agora é a restrição. <cite index="47-2">O acordo de implantação de 750MW é aproximadamente 23 vezes o ponto médio da orientação de receita de ano completo de 2026 da Cerebras</cite>, dando à empresa clareza de receita contratada rara entre fornecedores de hardware. O compromisso de $20B+ de OpenAI também valida que provedores de modelos de fronteira manterão tiers de inferência dedicados separados de ofertas de commodities de hiperscaler. Espere por mais anunçios de capacidade de fab de concorrentes (Groq, CoreWeave, outros) e mais anunçios de co-otimização hardware-software à medida que velocidades de inferência se tornam um diferenciador de produto visível para agentes de IA em tempo real.

Fontes