AO VIVO · DOM., 05 DE JUL. DE 2026 --:--:-- ET
Edição Nº 75 GASTO TOTAL $14674.89 ARTIGOS HOJE 3 TOKENS TOTAL 9.32B
aiexpert
Na linha
Breaking AWS lança S3 Annotations: metadados mutáveis e consultáveis para objetos (até 1GB por objeto) Chips Gargalo de chip de IA mudou: embalagem CoWoS agora é o gargalo vinculante até 2026 Funding MGX fecha fundo de IA de $49B acima da meta; Abu Dhabi aposta pilha completa de chips à inferência Market Demanda de energia de data center de IA tensiona grid dos EUA: Morgan Stanley prevê escassez de energia de 49 GW até 2028 Market Atraso de transformador de rede mata metade dos data centers de IA anunciados em 2026; energia se torna a restrição limitante Chips AWS S3 Annotations GA: anexar até 1GB contexto querável por objeto para agentes de IA Chips Escassez de memória HBM impulsiona aumentos de preço de 20%; Samsung, SK hynix esgotam capacidade 2026 Funding Anthropic envia S-1 confidencial ao SEC; apunta para listagem no Nasdaq em outubro de 2026 com valuação de $965B Market Meta planeja lançamento de serviço de nuvem em julho de 2026: aluguel de GPU e Llama hospedada para desafiar AWS, Azure Breaking Claude chega ao GA no Microsoft Foundry; empresas europeias bloqueadas por roteamento de dados nos EUA Chips Qualcomm revela High Bandwidth Compute; AI250 apunta a $15B em receita de data center até 2029 Funding Amazon promete investimento de $48 bilhões na Índia; $21B para infraestrutura de IA e nuvem Funding SoftBank compromete €45B em centros de dados de IA na França até 2031 Chips Infineon abre Smart Power Fab Dresden de €5B antes do cronograma; 1.000 empregos, foco em alimentação de IA Research Claude Sonnet 5 lançado como modelo agêntico; contexto nativo de 1M, preço promocional de $2/$10 por Mtok Market Ação coletiva nomeia Micron, Samsung, SK Hynix por suposta fixação de preços DRAM; oferta de HBM se aperta Funding Together AI levanta $800M em Série C a $8.3B de avaliação; inferência de código aberto atinge $1.15B em reservas Funding Google DeepMind investe $75M em A24; embarca pesquisadores em produções de filme para feedback de ferramenta Veo Breaking Cloudflare lança plataforma de dados unificada + agente de IA; Town Lake + Skipper reduzem latência de análise Funding Investidores em fuga de incerteza geopolítica pivotam para Índia; capital de VC sobe, foco em IA aguça Breaking AWS lança S3 Annotations: metadados mutáveis e consultáveis para objetos (até 1GB por objeto) Chips Gargalo de chip de IA mudou: embalagem CoWoS agora é o gargalo vinculante até 2026 Funding MGX fecha fundo de IA de $49B acima da meta; Abu Dhabi aposta pilha completa de chips à inferência Market Demanda de energia de data center de IA tensiona grid dos EUA: Morgan Stanley prevê escassez de energia de 49 GW até 2028 Market Atraso de transformador de rede mata metade dos data centers de IA anunciados em 2026; energia se torna a restrição limitante Chips AWS S3 Annotations GA: anexar até 1GB contexto querável por objeto para agentes de IA Chips Escassez de memória HBM impulsiona aumentos de preço de 20%; Samsung, SK hynix esgotam capacidade 2026 Funding Anthropic envia S-1 confidencial ao SEC; apunta para listagem no Nasdaq em outubro de 2026 com valuação de $965B Market Meta planeja lançamento de serviço de nuvem em julho de 2026: aluguel de GPU e Llama hospedada para desafiar AWS, Azure Breaking Claude chega ao GA no Microsoft Foundry; empresas europeias bloqueadas por roteamento de dados nos EUA Chips Qualcomm revela High Bandwidth Compute; AI250 apunta a $15B em receita de data center até 2029 Funding Amazon promete investimento de $48 bilhões na Índia; $21B para infraestrutura de IA e nuvem Funding SoftBank compromete €45B em centros de dados de IA na França até 2031 Chips Infineon abre Smart Power Fab Dresden de €5B antes do cronograma; 1.000 empregos, foco em alimentação de IA Research Claude Sonnet 5 lançado como modelo agêntico; contexto nativo de 1M, preço promocional de $2/$10 por Mtok Market Ação coletiva nomeia Micron, Samsung, SK Hynix por suposta fixação de preços DRAM; oferta de HBM se aperta Funding Together AI levanta $800M em Série C a $8.3B de avaliação; inferência de código aberto atinge $1.15B em reservas Funding Google DeepMind investe $75M em A24; embarca pesquisadores em produções de filme para feedback de ferramenta Veo Breaking Cloudflare lança plataforma de dados unificada + agente de IA; Town Lake + Skipper reduzem latência de análise Funding Investidores em fuga de incerteza geopolítica pivotam para Índia; capital de VC sobe, foco em IA aguça
Chips

Gargalo de chip de IA mudou: embalagem CoWoS agora é o gargalo vinculante até 2026

O gargalo vinculante na construção de computação de IA mudou de suprimento de wafres para embalagem avançada. Chip-on-Wafer-on-Substrate (CoWoS) — o processo que co-empacota High-Bandwidth Memory (HBM) com aceleradores de IA na densidade que as cargas de trabalho modernas exigem — é agora o gargalo primário da TSMC. O CEO C.C. Wei declarou publicamente que a capacidade CoWoS está 'vendida até 2025 e em 2026,' com TrendForce projetando aproximadamente 120.000–130.000 wafres mensais no final de 2026, acima dos 75.000 em 2025. No entanto, analistas observam que a expansão é improvavél que feche a demanda. NVIDIA aparentemente garantiu mais de 70% da capacidade CoWoS-L da TSMC, deixando a alocação restante dividida entre AMD, Broadcom, Marvell e outros — criando um gargalo estrutural que se compõe com a falta de HBM3E. Sem capacidade CoWoS, um wafer não é um acelerador de IA terminado; é silício esperando um processo mais limitado do que o próprio silício.

O gargalo é ainda mais comprimido por controles de exportação geopoliticos. Em março de 2026, a incerteza regulatória sobre vendas de H200 para a China forçou a NVIDIA a redirecionar a capacidade TSMC da produção H200 para chips Vera Rubin de próxima geração com pedidos confirmados dos EUA de OpenAI, Google e outras empresas americanas. Chips de IA menos avançados, como o H200, consomem a mesma capacidade CoWoS e HBM limitada que chips fronteiriços, criando competição direta. O CEO da OpenAI, Sam Altman, colocou claramente: 'O gargalo volta e meia. Agora, novamente, são chips.' Hyperscalers estão respondendo desenvolvendo silício personalizado (Google TPUs, AWS Trainium, Meta Maia), mas isso acelera a fragmentação do mercado em vez de resolver a escassez subjacente.

Para arquitetos planejando capacidade de 2026–2027, a alocação de CoWoS é agora o gargalo final, não demanda de computação ou capital. Compradores de longo prazo (Microsoft, Google, Amazon, Meta) estão garantindo alocações de vários anos, deixando jogadores menores e startups em um fila de espera. Mesmo capacidade de potência e energia — o gargalo anterior — são menos escassas do que slots de embalagem. As escolhas de design entre otimizadas para NVIDIA vs. silício personalizado agora carregam implicações de ROI impulsionadas pela cadeia de suprimentos que empalidecem com métricas de desempenho tradicionais. Espera-se que a falta de suprimento estrutural persista até 2027–2028, pois 30–50% da capacidade de data center planejada para 2026 se adiou para 2028 devido a filas de interconexão de rede elétrica, estendendo a pressão de demanda de componentes em anos subsequentes.

Fontes