AO VIVO · SEG., 29 DE JUN. DE 2026 --:--:-- ET
Edição Nº 69 GASTO TOTAL $14614.96 ARTIGOS HOJE 5 TOKENS TOTAL 9.24B
aiexpert
Na linha
Chips IPO de chip de IA Cerebras arrecada $5,5B com alta de 68% no primeiro dia; WSE-3 wafer-scale compete com Nvidia Chips Palantir implanta NVIDIA Nemotron em stack de IA de governo dos EUA isolado Funding Q2 2026 estabelece recorde de saídas de startups de $1B+: IPO SpaceX $75B, Cerebras $5,55B, Quantinuum $1,68B Funding Anthropic arquiva confidencialmente para IPO a valuação $965B após Series H $65B; supera OpenAI Market SpaceX arrecada $25B em débito após IPO; apresenta desafio de diversificação para investidores detendo ambos equity e bonds Chips MLPerf Training v6.0: NVIDIA Blackwell varre, AMD dentro de 5-6% no treinamento de LLM denso Funding Menlo Ventures levanta $3B, maior em 50 anos de história, all-in em startups de IA em toda a stack Funding British Business Bank implanta £400m por ano em scaleups do Reino Unido via 10 microfundos de VC iniciantes Funding SatVu fecha rodada de £30M (€34M) de satélite térmico liderada por NATO Innovation Fund; constelacão HotSat Breaking AWS FinOps Agent entra em visualização pública; investigação de anomalia de custo com IA para operações em nuvem Chips YOFC fibra oca atinge 51,3 Tb/s em 128 milhas sem repetidores; marco de backbone para era de IA Funding Reed Semiconductor arrecada US$100M para entrega de energia de IA; rodada subscrita em excesso sinaliza demanda de infraestrutura Chips Samsung envia amostras de HBM4E líderes da indústria a 16Gbps, 48GB por stack; ganho de velocidade de 20%+ sobre HBM4 Market Micron guia $50 bi Q4, margens de 86%; assina 16 acordos de clientes estratégicos no valor de ~$100 bi Chips Acelerador de inferência d-Matrix Corsair entra em produção total; afirma 10x mais rápido decodificar que apenas GPU com 5x menos energia Market SoftBank se compromete com €75 bilhões para construir 5 GW de capacidade de data center de IA na França até 2031 Funding Governo do Reino Unido apoia iniciativa de capital de risco de £400 milhões para gestores de fundos diversificados Chips Plataforma NVIDIA Blackwell chega; GPUs B200/B300 com velocidade de inferência 4x mais rápida que H100, custo/energia 25x menores Breaking HP implanta Frontier do OpenAI em operações empresariais; junta-se a seis adotadores da plataforma inaugural Market 79% da capacidade global de data centers de IA enfrenta risco elevado de hazards climáticos; operadores se deslocam para zonas rurais e de clima extremo Chips IPO de chip de IA Cerebras arrecada $5,5B com alta de 68% no primeiro dia; WSE-3 wafer-scale compete com Nvidia Chips Palantir implanta NVIDIA Nemotron em stack de IA de governo dos EUA isolado Funding Q2 2026 estabelece recorde de saídas de startups de $1B+: IPO SpaceX $75B, Cerebras $5,55B, Quantinuum $1,68B Funding Anthropic arquiva confidencialmente para IPO a valuação $965B após Series H $65B; supera OpenAI Market SpaceX arrecada $25B em débito após IPO; apresenta desafio de diversificação para investidores detendo ambos equity e bonds Chips MLPerf Training v6.0: NVIDIA Blackwell varre, AMD dentro de 5-6% no treinamento de LLM denso Funding Menlo Ventures levanta $3B, maior em 50 anos de história, all-in em startups de IA em toda a stack Funding British Business Bank implanta £400m por ano em scaleups do Reino Unido via 10 microfundos de VC iniciantes Funding SatVu fecha rodada de £30M (€34M) de satélite térmico liderada por NATO Innovation Fund; constelacão HotSat Breaking AWS FinOps Agent entra em visualização pública; investigação de anomalia de custo com IA para operações em nuvem Chips YOFC fibra oca atinge 51,3 Tb/s em 128 milhas sem repetidores; marco de backbone para era de IA Funding Reed Semiconductor arrecada US$100M para entrega de energia de IA; rodada subscrita em excesso sinaliza demanda de infraestrutura Chips Samsung envia amostras de HBM4E líderes da indústria a 16Gbps, 48GB por stack; ganho de velocidade de 20%+ sobre HBM4 Market Micron guia $50 bi Q4, margens de 86%; assina 16 acordos de clientes estratégicos no valor de ~$100 bi Chips Acelerador de inferência d-Matrix Corsair entra em produção total; afirma 10x mais rápido decodificar que apenas GPU com 5x menos energia Market SoftBank se compromete com €75 bilhões para construir 5 GW de capacidade de data center de IA na França até 2031 Funding Governo do Reino Unido apoia iniciativa de capital de risco de £400 milhões para gestores de fundos diversificados Chips Plataforma NVIDIA Blackwell chega; GPUs B200/B300 com velocidade de inferência 4x mais rápida que H100, custo/energia 25x menores Breaking HP implanta Frontier do OpenAI em operações empresariais; junta-se a seis adotadores da plataforma inaugural Market 79% da capacidade global de data centers de IA enfrenta risco elevado de hazards climáticos; operadores se deslocam para zonas rurais e de clima extremo
Chips

MLPerf Training v6.0: NVIDIA Blackwell varre, AMD dentro de 5-6% no treinamento de LLM denso

O conjunto de benchmarks MLPerf Training v6.0, lançado pelo MLCommons em 16 de junho de 2026, mostra que NVIDIA Blackwell alcançou o tempo de treinamento mais rápido em todos os workloads testados, com a empresa submetendo resultados em todos os sete benchmarks—o único fornecedor a fazer isso. O sistema GB300 NVL72 (Blackwell Ultra) da NVIDIA alcançou desempenho líder por acelerador e em escala completa nos workloads LLM densos legados e nos novos modelos de mistura de especialistas (MoE) de 671 bilhões de parâmetros adicionados nesta rodada: DeepSeek-V3 e GPT-OSS-20B. CoreWeave, executando infraestrutura de nuvem, alcançou o tempo mais rápido do DeepSeek-V3 em 8.192 GPUs: 2,02 minutos.

O MI355X da AMD ficou dentro de 5% no fine-tuning do Llama 2-70B e 6% no pré-treinamento do Llama 3.1-8B versus NVIDIA B200 usando receitas de precisão FP4 comparáveis (MXFP4 vs. NVFP4). No entanto, AMD não submeteu resultados nos novos benchmarks MoE; todas as entradas para DeepSeek-V3 eram apenas NVIDIA, deixando a imagem competitiva incompleta no treinamento de modelos esparsos em escala. Microsoft Azure escalou Llama 3.1 405B (denso, 405B parâmetros) para 8.192 GPUs Blackwell em 7,07 minutos, um trabalho de treinamento em escala recorde.

Para profissionais, o título abrange duas camadas: hardware e software. No nível de hardware, a limpeza de stack completo da NVIDIA e o status de único fornecedor em todos os testes sinalizam maturidade de plataforma para treinamento de grande escala em produção. No nível de software, NVIDIA relata que GB300 entregou ganhos de throughput de 1,3x no DeepSeek-V3 versus GB200 em seis meses impulsionados puramente por otimização de software (gráficos CUDA, fusões de kernel, melhorias de roteador MoE)—nenhuma mudança de hardware. Isso indica que empresas com GPUs NVIDIA atuais podem esperar ganhos de desempenho entre ciclos de geração de hardware. Submissões em nuvem dobraram versus a rodada anterior (v5.1), sinalizando uma mudança estrutural em direção ao treinamento como serviço em vez de aquisição de GPU no local. Para equipes de aquisição de chips e planejamento de provedor de inferência, a paridade de 5-6% da AMD em modelos densos a torna uma alternativa de nó, mas a falta de resultados MoE deixa incerteza sobre competitividade nos workloads de arquitetura esparsa se tornando padrão da indústria.

Fontes