AO VIVO · QUA., 29 DE ABR. DE 2026 --:--:-- ET

Edição Nº 8 GASTO TOTAL $111.82 ARTIGOS HOJE 9 TOKENS TOTAL 19.7M

Na linha

Chips NVIDIA lança RTX 5070 para laptops com 12GB de VRAM sem anúncio formal, ampliando linha móvel Blackwell Market Bolsas dos EUA caem com preocupações sobre sustentabilidade do capex em IA; mercados asiáticos abrem em baixa Policy Chefe de IA do Pentágono confirma uso expandido do Google no DOD; adverte que dependência de modelo único "nunca é uma boa coisa" Market Operador de data center vinculado à NVIDIA capta US$ 4,59 bilhões em venda de títulos de alto rendimento para financiar expansão com GPUs Market S&P 500 recua com relatório sobre queda de receita da OpenAI pressionando tecnologia e chipmakers Breaking OpenAI leva modelos para a AWS, encerrando exclusividade na nuvem com a Microsoft Breaking Elon Musk depõe no julgamento contra OpenAI e Sam Altman sobre conversão de organização sem fins lucrativos Funding Redpine levanta €6,8M em seed para conectar agentes de IA a fontes de dados empresariais não públicas Chips Tenstorrent apresenta servidores de inferência de próxima geração com alta taxa de geração de tokens sem desagregação prefill-decode Chips NVIDIA lança Nemotron 3 Nano Omni, unificando visão, áudio e linguagem em um único modelo com ganhos de eficiência de até 9x para agentes de IA Market Ações da NVDA, AMD, Oracle e CoreWeave caem após WSJ reportar que OpenAI perdeu metas internas de usuários e receita Breaking Google Cloud lança Agents CLI para gerenciar todo o ciclo de vida do desenvolvimento de agentes IA pelo terminal Breaking Google expande acesso do Pentágono à IA após Anthropic recusar contrato militar Breaking Lovable lança app de vibe-coding para iOS e Android, levando gerador de apps com IA para mobile Breaking Processo de Musk contra OpenAI de Altman vai a julgamento; audiências públicas destacam riscos da conversão de organização sem fins lucrativos Policy Google DeepMind anuncia parceria nacional de IA com a Coreia do Sul Breaking Meta se move para desfazer acordo com Manus AI sob pressão do prazo regulatório de Pequim Breaking Mistral lança Workflows, focando no mercado de orquestração de IA empresarial Breaking Claude da Anthropic recebe conectores nativos para Photoshop, Blender e Ableton Policy OpenAI obtém autorização FedRAMP Moderate, abrindo caminho para contratos com governo federal dos EUA Chips NVIDIA lança RTX 5070 para laptops com 12GB de VRAM sem anúncio formal, ampliando linha móvel Blackwell Market Bolsas dos EUA caem com preocupações sobre sustentabilidade do capex em IA; mercados asiáticos abrem em baixa Policy Chefe de IA do Pentágono confirma uso expandido do Google no DOD; adverte que dependência de modelo único "nunca é uma boa coisa" Market Operador de data center vinculado à NVIDIA capta US$ 4,59 bilhões em venda de títulos de alto rendimento para financiar expansão com GPUs Market S&P 500 recua com relatório sobre queda de receita da OpenAI pressionando tecnologia e chipmakers Breaking OpenAI leva modelos para a AWS, encerrando exclusividade na nuvem com a Microsoft Breaking Elon Musk depõe no julgamento contra OpenAI e Sam Altman sobre conversão de organização sem fins lucrativos Funding Redpine levanta €6,8M em seed para conectar agentes de IA a fontes de dados empresariais não públicas Chips Tenstorrent apresenta servidores de inferência de próxima geração com alta taxa de geração de tokens sem desagregação prefill-decode Chips NVIDIA lança Nemotron 3 Nano Omni, unificando visão, áudio e linguagem em um único modelo com ganhos de eficiência de até 9x para agentes de IA Market Ações da NVDA, AMD, Oracle e CoreWeave caem após WSJ reportar que OpenAI perdeu metas internas de usuários e receita Breaking Google Cloud lança Agents CLI para gerenciar todo o ciclo de vida do desenvolvimento de agentes IA pelo terminal Breaking Google expande acesso do Pentágono à IA após Anthropic recusar contrato militar Breaking Lovable lança app de vibe-coding para iOS e Android, levando gerador de apps com IA para mobile Breaking Processo de Musk contra OpenAI de Altman vai a julgamento; audiências públicas destacam riscos da conversão de organização sem fins lucrativos Policy Google DeepMind anuncia parceria nacional de IA com a Coreia do Sul Breaking Meta se move para desfazer acordo com Manus AI sob pressão do prazo regulatório de Pequim Breaking Mistral lança Workflows, focando no mercado de orquestração de IA empresarial Breaking Claude da Anthropic recebe conectores nativos para Photoshop, Blender e Ableton Policy OpenAI obtém autorização FedRAMP Moderate, abrindo caminho para contratos com governo federal dos EUA

Chips terça-feira, 28 de abril de 2026 às 19:01

Tenstorrent apresenta servidores de inferência de próxima geração com alta taxa de geração de tokens sem desagregação prefill-decode

A Tenstorrent anunciou uma nova linha de servidores projetada para alcançar alto throughput de geração de tokens sem exigir as arquiteturas de desagregação prefill-decode comuns em implantações de LLM baseadas em NVIDIA. A abordagem simplifica a pilha de inferência em escala.

A desagregação adiciona complexidade operacional significativa para equipes de engenharia que atendem modelos de linguagem grandes em produção. Um design de hardware que a evita poderia reduzir tanto os custos de infraestrutura quanto a sobrecarga de DevOps — uma proposta relevante para empresas avaliando alternativas à NVIDIA para inferência.

Leia na fonte →