AO VIVO · QUI., 02 DE JUL. DE 2026 --:--:-- ET
Edição Nº 72 GASTO TOTAL $14647.00 ARTIGOS HOJE 5 TOKENS TOTAL 9.28B
aiexpert
Na linha
Chips NVIDIA Abre Computação de AI Factory para Parceiros Capitalistas Via Modelo Revenue-Share DSX Breaking Tribunal sueco premia Klarna PriceRunner com $1,97B em indenizações de antitrust do Google; maior sentença de competição sueca Breaking Cloudflare abre Monetization Gateway para micropagamentos x402 em stablecoin; agentes pagam por solicitação sem inscrição Breaking Hugging Face + Cerebras desbloqueiam IA de voz em tempo real para robôs; Gemma 4 a 1.800 TPS permite fala-para-fala de baixa latência em 7.500+ unidades Reachy Mini Funding Wayve lança tender de US$ 85 milhões de funcionários na plataforma Pisces da LSE, primeiro grande teste do sistema de mercados privados do Reino Unido Funding Ant Group lidera rodada de financiamento de US$ 73,58 milhões em startup de robô humanóide Zeroth; 12ª aposta em robótica em 18 meses Market Samsung, SK Hynix caem 7%+ em abertura no Nasdaq com preocupações de mercado enquanto fabricantes de chips sofrem com venda geral de tecnologia Breaking Google lança modelo de vídeo Gemini Omni Flash a US$0,10/seg e Nano Banana 2 Lite para imagens em disponibilidade geral Chips Tesla contrata Gary Jiang, veterano da Intel com 17 anos, como Diretor do projeto de chips Terafab Market Meta lança negócio de cloud para vender capacidade de IA em excesso; ações +8% Market NVIDIA projeta $1 trilhão em demanda de infraestrutura de IA até 2027; dobra previsão anterior Chips Samsung HBM4 ultrapassa $1B em vendas em 4 meses; projeta taxa anual de $10B Funding Oxmiq Labs arrecada $35M em Series A para GPU IP licenciável, visando arquitetura similar à Arm Research ChatGPT ultrapassa 1 bilhão de usuários mensais ativos, marco mais rápido de aplicativo de consumidor na história Chips NVIDIA e TSMC marcam primeiro wafer Blackwell feito nos EUA em Phoenix, planejam gasto de $500B em infraestrutura em 4 anos Funding Oxmiq levanta $35M em Série A para GPU IP baseado em RISC-V, expande foco em arquitetura de data center Breaking PriceRunner da Klarna vence veredicto antitruste de $1.97B contra Google no tribunal sueco Policy Anthropic restaura Claude Fable 5 globalmente após EUA levantarem controles de exportação após correção de segurança Market Ações de tecnologia de mercados emergentes lideram H1 2026; Big Tech dos EUA +19,4% vs mercados emergentes +90% Chips Computex 2026: mercado de laptops se divide em mainstream de 8GB econômico e tier de computação agente $5K+ Chips NVIDIA Abre Computação de AI Factory para Parceiros Capitalistas Via Modelo Revenue-Share DSX Breaking Tribunal sueco premia Klarna PriceRunner com $1,97B em indenizações de antitrust do Google; maior sentença de competição sueca Breaking Cloudflare abre Monetization Gateway para micropagamentos x402 em stablecoin; agentes pagam por solicitação sem inscrição Breaking Hugging Face + Cerebras desbloqueiam IA de voz em tempo real para robôs; Gemma 4 a 1.800 TPS permite fala-para-fala de baixa latência em 7.500+ unidades Reachy Mini Funding Wayve lança tender de US$ 85 milhões de funcionários na plataforma Pisces da LSE, primeiro grande teste do sistema de mercados privados do Reino Unido Funding Ant Group lidera rodada de financiamento de US$ 73,58 milhões em startup de robô humanóide Zeroth; 12ª aposta em robótica em 18 meses Market Samsung, SK Hynix caem 7%+ em abertura no Nasdaq com preocupações de mercado enquanto fabricantes de chips sofrem com venda geral de tecnologia Breaking Google lança modelo de vídeo Gemini Omni Flash a US$0,10/seg e Nano Banana 2 Lite para imagens em disponibilidade geral Chips Tesla contrata Gary Jiang, veterano da Intel com 17 anos, como Diretor do projeto de chips Terafab Market Meta lança negócio de cloud para vender capacidade de IA em excesso; ações +8% Market NVIDIA projeta $1 trilhão em demanda de infraestrutura de IA até 2027; dobra previsão anterior Chips Samsung HBM4 ultrapassa $1B em vendas em 4 meses; projeta taxa anual de $10B Funding Oxmiq Labs arrecada $35M em Series A para GPU IP licenciável, visando arquitetura similar à Arm Research ChatGPT ultrapassa 1 bilhão de usuários mensais ativos, marco mais rápido de aplicativo de consumidor na história Chips NVIDIA e TSMC marcam primeiro wafer Blackwell feito nos EUA em Phoenix, planejam gasto de $500B em infraestrutura em 4 anos Funding Oxmiq levanta $35M em Série A para GPU IP baseado em RISC-V, expande foco em arquitetura de data center Breaking PriceRunner da Klarna vence veredicto antitruste de $1.97B contra Google no tribunal sueco Policy Anthropic restaura Claude Fable 5 globalmente após EUA levantarem controles de exportação após correção de segurança Market Ações de tecnologia de mercados emergentes lideram H1 2026; Big Tech dos EUA +19,4% vs mercados emergentes +90% Chips Computex 2026: mercado de laptops se divide em mainstream de 8GB econômico e tier de computação agente $5K+
Breaking

Hugging Face + Cerebras desbloqueiam IA de voz em tempo real para robôs; Gemma 4 a 1.800 TPS permite fala-para-fala de baixa latência em 7.500+ unidades Reachy Mini

Hugging Face e Cerebras publicaram um pipeline de fala-para-fala modular em 1º de julho que combina Cerebras Inference (executando Gemma 4 31B a 1.851 tokens/seg) com componentes de áudio de código aberto: Parakeet NVIDIA para reconhecimento de fala, Qwen3 TTS Alibaba para síntese de fala e Silero VAD para detecção de voz. O stack é implantado em produção na Reachy Mini, o robô de mesa de $300 da Pollen Robotics, que tem 7.500+ unidades em uso. Ao contrário de abordagens anteriores de IA incorporada exigindo APIs em nuvem, o pipeline permite interação conversacional completa local e em tempo real com latências anteriormente impossíveis em hardware edge.

Gemma 4 31B em Cerebras atinge 1.851 tokens/seg—o primeiro modelo multimodal que a empresa levou para hardware em escala de wafer e 18x mais rápido que Claude Haiku em qualidade equivalente. A velocidade permite loops agenticos com múltiplas chamadas de ferramenta e raciocínio de visão para serem concluídos em tempo real em vez de esperas de vários segundos. Cerebras afirma que a latência desbloqueia novas experiências de produto: screenshot-para-patch, análise de documento denso e edição conversacional com ciclos de feedback aperto com humano no loop.

O deploy da Reachy Mini representa envio tangível: 7.500+ unidades agora capazes de interação de voz responsiva através de tooling de código aberto. Hugging Face otimizou o gargalo TTS (Qwen3-TTS) via gráficos CUDA e caches KV estáticos, reduzindo o tempo para primeiro áudio de segundos para sub-200ms. Cada componente é modular e intercambiável, permitindo aos desenvolvedores trocar independentemente camadas ASR, LLM ou TTS. A arquitetura reflete uma mudança para longe de APIs em nuvem monolíticas em direção a stacks de inferência compostos e abertos.

Para construtores de infraestrutura, isso sinaliza que IA incorporada em tempo real agora é viável em modelos de peso aberto sem aprisionamento de fornecedor proprietário. Arquitetos implantando robôs ou agentes orientados por voz podem fazer benchmarking das velocidades Gemma 4 do Cerebras contra fornecedores de APIs proprietários e alternativas de deploy local. O stack modular também reduz risco operacional: se qualquer componente ficar mais rápido (por exemplo, ASR melhor), todo o pipeline se beneficia. Monitore se o hardware em escala wafer do Cerebras se torna a camada de inferência padrão para loops agenticos multi-turn ou permanece uma opção premium para aplicações sensíveis à latência.

Fontes