AO VIVO · QUA., 24 DE JUN. DE 2026 --:--:-- ET
Edição Nº 64 GASTO TOTAL $14509.27 ARTIGOS HOJE 13 TOKENS TOTAL 9.10B
aiexpert
Na linha
Breaking Huang diz aos acionistas que centros de dados do mercado negro de chips contrabandeados são um "beco sem saída" Research Google integra uso de computador nativamente no Gemini 3.5 Flash para automação com agentes Research Google OpenRL: API auto-hospedada Kubernetes para pós-treinamento de LLM; desacopla RL de infraestrutura Market Micron Q3 bate ganho com márgens DRAM recordes; suprimento de HBM totalmente alocado até 2026 Policy EUA garantem Países Baixos para aliança de chip Pax Silica; tensões de ASML persistem sobre restrições de exportação MATCH Act Chips OpenAI & Broadcom revelam Jalapeño: Chip de inferência LLM customizado visa deployment em escala de gigawatt até final de 2026 Breaking Gemini 3.5 Flash adiciona computer use nativo; framework de agente agora padrão em Search Research IA projeta rapidamente chips de rádio-frequência novos além da intuição humana, reduzindo anos de trabalho para horas Chips Supercomputador LineShine da China lidera TOP500 com 2.198 exaflops apenas com CPU, encerrando reinado de El Capitan dos EUA Market Ações da Cerebras caem 17% após perda de orientação de margem, CEO diz que aviso foi 'mal compreendido' Market Sunrun, Tesla e Renew Home formam usina de energia virtual de 16GW para data centers de IA; RUN +31% Breaking Amazon Zoox revela robotaxi redesenhado, planejando lançamento de serviço pago em final de 2026 Funding XCures fecha rodada Series B de $46M com avaliação pós-money de $127M Funding Qualcomm adquire Modular por ~$4B para fortalecer stack de software de IA e negócio de data center Chips OpenAI & Broadcom revelam Jalapeño, chip de inferência LLM customizado com ciclo de design de 9 meses Chips SK Hynix envia amostras de memória HBM4E: 16Gbps, 48GB por stack, ganho de potência de 20% Funding Qualcomm em negociações para adquirir Tenstorrent por $8–10B, expandindo portfólio de chips de IA RISC-V Chips TSMC aumenta preços de nós avançados 5–10% em todos os nós 7nm e mais novos Chips OpenAI e Broadcom revelam chip de inferência customizado Jalapeño Chips Projeto de chip personalizado OpenAI-Broadcom stagna; Broadcom exige garantia de compra Microsoft antes de financiar Breaking Huang diz aos acionistas que centros de dados do mercado negro de chips contrabandeados são um "beco sem saída" Research Google integra uso de computador nativamente no Gemini 3.5 Flash para automação com agentes Research Google OpenRL: API auto-hospedada Kubernetes para pós-treinamento de LLM; desacopla RL de infraestrutura Market Micron Q3 bate ganho com márgens DRAM recordes; suprimento de HBM totalmente alocado até 2026 Policy EUA garantem Países Baixos para aliança de chip Pax Silica; tensões de ASML persistem sobre restrições de exportação MATCH Act Chips OpenAI & Broadcom revelam Jalapeño: Chip de inferência LLM customizado visa deployment em escala de gigawatt até final de 2026 Breaking Gemini 3.5 Flash adiciona computer use nativo; framework de agente agora padrão em Search Research IA projeta rapidamente chips de rádio-frequência novos além da intuição humana, reduzindo anos de trabalho para horas Chips Supercomputador LineShine da China lidera TOP500 com 2.198 exaflops apenas com CPU, encerrando reinado de El Capitan dos EUA Market Ações da Cerebras caem 17% após perda de orientação de margem, CEO diz que aviso foi 'mal compreendido' Market Sunrun, Tesla e Renew Home formam usina de energia virtual de 16GW para data centers de IA; RUN +31% Breaking Amazon Zoox revela robotaxi redesenhado, planejando lançamento de serviço pago em final de 2026 Funding XCures fecha rodada Series B de $46M com avaliação pós-money de $127M Funding Qualcomm adquire Modular por ~$4B para fortalecer stack de software de IA e negócio de data center Chips OpenAI & Broadcom revelam Jalapeño, chip de inferência LLM customizado com ciclo de design de 9 meses Chips SK Hynix envia amostras de memória HBM4E: 16Gbps, 48GB por stack, ganho de potência de 20% Funding Qualcomm em negociações para adquirir Tenstorrent por $8–10B, expandindo portfólio de chips de IA RISC-V Chips TSMC aumenta preços de nós avançados 5–10% em todos os nós 7nm e mais novos Chips OpenAI e Broadcom revelam chip de inferência customizado Jalapeño Chips Projeto de chip personalizado OpenAI-Broadcom stagna; Broadcom exige garantia de compra Microsoft antes de financiar
Research

Google OpenRL: API auto-hospedada Kubernetes para pós-treinamento de LLM; desacopla RL de infraestrutura

GKE Labs de Google lançou OpenRL, uma API de treinamento open-source auto-hospedada para executar workflows de pós-treinamento de aprendizado por reforço em clusters Kubernetes. OpenRL abstrai complexidade de infraestrutura de RL da pesquisa de IA, permitindo pesquisadores desenvolver loops RL agenáticos em compute padrão (e.g., um MacBook) enquanto engenheiros de infraestrutura lidam com scaling, orquestração e alocação de hardware em clusters compartilhados. O design desacopla duas preocupações que estão "intimamente misturadas" em frameworks atuais como TRL e DeepSpeed: lógica de pesquisa de IA (loop RL, design de recompensa) e execução de infraestrutura (provisionamento, gerenciamento de memória, agendamento de hardware).

Loops de treinamento RL tradicionais são estritamente sequenciais: trainer espera por sampler, sampler espera por scoring de recompensa (frequentemente vinculado a CPU/rede), GPUs ociosam. OpenRL permite jobs RL concorrentes saturarem utilização de GPU. Executar 1 job deixa lacunas; executar 3 jobs concorrentes alcança ciclos de duty GPU quase contínuos. O sistema usa padrão Tinker (quatro APIs: I/O de dados, atualizações de peso, sampling, checkpoint save) e integra-se com Tinker-Cookbook. OpenRL suporta fine-tuning LoRA de Gemma e outros modelos base. Google incluiu "autoresearch recipe" (inspirado no trabalho de Karpathy) habilitando experimentos paralelos para sweep de hiperparâmetro e refinação de sinal de recompensa em tarefas text-to-sql.

Arquitetura é preview de pesquisa, focada em fine-tuning apenas LoRA por enquanto. Roadmap futuro inclui suporte de modelo mais amplo e integração mais próxima com pipelines KubeFlow. OpenRL executa em macOS, GPUs NVIDIA e GKE, permitindo pesquisadores iterarem localmente enquanto escalando produção RL para deployments Kubernetes multi-nós.

Para arquitetos: OpenRL é uma camada de abstração early-stage que desbloqueia dois workflows: (1) pesquisadores podem prototipar RL agenático sem hardware de GPU, apontando para APIs de cluster remoto; (2) times de ops podem empacotar múltiplos jobs RL concorrentes para amortizar custos de infraestrutura. A limitação: apenas LoRA (adapter-based, não tuning de modelo completo). Se adotado, este modelo (preocupações separadas de pesquisa e infra) poderia padronizar como empresas executam pós-treinamento multi-agente em escala. Observe se este padrão se espalha para outros frameworks RL (NVIDIA NeMo RL, Hugging Face TRL) ou permanece centric a Google.

Fontes