AO VIVO · SEX., 26 DE JUN. DE 2026 --:--:-- ET

Edição Nº 66 GASTO TOTAL $14549.42 ARTIGOS HOJE 5 TOKENS TOTAL 9.15B

Na linha

Chips Nanostack de 0,7nm da IBM quebra barreira sub-1nm com 100 bilhões de transistores em dado do tamanho de uma unha Chips Nvidia qualifica-se triplicemente fornecedores HBM4; SK Hynix, Samsung, Micron todos prontos-produção para navio Vera Rubin Q3 Market Ganhos de Q3 da Micron explodem: revenue de $41,5B quad, contratos de cliente de $22B travam suprimento HBM até 2027 Breaking Hugging Face envia vLLM em HF Jobs: endpoint LLM compatível com OpenAI com um comando Policy EO da Casa Branca obriga migração federal de PQC até 2030-2031; demanda por silício quantum-safe acelera Market NVIDIA GeForce NOW aprofunda foco em jogos em nuvem com descontos da Steam Summer Sale Market SK Hynix visa listagem Nasdaq ADR $29B em 10 de julho; gigante de chips quer reavaliacão nos EUA Funding SpaceX formaliza aquisição de Cursor por $60B, maior negocio de startup de todos os tempos; consolidação de ferramentas de codificação xAI Funding Anthropic assina leases de data center de 1GW+ com suporte financeiro de Google, pivota de aluguel de cloud Research Sakana Fugu Ultra: orquestrador multi-agente marca 95.5 GPQA, 73.7 SWE-Bench Pro, roteia contornando controles de exportação Market Micron quebra recordes: FY Q3 $41.5B receita, margem bruta 84.6%, guia Q4 $50B em 86% Market Q3 de Micron impressiona: margem bruta de 84,9%, ramp de HBM4 bloqueia poder de preço até 2027 Funding Fornecedor da Apple Lingyi iTech precifica IPO de Hong Kong de $1,06B; aloca $1,71B para hardware de servidores de IA e robótica Market SoftBank desaba 12% com custos de infraestrutura de IA alimentando venda em massa de tecnologia asiática Chips Tenstorrent BlackHole Galaxy entra em produção; 10 clientes, pedido de 96 unidades Breaking Cloudflare lança habilidades de agentes de código aberto para implantação e migração de Zero Trust Funding Salesforce adquire Fin (antigo Intercom) por $3.6B para fortalecer IA de atendimento ao cliente Agentforce Market CFO Sarah Friar empurra atraso do IPO da OpenAI para 2027, cita risco de gastos de $600B, quedas de receita Funding On Semiconductor adquire Synaptics por $7B no maior acordo de sua história, investe em IA física Market Escassez de memória força Apple, Microsoft a elevar preços de Mac/iPad/Xbox em 17-25% em meio à competição de hiperscalers de IA Chips Nanostack de 0,7nm da IBM quebra barreira sub-1nm com 100 bilhões de transistores em dado do tamanho de uma unha Chips Nvidia qualifica-se triplicemente fornecedores HBM4; SK Hynix, Samsung, Micron todos prontos-produção para navio Vera Rubin Q3 Market Ganhos de Q3 da Micron explodem: revenue de $41,5B quad, contratos de cliente de $22B travam suprimento HBM até 2027 Breaking Hugging Face envia vLLM em HF Jobs: endpoint LLM compatível com OpenAI com um comando Policy EO da Casa Branca obriga migração federal de PQC até 2030-2031; demanda por silício quantum-safe acelera Market NVIDIA GeForce NOW aprofunda foco em jogos em nuvem com descontos da Steam Summer Sale Market SK Hynix visa listagem Nasdaq ADR $29B em 10 de julho; gigante de chips quer reavaliacão nos EUA Funding SpaceX formaliza aquisição de Cursor por $60B, maior negocio de startup de todos os tempos; consolidação de ferramentas de codificação xAI Funding Anthropic assina leases de data center de 1GW+ com suporte financeiro de Google, pivota de aluguel de cloud Research Sakana Fugu Ultra: orquestrador multi-agente marca 95.5 GPQA, 73.7 SWE-Bench Pro, roteia contornando controles de exportação Market Micron quebra recordes: FY Q3 $41.5B receita, margem bruta 84.6%, guia Q4 $50B em 86% Market Q3 de Micron impressiona: margem bruta de 84,9%, ramp de HBM4 bloqueia poder de preço até 2027 Funding Fornecedor da Apple Lingyi iTech precifica IPO de Hong Kong de $1,06B; aloca $1,71B para hardware de servidores de IA e robótica Market SoftBank desaba 12% com custos de infraestrutura de IA alimentando venda em massa de tecnologia asiática Chips Tenstorrent BlackHole Galaxy entra em produção; 10 clientes, pedido de 96 unidades Breaking Cloudflare lança habilidades de agentes de código aberto para implantação e migração de Zero Trust Funding Salesforce adquire Fin (antigo Intercom) por $3.6B para fortalecer IA de atendimento ao cliente Agentforce Market CFO Sarah Friar empurra atraso do IPO da OpenAI para 2027, cita risco de gastos de $600B, quedas de receita Funding On Semiconductor adquire Synaptics por $7B no maior acordo de sua história, investe em IA física Market Escassez de memória força Apple, Microsoft a elevar preços de Mac/iPad/Xbox em 17-25% em meio à competição de hiperscalers de IA

Breaking sexta-feira, 26 de junho de 2026 às 10:04

Hugging Face envia vLLM em HF Jobs: endpoint LLM compatível com OpenAI com um comando

Hugging Face lançou vLLM em HF Jobs, um serviço de inferência sem servidor que permite aos desenvolvedores girar um endpoint LLM privado compatível com OpenAI na infraestrutura Hugging Face com um único comando CLI. Sem Kubernetes, sem provisão de servidores—apenas hf jobs run --flavor a10g-large --expose 8000, escolha um modelo (Qwen, Llama, Mistral, etc.) e obtenha um endpoint ao vivo em segundos. A cobrança é por minuto de uso de hardware, pago no crédito pré-pago.

A integração remove fricção para implantação de modelo. Desenvolvedores podem consultar endpoints de um laptop, notebook ou em qualquer lugar via bibliotecas de cliente OpenAI padrão (passe a URL do job como base_url). O suporte SSH permite que você faça shell em trabalhos em execução para depuração, inspeção de memória de GPU e cauda de log—experiência de ops familiar sem overhead de contêiner. Paralelismo de tensor é suportado; --tensor-parallel-size espalha modelos em múltiplas GPUs para modelos maiores ou throughput mais alto. Flavors variam de GPUs A10G a pares H200 para mixture-of-experts como Qwen 3.5-122B.

Para implantação em produção, isso compete com plataformas de inferência dedicadas (Together, Anyscale, Replicate) mas mantém o desenvolvedor dentro do ecossistema Hugging Face—autenticação Hub, importação de modelo nativa e ativos da comunidade existentes. Arquitetos avaliando inferência de borda, geração em lote ou APIs LLM internas devem testar isso; preço e SLAs de latência importam mais que a velocidade de implantação em si. Fique atento a salvaguardas empresariais (limite de taxa, controles de acesso, logs de auditoria) conforme mais orgs se movem de notebooks para infraestrutura compartilhada.

Fontes

Primary source
huggingface.co
“You can spin up a private, OpenAI-compatible LLM endpoint on Hugging Face infrastructure with a single command — no servers to provision, no Kubernetes, pay-per-second.”