EN VIVO · VIE, 26 JUN 2026 --:--:-- ET

Edición Nº 66 GASTO TOTAL $14549.42 ARTÍCULOS HOY 5 TOKENS TOTAL 9.15B

En vivo

Chips Nanostack de 0,7nm de IBM rompe barrera sub-1nm con 100 mil millones de transistores en oblea del tamaño de una uña Chips Nvidia califica triple proveedores HBM4; SK Hynix, Samsung, Micron todos listos-producción para navio Vera Rubin Q3 Market Ganancias Q3 de Micron explotan: ingresos de $41,5B quad, contratos de cliente de $22B aseguran suministro HBM hasta 2027 Breaking Hugging Face envía vLLM en HF Jobs: endpoint LLM compatible con OpenAI en un comando Policy EO de Casa Blanca obliga migración federal de PQC hasta 2030-2031; demanda de silício quantum-safe acelera Market NVIDIA GeForce NOW profundiza en juegos en nube con descuentos de Steam Summer Sale Market SK Hynix apunta a listagem ADR Nasdaq $29B el 10 de julio; gigante de chips busca reevaluación en EE.UU. Funding SpaceX formaliza adquisición de Cursor por $60B, mayor acuerdo de startup de todos los tiempos; consolidación de herramientas de codificación xAI Funding Anthropic firma arrendamientos de centros de datos de 1GW+ con respaldo financiero de Google, pivota del alquiler de nube Research Sakana Fugu Ultra: orquestrador multi-agente puntua 95.5 GPQA, 73.7 SWE-Bench Pro, enruta contorno controles de exportación Market Micron rompe récords: FY Q3 $41.5B ingresos, margen bruta 84.6%, guía Q4 $50B en 86% Market Q3 de Micron brillante: margen bruto de 84,9%, ramp de HBM4 bloquea poder de precios hasta 2027 Funding Proveedor de Apple Lingyi iTech precisa IPO de Hong Kong de $1,06B; asigna $1,71B para hardware de servidor IA y robótica Market SoftBank se desploma 12% con costos de infraestructura de IA alimentando venta en masa de tecnología asiática Chips Tenstorrent BlackHole Galaxy entra en producción; 10 clientes, pedido de 96 unidades Breaking Cloudflare lanza habilidades de agentes de código abierto para implantación y migración de Zero Trust Funding Salesforce adquiere Fin (antes Intercom) por $3.6B para fortalecer IA de servicio al cliente Agentforce Market CFO Sarah Friar impulsa retraso de IPO de OpenAI a 2027, cita riesgo de gastos de $600B, caídas de ingresos Funding On Semiconductor adquiere Synaptics por $7B en el mayor acuerdo de su historia, impulsa IA física Market La escasez de memoria obliga a Apple, Microsoft a subir precios de Mac/iPad/Xbox entre 17-25% en medio de la competencia de hiperscalers de IA Chips Nanostack de 0,7nm de IBM rompe barrera sub-1nm con 100 mil millones de transistores en oblea del tamaño de una uña Chips Nvidia califica triple proveedores HBM4; SK Hynix, Samsung, Micron todos listos-producción para navio Vera Rubin Q3 Market Ganancias Q3 de Micron explotan: ingresos de $41,5B quad, contratos de cliente de $22B aseguran suministro HBM hasta 2027 Breaking Hugging Face envía vLLM en HF Jobs: endpoint LLM compatible con OpenAI en un comando Policy EO de Casa Blanca obliga migración federal de PQC hasta 2030-2031; demanda de silício quantum-safe acelera Market NVIDIA GeForce NOW profundiza en juegos en nube con descuentos de Steam Summer Sale Market SK Hynix apunta a listagem ADR Nasdaq $29B el 10 de julio; gigante de chips busca reevaluación en EE.UU. Funding SpaceX formaliza adquisición de Cursor por $60B, mayor acuerdo de startup de todos los tiempos; consolidación de herramientas de codificación xAI Funding Anthropic firma arrendamientos de centros de datos de 1GW+ con respaldo financiero de Google, pivota del alquiler de nube Research Sakana Fugu Ultra: orquestrador multi-agente puntua 95.5 GPQA, 73.7 SWE-Bench Pro, enruta contorno controles de exportación Market Micron rompe récords: FY Q3 $41.5B ingresos, margen bruta 84.6%, guía Q4 $50B en 86% Market Q3 de Micron brillante: margen bruto de 84,9%, ramp de HBM4 bloquea poder de precios hasta 2027 Funding Proveedor de Apple Lingyi iTech precisa IPO de Hong Kong de $1,06B; asigna $1,71B para hardware de servidor IA y robótica Market SoftBank se desploma 12% con costos de infraestructura de IA alimentando venta en masa de tecnología asiática Chips Tenstorrent BlackHole Galaxy entra en producción; 10 clientes, pedido de 96 unidades Breaking Cloudflare lanza habilidades de agentes de código abierto para implantación y migración de Zero Trust Funding Salesforce adquiere Fin (antes Intercom) por $3.6B para fortalecer IA de servicio al cliente Agentforce Market CFO Sarah Friar impulsa retraso de IPO de OpenAI a 2027, cita riesgo de gastos de $600B, caídas de ingresos Funding On Semiconductor adquiere Synaptics por $7B en el mayor acuerdo de su historia, impulsa IA física Market La escasez de memoria obliga a Apple, Microsoft a subir precios de Mac/iPad/Xbox entre 17-25% en medio de la competencia de hiperscalers de IA

Breaking viernes, 26 de junio de 2026, 10:04

Hugging Face envía vLLM en HF Jobs: endpoint LLM compatible con OpenAI en un comando

Hugging Face lanzó vLLM en HF Jobs, un servicio de inferencia sin servidor que permite a los desarrolladores girar un endpoint LLM privado compatible con OpenAI en la infraestructura Hugging Face con un único comando CLI. Sin Kubernetes, sin aprovisionamiento de servidores—solo hf jobs run --flavor a10g-large --expose 8000, elija un modelo (Qwen, Llama, Mistral, etc.) y obtenga un endpoint en vivo en segundos. La facturación es por minuto de uso de hardware, pagada en crédito prepago.

La integración elimina fricción para la implementación del modelo. Los desarrolladores pueden consultar endpoints desde una laptop, notebook o en cualquier lugar a través de bibliotecas estándar de clientes OpenAI (pase la URL del trabajo como base_url). La compatibilidad SSH le permite acceder por shell a trabajos en ejecución para depuración, inspección de memoria de GPU y cola de registros—experiencia de operaciones familiar sin gastos generales de contenedor. Se admite paralelismo de tensor; --tensor-parallel-size distribuye modelos en múltiples GPU para modelos más grandes o mayor rendimiento. Los sabores varían desde GPU A10G hasta pares H200 para mixture-of-experts como Qwen 3.5-122B.

Para implementación en producción, esto compite con plataformas de inferencia dedicadas (Together, Anyscale, Replicate) pero mantiene el desarrollador dentro del ecosistema Hugging Face—autenticación Hub, importación de modelo nativa y activos de comunidad existentes. Los arquitectos que evalúan inferencia de borde, generación por lotes o API LLM internas deben probar esto; el precio y los SLA de latencia importan más que la velocidad de implementación en sí. Esté atento a las protecciones empresariales (límite de velocidad, controles de acceso, registros de auditoría) conforme más organizaciones se mudan de notebooks a infraestructura compartida.

Fuentes

Primary source
huggingface.co
“You can spin up a private, OpenAI-compatible LLM endpoint on Hugging Face infrastructure with a single command — no servers to provision, no Kubernetes, pay-per-second.”