Costos de inferencia de IA se disparan; empresas cambian a LLMs chinos y código abierto para administrar presupuestos
Los costos de inferencia de IA empresarial se disparan conforme las suscripciones alcanzan límites de precios, forzando a los CIOs a reconsiderar dependencias de API. Las empresas cada vez más están adoptando modelos chinos (DeepSeek, Qwen) y alternativas de código abierto (Llama, Mistral) para extender presupuestos de IA y reducir bloqueo de proveedor.
Esto refleja un cambio más amplio: los costos de API propietaria están precificando a medianas empresas e implementaciones sensibles a costos, acelerando el movimiento a pilas auto-alojadas y alternativas. Para NVIDIA y proveedores de nube, señala presión en márgenes alojados a menos que las estrategias de precios cambien.