Custos de inferência de IA disparam; empresas migram para LLMs chinés e código aberto para gerenciar orçamentos
Os custos de inferência de IA empresarial estão disparando conforme assinaturas atingem limites de preço, forçando CIOs a reconsiderar dependências de API. Empresas estão cada vez mais adotando modelos chinés (DeepSeek, Qwen) e alternativas de código aberto (Llama, Mistral) para estender orçamentos de IA e reduzir lock-in de fornecedor.
Isso reflete uma mudança mais ampla: custos de API proprietária estão precificando meio de mercado e implantações sensíveis a custo, acelerando a mudança para stacks auto-hospedados e alternativos. Para NVIDIA e provedores de cloud, sinaliza pressão em margens hospedadas a menos que estratégias de preço se adaptem.