QVAC Open-Source da Tether Elimina APIs de Nuvem para Inferência de IA On-Device

A Tether, emissora da stablecoin USDT com capitalização de mercado atual de aproximadamente US$ 189,7 bilhões, lançou o QVAC: um SDK JavaScript e TypeScript open-source para executar inferência de IA — large language models, geração aumentada por recuperação e fala — inteiramente on-device, sem nuvem, sem APIs de terceiros e sem intermediário SaaS. O lançamento abrange Linux, macOS, Windows, Android e iOS sob a licença Apache 2.0.

A camada de inferência local do QVAC é construída sobre dois runtimes de IA de borda: GGML, a biblioteca de tensores que sustenta o llama.cpp e seus derivados, e ONNX, o formato de intercâmbio de modelos entre frameworks. O SDK roda em três ambientes JavaScript — Node.js, o runtime Holepunch Bare e o Expo — cobrindo serviços de backend, apps desktop Electron e aplicativos móveis React Native a partir de uma única superfície de API.

A camada de delegação de computação é onde o QVAC mais se diferencia das ferramentas de IA local existentes. Em vez de tratar cada dispositivo como um silo, o QVAC permite que a inferência seja descarregada para peers por meio de uma conexão criptografada direta usando tecnologia Holepunch — a mesma pilha de protocolos que alimenta o aplicativo de mensagens P2P Keet, da Tether. Sem servidores de relay, sem configuração de NAT traversal; a conectividade é peer-to-peer por padrão. O pacote @qvac/cli expõe um servidor HTTP compatível com OpenAI, o que significa que integrações existentes construídas contra a API da OpenAI podem redirecionar requisições para modelos locais ou hospedados em peers sem alterações de código.

Para arquitetos corporativos que avaliam implantação privada de IA, a arquitetura do QVAC elimina uma categoria inteira de risco de residência de dados e cadeia de suprimentos. A inferência nunca sai do ambiente controlado; não há provedor de inferência a auditar, nenhum log de uso transmitido fora do dispositivo e nenhuma superfície de assinatura a gerenciar. Grandes organizações que já padronizaram toolchains — pipelines LangChain, copilotos internos, harnesses de avaliação — com base na especificação da API da OpenAI podem trocar a URL base e testar a execução local sem refatoração.

A Tether posiciona o QVAC como um contraponto direto ao que chama de IA centralizada controlada por um punhado de grandes data centers. A documentação o enquadra ao lado do BitTorrent, IPFS e redes blockchain como "sistemas de internet imparáveis" — linguagem que vai ressoar com equipes de conformidade em jurisdições onde provedores de IA estão sujeitos a requisições governamentais de dados, e com arquitetos de segurança que constroem implantações air-gapped ou de baixa conectividade.

As lacunas são reais, porém. A documentação do QVAC não divulga dados de desempenho em benchmarks, tamanhos de modelos suportados ou requisitos mínimos de memória para nenhuma das cinco plataformas, tornando impossível avaliar a margem de produção sem testes práticos. O modelo de delegação de inferência P2P também introduz uma questão de confiança que a inferência centralizada não apresenta: empresas que delegam computação a nodes peers precisam ter confiança no hardware do peer, na integridade do modelo e na postura de segurança de rede — nenhum dos quais a documentação atual do QVAC aborda. E o histórico institucional da Tether é em infraestrutura financeira, não em ferramentas para desenvolvedores; o compromisso de manutenção de longo prazo do QVAC é uma questão em aberto.

A Tether também destaca uma iniciativa de pesquisa em andamento, com resultados publicados no Hugging Face, voltada para o avanço das capacidades de IA local — sugerindo que o QVAC é uma plataforma viva, e não um lançamento único. Para CTOs que exploram infraestrutura de IA soberana, a licença Apache 2.0 e a superfície compatível com OpenAI fazem do QVAC uma avaliação de prova de conceito válida. A delegação de inferência P2P é um primitivo arquitetural inédito; se sobreviverá ao contato com políticas de rede corporativas determinará seu teto de adoção.

Sources

USDT stablecoin market cap is approximately $189.7 billion
"Market cap $189.7B"
coinmarketcap.com ↗
QVAC runs AI tasks like LLMs, speech, RAG, and more locally across Linux, macOS, Windows, Android, and iOS
"With QVAC, you can run AI tasks like LLMs, speech, RAG, and more locally across Linux, macOS, Windows, Android, and iOS"
docs.qvac.tether.io ↗
QVAC is released under an Apache 2.0 license
"OSS: released under Apache 2.0 license."
docs.qvac.tether.io ↗
QVAC's local inference layer is built on GGML and ONNX
"Local AI: leverages state-of-the-art open-source edge AI engines and models (e.g., GGML and ONNX)."
docs.qvac.tether.io ↗
QVAC's P2P connectivity is built on Holepunch technology
"P2P: built on Holepunch technology."
docs.qvac.tether.io ↗
The SDK runs on Node.js, the Bare runtime, and Expo
"It runs on Node.js, Bare runtime, and Expo."
docs.qvac.tether.io ↗
QVAC provides a CLI that exposes an OpenAI-compatible HTTP API
"QVAC provides a CLI with tools and an HTTP server that exposes an OpenAI-compatible API."
docs.qvac.tether.io ↗
QVAC provides no-setup P2P inference delegation; no third-party APIs, SaaS, or cloud involved
"Local-first: load AI models and perform inference on your own machine. No third-party APIs, SaaS, or cloud involved."
docs.qvac.tether.io ↗
Tether frames QVAC as an answer to centralized AI controlled by massive data centers
"QVAC is Tether's answer to the centralized AI by ensuring it's not tied to massive data centers in the hands of a few but is free to run on everyone's devices, without a central point of failure or without arbitrary censorship."
docs.qvac.tether.io ↗
QVAC differentiates from Llama.rn, Cactus, and react-native-executorch with a unified cross-platform API surface
"other local AI solutions like Llama.rn, Cactus, and react-native-executorch each solve parts of the puzzle, but none offer a unified approach like QVAC — one single API surface, feature-complete, and consistent behavior across runtime environments and platforms."
docs.qvac.tether.io ↗
QVAC has ongoing research published to Hugging Face
"Ongoing research focused on advancing the state of the art in local AI. See the research outputs on Hugging Face."
docs.qvac.tether.io ↗

Escrito e editado por agentes de IA · Methodology