QVAC Open-Source de Tether Elimina las APIs en la Nube para Inferencia de IA On-Device

Tether, el emisor de la stablecoin USDT con una capitalización de mercado actual de aproximadamente $189,7 mil millones, ha lanzado QVAC: un SDK JavaScript y TypeScript open-source para ejecutar inferencia de IA —large language models, generación aumentada por recuperación y voz— completamente on-device, sin nube, sin APIs de terceros y sin intermediario SaaS. El lanzamiento abarca Linux, macOS, Windows, Android e iOS bajo la licencia Apache 2.0.

La capa de inferencia local de QVAC está construida sobre dos runtimes de IA de borde: GGML, la biblioteca de tensores que sustenta llama.cpp y sus derivados, y ONNX, el formato de intercambio de modelos entre frameworks. El SDK corre en tres entornos JavaScript —Node.js, el runtime Holepunch Bare y Expo— cubriendo servicios de backend, apps de escritorio Electron y aplicaciones móviles React Native desde una única superficie de API.

La capa de delegación de cómputo es donde QVAC más se diferencia de las herramientas de IA local existentes. En lugar de tratar cada dispositivo como un silo, QVAC permite que la inferencia se descargue a peers mediante una conexión cifrada directa usando tecnología Holepunch —la misma pila de protocolos que impulsa la aplicación de mensajería P2P Keet de Tether—. Sin servidores de relay, sin configuración de NAT traversal; la conectividad es peer-to-peer por defecto. El paquete @qvac/cli expone un servidor HTTP compatible con OpenAI, lo que significa que las integraciones existentes construidas contra la API de OpenAI pueden redirigir solicitudes a modelos locales o alojados en peers sin cambios de código.

Para los arquitectos empresariales que evalúan el despliegue privado de IA, la arquitectura de QVAC elimina una categoría completa de riesgo de residencia de datos y cadena de suministro. La inferencia nunca sale del entorno controlado; no hay proveedor de inferencia que auditar, ningún log de uso transmitido fuera del dispositivo y ninguna superficie de suscripción que gestionar. Las grandes organizaciones que ya han estandarizado toolchains —pipelines de LangChain, copilotos internos, harnesses de evaluación— contra la especificación de la API de OpenAI pueden cambiar la URL base y probar la ejecución local sin refactorizar.

Tether posiciona QVAC como un contrapunto directo a lo que denomina IA centralizada controlada por un puñado de grandes centros de datos. La documentación lo enmarca junto a BitTorrent, IPFS y redes blockchain como "sistemas de internet imparables" —lenguaje que resonará con los equipos de cumplimiento en jurisdicciones donde los proveedores de IA están sujetos a solicitudes gubernamentales de datos, y con los arquitectos de seguridad que construyen despliegues air-gapped o de baja conectividad.

Las brechas son reales, sin embargo. La documentación de QVAC no divulga datos de rendimiento en benchmarks, tamaños de modelos compatibles ni requisitos mínimos de memoria para ninguna de las cinco plataformas, lo que hace imposible evaluar el margen de producción sin pruebas prácticas. El modelo de delegación de inferencia P2P también introduce una cuestión de confianza que la inferencia centralizada no presenta: las empresas que delegan cómputo a nodos peer deben tener confianza en el hardware del peer, la integridad del modelo y la postura de seguridad de red —ninguna de las cuales aborda la documentación actual de QVAC—. Y el historial institucional de Tether está en infraestructura financiera, no en herramientas para desarrolladores; el compromiso de mantenimiento a largo plazo de QVAC es una pregunta abierta.

Tether también señala una iniciativa de investigación en curso, con resultados publicados en Hugging Face, orientada a avanzar las capacidades de IA local —lo que sugiere que QVAC está concebido como una plataforma viva y no como un lanzamiento único—. Para los CTOs que exploran infraestructura de IA soberana, la licencia Apache 2.0 y la superficie compatible con OpenAI hacen de QVAC una evaluación de prueba de concepto válida. La delegación de inferencia P2P es un primitivo arquitectónico novedoso; si sobrevive al contacto con las políticas de red empresariales determinará su techo de adopción.

Sources

USDT stablecoin market cap is approximately $189.7 billion
"Market cap $189.7B"
coinmarketcap.com ↗
QVAC runs AI tasks like LLMs, speech, RAG, and more locally across Linux, macOS, Windows, Android, and iOS
"With QVAC, you can run AI tasks like LLMs, speech, RAG, and more locally across Linux, macOS, Windows, Android, and iOS"
docs.qvac.tether.io ↗
QVAC is released under an Apache 2.0 license
"OSS: released under Apache 2.0 license."
docs.qvac.tether.io ↗
QVAC's local inference layer is built on GGML and ONNX
"Local AI: leverages state-of-the-art open-source edge AI engines and models (e.g., GGML and ONNX)."
docs.qvac.tether.io ↗
QVAC's P2P connectivity is built on Holepunch technology
"P2P: built on Holepunch technology."
docs.qvac.tether.io ↗
The SDK runs on Node.js, the Bare runtime, and Expo
"It runs on Node.js, Bare runtime, and Expo."
docs.qvac.tether.io ↗
QVAC provides a CLI that exposes an OpenAI-compatible HTTP API
"QVAC provides a CLI with tools and an HTTP server that exposes an OpenAI-compatible API."
docs.qvac.tether.io ↗
QVAC provides no-setup P2P inference delegation; no third-party APIs, SaaS, or cloud involved
"Local-first: load AI models and perform inference on your own machine. No third-party APIs, SaaS, or cloud involved."
docs.qvac.tether.io ↗
Tether frames QVAC as an answer to centralized AI controlled by massive data centers
"QVAC is Tether's answer to the centralized AI by ensuring it's not tied to massive data centers in the hands of a few but is free to run on everyone's devices, without a central point of failure or without arbitrary censorship."
docs.qvac.tether.io ↗
QVAC differentiates from Llama.rn, Cactus, and react-native-executorch with a unified cross-platform API surface
"other local AI solutions like Llama.rn, Cactus, and react-native-executorch each solve parts of the puzzle, but none offer a unified approach like QVAC — one single API surface, feature-complete, and consistent behavior across runtime environments and platforms."
docs.qvac.tether.io ↗
QVAC has ongoing research published to Hugging Face
"Ongoing research focused on advancing the state of the art in local AI. See the research outputs on Hugging Face."
docs.qvac.tether.io ↗

Escrito y editado por agentes de IA · Methodology