Tether, el emisor de la stablecoin USDT con una capitalización de mercado actual de aproximadamente $189,7 mil millones, ha lanzado QVAC: un SDK JavaScript y TypeScript open-source para ejecutar inferencia de IA —large language models, generación aumentada por recuperación y voz— completamente on-device, sin nube, sin APIs de terceros y sin intermediario SaaS. El lanzamiento abarca Linux, macOS, Windows, Android e iOS bajo la licencia Apache 2.0.
La capa de inferencia local de QVAC está construida sobre dos runtimes de IA de borde: GGML, la biblioteca de tensores que sustenta llama.cpp y sus derivados, y ONNX, el formato de intercambio de modelos entre frameworks. El SDK corre en tres entornos JavaScript —Node.js, el runtime Holepunch Bare y Expo— cubriendo servicios de backend, apps de escritorio Electron y aplicaciones móviles React Native desde una única superficie de API.
La capa de delegación de cómputo es donde QVAC más se diferencia de las herramientas de IA local existentes. En lugar de tratar cada dispositivo como un silo, QVAC permite que la inferencia se descargue a peers mediante una conexión cifrada directa usando tecnología Holepunch —la misma pila de protocolos que impulsa la aplicación de mensajería P2P Keet de Tether—. Sin servidores de relay, sin configuración de NAT traversal; la conectividad es peer-to-peer por defecto. El paquete @qvac/cli expone un servidor HTTP compatible con OpenAI, lo que significa que las integraciones existentes construidas contra la API de OpenAI pueden redirigir solicitudes a modelos locales o alojados en peers sin cambios de código.
Para los arquitectos empresariales que evalúan el despliegue privado de IA, la arquitectura de QVAC elimina una categoría completa de riesgo de residencia de datos y cadena de suministro. La inferencia nunca sale del entorno controlado; no hay proveedor de inferencia que auditar, ningún log de uso transmitido fuera del dispositivo y ninguna superficie de suscripción que gestionar. Las grandes organizaciones que ya han estandarizado toolchains —pipelines de LangChain, copilotos internos, harnesses de evaluación— contra la especificación de la API de OpenAI pueden cambiar la URL base y probar la ejecución local sin refactorizar.
Tether posiciona QVAC como un contrapunto directo a lo que denomina IA centralizada controlada por un puñado de grandes centros de datos. La documentación lo enmarca junto a BitTorrent, IPFS y redes blockchain como "sistemas de internet imparables" —lenguaje que resonará con los equipos de cumplimiento en jurisdicciones donde los proveedores de IA están sujetos a solicitudes gubernamentales de datos, y con los arquitectos de seguridad que construyen despliegues air-gapped o de baja conectividad.
Las brechas son reales, sin embargo. La documentación de QVAC no divulga datos de rendimiento en benchmarks, tamaños de modelos compatibles ni requisitos mínimos de memoria para ninguna de las cinco plataformas, lo que hace imposible evaluar el margen de producción sin pruebas prácticas. El modelo de delegación de inferencia P2P también introduce una cuestión de confianza que la inferencia centralizada no presenta: las empresas que delegan cómputo a nodos peer deben tener confianza en el hardware del peer, la integridad del modelo y la postura de seguridad de red —ninguna de las cuales aborda la documentación actual de QVAC—. Y el historial institucional de Tether está en infraestructura financiera, no en herramientas para desarrolladores; el compromiso de mantenimiento a largo plazo de QVAC es una pregunta abierta.
Tether también señala una iniciativa de investigación en curso, con resultados publicados en Hugging Face, orientada a avanzar las capacidades de IA local —lo que sugiere que QVAC está concebido como una plataforma viva y no como un lanzamiento único—. Para los CTOs que exploran infraestructura de IA soberana, la licencia Apache 2.0 y la superficie compatible con OpenAI hacen de QVAC una evaluación de prueba de concepto válida. La delegación de inferencia P2P es un primitivo arquitectónico novedoso; si sobrevive al contacto con las políticas de red empresariales determinará su techo de adopción.
Escrito y editado por agentes de IA · Methodology