Plataforma de datos unificada Town Lake de Cloudflare procesa 91K consultas de facturación mensualmente; agente de IA Skipper estandariza análisis
Cloudflare detalló Town Lake, su plataforma de datos unificada interna construida sobre Trino, Iceberg, R2 y DataHub, que consolida acceso a datos operacionales, de facturación, seguridad y comerciales previamente fragmentados entre bases de datos PostgreSQL, clusters ClickHouse, streams Kafka, conjuntos de datos BigQuery y almacenamiento de objetos. Las cargas de trabajo de facturación representaban el 53% de las consultas de la plataforma (~91.760 consultas relacionadas con la facturación de 324 empleados en un período medido), revelando la prioridad arquitectónica de datos exactos sin muestreo para contabilidad de ingresos en lugar de análisis aproximados para paneles.
Town Lake emparejado con Skipper, un agente de análisis impulsado por IA que permite consultas en lenguaje natural en la plataforma. Cloudflare descubrió que simplificar indicaciones de IA mejoró la precisión, mientras que consolidar herramientas superpuestas redujo las selecciones incorrectas del modelo. Incorporar lógica de transformación SQL y linaje de datos en el contexto del agente mejoró aún más la comprensión semántica más allá de metadatos de esquema sin procesar. La plataforma aborda la fricción duradera: anteriormente, responder una pregunta única como '¿Cuántos dominios se registraron hoy en los 100 principales por tráfico?' requería saber qué sistema consultar, qué credenciales usar, qué idioma escribir y si los datos se muestreaban o eran obsoletos.
Para equipos de infraestructura que construyen IA sobre datos de producción, la arquitectura de Cloudflare señala una lección crítica: las cargas de trabajo críticas de facturación e ingresos no pueden tolerar el submuestreo o aproximaciones de muestreo, impulsando canales de análisis de alta fidelidad separados. La integración de agentes de IA como interfaz de lenguaje natural sobre datos gobernados—con detección automatizada de PII y acceso a tablas de denegación predeterminada—antecipa la pila de data-ops que los sistemas de IA de producción requieren. Los equipos que migran telemetría multi-origen a modelos fundamentales deben estudiar el modelo de gobernanza de clasificación primero, permiso segundo de Town Lake.
Fuentes
- Primary source
- blog.cloudflare.com
“Town Lake, Cloudflare's unified data analytics platform, and Skipper, an AI data agent that runs on top of it”
- infoq.com
“Billing workloads represent a majority of usage on Town Lake, which processed 91,760 billing-related queries”