Plataforma de dados unificada Town Lake do Cloudflare processa 91K consultas de cobrança mensalmente; agente de IA Skipper padroniza análises
Cloudflare detalhou Town Lake, sua plataforma de dados unificada interna construída sobre Trino, Iceberg, R2 e DataHub, que consolida acesso a dados operacionais, de cobrança, segurança e negócios anteriormente fragmentados em bancos de dados PostgreSQL, clusters ClickHouse, streams Kafka, datasets BigQuery e armazenamento de objetos. Cargas de trabalho de cobrança representavam 53% das consultas da plataforma (~91.760 consultas relacionadas a cobrança de 324 funcionários em um período medido), revelando a prioridade arquitetônica de dados exatos não-amostrados para contabilidade de receita ao invés de análises aproximadas para painéis.
Town Lake emparelhado com Skipper, um agente de análise alimentado por IA que permite consultas em linguagem natural entre a plataforma. Cloudflare descobriu que simplificar prompts de IA melhorou a precisão, enquanto consolidar ferramentas sobrepostas reduziu seleções incorretas do modelo. Incorporar lógica de transformação SQL e linhagem de dados no contexto do agente melhorou ainda mais a compreensão semântica além de metadados de esquema brutos. A plataforma aborda atrito duradouro: previamente, responder uma única pergunta como 'Quantos domínios se inscreveram hoje no Top 100 por tráfego?' exigia saber qual sistema consultar, quais credenciais usar, que linguagem escrever, e se os dados eram amostrados ou obsoletos.
Para equipes de infraestrutura construindo IA em dados de produção, a arquitetura do Cloudflare sinaliza uma lição crítica: cargas de trabalho críticas de cobrança e receita não podem tolerar redução de amostragem ou aproximações de amostragem, conduzindo pipelines de análises separados com alta fidelidade. A integração de agentes de IA como uma interface de linguagem natural sobre dados governados—com detecção automatizada de PII e acesso à tabela de negação padrão—antecipa a pilha de data-ops que sistemas de IA de produção exigem. Equipes migrando telemetria multi-origem para modelos de fundação devem estudar o modelo de governança de classificação-primeiro, permissão-segundo de Town Lake.
Fontes
- Primary source
- blog.cloudflare.com
“Town Lake, Cloudflare's unified data analytics platform, and Skipper, an AI data agent that runs on top of it”
- infoq.com
“Billing workloads represent a majority of usage on Town Lake, which processed 91,760 billing-related queries”