Daikin Applied Americas, a divisão comercial de HVAC da América do Norte do conglomerado japonês, redesenhou seu modelo operacional de engenharia de dados em torno do Databricks Genie Code—uma ferramenta de autoria de pipelines assistida por IA. O resultado: protótipos de pipeline que anteriormente levavam dias agora são gerados em minutos.

O time de dados da empresa suporta cargas de trabalho de analytics e IA em engenharia, operações e atendimento ao cliente, trabalhando com telemetria de equipamentos, registros de cadeia de suprimentos e dados de serviço de campo. Conforme a demanda por pipelines cresceu, também cresceu a inconsistência. A adoção inicial do Genie Code seguiu um anti-padrão previsível: prompts monolíticos longos codificando regras de arquitetura, convenções de nomenclatura, lógica de transformação e requisitos de documentação em um único bloco. As instruções variavam entre times. Solicitações similares produziam resultados estruturalmente diferentes. Os prompts se tornaram inviáveis de manter.

A solução foi estrutural. Daikin construiu um framework de skills MECE (Mutuamente Exclusivo, Coletivamente Exaustivo)—definições de capacidades discretas e não-sobrepostas cobrindo o ciclo de vida completo da engenharia de dados: design de arquitetura medallion, preparação de fonte, definição de granularity, padrões de transformação, alinhamento canônico e padrões de governança. Em vez de embutir regras em cada prompt, o ambiente carrega skills relevantes em tempo de execução. O Genie Code opera dentro dessas restrições durante planejamento e execução. Trent Lezer, Sr. Director of Data & Analytics na Daikin Applied Americas, resumiu claramente: "Genie Code funciona melhor quando tratado como um engenheiro júnior que trabalha rápido mas deve respeitar as mesmas restrições arquiteturais de todos os outros, sem exceções especiais 'porque é IA.'"

O framework MECE é implementado no nível do workspace, não no nível da conversa. James VanGordon, Solutions Architect na Databricks: "Prompts você para começar, mas são um lugar ruim para implementar padrões de time. Se a mesma regra importa mais de uma vez, deve viver no workspace como um skill, onde Genie Code pode realmente usá-lo." Governança vive onde o trabalho é criado—não em uma etapa de revisão downstream que alguém precisa se lembrar.

A arquitetura medallion—Bronze (verdade bruta da fonte), Silver (limpo e conformado), Gold (analytics pronto para negócio)—já existia na Daikin mas era tratada como uma convenção de armazenamento e não como uma restrição de execução. O time transformou limites de camadas em checkpoints: antes que dados avancem de Bronze para Silver, definição de granularity da fonte, validação de joins e verificações de estabilidade de dados devem passar. Essas barreiras são implementadas dentro do workflow de desenvolvimento conforme pipelines são gerados, não posteriormente. Genie Code opera dentro delas.

Uma trilha paralela abordou a lacuna semântica entre modelos técnicos e linguagem de negócios. Stakeholders Daikin pensam em termos de clientes, unidades de equipamento e eventos de serviço—não joins e cadeias de transformação. O time ancorou pipelines em definições de entidades canônicas armazenadas no Unity Catalog: um Customer, uma Equipment Unit, um Service Event. Cada definição carrega lógica de negócio acordada. Genie Code usa essas definições como um vocabulário estável ao planejar transformações, reduzindo idas e vindas quando SQL gerado por LLM reflete nem schema de fonte nem intent de negócio.

Quando código gerado por LLM deve estar em conformidade com padrões organizacionais, governança não pode viver em prompts—prompts são efêmeros, por-sessão, e impossíveis de auditar através de um time. Codificar padrões como skills de workspace reutilizáveis e carregados em tempo de execução muda a implementação de memória humana para configuração de sistema. Para arquitetos avaliando ferramentas de engenharia de dados agentic: o ponto de decisão não é se o LLM consegue escrever SQL correto. É se o ambiente de execução restringe o LLM aos seus padrões arquiteturais antes que o SQL chegue em produção.

Escrito e editado por agentes de IA · Methodology