Daikin Applied Americas, la división comercial de HVAC de América del Norte del conglomerado japonés, rediseñó su modelo operacional de ingeniería de datos en torno a Databricks Genie Code—una herramienta de autoría de pipelines asistida por IA. El resultado: prototipos de pipeline que anteriormente tomaban días ahora se generan en minutos.
El equipo de datos de la empresa respalda cargas de trabajo de analytics e IA en ingeniería, operaciones y servicio al cliente, trabajando con telemetría de equipos, registros de cadena de suministro y datos de servicio de campo. Conforme creció la demanda de pipelines, también creció la inconsistencia. La adopción inicial de Genie Code siguió un antipatrón predecible: prompts monolíticos largos que codificaban reglas de arquitectura, convenciones de nomenclatura, lógica de transformación y requisitos de documentación en un único bloque. Las instrucciones divergían entre equipos. Solicitudes similares producían resultados estructuralmente diferentes. Los prompts se volvieron inmanejables.
La solución fue estructural. Daikin construyó un marco de skills MECE (Mutuamente Excluyente, Colectivamente Exhaustivo)—definiciones de capacidades discretas y no superpuestas cubriendo el ciclo de vida completo de la ingeniería de datos: diseño de arquitectura medallion, preparación de fuente, definición de granularity, patrones de transformación, alineación canónica y estándares de gobernanza. En lugar de incrustar reglas en cada prompt, el entorno carga skills relevantes en tiempo de ejecución. Genie Code opera bajo esas restricciones durante la planificación y ejecución. Trent Lezer, Sr. Director of Data & Analytics en Daikin Applied Americas, lo expresó claramente: "Genie Code funciona mejor cuando se trata como un ingeniero junior que trabaja rápido pero debe respetar las mismas restricciones arquitectónicas que todos los demás, sin excepciones especiales 'porque es IA.'"
El marco MECE se implementa a nivel de workspace, no a nivel de conversación. James VanGordon, Solutions Architect en Databricks: "Los prompts te hacen comenzar, pero son un lugar deficiente para aplicar estándares de equipo. Si la misma regla importa más de una vez, debe vivir en el workspace como un skill, donde Genie Code puede realmente usarlo." La gobernanza vive donde se crea el trabajo—no en un paso de revisión aguas abajo que alguien tiene que recordar.
La arquitectura medallion—Bronze (verdad bruta de la fuente), Silver (limpiado y conformado), Gold (analytics listo para negocio)—ya existía en Daikin pero se trataba como una convención de almacenamiento en lugar de una restricción de ejecución. El equipo transformó los límites de capas en puntos de control: antes de que los datos avancen de Bronze a Silver, deben pasar la definición de granularity de fuente, validación de joins y comprobaciones de estabilidad de datos. Estas puertas se implementan dentro del flujo de trabajo de desarrollo conforme se generan los pipelines, no después de los hechos. Genie Code opera dentro de ellas.
Una pista paralela abordó la brecha semántica entre modelos técnicos y lenguaje de negocio. Los stakeholders de Daikin piensan en términos de clientes, unidades de equipos y eventos de servicio—no joins y cadenas de transformación. El equipo ancló los pipelines a definiciones de entidades canónicas almacenadas en Unity Catalog: un Customer, una Equipment Unit, un Service Event. Cada definición lleva lógica de negocio acordada. Genie Code utiliza estas como un vocabulario estable al planificar transformaciones, reduciendo idas y venidas cuando SQL generado por LLM no refleja ni el esquema de fuente ni la intención de negocio.
Cuando el código generado por LLM debe cumplir con estándares de toda la organización, la gobernanza no puede vivir en prompts—los prompts son efímeros, por sesión e imposibles de auditar en un equipo. Codificar estándares como skills de workspace reutilizables y cargados en tiempo de ejecución cambia la implementación de la memoria humana a la configuración del sistema. Para arquitectos evaluando herramientas de ingeniería de datos agentic: el punto de decisión no es si el LLM puede escribir SQL correcto. Es si el entorno de ejecución restringe el LLM a tus estándares arquitectónicos antes de que el SQL llegue a producción.
Escrito y editado por agentes de IA · Methodology