Databricks Lakebase Elimina los Picos de Latencia 10× en ERGO Hestia

ERGO Hestia ha migrado su pila de precios de seguros de 100 modelos a Databricks Lakebase y Mosaic AI Model Serving Endpoints, resolviendo problemas con los picos de latencia de ventana de lotes y las restricciones de despliegue fuera de horas pico que anteriormente obstaculizaban la cobranza B2C en tiempo real. La plataforma del asegurador polaco, que depende de más de 1,000 variables para cotizaciones de nivel de milisegundos, antes canalizaba datos a través de una tubería Delta a Azure PostgreSQL, un adaptador de caché personalizado y finalmente a la aplicación del motor de precios.

Este proceso de varios pasos resultó en tres restricciones de producción: la gobernanza y la linaje estaban divididas entre Databricks y PostgreSQL, complicando la auditoría; las actualizaciones de modelos requerían ventanas de despliegue fuera de horas pico para evitar la desestabilización de la capa de adaptador externo; y las grandes ingestas de datos causaban picos de latencia de 10× a 20× en la capa de servicio externo, lo que requería actualizaciones de ventana de lotes y evitaba los ajustes de precios del mismo día.

La nueva arquitectura mantiene los datos y el servicio dentro del lakehouse. Lakebase ofrece una capa transaccional relacional sobre las tablas Delta, con Sync Tables sincronizando los datos procesados a la capa de servicio sin extracción manual. Mosaic AI Model Serving Endpoints exponen los resultados directamente al motor de precios a través de la API, eliminando la aplicación intermedia y la base de datos externa. Unity Catalog gestiona tanto la linaje de datos como de modelos, preservando los conjuntos de entrenamiento históricos y versiones de modelos para cumplir con los requisitos de auditoría de seguros polacos.

El estudio de caso carece de detalles operativos. Menciona un pico de latencia de 10×–20× como un problema heredado, pero no proporciona benchmarks p50 o p99 para la nueva pila, ni enumera tipos de instancias, horas de GPU o costos por inferencia. Afirma una mayor rapidez en el envío de modelos y una respuesta al mercado instantánea, pero no proporciona métricas de frecuencia de despliegue o reducciones de tiempo de liderazgo. Las únicas métricas de escala concretas proporcionadas son los más de 100 modelos y más de 1,000 variables; la latencia de nivel de milisegundos sigue siendo un objetivo, no una cifra verificada. Las afirmaciones de rendimiento y velocidad deben considerarse direccionales hasta que esté disponible una telemetría de producción independiente.

El esfuerzo de migración de Azure PostgreSQL y código de adaptador personalizado a Lakebase no se cuantifica en horas de ingeniería o tiempo de inactividad, y el riesgo de regresión de mover 100 modelos fuera de una capa de caché personalizada no se examina. Reemplazar una base de datos externa con Sync Tables y Model Serving Endpoints administrados por Databricks introduce nuevos límites de proveedor, y los modos de fallo de sincronización no se caracterizan. Para equipos fuera del ecosistema de Databricks, replicar este patrón requiere importar el modelo de gobernanza de Unity Catalog o construir un puente de auditoría equivalente, un costo de integración no abordado en el estudio de caso. La arquitectura se describe como posicionando al equipo para la cobranza B2C en tiempo real, pero no está claro si actualmente está en producción.

Lo que un arquitecto podría considerar adoptar: reemplazar cadenas de servicio de extracción-transformación-carga fragmentadas con una capa relacional administrada coubicada en el lakehouse y frente a endpoints de modelo directos, siempre que el límite de servicio del proveedor y el marco de cumplimiento se alineen con los primitivos de auditoría del catálogo.

Sources

ERGO Hestia operates 100+ pricing models and 1,000+ variables, delivering millisecond-level quotes
"ERGO Hestia, one of Poland's leading insurance companies, operates a large-scale pricing platform supporting over 100 models and 1,000 variables"
databricks.com ↗
Previous multi-hop architecture: Databricks medallion pipeline → Azure PostgreSQL → custom adapter/caching layer → pricing engine
"Databricks ingested and transformed pricing data through its medallion architecture, then exported processed datasets to an external Azure PostgreSQL database. An intermediate adapter layer handled caching and exposed data to the pricing engine"
databricks.com ↗
Large data ingestions triggered 10x to 20x latency spikes in the external serving layer, forcing batch-window data refreshes
"these updates often triggered 10x to 20x latency spikes in the external serving layer, which effectively restricted data refreshes to timed batch windows"
databricks.com ↗
Model updates had to be scheduled for off-peak hours due to external adapter layer risk
"updates were often scheduled for off-peak hours to ensure system stability. This specialized orchestration limited the frequency of updates during the business day to avoid performance risks in the external adapter layer"
databricks.com ↗
Lakebase provides a relational transactional layer directly on Delta tables with Sync Tables for continuous data synchronization
"Databricks Lakebase provides a relational transactional layer directly on top of Delta tables. By using Sync Tables, the team enabled continuous, automatic synchronization between processed data and the serving layer"
databricks.com ↗
Unity Catalog provides full traceability of decisions and retains historical training sets and model versions for audit
"integrates data and model management to ensure full traceability and long term retention of historical training sets and model versions. This architecture provides Pricing experts with a reliable audit trail to ensure every decision remains fully traceable and verifiable"
databricks.com ↗

Escrito y editado por agentes de IA · Methodology

Databricks Lakebase Elimina los Picos de Latencia 10× en ERGO Hestia

Recibe la señal antes del ruido.

Recibe la señal antes del ruido.