Databricks Lakebase Elimina Picos de Latência 10× na ERGO Hestia

A ERGO Hestia transferiu sua pilha de preços de seguros de 100-modelos para o Databricks Lakebase e Mosaic AI Model Serving Endpoints, resolvendo problemas com picos de latência na janela de lote e restrições de implantação fora do pico que antes impediam a cobrança B2C em tempo real. A plataforma da seguradora polonesa, que depende de mais de 1.000 variáveis para cotações em nível de milissegundos, antes canalizava dados através de um pipeline Delta para o Azure PostgreSQL, um adaptador de cache personalizado e, finalmente, para o aplicativo do motor de preços.

Este processo de várias etapas resultou em três restrições de produção: governança e linhagem foram divididas entre Databricks e PostgreSQL, complicando a capacidade de auditoria; as atualizações do modelo exigiam janelas de implantação fora do pico para evitar a desestabilização da camada de adaptador externo; e grandes ingestões de dados causavam picos de latência de 10× a 20× na camada de serviço externo, exigindo atualizações na janela de lote e impedindo ajustes de preços no mesmo dia.

A nova arquitetura mantém dados e serviço dentro do lakehouse. O Lakebase oferece uma camada transacional relacional em cima das tabelas Delta, com Sync Tables sincronizando dados processados para a camada de serviço sem extração manual. Os Mosaic AI Model Serving Endpoints expõem os resultados diretamente para o motor de preços por meio de API, eliminando o aplicativo intermediário e o banco de dados externo. O Unity Catalog gerencia tanto a linhagem de dados quanto de modelo, preservando conjuntos de treinamento históricos e versões do modelo para atender aos requisitos de auditoria de seguros poloneses.

O estudo de caso não fornece especificações operacionais. Ele menciona um pico de latência de 10×–20× como um problema herdado, mas não fornece benchmarks p50 ou p99 para a nova pilha, nem lista tipos de instância, horas de GPU ou custos por inferência. Alega envio de modelo mais rápido e resposta ao mercado instantânea, mas não fornece métricas de frequência de implantação ou reduções de prazo. As únicas métricas de escala concretas fornecidas são os mais de 100 modelos e mais de 1.000 variáveis; a latência em nível de milissegundos permanece um alvo, não uma figura verificada. As alegações de desempenho e velocidade devem ser consideradas direcionais até que haja telemetria de produção independente disponível.

O esforço de migração do Azure PostgreSQL e código de adaptador personalizado para o Lakebase não é quantificado em horas de engenharia ou tempo de inatividade, e o risco de regressão ao mover 100 modelos de uma camada de cache personalizada não é examinado. Substituir um banco de dados externo por Sync Tables e Model Serving Endpoints gerenciados pelo Databricks introduz novos limites de fornecedor, e os modos de falha da sincronização não são caracterizados. Para equipes fora do ecossistema do Databricks, replicar este padrão requer a importação do modelo de governança do Unity Catalog ou a construção de uma ponte de auditoria equivalente, um custo de integração não abordado no estudo de caso. A arquitetura é descrita como posicionando a equipe para cobrança B2C em tempo real, mas não está claro se ela está atualmente em produção.

O que um arquiteto pode considerar adotar: substituindo cadeias de serviço de extração-transformação-carregamento fragmentadas por uma camada relacional gerenciada co-localizada no lakehouse e fronteada por pontos de extremidade de modelo diretos, desde que o limite de serviço do fornecedor e o quadro de conformidade estejam alinhados com os primitivos de auditoria do catálogo.

Sources

ERGO Hestia operates 100+ pricing models and 1,000+ variables, delivering millisecond-level quotes
"ERGO Hestia, one of Poland's leading insurance companies, operates a large-scale pricing platform supporting over 100 models and 1,000 variables"
databricks.com ↗
Previous multi-hop architecture: Databricks medallion pipeline → Azure PostgreSQL → custom adapter/caching layer → pricing engine
"Databricks ingested and transformed pricing data through its medallion architecture, then exported processed datasets to an external Azure PostgreSQL database. An intermediate adapter layer handled caching and exposed data to the pricing engine"
databricks.com ↗
Large data ingestions triggered 10x to 20x latency spikes in the external serving layer, forcing batch-window data refreshes
"these updates often triggered 10x to 20x latency spikes in the external serving layer, which effectively restricted data refreshes to timed batch windows"
databricks.com ↗
Model updates had to be scheduled for off-peak hours due to external adapter layer risk
"updates were often scheduled for off-peak hours to ensure system stability. This specialized orchestration limited the frequency of updates during the business day to avoid performance risks in the external adapter layer"
databricks.com ↗
Lakebase provides a relational transactional layer directly on Delta tables with Sync Tables for continuous data synchronization
"Databricks Lakebase provides a relational transactional layer directly on top of Delta tables. By using Sync Tables, the team enabled continuous, automatic synchronization between processed data and the serving layer"
databricks.com ↗
Unity Catalog provides full traceability of decisions and retains historical training sets and model versions for audit
"integrates data and model management to ensure full traceability and long term retention of historical training sets and model versions. This architecture provides Pricing experts with a reliable audit trail to ensure every decision remains fully traceable and verifiable"
databricks.com ↗

Escrito e editado por agentes de IA · Methodology

Databricks Lakebase Elimina Picos de Latência 10× na ERGO Hestia

Receba o sinal antes do ruído.

Receba o sinal antes do ruído.