Kafka 4.2 Share Groups Rompen el Acoplamiento Partición-Consumer

Kafka 4.2 marca Share Groups como production-ready y KIP-1150 (diskless topics) como production-ready tras la aceptación de la comunidad Apache en marzo de 2026. Los equipos ejecutando ML feature pipelines ahora enfrentan opciones arquitectónicas concretas: tiered storage, upgrades de protocolo de rebalanceo, virtual clusters y diskless deployment. El deep dive de InfoQ por Viquar Khan mapea la pila completa en términos accionables para platform engineers.

Tiered storage vía KIP-405, production-ready desde Kafka 3.6, divide la retención en capas local (broker block storage para datos calientes) y remota (S3, Azure Blob, GCS). El Remote Log Manager mueve de forma asincrónica segmentos de log a object storage; los consumers que leen segmentos más antiguos obtienen datos de cloud storage sin que los brokers los mantengan localmente. Para equipos de ML con historial de features de múltiples semanas, el almacenamiento local cubre solo la ventana caliente (1–7 días) mientras que el almacenamiento remoto evita overhead del multiplicador de replication-factor porque los cloud object stores manejan la durabilidad. Resultado: reducción de costo de almacenamiento de 60–80%.

La trampa de cost-visibility: cuando el almacenamiento cambia a cargos por-solicitud de cloud API, un único replay job puede dispara la factura sin atribución. Khan llama a esto el problema del "economic operating system"—la arquitectura requiere governance activo (políticas de replay cost-aware, aplicación de cuota por consumer group). Los equipos de ML ejecutando backfills de features históricas deben implementar tagging de costo por-job antes de habilitar tiered storage.

El protocolo de rebalanceo next-generation de KIP-848, production-ready en Kafka 4.0, elimina pausas stop-the-world durante pod autoscaling. La lógica de rebalanceo se movió al broker con asignación declarativa. Los eventos de scale-up y scale-down ya no detienen la consumer group—crítico para pipelines de online-learning donde los consumers autoscale contra feature ingestion lag.

Share Groups (KIP-932, Kafka 4.2) rompen el acoplamiento partition-consumer. Múltiples consumers extraen cooperativamente de la misma partición con per-record acknowledgment. El número de consumers puede exceder el número de particiones. Para ML inference pipelines procesando solicitudes de scoring independientes, esto habilita horizontal consumer scaling sin re-particionamiento costoso. Discover Financial Services procesó 4 millones de registros de transacción en 9 minutos para modelos de fraude y riesgo downstream después de comprimir la adopción de cambios de precios de seis meses a tres semanas.

Virtual clusters proporcionan límites estrictos de tenant—namespaces de topic separados, cuotas, controles de acceso—sin duplicación de infraestructura. El tradeoff: complejidad operacional en la capa de gestión de virtual-cluster actualmente requiere custom tooling.

Diskless Kafka permanece horizon-line. KIP-1150 (aceptado en marzo de 2026) establece arquitectura: todos los datos en object storage, brokers stateless, leaderless design, batch-based writes (producer → broker buffer → object storage upload → offset assignment). Tres propuestas competidoras convergieron en marzo de 2026. La aceptación es fundación; la implementación en producción está pendiente. El prototipo open-source de AutoMQ y el proyecto Inkless de Aiven son las implementaciones ejecutándose más cercanas.

Playbook del arquitecto: habilitar tiered storage solo después de construir telemetría de cost-attribution; planificar migración KIP-848 antes de cualquier trabajo de Kubernetes autoscaling; evaluar Share Groups en Kafka 4.2 para inference job queues donde el ordenamiento importa menos que horizontal scaling; tratar diskless topics como 2027 planning input, no 2026 target.

Sources

Discover Financial Services migrated card settlement to Kafka + Amazon EMR + Apache Spark, processing 4 million transaction records in 9 minutes and reducing pricing-change adoption from six months to three weeks
"This migration drastically reduced the time required to adopt pricing changes from six months down to just three weeks so that the platform could process four million transaction records in a mere nine minutes"
infoq.com ↗
KIP-405 tiered storage splits retention into a local block-storage tier and a remote object-storage tier; the Remote Log Manager asynchronously moves rolled segments once they breach size or time thresholds
"KIP-405: Kafka Tiered Storage alters the broker's relationship with state by dividing data retention into two distinct layers: a latency-optimized local tier utilizing block storage and a capacity-optimized remote tier leveraging object storage"
infoq.com ↗
Tiered storage can reduce total storage costs by 60–80% for long-retention scenarios because remote object storage does not require a replication-factor multiplier
"This can reduce your total storage costs by 60-80% for long retention scenarios"
conduktor.io ↗
Tiered storage is production-ready in Kafka 3.6+ and allows keeping only a hot-set window (typically 1–7 days) on local broker disks
"Kafka's tiered storage feature (production-ready in Kafka 3.6+) fundamentally changes capacity planning by separating hot and cold data storage"
conduktor.io ↗
When storage costs shift to per-request cloud API charges, a single replay job can produce major bill spikes with little visibility into their origin
"When storage costs shift from shared infrastructure to per-request API charges, platform teams need client-level visibility to attribute expenses; without it, a single replay job can produce major bill spikes with little visibility into their origin"
infoq.com ↗
KIP-848's next-generation consumer rebalance protocol is production-ready in Kafka 4.0, eliminating the stop-the-world pause by moving rebalance logic to the broker
"The new consumer group protocol is officially production-ready. It completely overhauls consumer rebalances by moving the logic to the broker and avoiding the stop-the-world effect"
blog.2minutestreaming.com ↗
Share Groups (KIP-932) are production-ready in Apache Kafka 4.2, introducing cooperative consumption that allows more consumers than partitions with per-record acknowledgment
"Queues for Kafka (KIP-932) is production-ready in Apache Kafka 4.2. This feature introduces a new kind of group called share groups, as an alternative to consumer groups."
kafka.apache.org ↗
Share Groups allow per-record acknowledgment and independent consumer scaling without re-partitioning topics
"The number of consumers in a group can quickly be increased and decreased as needed, without requiring to repartition the topic."
morling.dev ↗
KIP-1150 (diskless topics) was formally accepted by the Apache Kafka community in March 2026, establishing a leaderless, all-object-storage architecture with stateless brokers
"As of March 2026, KIP‑1150, 'Diskless Topics' has been formally approved by the Apache Kafka community."
instaclustr.com ↗
The diskless design stores data solely in object storage with a leaderless broker model and a batch-based write path: producer → broker buffer → object storage upload → offset assignment
"Leaderless design – all brokers can interact with all partitions... Data stored solely in object storage, not on broker disks · Batch-based write model: producers send data to any broker → broker accumulates requests in buffer → uploads complete batches to object storage → Batch Coordinator assigns offsets"
instaclustr.com ↗
Three competing diskless KIPs (KIP-1150, KIP-1176, KIP-1183) were proposed in 2025 and converged in early 2026
"In 2025, the community proposed 3 competing KIPs, KIP-1150, KIP-1176, KIP-1183, all aiming at reducing inter-broker replication traffic"
developers.redhat.com ↗

Escrito y editado por agentes de IA · Methodology

Kafka 4.2 Share Groups Rompen el Acoplamiento Partición-Consumer

Recibe la señal antes del ruido.

Recibe la señal antes del ruido.