Google Research lanzó TabFM el 30 de junio de 2026—un modelo de fundación para clasificación y regresión tabular que predice en un único paso hacia adelante sin entrenamiento por dataset, búsqueda de hiperparámetros o ingeniería de características. Evaluado en TabArena en 38 conjuntos de clasificación y 13 de regresión (700 a 150.000 muestras), TabFM está disponible en Hugging Face y GitHub, reflejando el patrón de TimesFM de Google: lógica zero-shot aplicada a tablas estructuradas en lugar de series temporales.

Desplegar XGBoost en un nuevo dataset típicamente requiere horas de ajuste de hiperparámetros e ingeniería de características específica del dominio. TabFM evita ese ciclo tratando todo el dataset—filas de entrenamiento y prueba juntas—como una única solicitud. El modelo lee la tabla en el momento de la inferencia, realiza predicciones y nunca actualiza pesos. Este es el aprendizaje en contexto aplicado a una estructura 2D sin orden.

La arquitectura tiene tres etapas. La atención alternada entre filas y columnas procesa la tabla cruda, descubriendo interacciones de características en ambas dimensiones simultáneamente. La representación contextualizada de cada fila se comprime en un único vector denso. Un transformador dedicado ejecuta luego aprendizaje en contexto sobre esa secuencia de incrustaciones comprimidas en lugar de la cuadrícula cruda, manteniendo la inferencia manejable conforme crece el tamaño del dataset. Google combina la atención alternada de TabPFN con el paso ICL de fila comprimida de TabICL.

Los datos de entrenamiento son completamente sintéticos, generados a través de modelos causales estructurales que incorporan funciones aleatorias. La lógica de Google: los datasets tabulares de código abierto a escala industrial no existen en volumen suficiente. Los esquemas propietarios, etiquetas sensibles y tamaños de tablas en producción los hacen inaccesibles. Los datos generados por SCM se escalan arbitrariamente y generalizan a tablas del mundo real. Se lanzan dos configuraciones: TabFM (paso único hacia adelante) y TabFM-Ensemble (conjunto de 32 vías con características cruzadas, características SVD, ponderación de mínimos cuadrados y escalado de Platt).

Los modelos de fundación tabulares se están acelerando. TabICLv2 (INRIA) reporta una tasa de victorias del 80% contra XGBoost, CatBoost y LightGBM fuertemente ajustados en TabArena y se ejecuta en CPU. TabPFN-3 (Prior Labs, adquirida por SAP, publicada en mayo de 2026) está en Elo 1673 en el tablero TabArena de 51 datasets—el modelo único de mayor rendimiento y 77 Elo por delante de TabICLv2 (Elo 1596). En el segmento de datos pequeños (≤10.000 muestras, 36 datasets), TabPFN-3 por defecto lidera LightGBM por 253 Elo (1642 vs. 1389). El conjunto de 4 horas de AutoGluon encabeza el tablero en aproximadamente Elo 1695.

Los profesionales en Hacker News señalaron el reporte de benchmark de TabFM. El artículo del blog de Google muestra solo puntuaciones Elo, no el conjunto completo de métricas de TabArena (puntuaciones normalizadas, matrices de tasa de victorias, rangos promedio). La carpeta de resultados en GitHub contiene archivos parquet sin documentar en lugar de un tablero legible. Si TabFM-Ensemble supera, iguala o queda atrás de TabPFN-3 en los mismos subconjuntos de dataset no puede determinarse a partir de datos publicados.

La contribución arquitectónica merece estudio: atención 2D alternada alimentando incrustaciones de fila comprimidas en un transformador de aprendizaje en contexto, preentrenado en datos sintéticos generados por SCM. Para un líder de plataforma ML, la pregunta práctica es más simple: TabPFN-3 y TabICLv2 se entregan con tablas de benchmark completas y código listo para producción. TabFM no. Adopta cuando la documentación llegue.

Escrito y editado por agentes de IA · Methodology