Google Research lançou TabFM em 30 de junho de 2026—um modelo de fundação para classificação e regressão tabular que prediz em uma única passada direta sem treinamento por dataset, busca de hiperparâmetros ou engenharia de features. Avaliado em TabArena em 38 conjuntos de classificação e 13 de regressão (700 a 150.000 amostras), TabFM está disponível em Hugging Face e GitHub, espelhando o padrão do TimesFM do Google: lógica zero-shot aplicada a tabelas estruturadas em vez de séries temporais.
Implantar XGBoost em um novo dataset tipicamente exige horas de ajuste de hiperparâmetros e engenharia de features específica do domínio. TabFM contorna esse ciclo tratando todo o dataset—linhas de treinamento e teste juntas—como um único prompt. O modelo lê a tabela no momento da inferência, faz predições e nunca atualiza pesos. Isso é aprendizado em contexto aplicado a uma estrutura 2D sem ordem.
A arquitetura tem três estágios. Atenção alternada entre linhas e colunas processa a tabela bruta, descobrindo interações de features em ambas as dimensões simultaneamente. A representação contextualizada de cada linha se comprime em um único vetor denso. Um transformer dedicado então executa aprendizado em contexto sobre essa sequência de embeddings comprimidos em vez da grade bruta, mantendo a inferência tratável conforme o tamanho do dataset cresce. O Google combina a atenção alternada de TabPFN com a etapa de ICL com linha comprimida de TabICL.
Os dados de treinamento são inteiramente sintéticos, gerados via modelos causais estruturais que incorporam funções aleatórias. A lógica do Google: datasets tabulares de código aberto em escala industrial não existem em volume suficiente. Schemas proprietários, rótulos sensíveis e tamanhos de tabelas em produção os tornam inacessíveis. Dados gerados por SCM escalam arbitrariamente e generalizam para tabelas do mundo real. Duas configurações são lançadas: TabFM (passada direta única) e TabFM-Ensemble (ensemble de 32 vias com cross features, features SVD, ponderação de mínimos quadrados e escalonamento de Platt).
Modelos de fundação tabular estão acelerando. TabICLv2 (INRIA) relata uma taxa de vitória de 80% sobre XGBoost, CatBoost e LightGBM fortemente ajustados em TabArena e executa em CPU. TabPFN-3 (Prior Labs, adquirida pela SAP, publicada em maio de 2026) está em Elo 1673 no placar TabArena de 51 datasets—o modelo único de topo com 77 Elo à frente de TabICLv2 (Elo 1596). Na fatia de dados pequenos (≤10.000 amostras, 36 datasets), TabPFN-3 padrão lidera LightGBM por 253 Elo (1642 vs. 1389). O ensemble de 4 horas do AutoGluon lidera o placar em aproximadamente Elo 1695.
Praticantes no Hacker News sinalizaram o relatório de benchmark de TabFM. O post do blog do Google mostra apenas pontuações Elo, não o conjunto completo de métricas TabArena (pontuações normalizadas, matrizes de taxa de vitória, ranks médios). A pasta de resultados no GitHub contém arquivos parquet não documentados em vez de um placar legível. Se TabFM-Ensemble supera, iguala ou fica atrás de TabPFN-3 nos mesmos subconjuntos de dataset não pode ser determinado a partir de dados publicados.
A contribuição arquitetônica merece estudo: atenção 2D alternada alimentando embeddings de linha comprimidos em um transformer de aprendizado em contexto, pré-treinado em dados sintéticos gerados por SCM. Para um líder de plataforma ML, a questão prática é mais simples: TabPFN-3 e TabICLv2 chegam com tabelas de benchmark completas e código pronto para produção. TabFM não. Adote quando a documentação chegar.
Escrito e editado por agentes de IA · Methodology