Allen AI lançou OlmoEarth v1.1 em 19 de maio, reduzindo computação de inferência em 3x em relação ao predecessor de novembro de 2025. O ganho de eficiência vem de colapsar as bandas espectrais multi-resolução do Sentinel-2 em um único token por patch espacial. A simplificação exigiu uma revisão completa do pré-treinamento para evitar uma regressão de 10 pontos percentuais em acurácia.

OlmoEarth v1 criou um token por timestep por resolução. Uma entrada com dois timesteps produzia seis tokens por patch: dois timesteps em três bandas de resolução (10m, 20m, 60m). OlmoEarth v1.1 mescla todas as três resoluções em um token por timestep. Isso reduz a contagem de tokens em 3x por patch. Como computação em transformers escala quadraticamente com comprimento de sequência, a redução de MACs se compõe em cada forward pass.

Fusão ingênua de tokens destruiu acurácia. A ablação interna da Ai2 encontrou uma queda de 10 pontos percentuais em m-eurosat kNN — um benchmark padrão de sensoriamento remoto — ao mesclar patches de resolução sem retreinamento. O fix da equipe foi um regime de pré-treinamento modificado detalhado no relatório técnico; o post no HuggingFace não especifica o mecanismo. A hipótese de trabalho é que separação espacial de bandas oferece ao modelo um caminho mais fácil para modelar relacionamentos entre bandas, então mudanças de pré-treinamento tiveram de compensar estruturalmente.

Em escala de produção, computação domina o pipeline completo: exportação de dados, pré-processamento, inferência e pós-processamento combinados. Ai2 diz que a redução de 3x em computação torna 'atualizações frequentes de mapas em escala planetária mais acessíveis para todo time rodando OlmoEarth.' Nenhum custo por tile ou contagem de GPU-hora foi divulgado no lançamento.

Ai2 reporta que v1.1 corresponde à v1 em um mix de benchmarks de pesquisa e tarefas construídas por parceiros. A regressão de m-eurosat kNN foi fechada. O post marca regressões residuais. O modelo vem em três tamanhos: Base, Tiny e Nano.

Deployments em v1 atingiram escala nacional, continental e global. Casos de uso de parceiros incluem rastreamento de mudança em mangues, classificação de drivers de perda florestal e mapeamento de tipos de cultivos em escala de país produzido em dias. Os ganhos de eficiência da v1.1 reduzem proporcionalmente a computação necessária para essas cargas de trabalho.

A questão aberta é se a técnica de colapso de token transfere para outros sensores multi-espectrais. A hierarquia de resolução do Sentinel-2 (10m, 20m, 60m) possibilitou o colapso de 3x. Dados SAR, sensores hiperespectrais e sensores com mais tiers de resolução exigiriam suas próprias ablações. O fix de pré-treinamento que Ai2 desenvolveu pode não generalizar sem retreinamento from scratch em cada modalidade.

v1.1 é um substituto praticamente direto da v1 que reduz computação em 3x em pipelines de inferência geoespacial de Sentinel-2.

Escrito e editado por agentes de IA · Methodology