OlmoEarth v1.1 da Allen AI reduz computação em inferência de satélite em 3x

Allen AI lançou OlmoEarth v1.1, uma família aberta de modelos transformers para sensoriamento remoto que reduz computação em até 3× em relação à v1 — sem sacrificar performance em benchmarks. O ganho de eficiência vem de colapsar as bandas espectrais multi-resolução do Sentinel-2 em um único token por patch, em vez de seis. A mudança exigiu repensar o pré-treinamento para evitar uma regressão de 10 pontos percentuais em acurácia. Parceiros já implementaram v1 para rastrear mudança em mangues, classificar drivers de perda florestal e gerar mapas de tipos de cultivos em escala de país; os ganhos de eficiência da v1.1 viabilizam atualizações de alta frequência em escala planetária para organizações menores.

Allen AI lançou OlmoEarth v1.1 em 19 de maio, reduzindo computação de inferência em 3x em relação ao predecessor de novembro de 2025. O ganho de eficiência vem de colapsar as bandas espectrais multi-resolução do Sentinel-2 em um único token por patch espacial. A simplificação exigiu uma revisão completa do pré-treinamento para evitar uma regressão de 10 pontos percentuais em acurácia.

OlmoEarth v1 criou um token por timestep por resolução. Uma entrada com dois timesteps produzia seis tokens por patch: dois timesteps em três bandas de resolução (10m, 20m, 60m). OlmoEarth v1.1 mescla todas as três resoluções em um token por timestep. Isso reduz a contagem de tokens em 3x por patch. Como computação em transformers escala quadraticamente com comprimento de sequência, a redução de MACs se compõe em cada forward pass.

Fusão ingênua de tokens destruiu acurácia. A ablação interna da Ai2 encontrou uma queda de 10 pontos percentuais em m-eurosat kNN — um benchmark padrão de sensoriamento remoto — ao mesclar patches de resolução sem retreinamento. O fix da equipe foi um regime de pré-treinamento modificado detalhado no relatório técnico; o post no HuggingFace não especifica o mecanismo. A hipótese de trabalho é que separação espacial de bandas oferece ao modelo um caminho mais fácil para modelar relacionamentos entre bandas, então mudanças de pré-treinamento tiveram de compensar estruturalmente.

Em escala de produção, computação domina o pipeline completo: exportação de dados, pré-processamento, inferência e pós-processamento combinados. Ai2 diz que a redução de 3x em computação torna 'atualizações frequentes de mapas em escala planetária mais acessíveis para todo time rodando OlmoEarth.' Nenhum custo por tile ou contagem de GPU-hora foi divulgado no lançamento.

Ai2 reporta que v1.1 corresponde à v1 em um mix de benchmarks de pesquisa e tarefas construídas por parceiros. A regressão de m-eurosat kNN foi fechada. O post marca regressões residuais. O modelo vem em três tamanhos: Base, Tiny e Nano.

Deployments em v1 atingiram escala nacional, continental e global. Casos de uso de parceiros incluem rastreamento de mudança em mangues, classificação de drivers de perda florestal e mapeamento de tipos de cultivos em escala de país produzido em dias. Os ganhos de eficiência da v1.1 reduzem proporcionalmente a computação necessária para essas cargas de trabalho.

A questão aberta é se a técnica de colapso de token transfere para outros sensores multi-espectrais. A hierarquia de resolução do Sentinel-2 (10m, 20m, 60m) possibilitou o colapso de 3x. Dados SAR, sensores hiperespectrais e sensores com mais tiers de resolução exigiriam suas próprias ablações. O fix de pré-treinamento que Ai2 desenvolveu pode não generalizar sem retreinamento from scratch em cada modalidade.

v1.1 é um substituto praticamente direto da v1 que reduz computação em 3x em pipelines de inferência geoespacial de Sentinel-2.

Sources

OlmoEarth v1.1 cuts compute costs by up to 3x versus v1 while maintaining v1 benchmark performance
"a new family of models that cuts compute costs by up to 3x while maintaining OlmoEarth v1's performance on a mix of research benchmarks and tasks we've constructed with partners"
huggingface.co ↗
Naive token-merging caused a 10 percentage-point drop on m-eurosat kNN benchmark
"Naively combining the tokens in this way leads to significant performance drops, including a 10 ppt drop on m-eurosat kNN (a common benchmark task for remote sensing models)"
huggingface.co ↗
A Sentinel-2 input with 2 timesteps yields 6 tokens per patch (2 timesteps × 3 resolutions) under v1's scheme
"For each patch, we create a token per timestep per resolution. So a Sentinel-2 input with 2 timesteps yields 6 tokens per patch (2 timesteps x 3 resolutions, 10m, 20m, and 60m)."
huggingface.co ↗
Collapsing resolutions into a single token produces three times fewer tokens
"collapsing resolutions into a single token produces three times fewer tokens and material savings across pretraining, fine-tuning, and inference"
huggingface.co ↗
Compute is by far the highest cost across the full OlmoEarth pipeline
"Over the full lifecycle of running OlmoEarth – data export, preprocessing, inference, and post-processing – compute is by far the highest cost."
huggingface.co ↗
Ai2 says 3x compute reduction makes frequent, planet-scale map refreshes more affordable for every team running OlmoEarth
"making frequent, planet-scale map refreshes more affordable for every team running OlmoEarth"
huggingface.co ↗
Partner deployments using OlmoEarth v1 include mangrove-change tracking, forest-loss classification, and country-scale crop-type mapping
"partners have applied it across a wide range of tasks, from tracking mangrove change to classifying drivers of forest loss to producing country-scale crop-type maps in days, scaling deployments to national, continental, and global areas"
huggingface.co ↗
OlmoEarth v1.1 ships in Base, Tiny, and Nano model sizes
"Check out the OlmoEarth v1.1 weights and training code, including the weights for our Base, Tiny, and Nano models."
huggingface.co ↗
Some performance regressions compared to v1 persist; team recommends checking the technical report
"It provides similar performance to OlmoEarth v1 while requiring one third of the compute, though we have seen some regressions (see our technical report for more details)."
huggingface.co ↗
OlmoEarth v1 was released in November 2025
"We released OlmoEarth (v1) in November 2025."
huggingface.co ↗

Escrito e editado por agentes de IA · Methodology

OlmoEarth v1.1 da Allen AI reduz computação em inferência de satélite em 3x

Receba o sinal antes do ruído.

Receba o sinal antes do ruído.