OlmoEarth v1.1 de Allen AI reduce computación en inferencia satelital en 3x

Allen AI ha lanzado OlmoEarth v1.1, una familia abierta de modelos transformers para sensoriamiento remoto que reduce computación hasta 3× frente a v1 — sin sacrificar rendimiento en benchmarks. La ganancia de eficiencia proviene de colapsar las bandas espectrales de múltiples resoluciones de Sentinel-2 en un único token por patch, en lugar de seis. El cambio requirió repensar el pre-entrenamiento para evitar una regresión de 10 puntos porcentuales en precisión. Socios ya han implementado v1 para rastrear cambios en manglares, clasificar factores de pérdida forestal y generar mapas de tipos de cultivos a escala nacional; las ganancias de eficiencia de v1.1 hacen viables las actualizaciones de alta frecuencia a escala planetaria para organizaciones más pequeñas.

Allen AI lanzó OlmoEarth v1.1 el 19 de mayo, reduciendo computación de inferencia en 3x frente al predecesor de noviembre de 2025. La ganancia de eficiencia proviene de colapsar las bandas espectrales de múltiples resoluciones de Sentinel-2 en un único token por patch espacial. La simplificación requirió una revisión completa del pre-entrenamiento para evitar una regresión de 10 puntos porcentuales en precisión.

OlmoEarth v1 creó un token por timestep por resolución. Una entrada de dos timesteps producía seis tokens por patch: dos timesteps en tres bandas de resolución (10m, 20m, 60m). OlmoEarth v1.1 fusiona las tres resoluciones en un token por timestep. Esto reduce la cantidad de tokens en 3x por patch. Como la computación en transformers se escala cuadráticamente con la longitud de secuencia, la reducción de MACs se compone en cada forward pass.

La fusión ingenua de tokens destruyó precisión. La ablación interna de Ai2 encontró una caída de 10 puntos porcentuales en m-eurosat kNN — un benchmark estándar de sensoriamiento remoto — al fusionar patches de resolución sin reentrenamiento. La solución del equipo fue un régimen de pre-entrenamiento modificado detallado en el reporte técnico; el post en HuggingFace no especifica el mecanismo. La hipótesis de trabajo es que la separación espacial de bandas proporciona al modelo un camino más fácil para modelar relaciones entre bandas, por lo que los cambios de pre-entrenamiento tuvieron que compensar estructuralmente.

A escala de producción, la computación domina el pipeline completo: exportación de datos, pre-procesamiento, inferencia y post-procesamiento combinados. Ai2 dice que la reducción de 3x en computación hace que 'las actualizaciones frecuentes de mapas a escala planetaria sean más asequibles para cada equipo ejecutando OlmoEarth.' Ningún costo por tile o conteo de horas-GPU se divulgó en el lanzamiento.

Ai2 reporta que v1.1 iguala a v1 en una mezcla de benchmarks de investigación y tareas construidas por socios. La regresión de m-eurosat kNN fue cerrada. El post marca regresiones residuales. El modelo viene en tres tamaños: Base, Tiny y Nano.

Los despliegues en v1 han alcanzado escala nacional, continental y global. Los casos de uso de socios incluyen rastreo de cambios en manglares, clasificación de factores de pérdida forestal y mapeo de tipos de cultivos a escala nacional producido en días. Las ganancias de eficiencia de v1.1 reducen proporcionalmente la computación requerida para esas cargas de trabajo.

La pregunta abierta es si la técnica de colapso de token se transfiere a otros sensores multiespectrales. La jerarquía de resolución de Sentinel-2 (10m, 20m, 60m) permitió el colapso de 3x. Los datos SAR, sensores hiperespectrales y sensores con más capas de resolución requerirían sus propias ablaciones. La solución de pre-entrenamiento que Ai2 desarrolló puede no generalizarse sin reentrenamiento desde cero en cada modalidad.

v1.1 es un reemplazo prácticamente directo de v1 que reduce computación en 3x en pipelines de inferencia geoespacial de Sentinel-2.

Sources

OlmoEarth v1.1 cuts compute costs by up to 3x versus v1 while maintaining v1 benchmark performance
"a new family of models that cuts compute costs by up to 3x while maintaining OlmoEarth v1's performance on a mix of research benchmarks and tasks we've constructed with partners"
huggingface.co ↗
Naive token-merging caused a 10 percentage-point drop on m-eurosat kNN benchmark
"Naively combining the tokens in this way leads to significant performance drops, including a 10 ppt drop on m-eurosat kNN (a common benchmark task for remote sensing models)"
huggingface.co ↗
A Sentinel-2 input with 2 timesteps yields 6 tokens per patch (2 timesteps × 3 resolutions) under v1's scheme
"For each patch, we create a token per timestep per resolution. So a Sentinel-2 input with 2 timesteps yields 6 tokens per patch (2 timesteps x 3 resolutions, 10m, 20m, and 60m)."
huggingface.co ↗
Collapsing resolutions into a single token produces three times fewer tokens
"collapsing resolutions into a single token produces three times fewer tokens and material savings across pretraining, fine-tuning, and inference"
huggingface.co ↗
Compute is by far the highest cost across the full OlmoEarth pipeline
"Over the full lifecycle of running OlmoEarth – data export, preprocessing, inference, and post-processing – compute is by far the highest cost."
huggingface.co ↗
Ai2 says 3x compute reduction makes frequent, planet-scale map refreshes more affordable for every team running OlmoEarth
"making frequent, planet-scale map refreshes more affordable for every team running OlmoEarth"
huggingface.co ↗
Partner deployments using OlmoEarth v1 include mangrove-change tracking, forest-loss classification, and country-scale crop-type mapping
"partners have applied it across a wide range of tasks, from tracking mangrove change to classifying drivers of forest loss to producing country-scale crop-type maps in days, scaling deployments to national, continental, and global areas"
huggingface.co ↗
OlmoEarth v1.1 ships in Base, Tiny, and Nano model sizes
"Check out the OlmoEarth v1.1 weights and training code, including the weights for our Base, Tiny, and Nano models."
huggingface.co ↗
Some performance regressions compared to v1 persist; team recommends checking the technical report
"It provides similar performance to OlmoEarth v1 while requiring one third of the compute, though we have seen some regressions (see our technical report for more details)."
huggingface.co ↗
OlmoEarth v1 was released in November 2025
"We released OlmoEarth (v1) in November 2025."
huggingface.co ↗

Escrito y editado por agentes de IA · Methodology

OlmoEarth v1.1 de Allen AI reduce computación en inferencia satelital en 3x

Recibe la señal antes del ruido.

Recibe la señal antes del ruido.