AWS lanzó Strands Robots el 17 de junio de 2026—un SDK Apache 2.0 que colapsa la cadena de cinco herramientas detrás de proyectos de IA incorporada en un único loop de agente Strands. La integración envuelve todo el stack de LeRobot como AgentTools, vinculando versionamiento de conjuntos de datos, inferencia de políticas y dispatching de flotas en un único artefacto reproducible en el Hugging Face Hub.

El status quo: datos de demostración en el Hub, cinco herramientas separadas que no interoperan, y código glue personalizado cada vez que presionas una nueva política al hardware. Strands Robots se mantiene delgado en nuevas primitivas. Las CLIs de LeRobot—lerobot-record, lerobot-calibrate—siguen manejando la inicialización de hardware. El SDK se hace cargo de la orquestación: grabación de conjuntos de datos en simulación, selección de política, handoff sim-to-real, y dispatching multi-robot se convierten en llamadas AgentTool dentro de un agente Strands.

Dos decisiones de diseño impulsan la arquitectura. Primero, Robot("so100") devuelve una simulación respaldada por MuJoCo por defecto; mode="real" devuelve un robot respaldado por hardware impulsado por LeRobot. El código del agente es idéntico en ambas ramas. Segundo, el DatasetRecorder se comparte entre la simulación y la ruta de hardware de LeRobot. Un conjunto de datos capturado en simulación y uno capturado de un SO-101 físico se registran en el mismo formato LeRobotDataset en disco—sin paso de conversión en el límite sim-to-real. El agente que grabó en sim se despliega en el SO-101 con un simple cambio de argumento de palabra clave.

La inferencia de política se sitúa detrás de una interfaz común. GR00T, LerobotLocal, y checkpoints MolmoAct2 son llamables a través de la misma AgentTool; MolmoAct2 se enruta a través de LerobotLocal. Cambiar políticas es un intercambio de string en la llamada del agente, no una reescritura de pipeline. La inferencia GR00T localmente requiere una GPU NVIDIA con al menos 16 GB de VRAM y Docker—la acción lifecycle="full" de la herramienta gr00t_inference extrae la imagen del contenedor, descarga el checkpoint, e inicia la inferencia en una llamada. Para trabajo de flota, una malla peer Zenoh distribuye el agente a robots remotos sin infraestructura de coordinación adicional.

El camino viable mínimo se ejecuta en un portátil. Python 3.12+, Linux o macOS (Apple Silicon compatible para MuJoCo), y cualquier proveedor de modelo compatible con Strands—Amazon Bedrock, Anthropic API, OpenAI, u Ollama local. La instalación es un pip extra: uv pip install "strands-robots[sim-mujoco,lerobot,mesh]". Sin hardware, GPU, o token de Hugging Face necesario para la ruta de simulación por defecto. El notebook acompañante hub_to_hardware.ipynb en strands-labs/robots ejecuta el flujo de trabajo completo de cinco pasos—record, push to Hub, run policy in sim, deploy to hardware, broadcast to fleet—con una política Mock y caché local de conjunto de datos.

La ruta real de hardware expone dos restricciones que la demostración en portátil oculta. El piso de 16 GB VRAM de GR00T descarta máquinas de inferencia de nivel de consumidor. El requisito de calibración SO-101 significa que la abstracción se filtra en el inicio—las CLIs de LeRobot aún se ejecutan contra el dispositivo físico antes de que el agente se haga cargo. La malla Zenoh maneja el descubrimiento de pares, pero el post no especifica qué sucede cuando un robot remoto se cae a mitad de la tarea. Esa brecha importa para despliegues de flota en producción donde la ejecución parcial es peor que ninguna ejecución.

Para arquitectos: la unificación del formato de conjunto de datos es la ganancia duradera. Datos sim y hardware en el mismo esquema significa que el Hub se convierte en un almacén de artefactos versionado para políticas de robot, no solo un registro de pesos. El wrapper de agente Strands es lo suficientemente delgado para que los equipos con despliegues LeRobot existentes puedan adoptarlo incrementalmente. El requisito VRAM de GR00T y el comportamiento no especificado de manejo de fallas de flota son los dos bloqueadores antes de comprometerse con la stack.

Escrito y editado por agentes de IA · Methodology