AI Agent长出手脚:Strands+LeRobot打通机器人,Natural Language直接驱动真机

AI Agent长出手脚:Strands+LeRobot打通机器人,Natural Language直接驱动真机

AI Agent 这两年最大的问题是什么?

不是不会聊天,也不是不会写代码,而是它大多数时候还困在屏幕里。你让它规划、搜索、写脚本、调 API,它很强;但你让它真的去推动一个机械臂、录制一段机器人示范、跑一轮仿真、再把策略部署到实体硬件,它立刻就会撞上一堆工程胶水。

现在这个断点开始被补上了。

AWS 生态里的 Strands Robots SDK 开源,把 Hugging Face LeRobot、MuJoCo 仿真、策略推理、Zenoh 多机器人 mesh 等能力封装成 Strands AgentTools。官方一句话非常直接:strands-robots gives a Strands Agent hands。

翻译成人话就是:AI Agent 开始长出手脚了。

这次到底发布了什么

项目名叫 strands-robots,代码在 strands-labs/robots,PyPI 包名也是 strands-robots。它的核心能力是用一个 Robot() 工厂,把仿真机器人或真实机器人变成 Strands Agent 可以调用的工具。

最小示例非常有代表性:

from strands import Agent
from strands_robots import Robot

robot = Robot(“so100”)
agent = Agent(tools=[robot])
agent(“Pick up the red cube”)

默认情况下,Robot(“so100”) 启动的是 MuJoCo 仿真,不需要 GPU,也不需要真实硬件。要切换到实体机器人,需要显式加 mode=”real”:

robot = Robot(“so100″, mode=”real”, port=”/dev/ttyACM0″)

这个默认设计很关键:先仿真,后上真机。不会因为一句自然语言指令,就误驱动真实舵机。

LeRobot 是什么:机器人世界的 Hugging Face 工具链

要理解 Strands Robots,必须先理解 LeRobot。

LeRobot 是 Hugging Face 推出的真实世界机器人学习库,目标是把机器人领域的模型、数据集和工具统一到 PyTorch 生态里,降低机器人学习门槛。

官方定位很清楚:

  • 提供真实世界机器人模型、数据集和工具
  • 让更多人共享机器人数据集和预训练模型
  • 覆盖模仿学习、强化学习、VLA 模型
  • 支持真实硬件与仿真环境

LeRobot 里最重要的东西之一,是 LeRobotDataset 格式。它把机器人视觉视频、状态、动作数据组织成标准结构,通常是 MP4 或图片加 Parquet。这样一来,数据可以上传到 Hugging Face Hub,也能被训练、评估、部署链路复用。

换句话说,LeRobot 给机器人学习提供了“数据和模型底座”。

但底座不等于完整工作流。真正落地时,你还要处理仿真、硬件端口、相机、校准、策略推理、多机器人协同、安全中断。Strands Robots 补的正是这一层。

Strands Robots 做的不是替代,而是封装

AI Agent长出手脚:Strands+LeRobot打通机器人,Natural Language直接驱动真机

很多人看到 Strands + LeRobot,第一反应可能是:是不是又来了一个新的机器人框架?

不是。

它更像是把机器人链路封装成 Agent 可以调用的工具层。LeRobot 仍然负责机器人数据、策略、硬件接口的一大部分;MuJoCo 仍然负责仿真;GR00T、ACT、Pi0、SmolVLA、Diffusion 等仍然是策略来源;Zenoh 负责 peer-to-peer mesh。

Strands Robots 的价值,是把这些原本分散的组件压到一个 Agent 工作流里:

  • 录制示范数据
  • 写入 LeRobotDataset
  • 上传或复用 Hugging Face Hub 数据
  • 在 MuJoCo 里跑仿真
  • 调用本地或远程策略
  • 部署到真实机器人
  • 让多台机器人通过 mesh 协调
  • 必要时广播 E-STOP 急停

以前这些步骤要写一堆胶水代码。现在它们可以变成 AgentTools,被同一个 Strands Agent 调度。

一句话链路:自然语言到机械动作

官方给出的链路很直观:

自然语言指令 → Strands Agent → Robot 工具 → Policy Provider → Action Chunk → MuJoCo 仿真或真实硬件 → observation 回流

这条链路的关键在于 Agent 不直接控制电机,而是通过 policy provider 生成 action chunk,再交给仿真或硬件执行。

支持的策略来源包括:

  • NVIDIA GR00T
  • LeRobot ACT
  • Pi0 / Pi0.5
  • SmolVLA
  • Diffusion Policy
  • 经典 motion planner
  • MPC
  • scripted controller
  • mock policy

这意味着 Strands Robots 没有押注单一模型,而是把不同策略都放到同一个抽象接口后面。你今天可以用 mock policy 验证流程,明天换成本地 LeRobot 模型,后天接 GR00T 推理服务。

50+ 机器人,8 大类别

Strands Robots 官方列出了 50+ 机器人,覆盖 8 个类别:

  • 机械臂:SO100、SO101、Koch、OMX、Panda、UR5e、xArm7 等
  • 人形机器人:Unitree G1、Unitree H1、Reachy2、Talos、Cassie 等
  • 移动机器人:Spot、Unitree Go2、Stretch、LeKiwi、EarthRover 等
  • 灵巧手:Shadow Hand、Allegro Hand、Leap Hand、Robotiq 2F85 等
  • 双臂系统:ALOHA、bi_openarm、Trossen WXAI
  • 飞行器:Crazyflie、Skydio X2
  • 表情/交互机器人:Reachy Mini
  • 移动操作机器人:Google Robot

其中部分机器人可以通过 LeRobot 驱动真实硬件,比如 SO100、SO101、Koch、OMX、HopeJR、ALOHA、bi_openarm、Reachy2、Unitree G1、LeKiwi、EarthRover。

更重要的是,所有机器人都可以仿真。对于开发者来说,这意味着可以先用低成本仿真跑通流程,再决定是否买硬件。

Mesh 多机器人协调 + 紧急停止

AI Agent长出手脚:Strands+LeRobot打通机器人,Natural Language直接驱动真机

多机器人和安全控制,是把 Agent 接到物理世界时绕不开的问题。

Strands Robots 内置了 Zenoh mesh 网络。每个机器人自动成为 peer,可以用 tell() 跟另一个机器人交互,用 broadcast() 广播指令,用 E-STOP 紧急停止。

Mesh 可以桥接到 AWS IoT Core,也能通过 device-connect 插件做更高级的设备感知网络。

安全设计也很明确:

  • 默认仿真,模式切换必须显式声明 mode=”real”
  • 状态、执行、停止三个工具动作分开
  • E-STOP 独立于正常控制流程
  • 真实动作前有人类审批中断

在工业场景里,这些不是可选配置。少一个都可能出事故。

术语澄清:谁做了这件事

这个集成方案由 AWS 开源(Apache 2.0),发表在 hugggingface.co 博客上。Strands 本身是 AWS 开源的 Agent SDK(Apache 2.0),支持 Python 和 TypeScript,有完整的 Agent 框架。LeRobot 是 Hugging Face 的项目。两者的交集,就是 strands-robots。

怎么上手

如果只是体验仿真,推荐从 MuJoCo extra 开始:

uv pip install “strands-robots[sim-mujoco]”

如果要接真实硬件和本地 LeRobot 策略:

uv pip install “strands-robots[sim-mujoco,lerobot]”

如果想全装:

uv pip install “strands-robots[all]”

基础安装很轻,只包含 numpy、opencv-headless、Pillow 等。不同能力通过 extra 分开安装:sim-mujoco 用于仿真,lerobot 用于真实硬件和本地策略,groot-service 用于 NVIDIA GR00T 推理,mesh 用于 Zenoh 多机器人网络,mesh-iot 用于 AWS IoT Core fleet 场景。

这套拆分方式比较务实,不会一上来把所有依赖塞满。

别误读:这不是“一键具身智能”

AI Agent长出手脚:Strands+LeRobot打通机器人,Natural Language直接驱动真机

这里必须泼一盆冷水。

Strands Robots 很酷,但它不是一键让 AI 变成机器人专家。

真实硬件仍然要面对:

  • 端口识别
  • 舵机通信
  • 相机配置
  • 机械臂校准
  • 数据 schema 对齐
  • checkpoint 可用性
  • GPU / Docker / 推理服务
  • 仿真到现实的 sim2real 差距
  • 多机器人安全边界

比如 GR00T 本地推理可能需要 NVIDIA GPU、Docker、checkpoint 和正确的数据配置。实体 SO-101 也不是 mode=”real” 一写就能自动抓红方块,你仍然需要摄像头、校准、策略和安全环境。

真正的价值:少写胶水代码

这次最值得关注的不是模型能力突然暴涨,而是工程链路被打通。

机器人开发最痛的地方,常常不是算法论文,而是各种系统之间互相不说话:

  • 数据集格式一套
  • 仿真脚本一套
  • 真实硬件控制一套
  • 策略推理一套
  • 多机器人通信一套
  • 安全停止又是一套

Strands Robots 把它们收敛成 AgentTools。

这对研究团队和创业团队都很实际。你可以先在本地笔记本跑 SO100 仿真,不买硬件、不上 GPU、不申请 Hub 权限;流程确认后,再逐步引入真实 SO101、GR00T、Hugging Face checkpoint、多机器人 mesh。

预算和风险可以分阶段释放,而不是第一天就把硬件、数据、训练、部署全压上。

为什么这对 Agent 重要

过去 Agent 的工具大多是数字世界工具:文件、浏览器、数据库、API、终端、代码解释器。

Strands Robots 把工具边界推到了物理世界:机器人、相机、舵机、仿真环境、动作策略、多机通信。

这意味着 Agent 的能力范围开始从“信息处理”扩展到“物理执行”。

当然,物理执行必须更谨慎。现实世界没有撤销键,机械臂撞到桌子、夹坏物体、打到人,都不是重新跑一次脚本能解决的。所以默认仿真、显式真机、E-STOP、审批中断,这些安全设计反而是项目成熟的信号。

和 ROS 的关系

AI Agent长出手脚:Strands+LeRobot打通机器人,Natural Language直接驱动真机

有人会问:这是不是要替代 ROS?

短期看,不是。ROS 是机器人系统工程的老底座,节点、topic、service、launch、driver 生态非常深。Strands Robots 更像是 Agent 编排层,面向的是“让大模型通过工具接口组织机器人任务”。

未来更可能出现的格局是:底层硬件和复杂机器人系统仍然有 ROS/厂商 SDK/控制器,Agent 层通过 Strands Robots 这样的工具,把任务规划、策略调用、数据记录、仿真验证、多机协调串起来。

也就是说,它不是抢底盘,而是抢上层工作流入口。

总结

Strands + LeRobot 这次打通机器人链路,真正意义不在于一句话让机械臂立刻变聪明,而在于 AI Agent 开始拥有一套通往物理世界的标准工具接口。

LeRobot 提供机器人学习的数据、模型和硬件接口;MuJoCo 提供安全仿真;GR00T、ACT、Pi0、SmolVLA、Diffusion 等提供策略;Zenoh mesh 提供多机器人通信;Strands Robots 把这些封装成 AgentTools。

这就是它的价值:不是一键革命,而是少写一大堆胶水代码。

AI Agent 过去长的是脑子和嘴,现在开始长手脚。

但真正走进现实世界之前,它还需要刹车、护栏、审批、仿真和大量工程细节。

这才是具身智能从 PPT 走向实验台最真实的一步。

暂无介绍....

延伸阅读:

AI Agent长出手脚:Strands+LeRobot打通机器人,Natural Language直接驱动真机

AI Agent 这两年最大的问题是什么?不是不会聊天,也不是不会写代码,而是它大多数时候还困在屏幕里。你让它规划、搜索...

itadol5j
2026年6月22日
Hermes Agent v0.17狂飙:AI助手长出新触角,iMessage、Raft、后台子Agent全来了

Hermes Agent v0.17.0 这次更新,官方给了一个很准确的名字:The Reach Release。v0....

itadol5j
2026年6月20日
12万字符被扒光!Claude Fable 5系统提示词泄露,AI安全底裤还剩几条?

Claude Fable 5 这瓜,越看越像一场 AI 安全行业的公开裸奔。据多家中文安全媒体和聚合平台报道,Anthr...

itadol5j
2026年6月17日
一行命令干翻5个API!阿里云百炼CLI开源,Agent水电煤之战正式开打

5月29日,阿里云干了一件让 Agent 开发者集体高潮的事——百炼核心能力正式 CLI 化,一行命令就能让 AI Ag...

itadol5j
2026年5月29日
20亿用户握手!PayPal钱包正式接入微信支付,老外来华扫码时代到了

5月27日,支付圈传出来一个让人眼前一亮的消息:腾讯财付通全球与 PayPal World 正式达成合作,PayPal ...

itadol5j
2026年5月28日