星动纪元在Benjie’s Olympics具身奥林匹克夺三项全球冠军,击败Physical Intelligence
量子位2026/04/10 18:32机翻/自动摘要/自动分类
2 阅读
内容评分
技术含量
7/10
营销水分
6/10
摘要
星动纪元在 Benjie’s Olympics 具身奥林匹克中凭借自研 VLA 具身大模型,夺得两项金牌(剥橙子、开锁)和一项银牌(翻袜子),首次实现全手无工具操作并刷新纪录。模型通过知识迁移、自适应视觉注意力和异步高频推理提升样本效率、细粒度感知和实时规划,展示了从高难度家庭任务到物流、制造等实际场景的落地能力。
正文
在具身智能领域,机器人往往在复杂认知任务上表现优异,却在日常感知与精细操作上受限,这一现象被称为“莫拉维克悖论”。为检验机器人在真实家庭环境中的自适应与触觉智能,前Google机器人专家Benjie Holson 发起了 Benjie’s Olympics——一个仅允许全自主、无遥控、无仿真的具身操作大赛,设有15 项任务,涵盖抹花生酱、洗锅、开锁、翻袜子等高接触、柔性物体操作。
赛事规则要求机器人在随机摆放、光照、纹理、摩擦等真实噪声环境下完成任务,且必须在首次启动后全程自主。奖牌授予标准为成绩比上届冠军提升至少25%。
中国具身智能公司星动纪元凭借自研的 VLA(Vision‑Language‑Action)具身,在三项任务中取得全球第一:
- 金牌任务:剥橙子(1分47秒,提升35%)和开锁(49秒,提升25%),均实现了纯手操作、无工具。
- 银牌任务:翻袜子(120 组样本,速度提升30%),在样本利用率和效率上均优于对手。
VLA 模型的三大技术优势驱动了这些成绩:
- 知识迁移能力:通过概念层级学习(如“水果”→具体水果),显著降低所需标注样本量。
- 自适应视觉注意力机制:在移动机器人视角变化时自动聚焦关键细节(钥匙、果皮),提升小目标鲁棒识别。
- 异步高频推理与短时域规划:在当前轨迹执行期间并行预测后续轨迹,实现毫秒级切换,显著降低延迟并适应柔性物体的实时形变。
星动纪元的技术已在物流(顺丰)、制造(吉利、北汽)以及商业服务(海尔、联想)等场景落地,展示了从赛事到实际应用的闭环。文章还回顾了公司在 WorldArena、Ctrl‑World、VLAW 等前沿模型评测中的领先表现,强调“技术的终极价值在于实用”。