本报讯(记者 杜兰)近日,由京城机电牵头成立的北京人形机器人创新中心(以下简称“北京人形”)在全球权威评测平台WorldArena上连下两城——继WoW具身世界模型登顶Data Engine(数据引擎)赛道后,首个“具身大一统”模型Pelican-Unify 1.0在综合评测中再度夺冠。北京人形由此成为全球唯一在WorldArena两大核心赛道同时登顶的企业,加冕具身智能领域首个“双冠王”,标志着其具身大脑能力已跻身世界第一梯队。
Pelican-Unify 1.0的核心突破,在于其研发路径不再把理解、推理、想象与行动当作四个独立模块分别优化再拼接,而是让它们共享同一个语义空间、在统一训练目标下相互约束、共同演化。简单来说,该模型在“看懂场景、理解指令”的同时,就能“想象接下来会发生什么”,并据此“决定该执行什么动作”,形成了感知与行动相互校验的完整闭环。
Pelican-Unify 1.0并非偏科取胜,而是展现了极强的综合素质:其EWM综合得分稳居榜首,在视觉质量、运动质量、内容一致性、物理遵循、3D准确性等多维度评估中表现均衡;其中3D Accuracy指标接近满分,充分验证了模型对三维空间结构的精准理解与构建能力。
在VLM评测中,Pelican-Unify 1.0在8个通用与具身基准测试中取得64.7平均分,均达到业界领先水平;在更具具身属性的任务上性能相较基座模型大幅提升。在动作生成方面,该模型在RoboTwin 50项任务双臂基准测试中取得93.5%平均成功率,其中31项任务成功率达95%以上,15项达100%,覆盖插拔、堆叠、交接等多种操作类型,性能与当前最优模型持平。
Pelican-Unify 1.0的一项关键能力,是能在动作执行前生成未来视觉状态,让动作预测与未来想象相互对齐。这意味着机器人的“想象”不是脱离实际的视觉生成,而是服务于行动的未来预演——未来画面约束动作是否合理,动作轨迹也约束未来是否可达。
北京人形将该模型部署至天工人形机器人及UR5e机械臂上进行真机验证。在组合泛化实验中,模型仅用“插入RJ45接头”和“做防水处理”等原子任务的数据训练,从未见过完整组合演示,却成功按照自然语言指令完成了先插线、后防水的长程组合任务,展现了出色的零样本迁移能力。
Pelican-Unify 1.0登顶的意义不止于拿到一个榜单第一,更在于提出了一条更接近通用具身智能的建模路径:让“看见、思考、想象、行动”在同一个系统中协同进化。作为研发主体,北京人形机器人创新中心以通用机器人平台“具身天工”和通用具身智能平台“慧思开物”为双核心,构建起覆盖“本体—大脑—小脑—平台—生态”的全栈闭环体系。
语音读报
