北京人形“登顶”全球两大权威赛道

杜兰

本文字数：1169

　　本报讯（记者杜兰）近日，由京城机电牵头成立的北京人形机器人创新中心（以下简称“北京人形”）在全球权威评测平台WorldArena上连下两城——继WoW具身世界模型登顶Data Engine（数据引擎）赛道后，首个“具身大一统”模型Pelican-Unify 1.0在综合评测中再度夺冠。北京人形由此成为全球唯一在WorldArena两大核心赛道同时登顶的企业，加冕具身智能领域首个“双冠王”，标志着其具身大脑能力已跻身世界第一梯队。

　　Pelican-Unify 1.0的核心突破，在于其研发路径不再把理解、推理、想象与行动当作四个独立模块分别优化再拼接，而是让它们共享同一个语义空间、在统一训练目标下相互约束、共同演化。简单来说，该模型在“看懂场景、理解指令”的同时，就能“想象接下来会发生什么”，并据此“决定该执行什么动作”，形成了感知与行动相互校验的完整闭环。

　　Pelican-Unify 1.0并非偏科取胜，而是展现了极强的综合素质：其EWM综合得分稳居榜首，在视觉质量、运动质量、内容一致性、物理遵循、3D准确性等多维度评估中表现均衡；其中3D Accuracy指标接近满分，充分验证了模型对三维空间结构的精准理解与构建能力。

　　在VLM评测中，Pelican-Unify 1.0在8个通用与具身基准测试中取得64.7平均分，均达到业界领先水平；在更具具身属性的任务上性能相较基座模型大幅提升。在动作生成方面，该模型在RoboTwin 50项任务双臂基准测试中取得93.5%平均成功率，其中31项任务成功率达95%以上，15项达100%，覆盖插拔、堆叠、交接等多种操作类型，性能与当前最优模型持平。

　　Pelican-Unify 1.0的一项关键能力，是能在动作执行前生成未来视觉状态，让动作预测与未来想象相互对齐。这意味着机器人的“想象”不是脱离实际的视觉生成，而是服务于行动的未来预演——未来画面约束动作是否合理，动作轨迹也约束未来是否可达。

　　北京人形将该模型部署至天工人形机器人及UR5e机械臂上进行真机验证。在组合泛化实验中，模型仅用“插入RJ45接头”和“做防水处理”等原子任务的数据训练，从未见过完整组合演示，却成功按照自然语言指令完成了先插线、后防水的长程组合任务，展现了出色的零样本迁移能力。

　　Pelican-Unify 1.0登顶的意义不止于拿到一个榜单第一，更在于提出了一条更接近通用具身智能的建模路径：让“看见、思考、想象、行动”在同一个系统中协同进化。作为研发主体，北京人形机器人创新中心以通用机器人平台“具身天工”和通用具身智能平台“慧思开物”为双核心，构建起覆盖“本体—大脑—小脑—平台—生态”的全栈闭环体系。

版权声明

首都建设网所刊载《首都建设报》(电子版)的一切内容(包括但不限于文字、图片、PDF、图表、标志、标识、商标、版面设计等任何信息)仅供读者阅读、学习、研究使用，未经首都建设报社书面授权，任何单位及个人不得将《首都建设报》(电子版)所登载、发布的内容用于商业性目的，包括但不限于转载、复制、发行、制作光盘、数据库、触摸展示等，或将之在非本站所属的服务器上作镜像。否则，首都建设报社将采取包括但不限于网上公示、向有关部门举报、诉讼等一切合法手段，追究侵权者的法律责任。