本报讯(记者 杜兰)2026年2月,由京城机电牵头成立的北京人形机器人创新中心(以下简称“北京人形”)发布的RoboMIND系列数据集刚刚跨越全球下载量200万次的里程碑;短短数月后,这一数字已再度跃升至600万次,稳居具身智能领域第一梯队。从10万条轨迹到40余万条,从4种机器人构型到6种异构本体,从479项任务到739项复杂挑战——RoboMIND的快速增长,标志着中国在具身智能开源数据基础设施建设上步入引领全球的新阶段。
数据规模与质量实现“双跃升”
什么是“具身智能”数据集?通俗地说,就像教孩子认识世界需要大量示例一样,让机器人学会感知环境、自主操作也需要海量的“动作示范”数据。
RoboMIND就是这样一个开放共享的“机器人训练题库”,全球研究者均可免费下载使用。2026年2月28日,RoboMIND成为具身智能领域首个全球下载量突破200万次的开源项目。此后仅数月,下载量爆发式增长至600万次,实现200%的跃升。这一跨越式增速的背后,是全球开发者社区的高度认可与集体贡献。
该数据集由北京人形与北京大学计算机学院联合推出。V1.0版本包含10万条以上高质量双臂操作轨迹,覆盖4种机器人本体、5大场景下的479项任务与38种技能。核心论文被机器人领域顶级会议RSS 2025正式收录。2025年底迭代的V2.0版本将数据规模扩展至超31万条轨迹,机器人本体增至6种,任务数量提升至739项,技能扩展至129种,并新增1.2万条以上带触觉感知的操作数据,让机器人不仅能“看”和“动”,还能“感受”力度,更接近人类操作。同时开源高保真仿真资产,支持数字孪生与批量评测。
从“数据”到“大脑”
技术底座与训练基地
基于RoboMIND积累的高质量数据,北京人形构建了一整套机器人“大脑”算法模型。简单来说,这些模型让机器人能够理解人的语言指令,观察周围环境,然后自主规划动作——比如你说“把桌上的杯子拿给我”,它就能自己走过去、识别杯子、调整抓握力度、稳稳递到你手里。
其中,VLA模型XR-1是全国唯一通过EI Bench国标测试的视觉-语言-动作大模型;具身世界模型系列WoW曾在国际公开评测WorldArena中包揽两项第一;全球首个全尺寸人形机器人全身VLA模型HEX也已诞生。
2026年3月,北京人形具身智能机器人数据与训练基地一期投入使用。这个近5000平方米的“机器人训练场”覆盖家居、商超、办公、工业、医药、康养等30多个典型场景,拥有120多台不同构型的机器人,具备真机遥操作、开放环境采集、动作捕捉采集等全栈式数据采集能力。基地已为多家头部企业和科研机构提供数万小时高质量实采数据,服务客户涵盖物流、商超、办公、家居、工业制造等多个领域。
开源生态加速“数据飞轮”转动
RoboMIND的快速增长离不开全球开发者社区的持续贡献。从斯坦福到清华,从创业公司到科研机构,全球已有数万名研究者和工程师将这份来自中国的开源数据作为具身智能研究的起点。在魔搭社区联合多家权威机构发布的“具身智能年度百项代表性成果”中,RoboMIND成功入选“十大数据集项目”。
数据越丰富,机器人学得越快;机器人越聪明,应用场景就越广泛。目前,以通用机器人平台“具身天工”为代表的多类机器人,已在工业制造、电力巡检、运动科学测试等真实场景中展现出显著价值,“数据飞轮”效应加速启动。北京人形机器人创新中心表示,未来将持续坚持开源开放,与全球社区并肩优化数据集,挑战更复杂的长程任务和多机协作场景,推动具身智能迈向“全自主、更好用”的新阶段。