上海重磅定调!智元获认证及开源!人形机器人数据“新基建”加速布局

发布时间:2025-09-24 21:29  浏览量:1

这两天,人形机器人产业迎来密集重磅消息!

上海重磅发布人形机器人数据集标准,智元机器人斩获业内首张人形机器人数据集CR认证,编号"001"。今天,智元机器人宣布全面开源其通用具身基座大模型GO-1(Genie Operator-1)。这一系列动作表明,人形机器人数据体系建设正在加速推进。

长期以来,人形机器人数据集标准缺失、分类编码各自为战、数据标注耗时耗力、格式不统一、缺乏全流程管理规范等,一直是行业痛点问题,也是人形机器人具身智能产业落地时面临的困境之一

上海发布人形机器人数据集标准,为产业提供了统一的数据语言, 将推动人形机器人从技术探索加速迈向规模化落地。该标准内容涵盖人形机器人数据集分类与编码、人形机器人数据集数据标注规范、人形机器人数据质量评价、人形机器人数据集格式等要求。

同步发布的"浦江X"具身智能标准化数据集平台(穹顶DOME)打通数据全链路,已在北京、上海、杭州等地落地,覆盖家政、教育、工业等多场景,具备百万级中国数据集升级任务的核心能力。

智元机器人成功通过CR-3-06:2025《人形机器人数据集 CR 产品认证实施规则》,拿下业内首张人形机器人数据集产品 CR 认证证书,编号“001”,成为国内首批依据T/SAIAS 024—2025、T/SAIAS 025—2025、T/SAIAS 026—2025、T/SAIAS 027—2025系列团体标准获得认证的企业。此举标志我国在人形机器人数据集标准化、质量评价与产业应用领域迈出关键步伐。

今日,智元机器人宣布全面开源其通用具身基座大模型GO-1(Genie Operator-1)。这是全球首个基于Vision-Language-Latent-Action (ViLLA)架构的具身智能模型,向全球开发者免费开放。

▍数据工厂遍地开花,构建具身智能"新基建"

在人形机器人产业链中,数据采集与训练的重要性日益凸显。相比自动驾驶,人形机器人的数据采集和标注需求更加前置,复杂程度也更高,特别是上肢交互方面的数据需求呈指数级增长。然而,当前数据采集面临着高成本、数据孤岛和评估空白三大瓶颈。单个企业采集真实数据的成本高达每条五元左右,不同设备和采集方式产生的数据难以通用,评估哪些数据对提升数据集价值具有关键作用也相对困难。

正是基于对数据价值的深刻认识,全国各地正在加速布局具身智能数据工厂,它们如同一个个功能各异的"数据发电站",共同构建起覆盖多场景、多技术的全国性数据网络。

北京市在石景山首钢园建立了首个人形机器人数据训练中心,占地约3000平方米。这是一个由区企共建的"一站式具身智能公共服务平台",部署了百余台人形机器人本体,聚焦医疗健康、新零售、汽车装配等十大典型应用场景。在这里,人形机器人既能精准地进行咖啡制作和拉花,也能在模拟的农业场景中采摘成熟的西红柿,甚至在智能生活区整理床单、清洁卫浴。该中心的目标是年产出超百万条数据,为超过50个行业提供解决方案,将企业研发成本降低30%。

天津的"帕西尼具身智能超级数据工厂"以其惊人的规模脱颖而出。这家占地12000平方米的"超级工厂"被誉为目前全球规模最大的具身智能数据采集与模型训练基地,预计每年可生产近2亿条高质量、高维的具身智能训练数据。其独有的"6D霍尔阵列多维触觉传感技术",已建立起超过15+N个综合场景矩阵,涵盖汽车制造、3C组装、家居办公、餐饮、商超、医疗康养等领域。

上海的智元机器人在张江科学城建立了4000平方米的数据采集工厂,部署了上百台数采机器人。该工厂搭建了家居、餐饮、商超、办公和工业等五类场景,通过人类数据采集师头戴VR眼镜、手持操作手柄的方式,亲身示范,手把手地教机器人学习各种技能。智元的商业模式遵循着"先易后难"的清晰路径:先从工业场景积累数据,再用这些数据反哺算法迭代,最终逐步渗透到家庭场景。

江苏吴江的长三角一体化示范区智能机器人训练中心则代表了政企联合、区域协同的创新模式。该中心由吴江区大数据公司、苏州湾集团和乐聚机器人联合运营,占地约1500平方米,年产数据可超200万条。值得一提的是,该训练中心还与中国移动、华为、乐聚机器人联合打造了5G-A具身智能应用场景孵化基地,实现了具身智能产业发展与国家新一代信息基础设施建设的深度融合。

人形机器人数据采集与训练正呈现四种不同类型的发展路径:遥操作数据通过操作人员直接控制获取,能捕捉人类经验但成本高昂;仿真环境生成数据在虚拟环境中模拟,成本低但存在Sim2real差距;机器人自主探索与交互数据依靠机器人在环境中自由探索,数据真实但质量难以保证;开源数据集与预训练模型利用公开资源,成本低但缺乏标准。在实际应用中,企业通常综合运用多种类型的数据,以充分发挥各自优势。

▍产业链逐步成型,相关上市公司加速布局

随着人形机器人数据标准化时代的到来,A股市场中已有多家上市公司在数据采集、标注、训练等环节进行布局。根据公开信息,我们梳理了部分相关公司的业务情况(来源:各公司公告及媒体报道):

数据标注领域:

• 海天瑞声:AI 训练数据 “隐形冠军”,为人形机器人提供动作、视觉、语音等数据标注服务,据称是上海"穹顶DOME"平台的合作方之一,2025年上半年相关机器人数据业务收入增长60%。

• 科大讯飞:教育 + 服务机器人数据 “双龙头”,提供语音交互和场景理解相关数据服务,据报道为"穹顶DOME"平台的教育场景数据供应商,上半年相关收入增长55%。

数据平台方面:

• 商汤科技:具身智能大模型 “国家队”,在具身智能大模型领域进行研发,提供环境感知、动作规划等数据服务,据称是上海牵头的国际人工智能标准化联合会核心成员。

• 云从科技:工业机器人数据 “隐形冠军”,专注工业机器人数据服务,为汽车制造机器人提供装配、质检等数据,据报道为"穹顶DOME"平台的工业场景数据合作方,上半年相关收入增长70%。

• 中科曙光:算力 + 数据平台 “双料选手”,在算力和数据平台领域均有布局,为人形机器人训练提供算力支持,据称参与上海"穹顶DOME"平台的算力调度,技术协同性强。

感知数据采集环节:

• 联创电子:据报道为特斯拉Optimus独家供应180°鱼眼视觉模组,采用超广角镜头技术,2025年相关订单额3-5亿元。

• 奥比中光:其3D视觉方案被全球最大具身智能数据集ARIO采用,相关相机产品用于真实场景数据采集。

• 柯力传感:六维力矩传感器送样验证,可采集机器人关节力控数据,2025年量产,适配人形机器人姿态稳定需求。

数据训练与管理:

• 四维图新:高精度地图覆盖全国44万公里高速及120城开放道路,车道级导航数据可适配机器人路径规划,与阿里云合作车路云一体化。

• 虹软科技:视觉 AI 数据 “隐形冠军”,给人形机器人供人脸识别、物体识别数据,2025 年上半年机器人视觉数据收入增长 45%,消费电子复苏带动需求。

• 山大地纬:政务数据 + 机器人 “跨界玩家”,给政务机器人供办事流程、政策解读数据,政策订单稳定。