仿真王者,实操青铜?不存在的,逐际动力新方案为具身大脑训练“开外挂”
发布时间:2025-09-05 15:06 浏览量:1
近日,马斯克在X上确认,Optimus人形机器人开始通过人类视频学习任务,放弃了动作捕捉服与远程操作方案。这让数据再次成为具身智能领域的焦点。
巧的是,就在今年初,逐际动力就已经推出基于视频数据的具身智能大脑训练方案,靠人类操作视频训练机器人。最近,他们又发布了新方案LimX DreamActor----这次是融合仿真数据和真机数据。
为什么不选择死磕一种数据呢?
答案很现实:在具身智能领域,数据始终是最大的坎。真机数据太贵,仿真数据不够真,视频数据没物理属性应用难度大——每种数据都有明显短板。
逐际动力走的是“多元数据”的路径:不管真机数据、仿真数据还是视频数据,能让机器人“更聪明”的就是好数据,用什么数据不重要,重要的是数据效率,以更低的成本获得更好的性能。
作为逐际动力"多元数据配方"策略的最新实践,DreamActor首次将Real2Sim2Real与真机强化学习深度融合,不是简单的数据拼接,而是让每种数据在训练全流程里各司其职,达到操作训练的最大效能。
这个范式如何能在"低门槛"的同时,做到部署的"高效率"?这种对数据使用的探索对具身智能规模化又意味着什么?
我们拆解了这套方案。
逐际动力具身智能训练新范式LimX DreamActor
▍四步打通虚实训练全流程
DreamActor设计了一套完整的“虚实结合”训练流程,把数据采集、仿真建模、大规模训练和真机微调紧密衔接在一起
第一步,用手机"扫描"真实世界。
过去采集环境数据要靠高精度专业级设备,成本高还麻烦。DreamActor打破了这个限制:只需用手机这类消费级设备拍摄场景与物体,就能完成多视角环境数据采集。
没有复杂的设备要求,数据获取的门槛和成本直接降了下来。
第二步,在虚拟世界注入物理规律。
系统会基于采集好的多视角图像做三维重建,更重要的是,它会给重建出的物体赋予和现实世界一致的物理参数——比如杯子的质量、桌面的摩擦系数、盒子的碰撞体积。
这一步不是只做"表面功夫",而是通过几何、物理、尺度和坐标的对齐,让仿真环境尽可能贴近现实,为后续训练打下"靠谱"的基础。
目前行业还只能做到“看起来像”,“用起来真”依然是一件高门槛的事。
第三步,在仿真里"练个够"。
在对齐现实物理属性的基础上,系统会构建大量高拟真场景,让机器人的操作轨迹在这些混合渲染的场景里反复训练。
不用耗费真机资源,就能低成本实现数据的大规模扩展,机器人也能在这个过程中学会应对不同场景,慢慢具备"泛化能力"——换个桌子、换个杯子,哪怕换个房间,机器人依然能够执行操作。
第四步,真机上"精雕细琢"。
在仿真环境中经过大量训练,已经具备“扎实的底子”之后,模型会再到真机上进行少量强化学习后训练。
这一步的妙处在于:不用让真机冒险试错——在工厂、家庭等真实场景,真机测试既危险又烧钱。通过真机数据校准仿真与现实的差距,确保模型部署到现实中时,成功率始终在线。
整个流程下来,DreamActor把"现实环境数据采集—仿真数据预训练—真机数据后训练"的链路彻底打通,既保留了仿真训练"高效率、大规模"的优势,又靠少量真机数据就补上了"落地稳定性"的短板。
整个流程下来,DreamActor把"现实环境数据采集--仿真数据预训练--真机数据后训练"的链路彻底打通,既保留了仿真训练"高效率、大规模"的优势,又靠少量真机数据就补上了"落地稳定性"的短板。
技术层面上,DreamActor引入了行业前沿的真机强化学习(RL)技术,这是低样本高效学习和Sim2Real泛化的重要突破。真机RL技术近年才开始在具身大模型中应用,逐际动力能将其成功融入训练流程,不仅展现了深厚的技术积累,更代表着他们在具身智能训练范式上走在了行业前沿。
最关键的是,这种虚实结合的方式,直接把机器人训练的门槛拉低了一个数量级——不需要专业设备,不需要海量真机数据,从开发伊始就大大降低了成本,让更多团队能够参与到具身智能的开发中来。
LimX DreamActor完整工作流程
▍为啥非要死磕多元数据?
DreamActor要花这么大功夫整合仿真和真机数据,背后是整个行业都在头疼的问题。
纵观当前行业的典型技术路线:
视频学习派:通过分析大量人类操作视频来训练机器人,充分挖掘海量视频资源,但这些数据大多没经过"物理校准",模型学完容易出现"幻觉"——比如把轻轻放杯子的动作学成了"扔"仿真优化派:专注于提升仿真环境的物理真实度,数据获取成本低,但最大挑战是仿真到现实的差距。现实世界的光照变化、材质差异、意外碰撞……任何一个小偏差都可能导致任务失败。端到端派:探索用大语言模型理解和生成机器人动作序列,或直接在真机上收集大量数据进行训练,再进行直接部署。真机数据最靠谱,但也最烧钱。 最烧钱的地方在于先要造机器人本体,但目前硬件迭代速度很快,一旦硬件/构型更新,数据很可能不能复用,泛化性难度很大;其次则是操作带来的设备、物品损耗。每种方法都有其独特价值,但也都存在局限性。这也是逐际动力“多元数据”策略要解决的解决具身智能数据问题。
DreamActor的核心突破是结合Real2Sim2Real的高保真数据与真机RL的可靠性,同时,通过技术创新实现了几个关键能力:
手机等消费级设备就能采集数据并重建高拟真场景支持大规模生成或调用3D资产,低成本扩展数据场景物理属性与现实一致,机械臂可高效完成坐标对齐,省去繁琐标定,能直接在仿真中训练策略。最终,Real2Sim加速策略初始化,真机RL保障部署可靠性,大幅缩短周期、降低风险。
LimX DreamActor优势对比
这些探索的核心目的,都是在寻找"数据应用的效率极值点":
多少仿真数据能撑起基础训练?需要补充多少真机数据校准偏差?不同场景下数据比例该怎么调?
关于这个函数当中的“自变量”与“因变量”,目前行业还没有统一答案,但每一种基于多元数据的实践,都在为具身智能找到更优的训练路径。
▍从VGM到DreamActor:逐际动力的"多元数据"进化史
LimX DreamActor不是逐际动力在实践LimX Data Recipe(多元数据配方)策略上的第一次尝试,在DreamActor之前,逐际动力已经推出过LimX VGM,那是一套聚焦视频数据的训练方案:
靠人类操作视频数据训练机器人,全过程零真机样本,还能实现多平台泛化,把人类视频数据变成了"可用的训练资源"。
(关于VGM的详细技术解析,可参考机器人大讲堂此前的深度报道:国内首次将人类操作数据直接应用于机器人操作!零真机数据实现跨平台泛化!)
逐际动力还提出了"数据-性能ROI"这个评价标准——模型优劣不是看模型用了多少数据,而是看投入的数据能换来多少操作性能提升。
从VGM主攻视频数据,到DreamActor深耕仿真+真机,两种路径对应了多元数据中最大的变量:一种是数量庞大但难以直接应用的视频数据,另一种则是易于生成但实际存在虚实差距的仿真数据。两种路径既展现了两种数据的应用潜力,也体现了从业者对数据应用理解的不断深化。
本质上,从VGM到DreamActor,探索的都是通过改变数据来源和配比,找到"数据-性能ROI"的最优解,最终目标是打造可供广泛应用的具身智能"工业母机"。
对逐际动力来说,这些探索不只是技术积累,更是其"IDS生态协同战略"的一部分。
他们想做的,是为创新者(Innovators)、开发者(Developers)和系统集成商(System Integrators)提供低成本、高效率的工具。
不管是VGM还是DreamActor,最终目的都是让更多人能参与到具身智能的开发中,推动这项技术从实验室走进科研、制造、家庭等真实场景。
现在来看,具身智能的"大脑"还在探索阶段,但这套"多元数据"思路,无疑为行业提供了一个值得参考的方向:
机器人的自主操作,从来不是"死磕某一种数据"就能实现的,而是在虚实数据的协同中,找到效率与稳定的平衡点。
当这个平衡点的公式被破解,具身智能的大规模应用,或许真的不远了。