特斯拉Optimus机器人训练新策略:纯视觉方案,挑战远超自动驾驶

发布时间:2025-08-27 10:51  浏览量:1

特斯拉在推进其Optimus人形机器人的训练中,采取了与自动驾驶技术相同的纯视觉方案,这一创新举措引发了业界的广泛关注。据《商业内幕》透露,特斯拉已在内部宣布,未来Optimus的训练将更多地依赖于视频数据,而非传统的动作捕捉服和虚拟现实头显。

此前,特斯拉利用动作捕捉服和VR头显记录人类操作员的数据,并通过这些数据远程操控机器人。然而,特斯拉现在计划通过录制员工执行任务的视频来训练Optimus,这些视频将涵盖从拾取物体到折叠衣物等多种动作。据内部人士透露,特斯拉认为,这一转变将使团队能够更快速地扩大数据收集规模,从而加速机器人的学习进程。

特斯拉的这一策略调整,标志着其在机器人领域的重大转变。长期以来,特斯拉一直坚持通过摄像头等视觉传感器来训练其自动驾驶系统,而Optimus的训练方式也将与此保持一致。特斯拉负责Optimus硬件研发的总监康斯坦蒂诺斯·拉斯卡里斯曾在社交媒体上表示,他们的机器人正在通过人类视频直接学习新任务,这一说法得到了马斯克的确认。

然而,这一新策略也面临着一些挑战。人类与机器认知研究所的高级研究科学家罗伯特·格里芬指出,虽然远程操作数据可以使机器人通过与环境的实际互动来学习,但要将视频数据转化为现实世界的动作并非易事。他强调,视频数据缺乏直接交互体验,这可能对机器人的学习造成一定障碍。

尽管如此,特斯拉仍在积极推进这一策略。据知情人士透露,特斯拉在6月底之前仍在远程操作Optimus,并通过动作捕捉服进行训练。然而,由于动作捕捉服和机器人本身存在的问题,团队能够收集的数据量受到限制。因此,特斯拉决定转变训练方式,开始使用内部自制的摄像头记录员工动作。这些摄像头安装在头盔和背包上,能够向各个方向拍摄,为AI模型提供精确的环境定位数据。

佛罗里达州立大学机器人实验室主任克里斯蒂安·胡比茨基表示,多角度拍摄有助于特斯拉采集更精细的细节,并实现机器人的空间精准定位。然而,执行训练任务的工作人员需要收到具体指令,特别是在手部动作方面需要确保动作尽可能接近人类形态。有些员工可能需要花费数月时间重复执行同一个简单动作,以确保数据的准确性和可靠性。

谢菲尔德大学机器人专家乔纳森·艾特肯认为,特斯拉需要想办法教会Optimus使用可应用于多种任务的动作。他指出,在这种规模的操作中,建立通用动作库至关重要,否则逐个训练所有动作将耗费大量时间。特斯拉可能会采用与PhysicalIntelligence公司类似的策略,通过输入海量示范数据来使机器人学习可转移技能并灵活应用。

尽管特斯拉在机器人训练方面取得了显著进展,但这一新策略仍面临诸多挑战。俄勒冈州立大学AI与机器人专家艾伦·费恩表示,对于特斯拉来说,训练Optimus将比开发自动驾驶汽车更加艰巨。驾驶只是单一任务,而机器人需要理解视频中发生的情况并具备完成任务的技能。有些技能可以通过观察学习获得,但有些则需要在模拟器或现实中进行物理实践。

尽管面临诸多挑战,但特斯拉仍在积极推进Optimus的训练工作。截至最近,特斯拉的招聘页面仍列出了50多个与Optimus相关的职位,这表明该公司仍在扩大其机器人团队并加速相关技术的研发。未来,随着技术的不断进步和数据的不断积累,Optimus有望在实现更多复杂任务方面取得突破。