宇树王兴兴:人形机器人迎“ChatGPT时刻”,具身智能模型成关键挑战

发布时间:2025-08-10 03:59  浏览量:2

在近期举办的2025世界机器人大会上,宇树科技的创始人兼CEO王兴兴发表了对全球机器人行业发展趋势的独到见解,引发了广泛关注。他指出,人形机器人领域正处在一个关键节点,相当于ChatGPT爆发前的黎明时刻,预计在未来一到两年内迎来重大突破。

王兴兴强调,得益于政策的扶持和需求的激增,2025年上半年,人形机器人整机及其零部件供应商普遍实现了50%至100%的高速增长,这一增幅极为显著,推动了整个行业的蓬勃发展。然而,他也指出了行业内存在的几个认知误区。

王兴兴认为,阻碍人形机器人大规模应用的主要因素并非硬件,而是具身智能的发展滞后。尽管硬件在量产和工程化方面仍有提升空间,但具身智能的瓶颈更为突出,当前的技术尚无法使机器人自主完成任务。他指出,问题的核心不在于数据,而在于模型架构。

展望未来几年,王兴兴预测智能机器人技术的核心将聚焦于端到端的具身智能AI模型。他认为,当前行业内广泛采用的VLA(视觉-语言-动作)模型存在局限性,对其持保留态度。相比之下,他更倾向于由视频生成模型(或世界模型)驱动的机器人控制,认为这一路径有望更快实现技术收敛。

王兴兴还提到,为了推动机器人技术的进一步发展,必须在强化学习的扩展定律(Scaling Law)上取得突破,以提高训练速度和技能学习效果。随着机器人的普及,分布式算力将成为必然趋势,这不仅能突破机器人本体算力的限制,还能满足实际应用中对安全性和通信延迟的要求。

在演讲中,王兴兴还分享了宇树科技的发展历程,从2013年研发机器狗X dog原型机起步,到2023年应客户需求推出首款人形机器人,这一路走来,他深刻体会到机器人与AI的发展是全球共创的成果,并鼓励更多企业和高校积极参与其中。

王兴兴进一步阐述了他对机器人AI技术临界点的看法。他认为,当人形机器人能够在陌生环境中自主完成任务,如将一瓶水递给观众或整理房间时,便标志着人形机器人迎来了其ChatGPT时刻。他预计,这一时刻可能在未来一到三年内到来,最晚也不会超过五年。

关于具身智能的瓶颈,王兴兴指出,当前的主要问题在于模型架构而非数据。尽管大语言模型领域的数据驱动方法取得了显著成效,但在具身智能领域,数据的质量和利用效率却成为挑战。他提到,VLA模型在与真实世界交互时,数据采集和质量成为难题,因此模型架构的升级和优化势在必行。

王兴兴还分享了宇树科技在视频生成模型驱动机器人控制方面的探索。他们尝试利用预训练的视频生成模型生成机器人动作视频,再控制实际机器人执行相应任务,这一技术已初步实现。他认为,这一路线可能比VLA模型更具发展潜力,尽管仍面临GPU消耗大等挑战。

王兴兴还强调了强化学习扩展定律在机器人能力提升方面的重要性。他提到,当前机器人在学习新技能时仍需从头开始训练,效率低下。他期望未来机器人能够在过去训练的基础上快速学习新技能,正如语言模型已经验证的那样。

在硬件方面,王兴兴认为低成本、高寿命的硬件是未来机器人发展的基础。同时,分布式算力将成为机器人行业不可或缺的一部分,以满足大规模应用中对安全性和通信延迟的要求。

最后,王兴兴再次强调了全球共创在AI和机器人领域的重要性。他认为,创新永远伴随着随机性,需要更多公司和高校的共同努力。他鼓励业界保持开放合作的态度,共同推动机器人技术的持续发展。