对话动易科技任晓雨:通用人形机器人,明年出现

发布时间:2025-11-14 10:54  浏览量:1

作者 | 金旺

栏目 | 机器人新纪元

2022年,人形机器人进入到了一个产业爆发期。

在此之前,人形机器人是一个相当小众的市场,之所以小众,原因有很多,既有动力学控制、模型控制带来的整机运动表现不够理想,硬件供应链不够成熟的原因,也有市场关注度不够高的原因。

不过,自2016年就已经投身于人形机器人行业中的任晓雨认为,“这些都不是问题关键所在,真正的关键问题是,当时大家没有看到人形机器人明确的未来发展潜力。”

换句话说,那些现在未能解决的问题,大家希望看到它在未来有得到解决的可能。

然而,以往基于传统运动控制理论构建起的人形机器人,即便解决了所有已知问题,依然难以实现规模化应用。

技术潜力,成了彼时潜藏在人形机器人产业中最大的前行阻碍,这样的情形一直持续到强化学习的出现。

2022年,当时在做人形机器人算法研发的任晓雨第一次完成了强化学习在人形机器人上的验证后,他兴奋地意识到:

属于人形机器人的那道曙光终于透过迷雾投射了下来,一个AI可以直接操控人形机器人的时代即将来临。

这也成了任晓雨后来创办动易科技的起点。

01 硬件机会,还有一次

人工智能技术的爆发,让人形机器人从业者们看到了曙光。

毕业于清华大学机械工程与自动化专业的任晓雨,自毕业后就投身于人形机器人这一“小众”赛道,他以走路这件事为我们分析了强化学习应用前后,人形机器人技术路径的改变:

以往要让人形机器人走路,要从运动控制模型建立开始,先要建立复杂的优化控制器,然后对优化控制器进行诸多条件假设和线性化,最终再进行现实推理。

由此构建起的人形机器人能够很好地进行步态控制,也有着很好的鲁棒性,但存在一个显著问题是:一旦机器人运动超出阈值,整个系统就会崩溃。

强化学习的引入,让人形机器人没有了明确的阈值概念,假如你对着现在的人形机器人踹一脚,即便它摔倒了,系统也不会崩溃,而是基于当前状态有一定的性能衰减。

这让人形机器人第一次拥有了泛化性,拥有了解决任何问题的可能。

于是,在2022年这个拐点出现之后,人形机器人很快进入到了一个产业爆发期,仅仅是在2023年,人形机器人领域融资就有23起,总金额超过54亿元,与此同时,国内各地人形机器人创新中心也相继成立。

相较而言,成立于2024年9月的动易科技,入场时间并不算早,但任晓雨认为,“这是一个比较好的时机。”

至于为什么说这是一个“比较好的时机”,任晓雨从市场发展和技术节点两方面给出了解释:

“从市场发展来看,2022年之前,无论是大众,还是投资人,对于人形机器人还没有明确的概念,即便是到了2023年,让大家理解人形机器人,依然不是一件容易的事,但到了2024年,大家对于人形机器人开始有了基本的认知,这个时候去创业会更容易;

不过,更重要的原因是,到2024年,大家对人形机器人领域的技术方案都已经做过了测试,但我们发现,人形机器人在硬件上还有一次‘大更新’的机会。”

就人形机器人核心零部件——减速器而言,谐波方案、行星方案、滚珠丝杠方案等在2024年已经成为主流方案,不过,这些方案又各有自己未能解决的问题,这才有了摆线方案的兴起。

任晓雨以行星方案与摆线方案进行对比称,“如果让关节达到20的减速比来实现大扭矩,摆线方案只需要一级减速、主要零件只有三个,行星方案则需要两级行星,经过力学校核后,这样的减速器无论是在体积、还是重量上,都不会很小,这就导致了行星方案的减速器扭矩密度很难提升。”

正是因为看到了摆线方案拥有更高的扭矩密度、更好的啮合度,动易科技成立之初,就基于摆线方案开始打造一体化关节模组。

到2025年4月,动易科技PhyArc系列准直驱一体化摆线关节模组正式发布时,其中主打高性能的PhyArc 150模组峰值扭矩已经达到590N·m,超越了一级方程式赛车发动机扭矩。

实际上,由于设计理念不同,相较于传统追求长时效稳定输出能力的人形机器人,动易科技更追求关节模组在额定状况下稳定输出,在峰值追求高爆发,由此也就要求驱动器拥有更强的短时高过载能力。

动易科技在过去一年,就减速器、驱动器、编码器、力矩电机等人形机器人关键零部件进行了全自研,并基于此在今年年初立项构建了一整套全新的人形机器人本体。

动易科技在2025年年初先后立项了两款人形机器人本体的研发,分别是聚焦生产力应用场景的大人形PHYBOT M1和聚焦服务场景的小人形PHYBOT C1。

不过,对于完成了一体化摆线关节模组研发、构建起了人形机器人本体的动易科技来说,能否基于这一套全新硬件再次跑通强化学习算法,就成了决定动易科技技术逻辑能否闭环的关键。

02 造一台AI原生人形机器人

2025年4月的一天,当动易科技研发团队将自研的强化学习算法加载到人形机器人M1上时,在M1走起来的那一刻,任晓雨就知道,“摆线关节+强化学习”这条路算是走通了。

也是在这一刻,任晓雨更笃定了这条技术路线。

回忆起当时的情景,任晓雨告诉我们,“这次对于强化学习算法的验证和2022年的那一次还不太一样,由于采用了一套区别于市面上主流应用方案的全新硬件方案,减速器、执行器、力矩电机都是由团队自研,当时最大的挑战是,面对全新的传动方式,自研的执行器性能能否跟得上。”

后来再回看时,任晓雨依然认为,这是动易科技一个关键的时间节点,强化学习在这套全新硬件上的成功跑通,也让团队后续工作变得有意义。

当然,这样的成功也并非偶然,说起来,这与动易科技团队技术研发理念有着很大的关系。

在创业之初,任晓雨看到了人形机器人领域的两个潜在机会,一个来自强化学习带来的机器人泛化性的可能,另一个来自于摆线方案潜力未被完全挖掘、却有成为主流方案的机会。

与此同时,任晓雨还发现,“在动易科技成立之前,我们还没有看到哪款人形机器人完全适配AI。”

如何打造一款原生适配AI的人形机器人,也成了任晓雨的目标。

所以,在人形机器人研发流程中,动易科技团队并不是从硬件开始,而是先通过强化学习进行仿真和验证,然后由AI告诉团队,AI需要怎样的关节模组、需要怎样的驱动器。

这样的人形机器人研发路径,任晓雨称之为Robot for AI,这也成了动易科技研发AI原生人形机器人的模式。

动易科技在人形机器人研发上第二个不同点,体现在他们对模型的理解上。

任晓雨告诉我们,“现在很多机器人团队是将上肢和下肢的研发分开的,然而,是否要先研发人形机器人下肢步态,然后再研发上肢手眼协调能力,还需要打一个问号。”

以在会议室拉出椅子、坐在椅子上这个长程任务来看,其中既涉及步态控制,也涉及手眼协调。

基于这样的理解,动易科技将运动控制过程中下肢动作和上肢动作的运动控制统一到了一个模型中,包括行走、站立、坐下等各类动作的运动控制,这些动作在动易科技的人形机器人上,都是由一个通用运动控制模型来实现。

实际上,任晓雨将AI原生人形机器人的构建流程划分为四个阶段:

第一阶段,构建整个人形机器人硬件基本面,从核心零部件开始,打造通用人形机器人本体;

第二阶段,构建通用运动控制模型(小脑),基于通用人形机器人本体,研发通用运动控制模型;

第三阶段,构建特定场景的智能决策模型(大脑),将通用运动控制模型与特定场景结合,研发智能化的场景应用;

第四阶段,构建真正的通用人形机器人。

任晓雨告诉我们,现在的动易科技正处于第二阶段。

据他预估,今年年底,动易科技团队就会完成通用运动控制模型的研发,明年会将重心转向大脑决策模型,届时他们也将会引入大模型领域的合作方。

不过,在此之前,动易科技也需要将商业化提上日程。

03 商业上的步步为营

2025年,是人形机器人的量产之年。

这一年人形机器人领域大额订单不断涌现,也有越来越多人形机器人开始进入车企、工厂,乃至商业市场进行POC验证,身在大潮中的动易科技似乎并不着急。

任晓雨告诉我们,“现在确实有不少人形机器人已经开始进入工厂做POC,但很多并不是由AI驱动,强化学习驱动的人形机器人依然处于技术成长期,进入工厂还为时尚早。”

任晓雨也特别强调,“并不是强化学习技术不行,而是大家对技术发展速度期望过高,现在需要的其实是时间。”

不过,这并不代表动易科技没有推动产品商业化。

就在前不久,动易科技经过升级后的PhyArc系列摆线关节模组正式对外发售,而这背后,也藏着动易科技的商业逻辑。

关于动易科技在商业化上的思考,任晓雨根据技术研发进程,同样是按照四个阶段自下而上来推动:

第一阶段,零部件的商业化,当前的动易科技已经在做通用本体和通用运动控制模型的研发,自研的核心零部件技术已经成熟,这时会先将关节模组这样的核心零部件进行量产和商业化交付;

第二阶段,人形机器人本体的商业化,当动易科技进入到大脑研发阶段时,通用人形机器人本体也会进行量产,进入到商业化阶段;

第三阶段,大小脑的商业化,当动易科技进入到结合应用场景的技术开发阶段时,大小脑中的部分软件也会进行商业化;

第四阶段,最后则是通用人形机器人的商业化。

就目前来看,动易科技摆线方案的关节模组商业化,无论是对动易科技自身,还是整个产业而言,都有着独特的意义。

对于机器人产业而言,任晓雨指出,“行业里已经很久没有出现新方案来给到从业者拿去测试了,我们这套一体化摆线关节模组的出现,为行业提供了一个新的选择,这不仅是给人形机器人行业一个新的选择,也为包括外骨骼、机械臂在内的整个机器人行业带来了一个新的可能。”

对于动易科技而言,除去能让团队在现阶段实现产品商业化外,也可以让更多人看到这套硬件方案的优势,提升这套方案在行业内的影响力。

当这套方案在行业中的影响力越来越高时,整个供应链效率和方案成本也将会迎来质变,动易科技的技术路线也将会成为一条主流技术路线。

任晓雨告诉我们,“大家之所以不敢轻易大改硬件方案,是因为人形机器人硬件研发周期较长,选错了方向再回头,往往会浪费掉6-12个月的时间。”

现在的动易科技,完成了强化学习+摆线方案这条技术路线上最关键的一步,验证了这条路线的可行性,接下来将会进入高速发展阶段。

不过,现在仍然有一个难题摆在任晓雨面前——如何证明这套方案的先进性?

04 通用人形机器人,明年出现

2025年9月19日,动易科技小人形产品PHYBOT C1正式对外发布。

PHYBOT C1身高1.28m,体重28kg,全身拥有超过25个自由度、内置高效强化学习算法、配备可拆卸电池、单臂负载达到5kg,更独特的是,这款人形机器人头部内置影像模块,可以通过投影功能结合语音等交互模式更好地与人交流。

PHYBOT C1为什么会有这样的功能设计?

任晓雨告诉我们,“主要原因是PHYBOT C1被定位到了服务场景,需要经常与人打交道,所以我们希望它可以拥有更丰富的交互方式。”

我们到访动易科技北京总部时,动易科技的工程师为我们现场演示了PHYBOT C1站立、走路、招手等动作。

正是因为内置了区别于传统机器人控制的高效强化学习算法,当通过遥控器为C1发送停止指令时,C1会立刻收回迈出的那一步、就地站稳,而不再需要完成节拍内动作才能停止。

任晓雨还特别为我们指出,“就现在主流的电驱+旋转关节的传动模式来看,我们这套方案是对人形机器人整个行业的一个重大补充,在我们这套方案补充进来之后,电机驱动的机器人方案就齐全了,人形机器人硬件结构上短期内将不会再有颠覆性的变化。”

就动易科技自身而言,在完成一体化关节模组、人形机器人整机研发过程中,整个团队也在不断扩编和产品研发中逐渐成形并得到历练。

任晓雨告诉我们,“在C1发布时,我们的团队已经通过算法补偿和交互上的标定解决了sim2real的gap难题,并将这样的技术成果集成到了人形机器人产品中。”

在完成了通用运动控制算法和通用人形机器人整机研发后,接下来,动易科技团队会陆续放出更多基于这套方案的人形机器人的实际运行效果。

值得一提的是,任晓雨多次向我们强调人形机器人的通用性,也一直在强调,动易科技打造的运动控制模型、人形机器人都具有通用性,只有在进入特定商业场景时,动易科技会通过“通用硬件+专用场景模型”的方式,推动人形机器人率先在一些商业场景落地。

而这样基于特定商业场景打造的通用人形机器人,任晓雨预计,明年就会出现。