让机器人“开窍”,清华教授孙富春解码具身智能的“发育”
发布时间:2025-09-21 18:17 浏览量:1
当机器人不仅能“看见”世界,还能像人一样“理解”并“适应”世界,人工智能便迈入了“具身智能”的新纪元。清华大学人工智能研究院智能机器人中心主任孙富春教授在今天举行的2025浦江创新论坛具身智能前沿技术论坛上指出,未来的智能机器人,将不再是执行预设指令的“工具”,而是能在真实物理世界中自主思考、学习和进化的“生命体”。
“开窍”
让机器人泡茶,它不仅要完成烧水、取茶、泡茶的流程,更要具备“推理”能力——当发现茶叶用完时,能自主规划去储物柜寻找替代品,这才是真正的具身智能。孙富春指出,传统机器人如同“死记硬背”的学生,环境稍有变化便束手无策,而具身智能的目标,是让机器拥有“举一反三”的能力。
这种能力,取决于“策略泛化”与“场景泛化”的能力。“开了上海的门,也能开北京的门。”他打比方解释说,无论是精致的旋钮还是粗犷的拉手,机器人都能适应,这背后是智能的“鲁棒性”,是摆脱对海量特定数据依赖的关键。
“发育”
人类通过长期训练,让身体与神经形成并具备独特技能,这就是人类成长的发育过程。孙富春认为,机器人也需要在与环境的持续交互中,让“感知”与“行为”共同“发育”,构建起对物理世界的深刻理解——即“世界模型”。
这要求智能体不仅能从数据中学习,更要能融合知识、记忆和经验。孙教授指出,传统的强化学习理论加入知识、记忆和经验已不足以支撑高级智能,必须转向“具身强化学习”,让机器在遇到未知挑战时,能像人类一样调用知识库、记忆和经验,并进行类比和迁移。
路径
未来的发展方向绝非“大模型 vs 小模型”,而是二者的深度融合。云端的“大模型”负责高阶认知,如任务规划、逻辑推理和知识引导,提供“认知高度”;而部署在机器人本体上的“小模型”则负责毫秒级的实时控制,如精确的力控和轨迹规划,保障“执行效率”。
目前,已有不少“云端边”案例在工业领域有很好的应用。他介绍,“云端大模型+边缘小模型”的分布式架构,是实现高效、安全、通用物理智能的一种路径。
未来
在本体形态上,孙教授坚定地认为人形机器人是具身智能研究的“最重要平台”。“人类是最理想的计算智能体。”——具备长期学习和技能发育的神经可塑性;人类行为在综合协调性上无与伦比;双足行走对智能要求极高,是绝佳的测试平台;人类的双手结构天生适合操作工具。
他透露,其团队深耕灵巧手技术,已研发出单臂负载达15公斤的主动握力灵巧手,能够完成穿针引线的精密任务,相关成果在国际顶级机器人会议的操作挑战赛中屡获佳绩。
孙教授展望,未来具身智能的发展需聚焦四大要素:本体技术(尤其是人形)、世界模型(融入物理规律和属性的场景库)、个性化智能体(适应不同任务需求)以及学习与进化机制。
栏目编辑:郜阳