里面是不是藏了人?机器人第一次自证不是人类

发布时间:2025-11-17 17:51  浏览量:1


下一个10年属于空间智能 | 图源:小鹏汽车

作者/ IT时报 孙妍

编辑/ 王昕 孙妍

11月5日,小鹏汽车在小鹏科技日上发布了一款女性形态的机器人,名叫IRON,人送外号“猫女”。她并没有在台上演示高能的技艺,只是自主地走了走猫步,就引发轩然大波:机器人里是不是藏了个真人?

“猫女”短短几步路,踩出了巨大的流量。由于步态太过自然,不仅吸引了圈内人一遍遍重播、放大、观察细节,连普通人都被吸引进这场“真假机器人”的侦探游戏中,不断探寻“猫女”的耳朵、关节、透气孔等细节透露出的蛛丝马迹。

质疑声此起彼伏,一夜未睡的何小鹏,在第二天拍了一段一镜到底的视频自证,拉开背后拉链,卷起袖子、裤子,裸露部分后背、手臂、腿部的内部结构,人们可以看到晶格肌肉、谐波关节等,并再次欣赏到了猫步。

这是机器人第一次自证:我不是人类!

虽然部分网友仍旧沉浸于“侦探游戏”,坚称IRON是由一位装着机械假肢的真人扮演,但质疑声未尝不是掌声,小鹏的自证虽然不够彻底,却开了一个好头,厂商就应该大大方方地接受观众和用户的检验。

在《IT时报》记者以往参加的发布会或展会上,不少机器人厂商只会放出实验室演示视频,就怕现场演示“翻车”,也有不少机器人在展会上“站桩”,偶有机器人握个手、翻个跟斗、跳个舞,就能成为现场焦点。

当观众看腻了机器人跳舞、耍功夫,人形机器人的下一个方向是什么?

小鹏女性机器人的定位很适合居家、康养场景,毕竟人类需要被照料时,天然会倾向于寻找具有母性关怀的对象。长期来看,如果要走进家庭这一终极场景,从“像人”到“像人一样会干活”,还有很长一段路要走。

小鹏女性机器人没有追求跑跳等爆发性能力,对执行器的功率、整体功耗的要求更低,能有更好的稳定性,是比较讨巧的做法。

我大胆猜测:小鹏还不想IRON爆单。在与圈内人士交流时,大多数人都认为机器人量产的主要困难,不是产量跟不上,而是稳定性跟不上。如此之多的执行器,出厂前都要调试,甚至必须得靠“手搓”。

2024年,全球人形机器人的出货量只有几百台。今年,全球人形机器人的出货量有望达到2万台。这个数量级的产量,的确还不用上汽车等产业那样的高水平流水线。

记得10年前到一家外骨骼机器人工厂参观,没想到就是在公司里开辟了一块场地,像一间小作坊,绝大多数零部件的组装靠“手搓”。10年后,机器人生产最大的进步是已经实现模块化,只需要将模块组装起来就行。

机器人本体“出厂”的那一刻,考验才刚刚开始,宕机、失灵等售后问题怎么解决?机器人不够“聪明”做错事怎么处理?

目前,人形机器人还处于“躯体渐强、大脑未醒”的状态。

数据可以改变机器人“缺智”的问题,但是高质量的训练数据是非常匮乏的。在一个机器人数据采集工厂里,厂商聘请了几十位来自技术院校的学生,手握手柄,头戴传感器,每人每天重复几百次倒水、叠被子、拉窗帘的动作,就为了让机器人学习,简直比教自家小孩还要更累、更有耐心。

但是,这种“教育”成本太高了。而且,感知到有被替代风险的工人已经开始“反抗”,一些产线工人不愿穿上数据采集服,担心用自己的技术“喂养”出成千上万个迟早会替代自己的机器人。

空间智能或许是下一场技术变革的“支点”。

投身人工智能领域25年后,斯坦福大学教授、World Labs联合创始人李飞飞在11月11日发表万字长文定义AI的下一个十年——构建真正具备空间智能的机器

字里行间,交织着预测未来世界的振奋与论证前沿技术的理性,流露着与图灵一般的好奇与敬畏。75年前,“人工智能之父”图灵提出了一个问题:机器能思考吗?这个问题至今仍在回荡。

李飞飞的回答是,AI的下一个前沿是空间智能。空间智能将彻底改变现实与虚拟世界的交互方式,它将重塑叙事、创意、机器人学、科学发现等领域。它代表着超越语言的前沿,它连接了想象、感知与行动,开启了机器真正赋能人类生活的可能,从医疗到创造力,从科学发现到日常助理。

但是,AI的空间能力仍与人类相距甚远,比如最先进的多模态大语言模型生成视频十分惊艳,在物理层面找不出破绽,但往往几秒后就失去连贯性。

所以要让机器人自主地与真实世界交互,空间智能还需要一个“脚手架”——世界模型。

机器人行业已经有了路径分野,绝大多数人认为通用型机器人依赖于大量互联网数据、合成仿真和现实世界中的人类示范数据;而另一条是小样本高泛化的路径。世界模型有着高泛化性,它能够预测环境的下一步状态,甚至预测符合人类预期的动作,随着其感知逼真度和计算效率的提升,世界模型的输出可以迅速缩小仿真与现实之间的差距。

李飞飞虽然没有给空间智能的到来划定一个具体的时间表,但是她联合创立的World Labs已经将研究方向聚焦于空间智能。11月12日,World Labs推出首款商业化世界模型产品——Marble,能生成可编辑、可下载的3D世界。用户可先手动构建空间结构框架,如墙体、平面等,再由AI填充视觉细节。

下一个十年的图景似乎已在眼前,2035年的双十一,一对年轻夫妇在饭后随意地逛到一家机器人4S店,里面有精通川菜、粤菜、本帮菜的中式大厨机器人,有精通琴棋书画的素质教育机器人,琳琅满目,目不暇接。由于老公与一个长相精致、声音甜美的美女机器人互动过多,老婆一气之下,全款买下一个拥有八块腹肌且精通营养学的健身教练机器人。