硅谷硬核创业:9 个人,造出 9000 美元人形机器人,想挑战特斯拉
发布时间:2025-05-29 19:33 浏览量:1
帮特斯拉砍掉激光雷达的人,在美国造低价机器人。
文丨贺乾明
编辑丨程曼祺
2023 年 8 月,宇树科技发布人形机器人 H1。时任 OpenAI 研究科学家、特斯拉前 AI 总监安德烈·卡帕蒂(Andrej Karpathy)对 9 万美元的售价和机器人性能感到惊讶,在社交媒体上说想买一两个,或者一些。
而曾在特斯拉帮助砍掉激光雷达的本·博特(Ben Bolte)觉得,在美国能做出更便宜的人形机器人。他说宇树科走通了低价人形机器人这条路,给了他很大启发。
他来中国拜访过宇树创始人王兴兴,他主要讲英文,王兴兴说中文。“王兴兴很厉害,只说中文也没关系。” 博特说。
今年 5 月 19 日,博特创办的人形机器人公司 K-Scale Lab 开源人形机器人软件套件,并开启人形机器人预售:1.5 米高,成本 9000 美元(约 6.5 万元人民币),售价 16000 美元(约 11.5 万元人民币)——这考虑了关税的影响。
K-Scale 的人形机器人 K-Bot。图片来自 K-Scale。
“其实 9000 美元还有得赚。”K-Scale 联合创始人、COO 徐睿说。徐睿曾在小米、字节、腾讯从事硬件产品工作,2024 年 10 月加入 K-Scale,负责技术、工程之外的所有工作。
产品发布之前,OpenAI、Google、英伟达等公司的工程师们经常去找他们交流,甚至帮忙写代码。K-Scale 也得到硅谷知名投资人奈特·弗里德曼(Nat Friedman)和 YC 、Fellows Fund 等风投的支持。
“只看价格,这是卷死大家的水平。” 一位机器人领域分析师说,她很难想象一家美国公司也能造出来如此便宜的人形机器人。国内类似的产品售价大概在 20 万~30 万元人民币,宇树最便宜的 G1 起售价也得 9.9 万,比它矮 20 公分。
9000 美元是 K-Scale 高度简化设计的结果,这款人形机器人没有 x86 CPU,只搭载英伟达的芯片,也没有昂贵的六维力传感器、激光雷达等等。他们依赖中国大陆和台湾地区的供应链,机器人中的大多数零部件都是原本用于手机、IoT 设备上的量产器件。
“如果只是用 AI 技术让机器人学会执行任务,这样就够用了,跟其他更贵的硬件没太大区别。” 徐睿说,他们刚开始预售时,页面只有两张图片,甚至没有介绍机器人参数、规格,就卖出不少。
他们希望用软件弥补硬件上的不足。博特说,这是他在特斯拉工作时的常态,马斯克要求特斯拉不能用激光雷达,只用摄像头实现自动驾驶系统,他是关键执行者。后来他去 Meta 研究具身智能。
与许多把目标瞄准工厂、家庭的人形机器人创业者不同,博特认为,当前人形机器人的销量主要在消费级市场,早期的杀手级应用是 “语音” 和 “视觉”;用户更关注 “人形”、而不是 “机器人”。
“关键在于你怎么看待人形机器人,是工厂流水线里的机器?还是家里类似电冰箱的设备?或者是电脑、手机之后的计算平台?” 博特说,K-Scale 相信人形机器人是计算平台,未来硬件设计趋同,差异会在软件系统、生态建设方面。他认为,宇树错过了在美国建立社区生态的机会。
他很欣赏智元联合创始人稚晖君的全栈能力,“一些公司模型比我们好,一些公司的硬件比我们好,还有一些公司的软件比我们好,我们把这些视为一个系统,把它做到最好。”
K-Scale 崇尚硅谷传统的车库创业、极客精神,把公司地点定在硅谷斯坦福大学后门处的一栋房子里,团队一起生活、办公,举办黑客松,希望挑战特斯拉这样的巨头。
一位接触过 K-Scale 的创业者说,K-Scale 的办公区域挂有中国公司团队的照片,提醒自己团队 “中国硬件工程师迭代多快”。
K-Scale 认为彻底开源是提升人形机器人能力的方法,也可以让他们在人手、资金有限的局面下做出尽可能好的产品。
“经常有一些大公司的程序员周末跑来帮我们写代码,大家一起吃两天披萨。” 徐睿说,还有国内大厂的工程师会贡献想法。他希望更多中国的工程师、供应商能加入 K-Scale 的社区,一起建设生态。
过去两年,中国、美国的人形机器人行业都已经习惯了创业者起步就筹集大量资金、招揽尽可能多的人才,认为只有这样才能做好人形机器人。当前 K-Scale 只有 9 名全职员工,天使轮融资 400 万美元,与中国大多数人形机器人公司相比都算是匮乏。但他们认为已经够用几年了。
5 月底,K-Scale 创始人本·博特和联合创始人徐睿接受我们访谈 ,分享了他们对人形机器人不一样的思考。
K-Scale 创始人本·博特和联合创始人徐睿。图片来自 K-Scale。
硬件高度简化,把人形机器人压到 9000 美元
晚点:你们在美国做 1.5 米高的人形机器人只要 9000 美元(约合 6.5 万人民币),比国内大多数人形机器人都低。怎么做到的?
徐睿:我们面向 AI 开发产品。有了 AI,不需要昂贵的定制机器人组件,手机或者 IoT 设备上的量产货就可以达到以前传统控制的效果。
最近 Ben 跟美国的人形机器人公司工程师交流,聊到其中的一个零部件陀螺仪(IMU),对方说他们的陀螺仪就要 2000 美元,非常精准。然后我们发现,手机上 1 美元的 IMU 就能达到很好的效果。
我们现在用的是中国大陆和台湾地区量产的商用电子元器件,然后用比较好的软件补齐零部件能力的不足。
我们把人形机器人定义成一个真正意义上的系统,也就是下一代的计算平台和跨系统运行的基础设施。这就意味着,我们不会只是卖一台机器就从这个循环里面跳出来了。我们在建整个平台,整个的生态链。
我们的硬件利润率留得很低,而且团队又小,研发费用分摊不多。所以能做到现在这个状态。
晚点:售价 1.6 万美元(约合 11.5 万人民币),利润率也不低了。
徐睿:9000 美元是 BoM(物料清单)成本定价,其实还有得赚。不过在美国卖东西很贵,可能还要给关税留空间。
晚点:这也很便宜。现在国内的全尺寸人形机器人,价格在 20 万~30 万人民币。
徐睿:国内大部分人形机器人带两套计算系统,一套 x86(CPU)、一套英伟达。我们直接把 x86 那套砍掉了,摄像也是百万像素的 MIPI。电机都是从灵足科技买的,也没用激光雷达。
从用户的角度来讲,做 RL(强化学习)实际上效果没差太多。如果是做传统的那种规控,我们的这套硬件可能就做不了。
晚点:其实是一个高度简化,但能够发挥作用的版本。如果给 2 万美元的成本,你们会增强哪方面能力?
Ben Bolte:我们会把它投到提升软件能力的硬件上。比如更好的芯片、更多的内存,更好的摄像头。
晚点:之前你们提到现在的机器人已经不够卖了。大概备了多少台?
徐睿:是这样的,我们之前发布软件产品,想要号召更多的开发者和我们一起训练模型,开发人形机器人。我们想让大家知道我们对硬件是认真的,就把预售打开了。页面基本上空的,只有两张图,规格也没写,一下子就卖出了不少,大大超出预期。
晚点:这是不是因为你们在美国?又卖得很便宜。2023 年宇树发布 H1 的时候说 9 万美元,安德烈·卡帕蒂(Andrej Karpathy)在社交媒体上说,他想买一两个,或者一些。
徐睿:在美国是一方面,我们也很认真地在做这件事,极客们都很喜欢开源的东西,他们下单的时候,都没有找我们要参数规格。
晚点:买你们人形机器人的都是哪些人?
徐睿:基本上三波人。第一波就是有钱的硅谷公司高管,他们想看看这些最新的机器人是什么样子。第二波是学校、科研机构里面的研究者。第三波就是 AI 行业的工程师,他们也会买一些。
晚点:个人用户偏多。Ben 预测人形机器人的杀手级应用是 “语音” 和 “视觉”;早期用户更关注 “人形”、而不是 “机器人”。怎么得出这些结论的?
Ben Bolte:关键是你怎么看待人形机器人,把它当成一个产线上机器,还是认为它是家里的一个设备。我们把它看做一个平台产品,所以它的第一个爆点,就不会在一个垂直领域,也不会在工厂。人形机器人跟视觉、语音技术关联很重要。你看无论是手机还是电脑,爆发的时候都是交互体验的进化。
徐睿:机器人跟人的交互,比跳舞、后空翻要更重要一些。你不会买一个机器人天天看它后空翻,你会希望它能听懂你在说什么,跟你交流,帮你干活。
晚点:美国做人形机器人的公司,像特斯拉、Figure、1X 都是带腿的机器人。国内就不一样,就算是做人形的机器人,也会做不带腿的版本出来,还有一些公司干脆不做带腿的。
徐睿:腿很难做。但是我们觉得带腿是终局。腿在人类世界的适应性比轮胎好很多。在工厂,环境可以改,不带腿也没事。但要是在家里、院子里或一些公共场合,移动还是需要腿的。
国内硬件资源充足,做中间形态也无所谓。但美国硬件资源比较少。让我们赌一个形态的话,肯定会把资源放在终极的形态上。
把软硬件模型视为整体,用开源提高机器人能力
晚点:你们一年时间做出来大大小小六款机器人。很多中国的人形机器人公司都没这么快。
徐睿:开源社区的帮助很大。我们只有 9 个全职员工,但有很多开源社区的人来帮忙。我们遇到什么卡点,很快就能从斯坦福大学或者周边懂机器人的人那里得到帮助。
经常有一些大公司的程序员周末跑来帮我们写代码,大家一起吃两天披萨。还是挺神奇的。
晚点:所以 K-Sacle 创办的时候,第一件事儿就是搬家到湾区?
徐睿:是的。我们是故意放在这的(笑),就在斯坦福的后门。
晚点:你们开发人形机器人的时候觉得硬件难,还是软件难?
Ben Bolte:最难的还是在美国造廉价的硬件。美国有很多公司造昂贵的人形机器人,这比较容易。但你要采购便宜的或者商用的组件,去用软件补上差距就不容易了。
这跟我在特斯拉做的事情类似。我们去掉了激光雷达,依赖摄像头。这个过程很难,但它让汽车变得很便宜,AI 让系统效果更好。
晚点:开发过程中,你们做得最好的事情是什么?
Ben Bolte:端到端的研发能力。我很喜欢稚晖君,他在视频中会讨论固件、软件、硬件、机器学习模型等等。每个部分都不是那么困难,但一个人精通这些非常困难。
我们的工程师都能做到这一点。很多公司的模型比我们好,或者硬件比我们好,或者软件比我们好,但没有哪家公司像我们这样,擅长所有事情,尤其是在美国。
晚点:为什么你们觉得开源是提升人形机器人能力的必要方式?
Ben Bolte:最重要的是让人形机器人迅速普及,闭源会阻碍这个过程。很多开发者想改进人形机器人,这需要我们更开放。
晚点:能举个开源提高能力的例子吗?
徐睿:我们最早开源的小机器人,是用 3D 打印做的。现在有 100 多个开发者打印出来,给了我们很多硬件和软件上的反馈。
前两天就有一个,我们的 Discord 里面有个国内大厂的工程师,给我们发消息说,把我们的小机器人打印了出来,有一些新的想法,跟我们分享。真的很新颖,最近他还在不断更新自己的想法。
还有一个例子,我们产品开源后,Google 的一些工程师也觉得这东西很好,想要跟我们合作。如果我们都是闭源公司,接下来就是商务与商务聊了。但我们开源,工程师们就可以相互交流了。
晚点:你们开源用什么协议?
徐睿:MIT。我们还是希望更多人到我们这个平台上来。
晚点:数据问题能够用开源解决吗?仿真、视频数据行业内都会认为很难让机器人理解物理世界,所以大家多少都在采集真机数据。
徐睿:这跟开源闭源没太多关系。闭源的数据大部分都是买的,雇人采集数据,去训练模型。开源的好处是,用户会花钱买硬件,自己训模型,很多人也会把数据贡献出来。美国的开源社区有分享数据的文化。
晚点:行业里很多人形机器人公司也在开源,比如美国有 Physical Intelligence, 中国的宇树、智元等。你们的开源跟他们有什么差别?
徐睿:开源的最重要的是你要维护一个社区。本质上还是刚才聊到的,你把人形机器人看成工厂里的机器,还是家里的电冰箱,或者是计算平台。这会决定开源的底层逻辑。
我们想培养一些熟悉我们技术、愿意用我们产品,并在我们产品的基础上做各种各样商品,并愿意回馈给整个社区和平台的人。
晚点:但这个市场还是存在竞争的。你们不担心开源会让对手变得更强吗?
Ben Bolte:别人用我们的技术让他们的产品更好,我会认为自己做得很棒。这其实是一种荣誉。至于竞争,我们只需要做得更好就可以了。现在重要的是建立最好的团队,尽早找到客户,速度最重要。
晚点:中国有很多人形机器人公司招募自动驾驶专家开发机器人模型。Ben 之前在特斯拉开发 Autopoilt。你觉得自动驾驶领域有哪些东西可以迁移到机器人领域,哪些不能?
Ben Bolte:自动驾驶是第一个把大规模 AI 系统放到现实世界的尝试,做成功的是特斯拉的端到端系统。实际上有很多公司都没有真正成功。那些没有开发成功自动驾驶系统工程师,到了机器人领域就会复制原本失败的经验,问题还会持续。
所以我们会选择开源,把技术提供给极客和开发者。比如 Stale Diffusion,这是一个很简单的模型,很多人都可以尝试,我们看到了很多有创造力的工作出来。
晚点:但开源 Stale Diffusion 的公司过得很差。
Ben Bolte:那是因为他们挣不到钱。K-Scale 可以卖硬件获得收入,并且以硬件为锚点,通过软件赚钱。
徐睿:我们所有的用户都在用我们硬件,这给我们很多商业化的机会。我们也有应用商店。
晚点:你们也想做个 App Store?
徐睿:更偏向游戏主机的形式。软件、应用是各种各样的游戏。软件的价值,会大大高于硬件的价值。
晚点:我们了解到,你们跟追觅前中国区执行总裁郭人杰创办的乐享科技合作举办过黑客松。他说他看到了高中生市场的潜力。你们看到了什么?
徐睿:美国有很浓厚的极客精神。他们会喜欢花一个周末做个好玩的东西出来,很多有才华的工程师,创造新东西需求是没有满足的。每次我们办黑客松,都会来上百人,把路边全部停满,邻居经常会抱怨。每次做完黑客松,我们都很有收获。
K-Scale 举办黑客松的场景。图片来自 K-Scale。
人形机器人在美国不该那么贵,宇树错过建生态系统的机会
晚点:Ben 之前说,如果未来是闭源的、成本 5 万美元以上的人形机器人不太对劲,所以出来创业。你为什么会觉得自己可以用开源的方式在美国做出来低价的人形机器人呢?
Ben Bolte:我做过尝试,看到了可能性。而且中国公司也在做,证明实际上是可行的,基本上都是一些工程问题。其他公司成本甚至可以到 50 万美元,完全是糟糕的工程案例。
晚点:宇树的 G1 卖 9.9 万人民币,成本也很低。Ben 去过宇树。你从宇树身上得到什么启发?
Ben Bolte:宇树基本上是第一家成功销售这种低价通用机器人的公司,给了我们很大的灵感。
但我认为,宇树错过了建立生态和社区的机会。在美国,宇树的硬件有故障的时候很难修,)账号,很难联系到支持人员。我们希望对开发者更友好。
晚点:你们的目标是实现未来有数十亿人形机器人的世界。这跟马斯克的目标一样。Ben 之前在特斯拉工作过。你们跟马斯克有什么不同?
Ben Bolte:山姆·阿尔特曼有句形容埃隆的话我很喜欢:他希望世界得到拯救,但前提是,他是做这件事的人。对于我们来说,我们只希望世界是安全,谁实现的并不重要。
人形机器人超过千万台,如果是一家闭源公司控制,会对社会造成非常大的破坏,很多人就会失业,会有机器人军队等等。阻止这种事情发生的唯一可能性,就是把技术开源出来。
晚点:听上去很像 OpenAI 刚成立时的样子,但现在他们闭源了。
Ben Bolte:问题在于他们的业务模式,他们不会从开源中受益。对我们来说,最重要的是一开始就建立业务模式,与许多不同的公司合作,建立生态。比如 Facebook,他们开源了很多 AI 技术,也能从生态系统中受益。如果业务模式跑不通,开源就没有意义,就是一个空洞的单词。
晚点:K-Scale 刚成立的时候,就得到硅谷知名投资人奈特·弗里德曼(Nat Friedman)的支持。他最看重什么点?
Ben Bolte:他很喜欢 “杀死巨人” 的项目。他建议我应该去尝试高风险、高回报的事情,现在是 “杀死巨人” 的时候了。我不想成为一个小人物。
晚点:你们眼中的巨人是谁?
Ben Bolte:特斯拉。
晚点:那徐睿呢?你在 2024 年 10 月加入了 K-Scale 前,在腾讯做 AR/VR 相关的事情,也在小米、字节做过硬件。你为什么选择跨行做人形机器人,而且加入一家美国公司?
徐睿:我认为机器人不是像耳机、3D 打印机这样的产品,而是类似个人电脑或智能手机的平台型硬件。这样的机会,可能一生只有一次。
更重要的是,这本质上是一个 AI 问题,而不是一个纯粹的硬件问题。整个逻辑、节奏和发展方向,都必须遵循 AI 的演进路径。所以在硅谷更好。
我觉得必须与那些在一线做过 Sim2Real、并且真正部署过物理层模型的人合作。我有意识地 “按图索骥”,寻找具备这种能力的人。经朋友介绍认识了 Ben,挺幸运的。
晚点:徐睿加入 K-Scale 之后,带来了什么改变?
Ben Bolte:我的性格偏向于史蒂夫·沃兹尼亚克(Steve Wozniak,苹果联合创始人)。但我们公司不只要有技术实力、靠着愿景建立生态系统,要有一个完整的有机体。在这个方面,徐睿比我更有经验。
晚点:K-Scale 是 YC 孵化器毕业的公司。他们会要求应用创业公司尽可能迅速的增长。但人形机器人很难这样。他们对你们会有什么新的要求吗?
Ben Bolte:快速增长并不是 YC 的硬性要求,他们更关注创始人是不是有很强的信念,是不是有技术实力,愿不愿意为了这个目标高度奉献。
我在 YC 的时候,他们还试图 check 这一点,认真劝我改变创业想法,大概有三次。我都拒绝了,最后他们就不再问了。
晚点:现在你们只有 9 个人,天使轮只融 400 万美元。这样的资源算得上匮乏。是投资人不愿意投你们吗?还是你们对融资和发展有自己的节奏?
Ben Bolte:我希望公司的管理层和团队拥有公司的大部分股权,400 万美元已经够用了。
徐睿:融来的钱更像是债。现在我说一年能卖出去 500~1000 台机器人,投资人会很开心。如果融了几千万美元、上亿美元,你说 500 台,他们可能会觉得公司有问题,我们只能讲很夸张的故事,打乱研发节奏。
晚点:接下来你们会怎么扩张?
徐睿:会建立市场营销团队。我们现在没有这类人。后面也会吸纳一些做 AI 的人,把产品做得更好。
晚点:你们会怎么预测未来几年人形机器人的发展?
Ben Bolte:大概两年后,就会出现类似 iPhone 这样的产品。在那之后,会出现一个庞大的生态系统,有 3 到 5 家公司有自己的 iPhone 相互竞争。
徐睿:应该会跑通 2~3 个人们生活中没有标准化的场景。我们希望有更多中国的硬件供应商和开发者加入我们的生态,大家一起做得更好。
晚点:若干年后人形机器人没有做成,会是哪里出了问题?
Ben Bolte:那我的工作就失败了,我会觉得很惭愧。技术进步是个体行为,有技术、有能力的人有这样的责任。中国和美国共同努力推动进步很重要。我认为世界由工程师管理会更好。