灵生科技:以“具身 Sora”为核心,打造机器人大脑新未来,已获数千万融资
发布时间:2025-08-28 03:03 浏览量:1
在近期举办的世界机器人大会上,一场关于机器人技术未来发展的深度讨论引起了广泛关注。宇树科技的创始人王兴兴在演讲中抛出了一个引人深思的观点,他认为,尽管硬件技术的不断进步为机器人应用提供了坚实基础,但模型技术的滞后才是阻碍机器人大规模落地的关键因素。王兴兴特别提到了视频生成模型路线,认为其相比当前的VLA技术,具有更大的收敛概率和潜力。
无独有偶,就在王兴兴发表演讲的同时,另一家科技初创企业——灵生科技,宣布了一项重大技术突破。他们推出了业内首个支持异步运行的快慢双系统视觉语言动作框架RealDualVLA,这一框架为机器人执行复杂操作任务提供了全新的高效协同解决方案。尤为RealDualVLA背后的数据生成技术,是灵生科技独创的视频生成模型“具身 Sora”。
灵生科技由拥有多年AI算法和产业经验的杨洪兵创办,专注于具身智能机器人大脑的研发。其核心产品云-边-端一体化大脑系统LingBrain,自推出以来便备受瞩目,并已成功获得数千万融资。杨洪兵坚信,真正的具身智能变革,在于赋予机器人一个能够独立思考和行动的“大脑”,而机器人“大脑”的进化,则离不开开源生态的繁荣。
杨洪兵表示,灵生科技不仅开源了自研的VLA模型,还提出了一种创新的训练方法:通过生成视频和“跟我学”的方式,让机器人先在脑海中“推演”操作流程,再去执行任务。这种方法显著提高了任务执行的成功率,达到了95%以上。在杨洪兵看来,真正的机器人应该是能够理解语言、感知物理世界、并能完成复杂任务的“生产力伙伴”,而非仅仅是人跟在后面的遥控玩具或实验室样品。
在谈及为何选择做机器人大脑而非本体时,杨洪兵分享了自己的见解。他认为,尽管当前机器人本体技术炙手可热,但真正的智能核心在于AI技术。如果只聚焦硬件,那不过是传统制造业的延续,而真正的具身智能需要AI来驱动。这也是灵生科技专注于研发“机器人大脑”的原因,他们希望通过技术创新,让机器人摆脱遥控器的束缚,实现真正的自主化。
针对当前机器人大脑技术发展的瓶颈,杨洪兵指出,数据匮乏是制约机器人大脑研发的关键因素之一。与语言模型相比,机器人智能需要大量的行为数据来训练,而这些数据在人类历史上并未被系统记录下来。为了弥补这一缺陷,灵生科技采用了视频生成技术,通过生成大量行为视频来训练机器人,从而解决了数据瓶颈问题。
在谈到开源VLA模型的决策时,杨洪兵表示,他们希望成为机器人领域的“鲶鱼”,通过开源高质量模型来推动整个行业的进步。他认为,开源不仅能够加速技术迭代,还能让整个生态更加繁荣。尽管当前闭源仍是主流,但灵生科技坚信,开源才是未来的趋势。
在产业化方面,灵生科技已经与国内多家大型客户建立了合作关系,并确定了合作和采购订单。他们的商业模式基于开放平台,同时提供增值服务。对于开源模型,如果客户需要进一步优化或定制,他们会提供收费的技术支持。与本体厂商合作时,他们通过增值服务收费;而与终端客户合作时,则直接通过赋能大脑技术来收费。这种模式既支持了生态共建,又确保了商业化的可持续性。
在谈及与大公司的合作进展时,杨洪兵透露,他们与大公司的合作通常分为付费POC、小批量采购和中等规模乃至大批量复购三个阶段。目前,大部分合作已完成POC阶段,进入了小规模复购阶段。这相比仍停留在实验室阶段的友商来说,是一个显著的进步。
在产业化过程中,灵生科技也遇到了不少挑战。真实产业环境远比实验室复杂得多,实验室中的成果往往无法直接应用。为了克服这一难题,他们通过工程化和体系化能力的提升,确保了技术能够适配上千、上万台机器的规模化需求。同时,他们也利用具身 Sora视频生成技术弥补了数据不足的问题,并优化了模型推理速度、效率和准确率,以确保交付和部署的稳定性。
对于未来,灵生科技表示将继续推动开源战略,吸引更多开发者基于他们的模型进行二次开发。他们希望通过共建生态来加速产业落地,并为用户提供真正能用、易用、好用的具身智能产品。同时,他们也正在积极探索自然语言处理通用接口(NLI)技术,以期实现用户只需用日常语言下达指令,机器人就能理解并执行的目标。