陶虎谈脑机接口的现实挑战和未来发展 | 锚点

发布时间:2025-10-21 21:37  浏览量:1

关注,从此你的世界多点科学~

INTERVIEW

脑机接口,曾经只存在于科幻中的技术,如今正因马斯克的Neuralink被热议。中国赛道同样突飞猛进:脑虎科技联合华山医院,凭借自主研发的256导柔性脑机接口,让患者成功发出了世界上首段靠意念完成的新年祝福,被誉为里程碑突破。脑机接口究竟做到了什么、没做到什么?科幻场景将来有多少能变成现实?未来脑机接口又该如何发展?

我在中国科学技术大学的师弟、脑虎科技创始人兼首席科学家陶虎认为,过去十年来,脑机接口行业处于渐进式发展的状态,当前该领域面临的核心挑战在于硬件的工程化集成,而非单点技术突破。未来,除了医疗领域,他比较看好的是“脑机接口+”的潜力,如结合大语言模型、机器人、智能控制等,赋能更广泛的应用场景。同时,他呼吁脑机接口从前沿研究快速转向产品落地。

陶虎

脑虎科技创始人兼首席科学家

Q:据有关媒体报道,你们在脑机接口的某些点上已经达到了世界领先!具体做了什么?中国在脑机接口领域做到了哪些世界领先?

A:

与其说世界领先,可能更多应该叫作“国内首次”。我们首次用脑机接口实现了汉语的实时解码,而且我们是用全自主研发的技术来做整个系统的搭建,包括植入手术。从这两个方面来看,确实具有很大的突破性。

语言作为一种更高级的功能,往往覆盖更多脑区,它本身的机制也不完全明朗,所以相比运动脑机接口,做语言脑机接口这一块可以借鉴的以往案例并不多,很多进展 都是我们在实践中一步步探索出来的。

之前也有团队能做语言脑机接口,但是做不到实时解码,他们完成解码大概需要10秒的时间,但是现在我们可以做到0.1秒。这样的话可以保证每分钟40个字左右的语言合成速度。虽然相比我们面对面的日常交流(每分钟大概能说150~200个字)还是要慢很多,但是基本上已经可以媲美用手机发信息的速度了。

Q:语言解码会涉及大范围的脑区吗?

A:

大脑是一个非常复杂的器官。我们的大脑里可以有800多亿个神经元,然后每个神经元跟旁边成千上万个神经元都有信息和物质的交换,这使得大脑成为已知宇宙里面最为复杂的计算或连接网络。

任何对外体现出来的大脑功能,不管是运动、语言,还是思考,其实都应该是底层相应的神经元,特别是多个(甚至是成片的)神经元,或者说是多个脑区协同工作的结果。

所以,越是涉及高级功能(如语言),相对来说需要协同的脑区就越多。这对脑机接口技术,特别是神经电极的能力,提出了更高的要求,比如说通量要更高(即需要的电极点位更多),以覆盖多个脑区。

Q:覆盖多个脑区意味着很多不同的地方都要采样吗?

A:

是的。语言合成其实有很多途径,有的是直接的,有的是间接的。像霍金用那个眼动仪,其实更多是在做选择题,他在26个字母上扫,扫到A就是A。这是一种间接的方式。

之前也有通过运动脑机接口来做文字或者语言解码的,设备还是放在他的运动区,但他脑袋里先想象的是笔画,是ABCD等字母的笔画,然后再将其变成单词。这是一种只需要用运动脑机接口就可以做到语言解码的方式,但它其实更多是意念打字或者意念敲字,而不是意念合成语言。

汉语跟英语还是有很大区别的。汉语是有语调的(普通话有四声),这一点我们需要加以利用,针对不同的语调进行调整。除此之外,回到文字本身,哪怕汉字已经发展 到简化字这个阶段,有些字还是属于会意文字,这就意味着在汉语的编解码机制里,语意本身参与的程度可能会更高一些。我们通过对几例受试者做的实验发现,这些在脑电特征以及编解码算法、范式设计里都会体现出来。

一位本身可以说话的受试者如果想要说什么,会通过相应的面喉部肌肉把音发出来。这一过程至少会涉及两个 非常主要的脑区:第一个是跟语意相关的,就是“我”到底想要说什么;第二个是跟运动相关的,就是“我”把这个东西说出来。我们现在就在尝试把受试者“发”相关字的放电活动捕捉起来,同时结合其语意相关的放电活动进行联合解码,这样效率会高很多。

Q:既然这位受试者本来就可以说话,为什么还要用脑机接口来让她说话呢?

A:

她本身是一个语言区肿瘤占位的癫痫患者,手术过程中这一块可能需要切除,切除后也许会影响她的语言功能。据我们了解,这是接受脑机接口汉语实时解码尝试的第一例患者。

我们不能无中生有地编一个编解码机制,得有初始的脑电数据和样本,所以我们必须在她还能正确说话的时候观察她的脑电活动是怎样的,并将其解码出来。这样后期如果真的有需要,就可以利用上(庆幸的是,现在这个患者整体恢复情况较好)。

而对于有些病症,比如说渐冻症,患者的语言功能是会慢慢消失的。针对这种情况,我们就可以在早期他还能正常说话的时候,给他植入一个脑机接口,通过这个脑机接口来进行语言功能的重塑。如此一来,后期他就可以用 意念合成语言来与外界交流。

其实,脑机接口本身还有一个很大的潜在作用,就是可以作为一个平台工具或者辅助工具来用。现在开发的很多新药和治疗手段用在渐冻症病人身上得到的反馈都不多,效率也是比较低的。但脑机接口作为一个“金标准”,它插在大脑里,我们就能知道这个神经元凋亡还是没凋亡,这对药物药效的及时开发,甚至是不同治疗手段的联动都有帮助。

这里只是以渐冻症为例。除此之外,像失明、失语以及成瘾、抑郁等精神类病症,情况大抵相同。脑机接口在其中更多是作为一种核心工具和手段,赋予我们更多的方式去了解大脑,而且是实时地了解。

Q:能达到这样的效果,你们的技术诀窍是什么?

A:

一般来说,植入式设备大多是三类医疗器械(中国医疗器械分类管理中最高风险级别的器械),长期在体的比短期的(比如说术中要用的)要难一些,放在脑袋里的又比放在骨头里的相对来说难一些。所以,相对而言,我们走的是最难的一条路线。

我们更多还是在做全链条的技术研发。从系统框架来讲,它其实是一个微系统,前端有非常重要的用于大脑信号采集和调控的电极,用于信号处理的芯片,用于信号分析的编解码算法,用于信号传输的无线协议、无线天线,以及用于维持整个系统运作的电池——我们希望将这些整体封装成一个足够小的package(包装)。

它要么植入颅骨里面,要么就放在颅骨上,不能给病人本身带来极大的负担,而且在运行过程中,如果有大量数据需要实时处理,还不能有太大的功耗,否则一天到晚充电都来不及。

另外,功耗大还涉及发热的问题。身体其他地方有一些热我们或许还能忍受,但大脑只要提高两摄氏度,人就会休克,这也是我们需要控制的。所以很多时候,我们这个领域做的事情其实是一种妥协。

Q:可能是单看每一项,每一项都不难,但集成在一块儿就会变得非常难。

A:

所以,我们一直说自己做的是脑机接口的接口,就是让电极跟芯片接口能匹配,芯片跟算法接口能匹配,算法跟无线通信能匹配。

Q:这个维度听起来很有趣。据我所知,米格尔•尼可莱利斯(Miguel Nicolelis)在2014年巴西世界杯的时候做了一件非常有意思的事情:他借助脑机接口和外骨骼技术成功让一位截瘫青年为世界杯开球。为什么我们现在看起来还是在做类似的事情?十年过去了,难道这个领域进步如此之慢吗?

A:

如果只是用意念开球,根本不用植入式脑机接口,因为不需要踢得有多准。但是运动本身也有流畅度、自由度、实时的延迟等维度的比较,这个是永无止境的。现在大家 就是在(试图让截瘫人士)从简简单单踢个球转变到可以像正常人一样踢球,这中间虽然在不停地迭代优化,但还是差得很远。

在我看来,这十年所取得的只能说是很渐进式的变化,还没有颠覆性的变化。我内心有自己的判断标准。第一个就是把病人变成“正常人”。比如说语言,如果语言合成的速度能达到我们正常说话的速度,我认为这就是一个很重要的里程碑。

下一个里程碑是看什么时候能够超过正常人的速度。脑机接口是什么?它是绕过我们的五官四肢跟外面直接建立联系。比如说运动,如果我们针对某个单项技能使用脑机接口这种运动控制,它可能确实会比人的操作还要快。在我看来,这也是一个里程碑,不过目前还没有见到。

人体最发达的就是大脑。可以说,我们的五官四肢是配不上我们的大脑的,无论是数量上还是质量上都配不上。例如,数量上我们只有两只手,质量上我们的视力也比不过老鹰。但是随着硅基技术的发展,现在我们有了传感器, 它比老鹰看得还准;我们也有了机械手,可以做8个机械手、10个机械手,这完全没有限制。

也就是说,现在我们有了比自身五官四肢更好的外部设备。即便如此,在性能功耗比方面,我们依然没有看到任何一个计算机比大脑更好。脑机接口就是要把我们的大脑跟外面更强的执行器、传感器连接起来,但里面的核心技术一直没有太大的突破。这里的突破指的是能够安全可靠地大规模进行神经编解码的分析。

它的核心技术卡在什么地方呢?神经电极的通道数依然很少。从早期的1个通道、4个通道到目前为止依然在用的100个通道的犹他电极,以及以埃隆·马斯克为首的团队终于做到了几千个通道……我们深刻意识到,在硬件上有所突破,才能做到更高效率的编解码。但总体来看,我们在硬件上其实一直没有太多突破,这是因为在脑科学领域,做硬件、做工具的人太少。

神经科学家有很多,也许是因为破解一些未知的科学难题更吸引人,相比之下,做工程就没有那么吸引人了,再加上硬件本身投入比较大,周期也比较长,就会导致愿意从事硬件开发的人相对较少。但是,近些年大家慢慢开始看到脑机接口在临床上有一些确切的应用前景,意识到它确实是有用的。我相信,在接下来的3~5年脑机接口领域会迎来大爆发。

Q:前面谈的应用场景主要还是医疗。除了医疗领域之外,脑机接口还有哪些应用场景?

A:

脑机接口在我心中的定义就是接口。既然是接口,现在要讨论的就不是脑机接口能干什么,而是脑机接口加什么。

Q:就像“人工智能+”是吧?

A:

对,这是“脑机接口+ ”。

首先是“脑机接口+语言大模型”。当我们能做到语言的编解码的时候,就会发现脑机接口加语言大模型非常有意思。在这一场景下,人们不仅可以跟语言大模型进行互动,而且可以快速积累数据。

其次就是“脑机接口+机器人”。脑机接口如果本身针对 的是患者肢体有障碍的问题,和机器人结合在一起就可以做很多事情,包括康复、陪伴、执行任务等。

再次,还有 “脑机接口+智能控制”,不管是控制智能家居,还是后面能做得更加可靠和成熟的无人驾驶,都可以实现。

除此之外,主流行业里类似的对人们有很大影响的东西,其实都可以通过脑机接口的方式加以赋能、拔高,甚至做出颠覆性的改变。

所以我想说的是,脑机接口这个赛道要有人去做,脑机接口跟其他赛道之间的接口也要有人去做,而我们正在做的就是把脑机接口发展成一种容易接入其他赛道的平台技术。

Q:近些年关于脑机接口,宣传最多的可能就是马斯克的Neuralink。人们对其有肯定,也有批评,比如,很多人认为马斯克的宣传是过度夸大的。对此,你怎么看?

A:

马斯克本质上还是商人,所以他会用商业化的方式来催熟一门技术。在我看来,马斯克在一些项目(包括Neuralink、特斯拉在内)中做得非常成功的一点——同时也是一直以来我觉得我们需要认真学习的地方——就是系统工程学。

他的每一个产品依靠的都不是单点的优势,至少目前看下来是这样的。从理论创新的角度来讲,我(在他那儿)甚至都没有看到一个颠覆性的前沿产品。他就是把现有的,甚至只是稍微有一点突破的东西,通过系统工程学的方式进行优化,包括它的成本、开发周期等。然而,这恰恰是国内过去缺乏的。

我们原来更擅长什么呢?是点上的突破。根据报道,国内现在已经有了超级高通道——通道数能达万级。甚至如果我们想做,未来百万级也是可以实现的。

问题是,即便做到百万通道,没有芯片匹配有什么用呢?芯片如果能匹配,功耗降不下来,耗电量降不下来,放上去10秒钟就没电了,又有什么用呢?怎么通过系统工程学的方式,把已有的六七成的技术,集成在一起做到八成、九成,这是之前国内科学家创业时很难去想的事情。在点上比别人的性能好,不代表做出来的产品就比别人的性能好。

此外,在实验室里获得的发现、在文章里发出来的东西跟产品本身是不一样的。做产品,特别是医疗产品,10个里面有一个坏的都不行。因为做产品跟做科研有本质上的区别,你不能将关于产品的要求套用在科研上,也不能按科研要求的先进程度来要求产品,这是两回事。但目前我认为,脑机接口不能再停留在前沿科技层面,而是要快 速转向,聚焦到产品落地上来。

一定要让政府、让病人、让市场看到它作为一个产品真正能带来的收益。

Q:2025年1月10日,上海发布了《上海市脑机接口未来产业培育行动方案(2025—2030年)》。这对整个行业来说应该是巨大利好,对吗?

A:

首先,现在整体上明确了“企业家+科学家+投资人”三位一体的工作方式。

其实,原来有很大一部分都是科学家在牵头,但仅靠科学家是不够的;也有一段时间在考虑是不是让企业家牵头,先把产品做出来再说,结果发现里面的科技属性又太淡了。

现在,我们发现科学家和企业家之间还有资本驱动的情况存在,因为它毕竟是一个需要资源助力的行业。如此一来,明确三位一体的工作方式对行业发展来说显然是有利的。

其次,脑机接口一定是以应用场景需求驱动的方式发展,它的执行主体一定是企业,它必然以产品形态出现。我们不能再以文章、论文的形式来做这些。

最后,脑机接口的发展也需要国家机构的监督,需要多方配合、共同制定标准。着眼于这个方案,我们可以非常明确地看到上海市要以产品为导向发展脑机接口行业的决心。

Q:在你看来,脑机接口领域下一个亟待解决的重要问题是什么?或者说,下一个锚点是什么

A:

下一个锚点就是接口,或者说是连接。我们希望脑机 接口这样的技术可以连接不同领域、不同学科的专家,甚 至可以连接不同国家,大家一起来做这件事情。因为这件 事情对全人类的现在,包括未来,都是有历史价值的。

袁岚峰

《锚点》科学对谈人

-本文刊载于《世界科学》杂志2025年第10期“锚点”专栏;该专栏由《世界科学》编辑部和东方卫视《锚点》节目组联合开发,节目原题为《脑机接口,中国后来居上?》-