2025北京智源大会开幕|智源发布“悟界”系列大模型

发布时间:2025-06-06 14:08  浏览量:1

2025年6月6日,第七届北京智源大会在中关村展示中心拉开帷幕。作为全球人工智能领域的顶级学术盛会,本届大会以“全球视野、思想碰撞、前沿引领”为核心理念,汇聚了图灵奖得主、国际顶尖科技企业代表及国内头部AI公司创始人,共同探讨人工智能技术的未来发展方向。大会期间,智源研究院正式发布“悟界”系列大模型,标志着其在人工智能从数字世界迈向物理世界的探索中迈出关键一步。


“悟界”系列大模型延续了智源研究院此前“悟道”系列的技术基因,但将研究视野从语言模型扩展至多模态、脑科学、具身智能及微观生命科学等领域。这一系列模型包括原生多模态世界模型Emu3、脑科学多模态通用基础模型见微Brainμ、跨本体具身大小脑协作框架RoboOS 2.0与具身大脑RoboBrain 2.0,以及全原子微观生命模型OpenComplex2。这些模型不仅在技术架构上实现了突破,更在应用场景上展现出从微观到宏观、从虚拟到现实的广泛覆盖能力。

原生多模态世界模型Emu3是“悟界”系列的核心技术之一。该模型基于下一个token预测范式,通过新型视觉tokenizer将图像和视频编码为与文本同构的离散符号序列,构建了模态无关的统一表征空间。这一设计使得Emu3能够支持文本、图像、视频的任意组合理解与生成,为跨模态交互提供了强大的技术基座。例如,在机器人控制场景中,Emu3可以通过理解自然语言指令和视觉信息,直接生成对应的操作动作,显著提升了人机交互的效率与自然性。


脑科学多模态通用基础模型见微Brainμ则是“悟界”系列在生命科学领域的突破性成果。基于Emu3的底层架构,Brainμ将fMRI、EEG等脑信号统一token化,实现了多模态脑信号与文本、图像的双向映射。该模型整合了神经科学领域多个大型公开数据集和合作实验室的高质量数据,完成了超过100万单位的神经信号预训练。在自动化睡眠分型、感官信号重建等任务中,Brainμ的性能显著超越现有专有模型,并刷新了相关领域的SOTA表现。更令人瞩目的是,Brainμ在与脑机接口企业强脑科技BrainCO的合作中,首次在便携式消费级脑电系统上实现了感觉信号重建,为脑机接口技术的普及提供了新的可能性。

在具身智能领域,跨本体具身大小脑协作框架RoboOS 2.0与具身大脑RoboBrain 2.0的发布,标志着智源研究院在机器人智能体技术上的重大进展。RoboOS 2.0是全球首个支持无服务器一站式轻量化机器人本体部署的开源框架,其免适配注册机制显著降低了开发门槛,代码量仅为传统手动注册方式的1/10。RoboBrain 2.0则在任务规划和空间推理能力上实现了突破,新增了多本体时空记忆场景图共享机制和多粒度任务监控模块,有效提升了机器人任务执行的稳定性与成功率。目前,这两款模型已全面开源,并与全球20多家具身智能企业建立了战略合作关系,共同推动具身智能生态的发展。

全原子微观生命模型OpenComplex2则是“悟界”系列在微观生命科学领域的代表作。该模型通过融合扩散生成式建模与生物实验数据,在原子分辨率层面捕捉分子相互作用及平衡构象分布,为探索微观构象波动与宏观生物功能的跨尺度关联提供了全新视角。在蛋白质结构预测关键评估竞赛CASP16中,OpenComplex2成功预测了蛋白质T1200/T1300的空间构象分布,成为唯一取得该突破的团队。这一成果不仅为生物分子动态特性预测提供了新的工具,还将加速从基础分子机制研究到药物设计等下游应用的发展。


除了技术发布,本届智源大会还设置了丰富的互动体验展区,展示了“悟界”系列大模型在具身智能、脑科学、数字心脏等领域的实际应用。例如,基于RoboOS 2.0和RoboBrain 2.0的机器人展示了餐饮互动、抓娃娃和家居物品收纳等技能;Brainμ模型则通过与脑机接口设备结合,实现了消费级便携式脑电设备上的感觉信号重建。此外,智源研究院还与北京大学第一医院签署战略合作协议,共同推进“智慧医学系统”领域的研发与应用。

智源研究院院长黄铁军在大会上表示,“悟界”系列大模型的发布,标志着智源研究院在人工智能技术路线探索上迈出了新的步伐。从“悟道”到“悟界”,智源始终致力于解构物理世界与智能本质的深层关联,推动人工智能技术的开源开放与普惠发展。未来,智源研究院将继续携手全球合作伙伴,共同构建开放繁荣、协同共生的AI生态体系,为通用人工智能的实现贡献中国智慧。