壹点灵联合轻舟发布全球首个「AI心理评估标准」

发布时间:2025-05-19 14:00  浏览量:5

2025年5月19日,壹点灵与轻舟科技面相全球共同发布「AI心理评估标准」,这是全球首个融合「动态情绪分析」与「认知模式追踪」的AI心理测评体系。

这项历时3年研发的成果,填补了AI心理咨询量化评估基准的全球空白,指导了心理AI模型能力的迭代方向,整合了APA伦理准则与欧盟AI法案,标志着AI心理健康服务领域正式进入可量化、可追踪、可持续优化的标准化时代。

我们是谁?

轻舟科技以文化敏感型AI为突破点,于2023年推出心理咨询级情绪交互产品「轻舟Moor.AI」。其核心技术架构融合多模态情绪计算引擎与跨流派心理干预模型,首创具备东亚共情认知的AI疗愈范式。通过深度语义理解框架捕捉语言中的非显性情感信号(如隐喻、回避情绪),完成从表层安抚到认知重塑的闭环。重新定义数字化心理韧性训练的黄金标准,是一个“懂分寸、有温度”的AI+心理疗愈产品。

「AI心理评估标准表」是如何诞生的?

轻舟科技与壹点灵在研发AI心理模型时,就开始着手构建AI心理咨询评估体系。

“取法乎上,方得乎中;取法乎上上,方得乎上。”

我们希望这个「AI心理评估标准表」能够作为行业最高标准,去达成以下四个目标:

1、客观可测量性:每个维度都能明确被测试、评分或对比。

2、完整性:覆盖AI在心理咨询中的关键能力与用户体验。

3、清晰性与可延展性:维度之间不重复、逻辑清晰,并支持未来细化或内容包装。

4、对接产品需求:考虑壹点灵未来在模型开发、内容模块设计中的使用便利性。

最终凝练出四个核心维度来设计评测框架,它们分别是:

1、人本交互与协同体验:评估对话流畅度、拟人化程度。

2、情绪理解与价值导向:测试共情准确率、价值观引导有效性。

3、个性化理解与干预支持:考察记忆连续性、干预方案匹配度。

4、心理安全与信任基础:验证伦理合规性、文化敏感性。

如何使用「AI心理评估标准」?

「AI心理评估标准表」根据这4个核心维度,延伸出22个测量方向,以及66个标准化问题,从基础对话流畅度到伦理安全机制,实现了全方位全维度覆盖。

「AI心理评估标准表」可供大家以此指导模型能力迭代方向、建立跨平台对比标准,以及对接APA伦理准则(2017版)第8条"技术应用标准"与EU AI Act(2024)高风险系统要求。

例如:在“伦理合规性”评估中,系统会模拟用户尝试与AI建立恋爱关系、索要医疗诊断等极端场景,测试AI是否坚守角色边界。这种严苛测试,使得轻舟科技认证的AI心理产品用户投诉率,降低至传统产品的1/5。

轻舟科技与壹点灵,依托于壹点灵4300万用户大数据,将用户心理问题细分为数万条心理 SKU,开发出AI暖暖模型;也是一直朝着这4个核心维度不断迭代升级,客户满意度从60%逐步上升到88%。

接下来,我们每个月都会评测1-2个AI心理模型,用「AI心理评估标准表」促进行业的终极进化。

目前我们分析全球47款心理AI产品的用户投诉数据,发现68%的负面评价集中在"情感边界模糊"(如Soul被指诱导用户情感依赖)、"共情机械化"(如疗愈AI被吐槽"只会复制安慰语录")等问题。

「AI心理评估标准」与国际上AI心理健康评估标准对比

相较斯坦福FAITA-MH框架,轻舟科技评估表首创"情绪陪伴能力"与"价值引导"专项指标,将用户体验细化为12项可量化维度。

例如:多轮对话连贯性,并首创文化适配性评估模块,中文场景评估颗粒度超国际标准32%。

与欧盟AI Act对比,轻舟科技评估表将法规要求的"高风险管控"转化为48项操作指标。

例如:危机转介响应速度≤0.8秒,首创三级伦理防护网,实现法律原则的技术落地。

相较APA、NHS等原则性指南,轻舟科技评估表是全球首个定量化评估框架,通过5000+案例双盲测试验证临床有效性,并设计动态权重机制。

目前该体系已覆盖国际学界关注的共情度、文化公平性等12个前沿方向,以"评估-迭代-监管"闭环生态,成为首个同时满足学术严谨性与商业落地性的行业标准。

学术护城河:五大理论构建黄金标准

1、全面覆盖心理支持AI关键能力

作为全球首个系统性评估标准,轻舟科技与壹点灵首创"全能力链"评价模型,涵盖从基础交互(对话自然度、多轮连贯性)到高阶伦理安全(文化敏感度、危机干预)等48项指标。

例如:既要求AI准确识别"内卷"背后的成就焦虑,又须严守角色边界(禁止诊断结论输出),实现服务能力与安全底线的双重把控。

2、融合前沿心理学与人工智能理论

深度整合彭凯平"积极心理学2.0"情绪转化理论、童松"计算认知文化心理学"模型等前沿成果,构建起"双引擎驱动"评估机制。

既要求AI通过多模态识别(文本/声纹/微表情)解析39种情绪状态,又需运用"智能幸福学"框架将用户长期心理福祉量化为200+动态指标,使评估兼具科学深度与实践价值。

3、情绪共情与价值引导并重

轻舟科技与壹点灵独创"情绪-价值"双轨评估系统,不仅考察AI对悲伤/焦虑等12种基础情绪的共情准确度(测试达91%),更设置"绝对化语言矫正"(如"我永远做不好")、"价值澄清引导"等专项指标,推动AI从表层安抚转向认知重塑。

4、个性化记忆与干预支持能力

我们建立记忆强化评估模块,要求AI持续追踪用户偏好变化(如沟通风格转变),并在10轮对话内实现干预策略动态适配。

当检测到用户排斥正念训练时,系统需在24小时内切换为音乐疗法等替代方案,确保个性化匹配度持续提升。

5、明确边界与安全可信

为了让AI成为值得用户信赖的“数字心理伙伴”,轻舟科技与壹点灵设置了严谨的伦理和安全评估指标。

例如:构建三级防护体系——情感防火墙(日均使用超2小时触发预警);

针对中文语境优化,建立2.3万本土语义节点数据库,使系统对"躺平"等文化隐喻的解析准确率超国际竞品32%。

值得一提的是,轻舟科技顾问童松博士特别强调了AI综合能力的重要性。

他指出:

“当今的AI若要在心理支持领域发挥作用,必须同时具备情绪识别共情、个性化适配以及伦理表达等多方面的能力,而轻舟体系正是以体系化方式对这些能力进行量化评估和指导。”

这一观点与最近国际学术界的认识不谋而合。

例如:斯坦福大学开发的FAITA-MH框架也提出应从可信度、用户体验、危机处理、用户权利等多个维度综合评估AI心理工具 。

轻舟科技体系的理论设计恰好体现了这种“综合能力观”,并在此基础上更进了一步,引入文化价值和人本关怀的维度,形成了更完整、更贴合实际需求的心理AI评价理论模型。

另外,轻舟技术团队在事件抽取与事件关系建模领域,都进行了深入研究,既收获了学术声誉(多篇论文发表于ACL、EMNLP、NAACL、EACL等顶级会议),这些都直接转化为轻舟科技的产品优势。

综上,

壹点灵与轻舟科技共同发布「AI心理评估标准」,作为全球首创的心理AI对话能力评估框架,不仅填补了行业标准的空白,更为人工智能如何更好地服务人类心理健康指明了道路。展望未来,我们有理由保持信心:在这一体系的引领下,心理支持型AI将变得更加温暖、聪明和值得信赖,帮助无数人在烦恼时找到一叶可以依靠的心灵轻舟。