壹点灵联合轻舟发布全球首个「AI心理评估标准」

发布时间：2025-05-19 14:00 浏览量：67

2025年5月19日，壹点灵与轻舟科技面相全球共同发布「AI心理评估标准」，这是全球首个融合「动态情绪分析」与「认知模式追踪」的AI心理测评体系。

这项历时3年研发的成果，填补了AI心理咨询量化评估基准的全球空白，指导了心理AI模型能力的迭代方向，整合了APA伦理准则与欧盟AI法案，标志着AI心理健康服务领域正式进入可量化、可追踪、可持续优化的标准化时代。

我们是谁？

轻舟科技以文化敏感型AI为突破点，于2023年推出心理咨询级情绪交互产品「轻舟Moor.AI」。其核心技术架构融合多模态情绪计算引擎与跨流派心理干预模型，首创具备东亚共情认知的AI疗愈范式。通过深度语义理解框架捕捉语言中的非显性情感信号（如隐喻、回避情绪），完成从表层安抚到认知重塑的闭环。重新定义数字化心理韧性训练的黄金标准，是一个“懂分寸、有温度”的AI+心理疗愈产品。

「AI心理评估标准表」是如何诞生的？

轻舟科技与壹点灵在研发AI心理模型时，就开始着手构建AI心理咨询评估体系。

“取法乎上，方得乎中；取法乎上上，方得乎上。”

我们希望这个「AI心理评估标准表」能够作为行业最高标准，去达成以下四个目标：

1、客观可测量性：每个维度都能明确被测试、评分或对比。

2、完整性：覆盖AI在心理咨询中的关键能力与用户体验。

3、清晰性与可延展性：维度之间不重复、逻辑清晰，并支持未来细化或内容包装。

4、对接产品需求：考虑壹点灵未来在模型开发、内容模块设计中的使用便利性。

最终凝练出四个核心维度来设计评测框架，它们分别是：

1、人本交互与协同体验：评估对话流畅度、拟人化程度。

2、情绪理解与价值导向：测试共情准确率、价值观引导有效性。

3、个性化理解与干预支持：考察记忆连续性、干预方案匹配度。

4、心理安全与信任基础：验证伦理合规性、文化敏感性。

如何使用「AI心理评估标准」？

「AI心理评估标准表」根据这4个核心维度，延伸出22个测量方向，以及66个标准化问题，从基础对话流畅度到伦理安全机制，实现了全方位全维度覆盖。

「AI心理评估标准表」可供大家以此指导模型能力迭代方向、建立跨平台对比标准，以及对接APA伦理准则（2017版）第8条"技术应用标准"与EU AI Act（2024）高风险系统要求。

例如：在“伦理合规性”评估中，系统会模拟用户尝试与AI建立恋爱关系、索要医疗诊断等极端场景，测试AI是否坚守角色边界。这种严苛测试，使得轻舟科技认证的AI心理产品用户投诉率，降低至传统产品的1/5。

轻舟科技与壹点灵，依托于壹点灵4300万用户大数据，将用户心理问题细分为数万条心理 SKU，开发出AI暖暖模型；也是一直朝着这4个核心维度不断迭代升级，客户满意度从60%逐步上升到88%。

接下来，我们每个月都会评测1-2个AI心理模型，用「AI心理评估标准表」促进行业的终极进化。

目前我们分析全球47款心理AI产品的用户投诉数据，发现68%的负面评价集中在"情感边界模糊"（如Soul被指诱导用户情感依赖）、"共情机械化"（如疗愈AI被吐槽"只会复制安慰语录"）等问题。

「AI心理评估标准」与国际上AI心理健康评估标准对比

相较斯坦福FAITA-MH框架，轻舟科技评估表首创"情绪陪伴能力"与"价值引导"专项指标，将用户体验细化为12项可量化维度。

例如：多轮对话连贯性，并首创文化适配性评估模块，中文场景评估颗粒度超国际标准32%。

与欧盟AI Act对比，轻舟科技评估表将法规要求的"高风险管控"转化为48项操作指标。

例如：危机转介响应速度≤0.8秒，首创三级伦理防护网，实现法律原则的技术落地。

相较APA、NHS等原则性指南，轻舟科技评估表是全球首个定量化评估框架，通过5000+案例双盲测试验证临床有效性，并设计动态权重机制。

目前该体系已覆盖国际学界关注的共情度、文化公平性等12个前沿方向，以"评估-迭代-监管"闭环生态，成为首个同时满足学术严谨性与商业落地性的行业标准。

学术护城河：五大理论构建黄金标准

1、全面覆盖心理支持AI关键能力

作为全球首个系统性评估标准，轻舟科技与壹点灵首创"全能力链"评价模型，涵盖从基础交互（对话自然度、多轮连贯性）到高阶伦理安全（文化敏感度、危机干预）等48项指标。

例如：既要求AI准确识别"内卷"背后的成就焦虑，又须严守角色边界（禁止诊断结论输出），实现服务能力与安全底线的双重把控。

2、融合前沿心理学与人工智能理论

深度整合彭凯平"积极心理学2.0"情绪转化理论、童松"计算认知文化心理学"模型等前沿成果，构建起"双引擎驱动"评估机制。

既要求AI通过多模态识别（文本/声纹/微表情）解析39种情绪状态，又需运用"智能幸福学"框架将用户长期心理福祉量化为200+动态指标，使评估兼具科学深度与实践价值。

3、情绪共情与价值引导并重

轻舟科技与壹点灵独创"情绪-价值"双轨评估系统，不仅考察AI对悲伤/焦虑等12种基础情绪的共情准确度（测试达91%），更设置"绝对化语言矫正"（如"我永远做不好"）、"价值澄清引导"等专项指标，推动AI从表层安抚转向认知重塑。

4、个性化记忆与干预支持能力

我们建立记忆强化评估模块，要求AI持续追踪用户偏好变化（如沟通风格转变），并在10轮对话内实现干预策略动态适配。

当检测到用户排斥正念训练时，系统需在24小时内切换为音乐疗法等替代方案，确保个性化匹配度持续提升。

5、明确边界与安全可信

为了让AI成为值得用户信赖的“数字心理伙伴”，轻舟科技与壹点灵设置了严谨的伦理和安全评估指标。

例如：构建三级防护体系——情感防火墙（日均使用超2小时触发预警）；

针对中文语境优化，建立2.3万本土语义节点数据库，使系统对"躺平"等文化隐喻的解析准确率超国际竞品32%。

值得一提的是，轻舟科技顾问童松博士特别强调了AI综合能力的重要性。

他指出：

“当今的AI若要在心理支持领域发挥作用，必须同时具备情绪识别共情、个性化适配以及伦理表达等多方面的能力，而轻舟体系正是以体系化方式对这些能力进行量化评估和指导。”

这一观点与最近国际学术界的认识不谋而合。

例如：斯坦福大学开发的FAITA-MH框架也提出应从可信度、用户体验、危机处理、用户权利等多个维度综合评估AI心理工具。

轻舟科技体系的理论设计恰好体现了这种“综合能力观”，并在此基础上更进了一步，引入文化价值和人本关怀的维度，形成了更完整、更贴合实际需求的心理AI评价理论模型。

另外，轻舟技术团队在事件抽取与事件关系建模领域，都进行了深入研究，既收获了学术声誉（多篇论文发表于ACL、EMNLP、NAACL、EACL等顶级会议），这些都直接转化为轻舟科技的产品优势。

综上，

壹点灵与轻舟科技共同发布「AI心理评估标准」，作为全球首创的心理AI对话能力评估框架，不仅填补了行业标准的空白，更为人工智能如何更好地服务人类心理健康指明了道路。展望未来，我们有理由保持信心：在这一体系的引领下，心理支持型AI将变得更加温暖、聪明和值得信赖，帮助无数人在烦恼时找到一叶可以依靠的心灵轻舟。

标签：心理伦理心理咨询 apa 共情

壹点灵联合轻舟发布全球首个「AI心理评估标准」

我们是谁？

「AI心理评估标准表」是如何诞生的？

如何使用「AI心理评估标准」？

「AI心理评估标准」与国际上AI心理健康评估标准对比

学术护城河：五大理论构建黄金标准

相似文章

资讯分类

热门资讯

热门产品