人工智能(AI)迅速改变了多个行业,其在心理学领域的潜力也不例外。心理研究和临床实践中最复杂和耗时的任务之一是叙事评估,专家们通过分析故事来评估人格特质、情绪和思维模式。传统上,这一过程需要广泛的人类专业知识,因此速度慢且资源密集。然而,最近的一项研究表明,当由专家设计的提示引导时,AI可以像训练有素的心理学家一样可靠地评估心理叙事。
这项名为《从Llama到语言:提示工程使通用人工智能能够像专家心理学家一样评估叙事》的研究,由Barry Dauphin和Caleb Siefert发表在《前沿人工智能》(2025年),探讨了AI聊天机器人是否可以可靠地进行心理评估。通过使用优化的提示工程过程,研究人员使如ChatGPT-4和CLAUDE-2-100k等AI模型能够以高精度和一致性评估叙事。他们的发现为AI在心理评估中的作用提供了突破性的见解。
提示工程在心理评估中的力量
该研究探索了专家设计的提示是否可以使AI聊天机器人使用社会认知和人际关系量表——全球评分方法(SCORS-G)评估叙事。SCORS-G基于各种认知、情感和人际维度评估心理叙事,要求专业知识才能正确应用。
研究人员遵循了一个结构化的提示优化过程,专家们通过多次迭代改进AI生成的提示。最初,聊天机器人难以产生准确的评分。但在引入专家设计的提示后,AI模型在评分一致性和可靠性方面表现出显著改进。研究比较了基本提示、单次提示和专家优化的提示,发现只有专家优化的提示达到了与人类评分者相当的可靠性分数。
此外,研究人员测试了结合两个不同AI模型——ChatGPT-4和CLAUDE-2-100k——的评分是否会提高准确性。他们发现平均AI评分进一步提高了可靠性,减少了不一致性和缓解了个别模型的偏差。这表明多个AI模型可以相互补充,增强心理评估的效果。
AI作为研究助手:机器能否匹敌人类心理学家?
该研究的一个最引人注目的发现是,当给予优化的提示时,AI模型在可靠性方面可以匹敌甚至超过人类评分者。AI能够在几分钟内处理大量叙事数据,而人类专家则需要数月时间。这表明AI有可能彻底改变人格研究。这对于心理学领域具有重大意义,因为主观评价叙事数据历来是缓慢且昂贵的过程。
此外,AI有潜力检测到人类可能忽略的叙事中的微妙模式。在临床心理学中,这可以帮助识别心理健康状况的早期迹象,改进人格评估,并协助治疗计划。研究还强调了AI在减少人类评估中的偏见和疲劳方面的潜力,因为它可以在长时间内保持一致的表现而不出现认知衰退。
然而,尽管有这些好处,研究人员警告不要完全取代人类评估者。虽然AI在评估全球心理特征方面表现有效,但某些细微的叙事解释仍需人类判断。目前,AI可以作为心理学家的强大助手,而不是替代品。
使用AI进行心理评估的挑战和伦理考虑
尽管结果令人鼓舞,该研究承认使用AI进行心理评估存在关键挑战和伦理问题。一个主要问题是数据隐私,敏感的个人叙事必须防止未经授权的访问。此外,AI偏差仍然是一个问题,因为基于有偏差的数据集训练的模型可能会在其评估中引入无意的扭曲。
另一个挑战是AI生成评分的可解释性。虽然AI可以提供评分和摘要,但心理学家必须了解AI如何得出结论,以确保其评估与人类专业知识一致。研究建议,在完全整合到临床环境之前,需要提高AI决策过程的透明度。
此外,必须解决AI在心理健康决策中的伦理影响。随着AI在心理学中扮演更大角色,需要明确的指南和监管框架,以确保负责任的使用,防止滥用并维持人类监督。
AI在心理研究和临床实践中的未来
该研究得出结论,AI有潜力改变基于叙事的心理学研究和评估。通过进一步优化提示工程,AI模型可以帮助诊断心理健康状况,跟踪治疗进展,并提高人格评估的效率。
未来的研究应探索AI评估更多样化的叙事数据集的能力,并评估不同的语言模型(如GPT-4、Gemini和Llama)是否产生相似的结果。此外,将AI驱动的心理评估与传统诊断工具相结合,可以创建一个结合人类专业知识和AI效率的混合模型。
最终,这项研究代表了AI辅助心理学的重要一步,展示了专家指导的AI模型如何增强临床研究和实践。尽管AI尚未成为人类心理学家的替代品,但它有望成为提高心理评估速度、准确性和可及性的宝贵工具。
(全文结束)


