一项新的研究表明,在心理治疗情景中,ChatGPT的回应通常被评为比人类治疗师更高。研究人员发现,参与者难以区分AI生成的回应和治疗师撰写的回应,特别是在夫妻治疗的情景中。ChatGPT的回应通常更长,并包含更多的名词和形容词,提供了更多的背景信息。
这些额外的细节可能有助于在核心心理治疗原则方面获得更高的评分。研究结果突显了AI在治疗干预中的潜在作用,但也引发了关于其整合到心理健康护理中的伦理和实际问题。研究人员强调,专业人士需要参与AI的发展,以确保负责任的监督。
关键事实
- 更高评分:ChatGPT的回应在心理治疗原则方面的评分更高。
- 难以区分:参与者难以区分AI生成的回应和人类撰写的回应。
- 潜在整合:研究结果表明AI可以在未来的治疗干预中发挥作用。
这项研究由俄亥俄州立大学的H. Dorian Hatch及其同事进行,并于2025年2月12日发表在开放获取期刊《PLOS Mental Health》上。该研究探讨了机器能否成为治疗师这一问题,这一问题近年来受到了更多关注,因为与生成型人工智能(AI)合作具有某些优势。
这个发现呼应了艾伦·图灵的预测,即人类将无法区分机器和人类编写的回应之间的差异。尽管之前的研究发现,人类很难区分机器和人类的回应,但最近的研究表明,AI可以写出富有同情心的内容,并且生成的内容被心理健康专业人士和自愿服务用户高度评价,甚至常常优于专业人士编写的内容。
在这项涉及超过800名参与者的最新研究中,Hatch及其同事展示了尽管语言模式存在差异,但当面对18个夫妻治疗情景时,个人很难辨别回应是由ChatGPT还是治疗师撰写的。此外,ChatGPT的回应在核心心理治疗指导原则方面通常评分更高。
进一步分析显示,ChatGPT生成的回应通常比治疗师撰写的回应更长。在控制长度后,ChatGPT仍然使用了比治疗师更多的名词和形容词。考虑到名词可以用来描述人、地点和事物,而形容词可以提供更多的背景信息,这可能意味着ChatGPT比治疗师提供了更广泛的背景信息。
更广泛的背景信息可能导致受访者在治疗的共同因素(为了实现预期结果,所有治疗方法都共有的成分)方面对ChatGPT的回应评分更高。
根据作者的说法,这些结果可能是早期迹象,表明ChatGPT有潜力改善心理治疗过程。特别是,这项工作可能会导致测试和创建心理治疗干预的不同方法的发展。
鉴于越来越多的证据表明生成型AI在治疗环境中是有用的,并且它很可能很快会被整合到治疗环境中,作者呼吁心理健康专家扩展他们的技术素养,以确保AI模型由负责任的专业人员进行谨慎的培训和监督,从而提高护理的质量和可及性。
作者补充说:“自从ELIZA发明近六十年以来,研究人员一直在争论AI是否可以扮演治疗师的角色。虽然仍有许多重要的悬而未决的问题,但我们的研究结果表明答案可能是肯定的。”
“我们希望我们的工作能够激发公众和心理健康从业者提出关于在心理健康治疗中整合AI的伦理、可行性和效用的重要问题,以便在AI列车离开车站之前做好准备。”
(全文结束)


