我们现在有了科学依据来支持关于聊天机器人在心理健康支持方面的价值的传闻证据。
无论你喜不喜欢,聊天机器人已经成为了我们生活中的一部分。越来越多的人开始转向Claude和ChatGPT等工具寻求个人帮助,但在此之前,关于它们在心理健康方面的价值只有传闻证据。直到现在。
达特茅斯学院的研究人员进行了首次此类试验,使用该学院开发的生成式AI聊天机器人来量化这种新技术模型对有心理健康挑战的人的有效性。在这项研究中,106名来自美国各地的参与者被诊断为重度抑郁症(MDD)、广泛性焦虑症(GAD)或饮食障碍,他们参与了为期四周的随机临床试验。对照组从第四周开始到第八周可以访问名为Therabot的智能手机聊天机器人。
与ChatGPT等聊天机器人不同,Therabot会主动与参与者互动,提出关于情绪和情感的问题,鼓励用户回应并进一步参与对话。试验结束时,大约四分之三没有其他心理健康干预措施的Therabot用户根据症状缓解指标进行了评估。
患有抑郁症的参与者报告称,他们的症状平均减轻了51%,特别是在情绪和整体幸福感方面有所改善。同时,GAD群体报告称其症状平均减少了31%,这使得许多人的临床焦虑水平从中度降至轻度,或从轻度降至低于诊断阈值。对于有饮食障碍的参与者,他们在身体形象方面的平均改善率为19%——鉴于通过传统方法治疗该病症的难度,这一结果尤为令人印象深刻。
“我们在症状改善方面观察到的结果与传统门诊治疗的效果相当,这表明这种AI辅助的方法可能提供临床上有意义的好处,”高级作者、达特茅斯盖塞尔医学院副教授尼古拉斯·雅各布森表示。“没有什么能替代面对面的护理,但目前可供选择的提供者数量远远不足。”
在我们最近关于使用聊天机器人进行心理健康支持的文章中,我们也强调了这一点:由于缺乏负担得起且及时的治疗方法,许多人因各种原因而无法获得帮助。研究人员补充说,在美国,需求远超供给,每约1600名需要支持的临床焦虑或抑郁患者只有一名治疗师。虽然聊天机器人尚未为此类工作接受培训(至少目前如此),但它们提供了随时可用的24/7服务,使人们在需要时能够求助——这种实时可靠性建立了信任。
“我们希望看到生成式AI能够为系统外大量需要心理健康支持的人提供帮助,”雅各布森补充道。“我认为人与人之间的治疗和基于软件的治疗可以共同发挥作用。”
如果你曾经使用过聊天机器人寻求心理健康支持,你可能会发现它在当时是有帮助的。尽管这项技术正在迅速进步,但医疗保健专业人员仍对其建议和反馈持谨慎态度。
“虽然这些结果非常有前景,但没有任何生成式AI代理准备好在心理健康领域完全自主运作,因为在这种情况下它可能会遇到非常广泛的风险情境,”第一作者、达特茅斯希契科克医学中心助理教授兼精神病学家迈克尔·海因兹表示。“我们仍需更好地了解和量化在心理健康背景下使用生成式AI的相关风险。”
与其他现有聊天机器人不同,Therabot是在心理学家和精神科医生的咨询下专门为用作心理健康支持工具而开发的。因此,用户会对提示收到开放式回复,鼓励他们进一步谈论自己的担忧和情绪状态。在试验期间,设置了防护措施以识别任何有自残风险的参与者,并提供可点击的紧急护理链接。
在最初的四周试验后,用户(包括对照组)又获得了四个星期的Therabot访问权限,但这次没有应用程序主动提示。参与者继续与聊天机器人互动。
总体而言,人们在整个试验期间与Therabot交流的时间约为六个小时,相当于八次与治疗师的会话。并且在症状通常最明显的时段,如深夜,使用量有所增加。试验提示阶段结束后继续使用的现象表明,用户对这个工具形成了一定程度的信任和依赖。
“我们没想到人们几乎把这款软件当成朋友一样对待,”雅各布森说。“这说明他们实际上与Therabot建立了关系。”
“我的感觉是,人们觉得与机器人交谈更自在,因为它不会评判他们,”他补充道。
参与者表示,他们更愿意坦诚地向Therabot敞开心扉,但这项研究并未评估这种好处本身如何有助于症状缓解。尽管研究人员警告不要过度依赖这项未经充分研究的技术,但研究表明,对此既有需求也有益处。
“我们的结果与那些能够接受黄金标准认知疗法的患者所获得的效果相当,”雅各布森说。“我们谈论的是在较短时间内提供相当于最佳治疗的效果。”
“自从ChatGPT发布以来,有很多公司急于进入这个领域,很容易推出看起来不错的概念验证,但其安全性和有效性尚未得到充分验证,”他补充道。“这是一个需要严格监管的情况,提供这种监管确实使我们在这一领域脱颖而出。”
该研究发表在《新英格兰医学杂志:NEJM AI》上
来源:达特茅斯学院
(全文结束)


