一项开创性的研究表明,人工智能(特别是经过预训练的ChatGPT-4)可以在心理治疗培训的关键领域匹配甚至超越人类督导。这项名为《AI技术能否支持临床督导?评估ChatGPT的潜力》的研究发表在《信息学》期刊上,由意大利顶级格式心理治疗研究所的多机构研究团队进行。他们的发现为未来混合式临床心理学督导提供了令人鼓舞的一瞥,其中人类专业知识可以被AI增强,而不是被取代。
该研究探讨了ChatGPT-4是否能够为心理治疗实习生提供有意义的督导反馈,通过比较未经训练的AI、经过格式治疗提示微调的预训练AI模型以及合格的人类督导的输出结果。每种形式的督导反馈都通过一个16项Likert满意度问卷由实习生进行盲测评估。关键绩效指标包括情感共鸣、专业相关性、治疗指导和教学清晰度。统计结果显示,一个经过良好校准的AI界面可以在多个督导维度上与人类输入相媲美甚至超越。
ChatGPT能否在心理治疗培训中提供具有临床意义的反馈?
该研究使用了一个标准化的临床案例,并将其提交给三种类型的督导:未经预训练的ChatGPT-4(Fb1)、经过目标格式治疗督导预训练的ChatGPT-4(Fb2)和一个人类专家(Fb3)。该案例包括全面的信息:病史、人格分析、治疗师会话记录和早期心理治疗互动中的主观体验。
71名格式心理治疗实习生对每种来源的反馈进行了盲审。他们在清晰度、相关性、同理心、情感影响、专业适用性和实用性等方面进行评分。主成分分析(PCA)显示了四个主要组成部分:关系和情感维度、教学和技术质量、治疗支持和发展、职业导向和适应性。
经过训练的AI(Fb2)在几乎所有这些组成部分上都显著优于未经训练的AI(Fb1),甚至在职业导向和适应性方面超过了人类督导(Fb3)。这一维度包括与受督者的成长阶段对齐、合同定义的有用性以及与专业伦理和标准的相关性等指标。实习生还对经过训练的AI的情感影响和同理心语气给予了更高的评价,表明当适当引导时,AI在语言上模拟情感深度方面具有惊人的能力。
经过训练的AI在哪些方面优于未训练的AI和人类督导?
最显著的差异出现在关系和情感维度上,Fb2在这方面的评分显著高于Fb1,并且与Fb3大致相当。这表明经过适当预设的AI可以生成与实习生产生情感共鸣的反馈,即使它缺乏真正的意识。关键指标包括感知到的同理心、情感影响和支持自我反思和自信建设。在这个领域,Fb2特别受到赞扬,因为它整合了格式特定的技术并反映了治疗师的主观性——这些技能通常被认为是人类督导独有的。
在职业导向和适应性类别中,经过训练的AI超过了未训练的AI和人类督导。它在处理治疗合同方面表现出色,根据实习生的技能水平定制建议,并促进职业发展。值得注意的是,预训练的AI在生成具有强烈发展框架的可操作指导方面也更有效——这对于仍在寻找临床声音的治疗师来说至关重要。
虽然在教学和技术质量及治疗支持方面的统计差异较小,但Fb2仍然保持竞争力。它展示了与临床案例的高度相关性、强大的技术分析能力以及对优点和改进领域的平衡呈现。这种整体可靠性,结合在同理心和适应性方面的进步,标志着AI在临床语言建模能力上的重大进化。
AI能否成为心理治疗混合式督导的可靠组成部分?
这项研究的影响是巨大的。研究作者建议,特别是通过系统性提示预训练的AI,可以作为增强传统督导实践的可行工具。AI不是取代人类督导,而是作为一个一致、即时且始终可用的反馈机制,尤其有助于填补督导空白、减少治疗师的职业倦怠并加速专业发展。
对于心理治疗实习生而言,这意味着在预定会话之间可以获得实时督导见解。对于机构而言,这表明通过AI辅助平台标准化早期督导的可能性,确保培训质量的公平性。研究还指出,随着提示迭代,尤其是基于格式理论框架,ChatGPT模拟治疗师语言和解释复杂心理治疗过程的能力不断提高。
然而,研究并没有回避局限性。它承认情感复杂性、文化背景和临床直觉仍然是独特的人类能力。此外,研究的单案例焦点和同质实习生样本限制了更广泛的推广。在情感敏感环境中使用AI的伦理问题仍然存在,特别是在数据隐私、情感误解和过度依赖机器生成的同理心方面。
(全文结束)


