研究发现心理健康诊断"黄金标准"可能导致患者被错误分类 - 健康研究

研究发现心理健康诊断"黄金标准"可能导致患者被错误分类‘Gold Standard’ for Mental Health Diagnosis May Leave Patients Miscategorized, Study Finds

环球医讯 / 健康研究来源：gizmodo.com美国 - 英语2026-06-02 11:02:24 - 阅读时长3分钟 - 1479字

加拿大麦克马斯特大学领导的一项针对57项研究的系统性回顾和元分析发现，心理健康评估中广泛使用的标准化诊断访谈(SDIs)可能存在显著的不一致性，对同一患者的重复评估结果往往不一致，精神障碍诊断的匹配率仅为65%左右，质疑了这些方法作为"黄金标准"的可靠性，该研究涵盖了来自26个国家8000多名患者的诊断数据，揭示了心理健康诊断标准在不同疾病类型间的可靠性差异，对现行心理健康评估体系提出了重要挑战。

一项由加拿大麦克马斯特大学心理学研究人员主导的系统性回顾和元分析，对57项研究中用于心理健康评估的标准化诊断访谈(SDIs)实践进行了严格审查，结果对这些问卷的可靠性提出了严重质疑。

当前心理健康实践的批评者指出，心理健康从业者仍在1980年版《精神疾病诊断与统计手册》(DSM III)的阴影下工作。正如一份医学期刊在2012年的一篇论文中所述，这一修订试图通过将所有心理障碍简化为可理解的体征和症状清单，来"掩盖精神动力学、行为学和神经生物学对精神疾病解释之间的宗派分歧"。

这项新的深入元分析涵盖了来自26个国家的8000多名成年人进行的SDIs，研究发现，即使在相隔仅几天的情况下，对同一患者通过两次单独的SDIs进行评估时，结果并不特别一致。更令人担忧的是，测试与重测之间的可靠性似乎因正在调查的心理健康问题而有显著差异。

麦克马斯特大学精神病学与行为神经科学系助理教授、该研究资深作者劳拉·邓肯在一份声明中表示："如果我们对同一个人进行两次相同的访谈，我们希望访谈能产生相同的结果，但情况并非总是如此。"

邓肯此前作为博士候选人时曾对健康研究方法学进行过批判性研究，她补充道："我们的发现表明，这些访谈并不像许多人认为的那样可靠或一致。"

观察者的眼睛

邓肯及其团队包括来自丹麦哥本哈根大学和波士顿马萨诸塞大学陈医学院的研究人员，他们指出，这些访谈对物质使用障碍的评估往往比对心理健康问题的评估更为可靠。

邓肯表示："这些差异表明，结构化访谈对行为或时间线更清晰的疾病效果更好，而对于严重依赖个人经验和解释的疾病则效果较差。"

在这项元分析中汇集的57项研究中，最终有46项被选中进行详细的交叉比较，使用了一种名为Cohen's kappa的统计方法来补偿访谈数据中未知的不精确性。

研究发现，对各种应对物质使用障碍的个体患者进行的SDI测试和重测，在约72%的情况下保持一致，而对精神障碍的SDI重测仅约65%的时间与其原始测试匹配。对于非情感性精神病（包括精神分裂症谱系障碍的类别）的SDIs测试，可靠性基本上是50/50；这些重测仅在55%的情况下得出相同结论。相比之下，双相情感障碍的重测在约74%的案例中与首次SDI结果匹配。

他们发现，在所研究的最一致的诊断中，阿片类药物成瘾测试的一致性高达81%。

差异巨大的世界

邓肯和她的同事们承认他们的系统性回顾存在"若干局限性"，包括"数据报告不完整"，他们写道，这包括可能影响46项研究中每项数据的某些变量的缺失信息。尽管如此，他们的结论是明确的。

研究人员在上周发表在《美国医学会杂志网络开放》(JAMA Network Open)上的研究中警告称，"重新管理典型的SDI（即获得第二次临床意见）将导致相当大比例患者的初始诊断结果被推翻。"

邓肯团队认为，这种差异很可能是因为心理健康状况——如焦虑、抑郁或精神病性障碍——是更加主观的体验，其表现方式不仅高度个性化，而且在单个患者的一生中会随时间变化。

邓肯表示："可靠的诊断可能需要将标准化工具与关于疾病进程和复杂性的知识相结合，这些知识可能影响诊断的可靠性评估。"

换句话说，SDIs应该在保留一定质疑态度的同时，辅以一些诊断备份，认识到其局限性并将结果与更多背景信息整合。邓肯表示，至少"我们应该重新考虑将其视为评估的'黄金标准'"。

【全文结束】