辛辛那提儿童医院医疗中心与伦敦大学学院和橡树岭国家实验室合作的研究人员发现了一种实用的以数据为中心的策略,可减少用于儿童心理健康护理的人工智能(AI)系统中的偏见。该研究结果发表在《通讯医学》(Communications Medicine)期刊上,解决了日益关注的问题:为临床医生提供辅助的AI工具可能在不同患者群体中表现不均等。
先前研究表明,一些心理健康模型对女孩的诊断准确性低于男孩。这项新的国际研究表明,有针对性地改进训练数据可显著减少这些差异——同时不会降低模型的整体性能。
检测表现不均等
研究团队分析了来自电子健康记录的近20,000例儿科焦虑病例。他们发现,AI模型更有可能漏诊女性青少年的焦虑症状。这种表现差距在青春期最为明显——这一时期女孩的焦虑症患病率显著增加。
"我们的研究表明,模型表现的差异并非不可避免,"伦敦大学学院教授、该研究的主要作者朱莉娅·艾夫(Julia Ive)博士说。"通过仔细研究AI系统如何从临床记录中学习,我们能够识别出导致这种偏见的训练数据模式,并展示了解决这些问题的具体步骤。"
心理健康AI中偏见产生的原因
与许多依赖实验室数值或影像的医疗AI系统不同,心理健康工具通常分析非结构化的临床记录,以检测早期预警信号。研究发现,关于男性患者的记录平均比关于女性患者的记录长约500字,并且在语言模式和信息密度方面存在差异。
这些差异并非有意为之。然而,由于AI系统直接从记录模式中学习,这种差异可能会影响模型如何解释症状并生成预测。
"AI中的偏见很少源于恶意意图——它反映了嵌入在数据中的模式,"辛辛那提儿童医院医疗中心"解码心理健康计划"(Decode Mental Health Program)的联合主任、该研究的资深作者约翰·佩斯蒂安(John Pestian)博士说。"在心理健康护理中,预测系统严重依赖书面临床记录,护理和记录方式的差异可能会塑造AI如何解释患者信息并得出结论。"
以数据为中心的方法
研究团队没有重新设计AI系统,而是专注于改进用于训练它的信息。为此,研究人员使用先进的语言处理工具去除信息量较少的文本,平衡了女孩和男孩之间具有临床意义的信息,并将性别特定的名称和代词替换为中性术语,同时保持临床背景的完整性。
这些有针对性的调整将诊断偏见降低了高达27%,同时保持了整体准确性并提高了预测的可信度。
"这项研究表明,提高公平性并不一定需要更复杂的模型,"艾夫说。"仔细关注临床信息的结构和表示方式可以产生可衡量的影响。"
临床意义
焦虑症是影响儿童和青少年的最常见心理健康问题之一。它们通常逐渐发展,并可能在不同发育阶段和不同性别之间呈现不同的症状。早期识别和及时治疗至关重要。
"青春期是焦虑症在女孩中特别普遍的时期,"辛辛那提儿童医院医疗中心的儿科焦虑症专家、该研究的合著者杰弗里·斯特劳恩(Jeffrey Strawn)博士说。"如果AI工具对该人群的敏感性较低,我们可能会在关键的发育窗口期延迟识别和治疗。"
"随着AI越来越多地融入儿科护理,对偏见的严格评估至关重要,"辛辛那提儿童医院医疗中心"解码心理健康计划"的联合主任特蕾西·格劳瑟(Tracy Glauser)博士说。"这些系统旨在支持临床医生。确保在不同人群中表现公平既是科学责任,也是道德责任。"
"AI的进步通常以计算能力来衡量,"佩斯蒂安说。"但其持久影响将通过信任来衡量。通过加强指导这些系统的数据,我们帮助确保它们以公平、可靠且值得我们服务的家庭信赖的方式支持临床医生。"
【全文结束】

