自主AI系统筛查认知障碍Autonomous AI Flags Cognitive Impairment With 98% Specificity | Technology Networks

环球医讯 / 认知障碍来源:www.technologynetworks.com美国 - 英语2026-01-21 18:51:41 - 阅读时长3分钟 - 1437字
麻省总医院布里格姆医疗系统研究团队开发出全球首个全自主人工智能系统,该系统无需人工干预即可通过常规临床文档筛查认知障碍,在真实世界验证中特异性高达98%。系统采用五个专业智能体组成的"数字临床团队",通过迭代协作优化判断并提升准确性,已开源工具Pythia供医疗系统部署。研究分析3300余份临床笔记发现,AI在58%的人机分歧案例中被专家验证正确,但在真实条件下敏感性降至62%,特异性保持98%,凸显临床AI校准挑战。研究人员强调需公开此类问题以建立医疗AI信任,为阿尔茨海默病等早期干预提供新路径。
认知障碍自主AI系统临床文档筛查早期检测开源工具Pythia敏感性特异性临床笔记麻省总医院布里格姆医疗系统认知衰退
自主AI系统筛查认知障碍

麻省总医院布里格姆医疗系统的研究团队已成功开发出首批全自主人工智能(AI)系统之一,该系统能够利用常规临床文档筛查认知障碍。该系统部署后无需人工干预或提示,在真实世界验证测试中达到98%的特异性。相关成果已发表在《npj数字医学》期刊上。

随论文发布,研究团队同时推出开源工具Pythia,使任何医疗系统或研究机构都能为其AI筛查应用部署自主提示优化功能。

"我们并非构建单一AI模型,而是打造了一支数字临床团队,"论文通讯作者、麻省总医院临床增强智能(CLAI)研究组主任兼医学副教授侯赛因·埃斯蒂里博士表示,"该AI系统包含五个专业智能体,它们相互批判并优化推理过程,就像临床医生在病例讨论会上所做的那样。"

认知障碍在常规临床护理中长期存在严重漏诊问题,传统筛查工具和认知测试不仅实施资源密集,患者也难以获取。然而,随着近期阿尔茨海默病疗法获批(早期用药效果最佳),早期检测变得日益关键。

"当许多患者获得正式诊断时,最佳治疗窗口可能已经关闭,"麻省总医院布里格姆医疗系统神经病学系人口健康与医疗智能中心主任、联合首席作者丽迪亚·穆拉医学博士、哲学博士、公共卫生硕士指出。

为更精准识别高风险患者,该团队开发了基于开源权重大型语言模型的AI系统,可部署于医院本地信息技术基础设施内。系统采用五个各司其职的智能体,通过协作进行临床判断并优化结果,以提升敏感性与特异性。

这些智能体在迭代循环中自主运行,通过结构化协作持续精进检测能力,直至达成性能目标或系统判定收敛。所有处理均在本地完成,患者数据不会传输至外部服务器或云AI服务。

研究分析了麻省总医院布里格姆医疗系统200名匿名患者的3300余份临床笔记。通过解析常规医疗就诊产生的临床记录,该创新系统能将日常文档转化为认知障碍筛查机会,帮助识别可能需要正式评估的患者。

"临床笔记中隐含着认知衰退的细微线索,忙碌的临床医生难以系统捕捉,"穆拉表示,"该系统实现了规模化监听。"

当AI系统与人工评审结果出现分歧时,由独立专家重新评估每个案例。在分歧案例中,专家有58%的时间验证了AI的推理——这意味着系统常做出初始人工评审遗漏的合理临床判断。

"我们本预期会发现AI错误,结果却发现AI常基于笔记证据做出合理判断,"埃斯蒂里表示。

对AI错误案例的分析揭示出系统性模式:文档局限性(认知担忧仅出现在问题列表而无叙述支持)和领域知识缺口(系统未能识别特定临床指标)。该系统在详尽的临床叙述中表现出色,但在缺乏上下文的孤立数据前表现欠佳。

尽管系统在平衡测试中达到91%敏感性,但在真实条件(33%阳性病例率)下敏感性降至62%,特异性仍保持98%高位。研究人员主动报告这些校准挑战,以提升透明度并指导未来临床可靠性改进工作。

"我们正在公开发布AI存在困难的确切领域,"埃斯蒂里强调,"若想让临床AI获得信任,行业必须停止隐藏这些校准挑战。"

参考文献:田J、法尔德P、卡甘C等. 利用大型语言模型进行认知问题临床检测的自主智能体工作流. npj数字医学. 2026;9(1):51. doi:10.1038/s41746-025-02324-4

本文已从以下材料转载。注:材料可能经过编辑以适应篇幅和内容。欲了解更多信息,请联系引用来源。

【全文结束】

大健康
大健康