研究人员开发自主AI智能体系统用于检测认知衰退早期迹象Autonomous AI agents developed to detect early signs of cognitive decline | EurekAlert!

环球医讯 / 认知障碍来源:www.eurekalert.org美国 - 英语2026-01-16 06:11:22 - 阅读时长4分钟 - 1764字
麻省总医院布里格姆医疗系统研究团队成功开发出全球首批完全自主人工智能系统之一,该系统能通过常规临床文档自动筛查认知障碍,部署后无需人工干预,在真实世界验证中特异度达98%,并已开源Pythia工具供全球医疗机构使用;研究分析200名匿名患者的3300多份临床笔记,发现AI在58%的分歧案例中获得专家支持,表明其能有效捕捉临床医生忽略的细微信号,但真实环境下灵敏度降至62%,研究人员强调必须透明报告AI校准挑战以建立临床信任,这对阿尔茨海默病等早期治疗至关重要。
健康认知衰退早期检测AI智能体临床文档认知障碍筛查Pythia麻省总医院布里格姆临床笔记灵敏度特异度开源工具阿尔茨海默病临床判断
研究人员开发自主AI智能体系统用于检测认知衰退早期迹象

麻省总医院布里格姆医疗系统(Mass General Brigham)的研究团队开发了全球首批完全自主的人工智能(AI)系统之一,该系统能够利用常规临床文档筛查认知障碍。该系统部署后无需人工干预或提示,在真实世界验证测试中达到98%的特异度。研究结果发表在《npj Digital Medicine》期刊上。

伴随论文发表,研究团队同时发布了开源工具Pythia,使任何医疗系统或研究机构都能部署自主提示优化技术,用于自身的AI筛查应用。

“我们并非构建单一AI模型,而是打造了一支数字临床团队,”论文通讯作者、麻省总医院(Massachusetts General Hospital,麻省总医院布里格姆医疗系统创始成员)临床增强智能(CLAI)研究组主任兼医学副教授侯赛因·埃斯蒂里(Hossein Estiri)博士表示,“该AI系统包含五个专业智能体,它们相互批判并优化推理过程,如同临床医生在病例讨论会上的协作。”

认知障碍在常规临床诊疗中长期存在严重漏诊问题,而传统筛查工具和认知测试不仅耗用大量医疗资源,患者也难以获取。然而,随着近期阿尔茨海默病疗法获批(该疗法在疾病早期使用效果最佳),早期检测变得愈发关键。

“当许多患者获得正式诊断时,最佳治疗窗口可能已经关闭,”共同首席作者、麻省总医院布里格姆医疗系统神经病学系人口健康与医疗智能中心主任莉迪亚·莫拉(Lidia Moura)医学博士表示。

为更精准识别高风险患者,麻省总医院布里格姆医疗系统团队开发了基于开源权重大语言模型的AI系统,可在医院信息技术基础设施内本地部署。该系统采用五个各司其职的智能体,通过协作进行临床判断并优化结果,以纠正错误并提升灵敏度与特异度。

这些智能体在迭代循环中自主运行,通过结构化协作持续优化检测能力,直至达到性能目标或系统判定收敛。患者数据全程保留在本地,不传输至外部服务器或云端AI服务。

研究分析了麻省总医院布里格姆医疗系统200名匿名患者的3300多份临床笔记。通过解析常规医疗访问产生的临床记录,该创新系统能将日常文档转化为认知问题筛查机会,帮助识别可能需要正式评估的患者。

“临床笔记中隐藏着认知衰退的细微信号,忙碌的临床医生难以系统性捕捉,”莫拉表示,“该系统实现了规模化监听。”

当AI系统与人类评审员判断不一致时,独立专家会对每个案例重新评估。在分歧案例中,专家有58%的时间认可AI的推理——这意味着该系统常做出合理临床判断,却被初始人工评审忽略。

“我们本预期发现AI错误,却常看到AI基于笔记证据做出合理判断,”埃斯蒂里表示。

对AI误判案例的分析揭示出系统性模式:文档局限性(认知担忧仅出现在问题列表中而缺乏叙述支撑)和领域知识缺口(系统未能识别特定临床指标)。该系统在完整临床叙述中表现出色,但面对缺乏背景的孤立数据时表现欠佳。

尽管该系统在均衡测试中灵敏度达91%,但在真实环境(阳性病例占比33%)下灵敏度降至62%,特异度仍保持98%的高位。研究人员公开报告这些校准挑战,旨在提升透明度并指导未来改进临床可靠性。

“我们正在精确公布AI的薄弱环节,”埃斯蒂里表示,“若要建立临床AI的信任度,学界必须停止掩盖这些校准挑战。”

作者名单:除埃斯蒂里和莫拉外,麻省总医院布里格姆医疗系统与哈佛医学院的共同作者包括Jiazi Tian、Pedram Fard、Cameron Cagan、Neguine Rezaii、Rebeka Bustamante Rocha、Liqin Wang、Valdery Moura Junior、Deborah Blacker、Jennifer S. Haas、Chirag Patel和Shawn N. Murphy。

利益声明:作者声明无竞争利益。

资金支持:本研究由美国国立卫生研究院(NIH)资助,包括国家老龄化研究所(资助号RF1AG074372、R01AG074372、R01AG082693)及国家过敏与传染病研究所(R01AI165535)。

引用论文:Tian等,“利用大语言模型进行认知问题临床检测的自主智能体工作流”,《npj Digital Medicine》,DOI: 10.1038/s41746-025-02324-4。

【全文结束】

大健康
大健康