在16例假阴性案例中,有7例(44%)的代理工作流程在临床上判断正确,体现了临床合理的推理逻辑。
HealthDay新闻——根据1月7日在线发表于《npj Digital Medicine》杂志的一项研究,一种完全自主的人工智能(AI)模型能够从临床记录中筛查认知障碍。来自波士顿马萨诸塞州总医院的田佳子(Jiazi Tian)及其同事开发了两种用于识别临床记录中认知问题的大语言模型工作流程:一种是专家驱动的工作流程,通过在三个大语言模型上进行迭代式提示优化;另一种是自主代理工作流程,该流程协调五个专业代理执行提示优化任务。该模型在平衡优化数据集上完成训练,并在反映现实世界患病率的独立数据集上通过验证。
研究人员发现,相较于专家驱动工作流程,代理工作流程取得了相当的验证性能(F1值:0.74对比0.81)和更优的优化结果(0.93对比0.87)。敏感性从优化数据集中的0.91下降至独立数据集中的0.62,这揭示了患病率变化对模型泛化能力的影响。在专家重新评估中,代理工作流程对16例假阴性案例中的7例(44%)作出临床正确判断,再次印证其推理符合临床逻辑。"我们没有构建单一的AI模型——我们构建了一个数字临床团队,"同样来自马萨诸塞州总医院的合著者侯赛因·埃斯蒂里(Hossein Estiri)博士在声明中表示,"该AI系统包含五个专业代理,它们相互质疑并完善推理过程,就像临床医生在病例讨论会上所做的那样。"
【全文结束】

