聊天机器人在临床决策中的表现Physician's medical decisions can benefit from chatbot, study suggests

环球医讯 / AI与医疗健康来源:www.msn.com美国 - 英语2025-02-06 00:00:00 - 阅读时长4分钟 - 1699字
研究发现,聊天机器人在处理复杂的临床管理问题时表现出色,并且医生在聊天机器人的辅助下也能够做出更优的决策。这项研究表明,结合人和计算机的能力可以更好地解决医疗领域的复杂问题。
聊天机器人临床决策疾病诊断临床管理推理医生人工智能健康医疗判断医疗决策患者案例
聊天机器人在临床决策中的表现

由人工智能驱动的聊天机器人在诊断某些疾病方面已经变得相当出色,但当问题不再是非黑即白时,聊天机器人的表现如何呢?例如,患者在手术前应提前多久停止服用处方抗凝血药物?如果患者过去对类似药物有不良反应,治疗方案是否需要改变?这些问题没有标准答案,而是需要医生根据自己的判断来决定。

斯坦福大学医学助理教授、医学博士乔纳森·H·陈(Jonathan H. Chen)和他的研究团队正在探索聊天机器人(一种大型语言模型,LLM)是否能有效地回答这些复杂的问题,以及在聊天机器人的支持下,医生的表现是否会更好。

结果表明,答案是肯定的。研究团队测试了聊天机器人在面对各种临床决策时的表现。单独使用聊天机器人的表现优于只能访问互联网搜索和医学参考资料的医生,但在拥有自己的LLM的情况下,来自美国多个地区和机构的医生们能够与聊天机器人保持同步。

“多年来我一直说,人类加上计算机将比两者单独工作时表现得更好,”陈博士说。“我认为这项研究促使我们更批判性地思考这个问题,并问自己,‘计算机擅长什么?人类擅长什么?’我们需要重新考虑如何结合这些技能,以及在哪些任务中引入人工智能。”

详细描述这些结果的研究发表在《自然医学》杂志上。陈博士和哈佛大学助理教授亚当·罗德曼(Adam Rodman)是该论文的共同资深作者。博士后学者伊桑·高(Ethan Goh)和罗伯特·加洛(Robert Gallo)是共同第一作者。

通过聊天机器人增强

2024年10月,研究团队在《JAMA Network Open》上发表了一项研究,测试了聊天机器人在诊断疾病方面的表现,并发现其准确性高于医生,即使医生使用了聊天机器人。当前的论文深入探讨了医学中更为模糊的一面,评估了聊天机器人和医生在称为“临床管理推理”的问题上的表现。

高解释了这种差异:想象一下你正在使用手机上的地图应用程序导航到某个目的地。使用LLM诊断疾病有点像使用地图定位正确的地点。而如何到达那里则是管理推理的部分——你是选择绕行小路以避开交通拥堵?还是继续在拥挤的路上行驶?或者等待道路畅通?

在医疗环境中,这些决策可能会变得很复杂。假设医生偶然发现住院患者肺上部有一个较大的肿块。接下来的步骤是什么?医生(或聊天机器人)应该认识到,位于肺上叶的大结节统计上有较高的转移风险。医生可以选择立即进行活检,安排稍后的检查,或订购影像学检查以了解更多情况。

确定哪种方法最适合患者取决于许多细节,首先是患者的已知偏好。他们是否不愿意接受侵入性程序?患者的病史是否显示他们不遵守预约?医院的医疗系统在安排随访预约时是否可靠?转诊情况如何?这些背景因素都是至关重要的,陈博士说。

研究团队设计了一项试验,以研究三组人员在临床管理推理方面的表现:单独的聊天机器人、46名有聊天机器人支持的医生,以及46名只能访问互联网搜索和医学参考资料的医生。他们选择了五个去识别化的患者案例,并将其提供给聊天机器人和医生,所有人都提供了书面答复,详细说明他们在每个案例中会采取的措施、原因以及考虑的因素。

此外,研究人员还邀请了一组经过认证的医生创建了一个评分标准,以评估一个医疗判断或决策是否适当。然后根据这个评分标准对决策进行评分。

令研究团队惊讶的是,聊天机器人的表现优于只能访问互联网和医学参考资料的医生,在评分标准上得分更高。但与聊天机器人配对的医生表现与单独的聊天机器人一样好。

未来的聊天机器人医生?

究竟是什么让医生-聊天机器人的合作更加出色,仍有待讨论。使用LLM是否迫使医生更加仔细地考虑病例?还是LLM提供了医生自己想不到的指导?这是未来研究的方向,陈博士说。

聊天机器人和与聊天机器人配对的医生取得的积极成果引发了一个常见问题:AI医生是否即将到来?

“这可能是AI的一个优势,”陈博士说。但与其取代医生,结果表明医生可能希望欢迎聊天机器人的帮助。

“这并不意味着患者应该跳过医生直接去找聊天机器人。不要这样做,”他说。“外面有很多好的信息,但也有很多坏的信息。我们都必须发展出辨别什么是可信的、什么是不可信的技能。这比以往任何时候都更重要。”


(全文结束)

大健康
大健康