一位父亲担心他的幼儿已经发烧两天并一直在拉扯一只耳朵。一位65岁的妇女在晨练时感到气喘吁吁,比平时更容易疲劳。两人都拿起手机,将症状输入AI聊天机器人。
"您的孩子可能患有耳部感染,"父亲了解到。"您的症状可能表明有心脏问题,"这位女士读到。
这些是有用的回答——而且很可能正确。人工智能在准确诊断方面正接近甚至在某些情况下超过医生的能力。2026年4月的一项研究发现,OpenAI的o1模型在《新英格兰医学杂志》发表的复杂诊断案例中准确率达到78%,并且在诊断实际急诊室患者时也优于经验丰富的医生。同样,2024年的一项研究发现,ChatGPT在诊断复杂病例方面甚至超过了医生——即使医生自己也能使用ChatGPT。
然而,做出正确诊断只是医生工作的一半。另一半是知道该如何处理——换句话说,决定如何管理患者的健康状况。
我是一名医生和医学教育者,研究医生如何做出这些决策,这一过程被称为"管理推理",以及医学生如何培养这种能力。对于明确的健康问题,AI诊断可能足以让某人获得所需的护理——比如为婴儿牙龈涂抹一点麻醉膏,或预约心脏病专家。
但在临床实践中,不确定性很常见。通常,知道患者患有什么疾病对于确定如何照顾他们来说是必要但不充分的。即使在诊断确定后,如何管理患者也是一个复杂的问题。
诊断进行分类,但管理需要优先排序
经验丰富的医生不会从头开始评估每位患者。经过多年实践,他们建立了称为"疾病脚本"的心理捷径。
疾病脚本不仅仅是症状清单。它们捕捉了疾病通常的表现形式、谁容易患病以及疾病最常见的发展过程。当医生看到新患者时,他们会将观察到的情况与这些心理脚本进行匹配——这是一个分类和模式识别的过程。
当患者出现熟悉的症状和体征模式时,医生几乎不假思索地调用匹配的心理脚本。这使他们能够注意到不太符合的元素:一个不符合的症状,或患者病史中的一个细节——最近的国外旅行、工作中的不寻常接触——这可能指向不同的诊断。
AI擅长这种模式匹配并不奇怪。像ChatGPT这样的大型语言模型以类似的方式工作。它们根据从大量文本(包括医学文献)中学到的模式,预测句子中下一个应该出现的单词。在这些文献中,"肺炎"一词总是跟随某些症状模式:比如发烧加上胸部X光片上的模糊斑点。在这个层面上,模式匹配本质上与医生将患者症状与疾病脚本匹配时所做的相同。
但决定下一步该做什么——该做哪些检查、尝试哪些治疗、监测什么以及跟进什么——则有所不同。医生面对的不是唯一正确的答案,而是多个合理的选择。医疗管理的艺术是优先考虑对面前患者来说最好的选项。
人类的优势
那么,医生如何从诊断患者过渡到确定最佳护理方式?答案几乎总是"视情况而定"。
考虑两位男士,Marcus和Tomás,都是68岁,刚刚被诊断出早期前列腺癌。他们的活检显示相同:一个局限于前列腺的缓慢生长的肿瘤。
两人都获得了相同的两个管理选项。立即治疗,通过手术或放疗,接受尿失禁和性功能变化的风险。或者密切监测,定期进行检查和活检,仅在肿瘤生长时治疗。一项追踪了82,000多名早期前列腺癌男性15年的研究发现,无论选择哪条路径,死于前列腺癌的人数都不到3%,尽管选择监测的男性看到癌症扩散的可能性大约是两倍。
AI可以同时呈现这两个选项及其统计数据。医生带来的是对面坐着的人的知识。
Marcus没有其他重大健康问题。他的医生知道这一点,并且足够了解Marcus,知道不确定性对他来说很糟糕。对于没有其他紧迫健康问题的患者,缓慢生长的肿瘤有时间进展并变得更严重。两种管理路径都是真正合理的,但Marcus无法忍受等待。知道癌症在自己体内,被观察但不治疗,是他无法放下的事情。他选择治疗。
Tomás患有晚期心力衰竭,他的医生多年来一直与他一起管理这一状况。她知道他的心脏状况对他的健康构成比这个缓慢生长的肿瘤更直接的威胁。她也知道他目睹一位朋友经历了放疗后身体状况恶化。积极治疗意味着要承担真正的成本,而可能永远得不到益处。她建议主动监测。对Tomás来说,这是正确的答案,也是一种解脱。
在医学中,不同的管理决策是常态。对任何患者的正确路径取决于该患者是谁以及他们重视什么,以及医生对证据可靠性和剩余真实不确定性的判断。
评估风险和不确定性
要决定如何管理患者的病情,医生首先考虑医学文献中的证据,然后将可用的管理选项应用到患者的具体情况中。这需要诚实的沟通、共同决策、共同应对风险并承认不确定性。
一些风险可以衡量。对于胸痛,医生使用评分工具,根据症状和检查结果估计患者短期内心脏病发作的可能性。AI可能比大多数医生更快地处理这些数字。
但床边或诊所中的风险和不确定性难以衡量。评分系统和实践指南是为平均患者设计的——一个理想化的人,不存在。医生和患者对风险和不确定性的感知都受到他们经验的影响。对许多患者来说,这包括在医疗保健系统中长期且有充分理由的不信任历史。
AI不知道你经历过什么或你愿意接受什么样的风险权衡。它不能像好医生那样承认不确定性,随着你的情况变化而与你一起重新审视它。
这就是诊断和管理分道扬镳的地方。发烧幼儿的父亲可能得到了有用的答案:AI在医学文献中见过足够多的发烧幼儿,可以做出合理的判断。但知道接下来该做什么,包括何时停止观察并开始担心,最好与你的医生进行对话。
Andrew Parsons是弗吉尼亚大学医学院副教授
本文首次发表于《对话》
【全文结束】

