斯科特·戈特利布认为所有医生很快都会使用大型语言模型 - AI与医疗健康

斯科特·戈特利布认为所有医生很快都会使用大型语言模型‘You Almost Have to Be Doing It’: Why Scott Gottlieb Thinks All Doctors Will Use LLMs Soon

环球医讯 / AI与医疗健康来源：medcitynews.com美国 - 英语2024-10-30 05:00:00 - 阅读时长3分钟 - 1145字

前FDA局长斯科特·戈特利布在第三届农村医疗保健未来峰会上表示，大型语言模型（LLMs）将很快成为医生临床工作流程的重要组成部分

大型语言模型（LLMs）即将成为医生临床工作流程的重要组成部分，前FDA局长斯科特·戈特利布周二在南达科他州苏福尔斯举行的第三届农村医疗保健未来峰会上表示。戈特利布在接受桑福德健康计划总裁兼首席执行官汤米·易卜拉欣的采访时分享了这一观点。

易卜拉欣提到了戈特利布最近与美国企业研究所（一个中右翼智库）合作进行的研究。该研究于今年夏天发布，测试了五种大型语言模型：Open AI的ChatGPT-4、Google的Gemini Advanced、Anthropic的Claude 3.5、xAI的Grok和Llama的HuggingChat。研究团队向这些模型提出了50个来自美国医学执照考试最难题目的问题。这些AI模型表现相当出色，其中Open AI的ChatGPT-4准确率最高，达到98%。Llama的HuggingChat准确率最低，为66%，其余模型的准确率在84%到90%之间。美国医学执照考试要求考生答对约60%的问题，历史平均及格分数约为75%。

基于这些研究结果，以及他在新企业协会担任合伙人期间看到的AI创新水平，戈特利布对大型语言模型在医疗保健领域的潜力持乐观态度。但他认为这种潜力尚未完全实现。

“我认为我们现在已经到了这样一个阶段，如果你处理的是复杂病例，而你没有使用[大型语言模型]，你可能应该这样做。我认为大多数医生还没有这样做，因为在医疗系统中还没有一个好的选项可以在符合HIPAA法规的情况下使用这些工具。目前还没有很多系统部署了这些聊天机器人的本地实例。”戈特利布解释道。

他还提到正在进行的研究，以进一步测试大型语言模型的医疗能力。戈特利布和他的研究团队正在向ChatGPT-4提供《新英格兰医学杂志》中的临床案例。该杂志每期都会刊登一个难以诊断的临床案例，并提供选择题形式的答案，答案在下一期揭晓。在线上有350个这样的临床案例，戈特利布和他的团队正在将它们全部输入ChatGPT-4。

“到目前为止，它的准确率达到了100%，并且解释了它是如何得出诊断的。它从临床案例中提取线索，并解释为什么这些线索是关键线索，帮助得出诊断。临床推理非常深刻。”他宣布道。戈特利布让观众想象一名住院医师深夜接到一个复杂病例的电话。他认为，显然这名住院医师应该能够使用大型语言模型来更快地得出鉴别诊断。

“我的意思是，你几乎必须要这样做。”戈特利布说道。

然而，他指出，用于临床决策支持的大型语言模型尚未大规模部署。这些工具对大多数医生来说并不容易获得。要使用大型语言模型进行诊断支持，医疗系统必须创建自己的模型或通过添加本地健康数据和患者数据隐私控制来修改现有模型——这需要时间和资源。

“但我觉得很快每个人都要考虑如何在临床上部署这些工具。”他说。

(全文结束)