研究发现ChatGPT在急诊中过度开具不必要的X光片和抗生素 - AI与医疗健康

研究发现ChatGPT在急诊中过度开具不必要的X光片和抗生素ChatGPT over prescribed unneeded x-rays & antibiotics in emergency care: Study

环球医讯 / AI与医疗健康来源：www.daijiworld.com美国 - 英语2024-10-08 21:00:00 - 阅读时长2分钟 - 764字

一项由加州大学旧金山分校领导的研究发现，尽管ChatGPT在与患者互动和通过医学考试方面表现出色，但在急诊中可能会过度开具不必要的X光片和抗生素。

新德里，10月8日（IANS）：尽管ChatGPT在与患者互动和通过医学考试方面表现出色，但这项由OpenAI开发的流行生成式人工智能（AI）平台在急诊中可能会过度开具不必要的X光片和抗生素，这是周二发布的一项研究的结果。该研究由加州大学旧金山分校（UCSF）的研究人员领导，研究结果发表在《自然通讯》杂志上。研究人员表示，虽然可以通过特定提示使模型的响应更加准确，但它仍然无法与人类医生的临床判断相匹敌。

“这是对临床医生的一个重要信息，不要盲目信任这些模型，”UCSF的博士后研究员克里斯·威廉姆斯（Chris Williams）说。“ChatGPT可以回答医学考试问题和帮助起草临床笔记，但目前它并不适用于需要多方面考虑的情况，如急诊科的情况。”

最近，威廉姆斯的一项研究表明，ChatGPT这一大型语言模型（LLM）在确定两名急诊患者中哪一位病情更严重方面略优于人类——这是一个简单的选择题，即选择患者A或患者B。在当前的研究中，他挑战了AI模型执行一个更复杂的任务：提供医生在初步检查患者后所做的建议——是否收治患者、进行X光或其他扫描，或开具抗生素。

为了每个决定，研究团队从超过251,000次访问记录中编制了1,000次急诊访问数据集。这些数据集中，关于住院、放射学和抗生素的决策比例相同。研究团队将每位患者的症状和检查结果的医生笔记输入ChatGPT-3.5和ChatGPT-4。然后，通过不断增加详细提示来测试每组数据的准确性。

结果显示，AI模型推荐的服务比实际需要的更多。虽然ChatGPT-4的准确性比住院医师低8%，但ChatGPT-3.5的准确性低24%。

“AI倾向于过度开具处方，因为这些模型是在互联网上训练的。到目前为止，还没有设计出能够回答紧急医疗问题的合法医疗建议网站。”

(全文结束)