多哈,卡塔尔:一项在卡塔尔进行的独特研究揭示,生成式人工智能聊天机器人ChatGPT在急诊医学(EM)的理论方面表现出色,在考试环境中甚至超过了住院医师。
该研究题为“卡塔尔急诊医学住院医师考试中ChatGPT的表现:与住院医师的比较分析”,引起了读者的广泛兴趣,成为本月Qscience网站上最热门的文章之一。
该研究发表在最新一期的《卡塔尔医学杂志》上,强调了人工智能(AI)作为医学教育补充工具的日益增长的潜力。研究结果表明,AI可能在医学领域的学习和评估方法中发挥重要作用,特别是在急诊医学方面。
这项由卡塔尔专家团队进行的研究,重点评估了ChatGPT在急诊医学住院医师考试中的表现。通过将AI的结果与住院医师的成绩进行对比,研究突显了AI在医学培训和评估中的潜在贡献。
考试形式包括由负责卡塔尔董事会急诊医学考试的同一教员设计的多项选择题(MCQ)。2023年8月,进行了一项回顾性描述性研究,采用混合方法设计。评估了来自不同研究生年份(PGY1至PGY4)的238名急诊科住院医师的成绩。随后,这些成绩与完成了相同考试的ChatGPT的成绩进行了比较。
结果显示,ChatGPT在所有考试类别中均持续超过住院医师。然而,高级住院医师(PGY3和PGY4)的及格率显著下降,引发了对理论考试表现与实际能力一致性的问题。
这一趋势的一个可能解释是COVID-19大流行对高级住院医师学习经验和知识巩固的影响。
研究样本包括238名住院医师,分布在PGY1至PGY4的不同阶段。具体来说,58名PGY1住院医师(23.8%),61名PGY2住院医师(25.1%),66名PGY3住院医师(27.2%),53名PGY4住院医师(21.8%)参与了研究。性别分布大约为每两名男性住院医师对应一名女性。各研究生年份的及格分数要求如下:PGY4(60%),PGY3(55%),PGY2(50%),PGY1(45%)。
每次考试包含40个问题,满分为40分。该研究的发现不仅表明像ChatGPT这样的AI模型在理论考试中表现出色,还突显了AI在医学教育中的作用正在演变。
AI工具在医疗保健中的应用已经开始改变医疗实践,从诊断到治疗策略,现在,正如这项研究所示,扩展到了教育方法。“ChatGPT在急诊医学的理论知识方面表现出显著的熟练度,在考试环境中超过了住院医师。这一发现表明,AI有可能作为医学教育的辅助工具。”研究结论如是说。
(全文结束)


