在最近发表于《联合委员会质量和患者安全杂志》的一项研究中,波士顿大学的研究人员测试了GPT-4这一先进的公开生成式AI模型,评估其在患者安全认证专业人士(CPPS)自评考试五个关键领域的答题能力。该考试是一个标准化的多项选择题认证,旨在评估患者安全专业人士的知识水平。GPT-4达到了88%的准确率,展示了其在这一领域的出色表现。
生成式人工智能(genAI)通过数百万甚至数十亿的数据点进行训练,能够生成创意且逼真的输出,模仿人类创作的材料。它可用于加速工程设计、创建音频和视频内容,以及为在线客户提供个性化推荐。
genAI在医疗保健领域的潜在应用包括改进成像技术、预测患者的疾病轨迹和开发新型疫苗。波士顿大学助理教授Nicholas Cordella表示:“虽然过去一年有其他研究考察了genAI在不同医疗专业领域的考试表现,但我们的研究是首次对其在患者安全领域的熟练度进行全面测试。”
研究报告的共同作者James Moses医学博士、公共卫生硕士曾在该校担任儿科副教授,目前在密歇根州Corewell Health担任质量、安全和患者体验主任。研究人员未对GPT-4进行额外培训或医学微调,而是直接向其输入CPPS自评考试的问题,随后评估该模型在其他考试类别的表现。
研究发现,GPT-4在患者安全和解决方案、测量和改进绩效、系统思维和设计/人因工程等领域表现出色。基于这些结果,研究人员确定了患者安全专业人士可以开始探索AI的实际能力和局限性的领域。
Nicholas Cordella表示:“我们的研究结果表明,AI可以帮助医生更好地识别、处理和预防医院和诊所中的错误。尽管仍需进一步研究以全面了解当前AI在患者安全领域的应用,但这项研究表明,AI有可能通过协助临床医生解决可预防的伤害来改善医疗保健。”
Cordella同时也是波士顿医学中心的质量和患者安全医疗总监。他认为,应用AI可以增强患者安全协议,更有效地解决每年导致近40万人死亡的医疗错误问题。Cordella指出,这项研究支持了一种更为普遍的观点,即AI可以提高专家(如医生)的工作效率。类似于其他知识工作者利用AI提升绩效,临床医生也可以通过利用AI支持其工作来提高医疗保健的安全性和有效性。
研究还指出了现有AI技术的不足之处,并建议用户注意大语言模型(如GPT-4)响应中的偏见、虚假自信、伪造数据或幻觉现象。
Nicholas Cordella总结道:“我们的研究结果表明,AI有潜力显著提升患者安全,标志着利用这一技术减少可预防伤害并实现更好医疗结果的重要一步。然而,重要的是要认识到这只是一个初步步骤,必须严格测试和完善AI应用,才能真正惠及患者护理。”
(全文结束)


