该研究发表于《JAMA网络开放》,由明尼苏达大学医学院、斯坦福大学、贝斯以色列女执事医疗中心和弗吉尼亚大学的联合研究团队完成。研究对象为50名持有美国执业资格的家庭医学、内科和急诊科医生。研究发现,医生使用GPT-4作为诊断辅助工具时,与传统资源相比并未显著提升临床推理能力。其他关键发现包括:
- GPT-4独立诊断的表现显著优于传统诊断资源辅助组和GPT-4辅助医生组
- 在评估GPT-4辅助医生组与传统资源组时,未发现诊断性能的显著提升
明尼苏达大学医学院教授兼M Health Fairview医院医师Andrew Olson博士表示:"人工智能领域正在迅速发展,影响着医疗内外的各个方面。我们需要研究这些工具,了解如何最佳利用它们提升医疗服务质量和提供体验。本研究提示,在临床实践中AI与医生协作仍有改进空间。"
研究结果凸显了人工智能融入临床实践的复杂性。虽然GPT-4独立诊断展现出良好表现,但作为辅助工具与医生协作时,并未显著超越传统诊断资源。这表明AI在医疗领域的应用潜力具有多面性,需进一步探索如何让AI更好地支持临床实践。研究团队建议开展更多研究以明确医生使用AI工具的培训方法。
四家合作机构已建立名为ARiSE的跨海岸人工智能评估网络,进一步评估生成式人工智能在医疗领域的应用。本研究由戈登和贝蒂·摩尔基金会提供资金支持。
研究通讯作者为明尼苏达大学医学院的Andrew P.J. Olson教授,联合研究团队成员包括来自上述机构的15名医学专家和AI研究人员。
【全文结束】