研究表明,ChatGPT-4o能够提供准确、完整且可信的回答,以解答患者提出的结直肠癌(CRC)筛查问题。
一项研究显示,ChatGPT-4o在回答符合结直肠癌(CRC)筛查条件的个体提出的真实问题时,始终提供了准确且易于理解的答案。通过专家评审和患者反馈对AI生成的答案进行评估,研究人员发现强有力的证据支持ChatGPT在促进患者知情参与CRC筛查计划中的作用。
这项队列研究发表在《Endoscopy International Open》杂志上。
“尽管我们的研究中发现了一些答案的微小差异,但我们发现ChatGPT-4o仍然能有效地提供准确、完整且易于理解的答案,”研究人员写道。“此外,患者对答案的完整性、可理解性和可信度给予了积极反馈,表明他们对该工具性能的认可。”
AI工具在重塑CRC检测和理解方面显示出潜力,为改善早期诊断和患者参与提供了有希望的途径。最近在ASCO胃肠癌症研讨会上展示的研究表明,《C the Signs》模型能够通过分析电子病历中的症状模式,在传统方法之前最多提前五年识别出高风险的CRC个体。这些发现展示了AI不仅在预测癌症风险方面的潜力,还在向患者提供可访问、及时且可信的信息以鼓励早期检测和干预方面的潜力。
在这项研究中,招募了10名年龄在50至69岁之间、符合意大利国家CRC筛查计划资格但尚未参与的连续个体。每位参与者被呈现4个标准化场景,反映了关于CRC筛查的常见关切,并要求每个场景生成一个问题以寻求更多信息。这些由患者生成的问题在两个独立会话中提交给ChatGPT-4o,以评估一致性和回答质量。一个由5名CRC筛查领域的资深专家组成的小组使用五点李克特量表在三个领域(准确性、完整性和可理解性)对每个AI生成的回答进行了独立评估。
此外,提出问题的同一批10名参与者也审阅了回答,并使用二分法(是/否)量表对回答的完整性、可理解性和可信度进行了评价。所有评估都是独立进行的,评估者对彼此的评估结果不知情。
专家小组对ChatGPT-4o的回答在准确性、完整性和可理解性方面的平均(标准差)评分分别为4.1(1.0)、4.2(1.0)和4.3(1.0),表明在关键评估领域整体表现良好。患者的评价同样积极,97.5%的回答被评为完整,95%被评为可理解,100%被评为可信。值得注意的是,ChatGPT在两个会话中的回答相似度为86.8%,表明其在回答患者生成的CRC筛查问题时具有可靠和可重复的表现。
然而,研究人员指出了一些局限性。首先,该研究仅评估了一个大型语言模型,以保持与先前研究的一致性,这限制了与其他工具的比较。其次,样本量较小可能影响了研究结果的强度。最后,由于该研究完全用意大利语进行,结果可能不适用于其他语言或文化背景。因此,研究人员认为需要更广泛的研究来确认这些发现在不同平台和人群中的适用性。
尽管存在这些局限性,研究人员认为该研究表明ChatGPT在回答CRC筛查问题时表现良好,即使直接由患者使用也是如此。
“然而,重要的是要强调,这项技术并不旨在取代专业医疗建议,”研究人员写道。“大多数患者仍需与医疗保健提供者面对面交流,讨论他们的关切并获得必要的解释。此外,咨询医生始终是解决涉及健康状况和药物管理的复杂问题以及提供个性化医疗服务所必需的。”
(全文结束)


