一项研究表明,ChatGPT在诊断疾病和医疗状况方面优于医生。该研究的发现最近发表在《JAMA Network Open》期刊上,强调了人工智能(AI)聊天机器人可能更有效地分析患者病史和状况,并提供更准确的诊断。虽然这项研究旨在了解AI聊天机器人是否能帮助医生提供更好的诊断,但结果意外地显示,OpenAI的GPT-4驱动的聊天机器人在没有人类协助的情况下表现更好,而不是与医生配合使用。
该研究由波士顿贝斯以色列女执事医疗中心的一组研究人员进行。据《纽约时报》报道,实验涉及50名医生,包括住院医师和主治医师。这些医生通过美国多个大型医院系统招募,并被给予六例患者的病例历史。要求他们对每个病例提出诊断,并解释为什么青睐或排除某些诊断。医生的最终诊断是否正确也会被评分。
为了评估每位参与者的绩效,选定了医学专家作为评分员。他们可以看到答案,但不知道这些答案来自有AI辅助的医生、仅医生或仅ChatGPT。此外,为了消除不切实际的病例历史的可能性,研究人员选择了几十年来一直被研究人员使用的实际患者病例历史,但从未发表过,以避免数据污染。这一点很重要,因为ChatGPT不能基于从未发布过的数据进行训练。
研究的发现令人惊讶。没有使用任何AI工具诊断病例历史的医生平均得分为74%,而使用聊天机器人的医生平均得分为76%。然而,当ChatGPT单独分析病例历史并提供诊断时,其平均得分为90%。
尽管医生的经验水平和对某些诊断的个人偏见等因素可能影响了研究结果,但研究人员相信,该研究突显了AI系统在医疗机构中的潜力不容忽视。
(全文结束)


