研究发现AI在患者沟通方面存在困难,影响诊断准确性Study Finds AI Struggles with Patient Communication, Hindering Diagnosis Accuracy

环球医讯 / AI与医疗健康来源:www.digitalinformationworld.com美国 - 英语2025-01-06 06:00:00 - 阅读时长2分钟 - 733字
斯坦福大学和哈佛医学院的一项新研究表明,尽管AI在通过医疗考试方面表现出色,但在与患者的沟通中存在明显不足,特别是在收集关键信息和处理开放式问题时,这对其在医疗环境中的应用提出了挑战。
人工智能患者沟通诊断准确性医疗保健斯坦福大学哈佛医学院CRAFT-MDChatGPT健康咨询医疗对话AI聊天机器人医学考试医生提问病例摘要GPT-4开放式问题患者病史非结构化对话
研究发现AI在患者沟通方面存在困难,影响诊断准确性

人工智能在许多领域都提供了巨大帮助,包括医疗保健系统。然而,根据斯坦福大学和哈佛医学院的一项新研究,人工智能在与患者交流方面存在不足,无法有效地进行准确诊断。在医学领域,与患者的沟通至关重要,医生和医疗专家需要通过交流了解患者的感受,但AI在此方面显示出明显的局限性。

研究人员使用“医疗对话推理评估框架”(Conversational Reasoning Assessment Framework for Testing in Medicine,简称CRAFT-MD)测试AI在医疗沟通中的表现。特别是现在许多人转向像ChatGPT这样的AI寻求健康咨询,了解AI与患者的互动如何帮助系统理解患者所经历的疾病或问题显得尤为重要。测试结果显示,尽管许多AI聊天机器人能够成功通过医学考试,但在与患者的日常交流中却表现不佳。

在医疗诊断过程中,医生需要在合适的时间向患者提问,并以正确的方式记录患者提供的信息,以便找出真正的问题。由于AI在沟通方面的不足,其在医疗环境中的表现令人担忧。研究人员对四个主要的AI模型进行了测试,提供了2000个医疗案例。结果显示,当给定病例摘要时,GPT-4的诊断正确率为82%,但在与患者互动以收集信息时,正确率下降到63%。当AI模型面对开放式问题而非选择题时,正确率进一步下降。

AI模型在收集关键信息、患者病史以及提出有助于连贯对话的问题方面遇到了最大困难。研究人员之一Daneshjou表示,他对在临床环境中使用AI感兴趣,但目前AI的表现并不令人满意。CRAFT-MD框架是测试AI在医疗领域响应能力的好方法,因为它可以实时监控对话。研究人员建议开发者应更加注重提高AI的沟通技能,使其能够处理非结构化对话。


(全文结束)

大健康
大健康