患者对人工智能在放射学诊断中实施的看法:焦点小组研究Journal of Medical Internet Research - Patients’ Perspectives on the Implementation of AI in Radiological Diagnostics: Focus Group Study

环球医讯 / AI与医疗健康来源:www.jmir.org德国 - 英语2026-05-26 10:19:13 - 阅读时长25分钟 - 12402字
这项研究通过7个焦点小组调查了34名患者对人工智能在放射学诊断中应用的看法。研究发现,患者普遍对AI在放射诊断中的使用持开放态度,但前提是必须满足科学验证的安全性和准确性、透明度、质量保证等条件。在个人健康受威胁的情况下,患者特别关注医生在AI诊断过程中的角色,希望医生能独立诊断、解释AI结果并保持人性化的医患关系。研究强调了高质量"社会技术"系统对患者接受AI诊断的重要性,指出AI性能的进一步发展必须与满足患者对医生角色期望的框架条件相结合。这些发现为AI在放射学实践中的成功整合提供了宝贵见解,对医疗AI的实施具有重要指导意义。
人工智能放射学诊断患者信任接受度医患关系质量保证诊断准确性数据隐私
患者对人工智能在放射学诊断中实施的看法:焦点小组研究

摘要

背景: 人工智能(AI)的快速发展将在不久的将来使其在放射学诊断中得到广泛应用。患者随后将面对借助AI生成的诊断结果。了解患者对这一技术使用的看法是其成功实施的关键因素之一。

目的: 本定性研究旨在深入了解患者对放射学诊断中使用AI的机遇和风险的思考,确定其接受的前提条件,并识别能够促进对AI诊断信任的方面,特别是在高度个人关切的情境下。

方法: 采用目的抽样策略,共进行了7个焦点小组讨论,涉及34名患者(15名女性,占44%),年龄在23至85岁之间(平均49.06岁,标准差17.08岁)。每个焦点小组都进行录音、转录,并使用结构化定性内容分析方法进行分析。

结果: 研究结果表明,患者对在放射学诊断中使用AI持开放态度。基本前提包括:(1)有科学证据证明其结果比不使用AI更安全、更准确、更快;(2)在患者护理中具有可识别的附加价值;(3)使用AI的透明度并向患者披露;(4)全面、有约束力的质量保证措施;(5)仅将AI用于支持医生。然而,研究结果表明,患者愿意选择使用AI的放射科医生并信任AI诊断还需要满足其他条件。当他们个人受到影响时,患者担心医生会过度信任AI结果,医患关系会变得非人性化。因此,从患者角度看能激发信任的医生能力和职能必须发挥作用。这些包括:(1)医生进行独立诊断,不仅考虑临床背景,还考虑患者的个体性;(2)向患者全面解释使用AI的利弊,并清晰传达AI输出结果;(3)保持人性化和富有同理心的医患关系,表明医生继续对患者负责。

结论: 研究结果强调,整个"社会技术"系统的高质量是患者接受在放射学诊断中使用AI以及信任AI诊断的基本前提。AI性能的进一步发展必须与满足患者对医生角色期望的框架条件相结合,确保建立信任的医患关系。本研究为如何将AI整合到放射学实践中提供了宝贵见解。

J Med Internet Res 2026;28:e89178

关键词: 人工智能;AI;放射学;诊断;信任;接受度;焦点小组;定性研究

引言

AI技术的快速进步已经在医疗保健的各个领域引发革命[1]。放射学是这一发展的先驱之一。X光图像以及磁共振成像(MRI)和计算机断层扫描长期以来已经数字化,从而为将AI整合到疾病诊断、预测或分类中提供了坚实基础[2]。最大的优势之一是提高医学图像解读效率和增强诊断准确性[3,4]。

研究表明,AI模型可以高精度地对计算机断层扫描中的肺结节进行分类[5,6]。一项包含38项研究的综述,包括2924例多发性硬化症病例和2509例健康对照,报告显示敏感性范围为77%至100%,特异性为74%至100%。此外,34项研究报告的准确性范围为81%至10梓%[7]。比较显示,AI的准确性通常与放射科医生的表现相当甚至超过他们[8,9]。例如,使用深度学习算法在胸部X光片中检测COVID-19肺炎实现了96%的敏感性和64%的特异性,而放射科医生的敏感性和特异性分别在50%至73%之间[10]。在淀粉样蛋白相关影像异常患者中,放射科医生在使用深度学习方法的辅助环境下检测性能显著更好(87%),相比之下,未辅助环境下的检测性能为71%[11]。

然而,在将该技术引入常规临床实践时,必须考虑一些挑战。

一个关键挑战涉及用于训练AI的数据。问题不仅在于训练数据的数量和质量,最重要的是AI模型的适当验证。关键问题包括,例如,由于缺乏代表性或数据标签中的偏见以及误分类而导致的有意或无意的扭曲。大多数AI应用程序是使用高收入国家的数据集开发和训练的。少数群体和非西方人口因此往往代表性不足。这种扭曲可能导致某些患者群体表现不佳和错误诊断[12-14]。此外,AI模型的"黑箱"特性使得难以检测和澄清错误。然而,在实践中,到目前为止,监测输出的责任一直由放射科医生承担。因此,正在努力使深度学习模型可解释,以便放射科医生能够履行其责任[15,16]。与此同时,关于自动化偏见的研究表明,放射科医生可能过度信任AI结果的风险[17]。

除了AI的性能外,成功的实施还取决于受影响者的接受度和信任,特别是患者[18,19]。信任在几乎任何存在不确定性或可能出现不良结果的情况下都至关重要[20]。在具有潜在致命后果的敏感放射学诊断领域,信任尤其受到挑战。接受度和信任不仅由个人因素塑造,还受国家背景影响[21]。与新兴经济体和非西方国家的人们不同,具有高收入背景和文化背景与德国相似的工业化国家的个体往往对AI持较为怀疑的态度[22]。这种怀疑似乎也延伸到健康部门使用AI上。此类工业化国家的研究表明,患者担心使用AI时误诊的风险[23]。Nelson等人[24]关于皮肤癌诊断的研究中,患者表达了对AI开发中训练集不足的担忧。对AI建模质量的不信任可能导致对其使用风险评估显著提高[25]。使用AI的透明度并向患者披露被视为促进接受度的方式[26]。这些方面对于患者在个人受到影响的情况下愿意选择使用AI的放射科医生的重要性迄今为止几乎没有得到研究。各种研究表明,患者更支持AI在支持而非取代医生的角色[27,28]。在Jutzi等人的研究中[29],在关于皮肤肿瘤诊断的在线调查中,只有41%的患者支持AI作为独立系统,而94%的大多数人更喜欢AI仅用于支持医生。Ozcan等人关于乳腺X光检查诊断的研究显示了类似结果[30]。只有4%的患者接受独立的AI解释,而71%的大多数人更喜欢AI作为第二意见使用。如果AI输出未经医生检查,患者对诊断的不信任程度会比经医生审查时更高[31,32]。然而,迄今为止,关于患者对AI的观察到的不信任背后的原因的信息很少。医生的角色和医患关系的重要性也是如此。研究仅表明,个人沟通和同理心被认为是令人满意的医患关系所必需的,不应因使用AI而受到威胁[33,34]。然而,尚不清楚医患关系的哪些特征可以促进信任,以及在患者看来,这些特征在多大程度上可能因放射学诊断中使用AI而受损。

本研究旨在通过深入了解患者对风险和收益的看法、患者在什么条件下接受放射学诊断中使用AI并信任AI诊断、他们对医生的期望以及其态度背后的动机来填补这些空白。

方法

研究设计

本研究选择了焦点小组设计[35,36]。焦点小组格式固有的群体动力学允许深入探讨敏感且难以把握的话题,如对复杂健康相关技术发展的接受度和信任[37]。本研究使用高风险个人健康场景来捕捉通常较为隐含的假设、信念、价值观和期望。研究设计和报告遵循定性研究报告综合标准(COREQ)指南(附录1)[38]。

数据收集

患者通过患者组织和自助代表的帮助进行招募,他们将参与研究的邀请转发给其成员,允许他们自行注册参与研究。此外,还通过社交媒体发出呼吁,并在相关活动上分发传单。参与者根据"目的抽样"原则进行选择[39]。考虑的纳入标准是参与者已接受预防性医疗检查和/或目前由全科医生或专科医生照顾。他们还需要精通德语且至少18岁。

焦点小组于2022年11月至2023年6月在德国北莱茵-威斯特法伦州进行。在论点达到饱和后停止进行焦点小组[40]。每个焦点小组由4至6名参与者组成。参与者被要求完成一份关于人口统计数据、放射学检查经验以及使用德语版技术交互亲和力量表的技术亲和力的简短问卷[41]。所有焦点小组都以面对面方式进行。在焦点小组之前,参与者与研究人员之间没有建立关系。参与者被告知项目目标、跨学科研究团队和参与研究机构。经验研究由一位具有丰富定性社会研究方法经验的高级研究员(心理学家)进行。她由一位初级研究员(心理学家)协助。

在焦点小组开始时,参与者获得了关于放射学中基于AI诊断的标准化信息(附录1),以及关于焦点小组目的和程序的信息。半结构化、经过试点测试的指南作为所有焦点小组讨论的框架。在研究前,对患者组织和医学专业协会的代表进行了访谈,以确定相关主题并以适合目标群体的方式制定指南。访谈指南包含关键问题和附加问题。

为启动讨论,向参与者提出了以下问题:"您看到哪些机遇和风险?"以及"需要保证什么条件您才会支持在放射学中使用AI?在什么情况下您会拒绝使用?"在讨论的主要部分,通过个人参与场景引入关键问题。第一个场景描述了以下情况:"假设您的医生不确定您是否正在发展一种严重疾病,例如多发性硬化症,并希望将您转介进行MRI扫描,以尽早发现疾病并在必要时启动治疗。"随后向参与者提问:"您会选择使用或不使用AI的放射科医生吗?您的决定取决于什么?在评估图像或做出诊断时,您对哪种AI功能感到最放心?"第二个场景描述了一种情况,即使用AI生成的MRI报告包含表明存在严重疾病(如多发性硬化症)的异常迹象。随后向参与者提问:"您会信任AI诊断吗?在什么情况下?如果您的医生对AI诊断表示怀疑,您会更信任谁,医生还是AI?"在第三个场景中,要求参与者想象AI在诊断中广泛使用的开发。提出了以下关键问题:"这可能会改变您的医患关系,还是会保持不变?您对医生在此未来发展方面的期望是什么?"

对于所有关键问题,鼓励参与者解释其观点的原因。关键问题被可视化以刺激思考和论证。所有焦点小组均由作者以中立角色主持。采用"漏斗设计"[42]。在每个小组中,1名研究助理记录参与者互动中的非语言信息。每个焦点小组持续约2小时,进行录音并逐字转录。

数据分析

使用Mayring的结构化定性内容分析[43]以及框架分析[44]进行数据分析。这两种方法都是对显性和隐性通信内容进行系统分析的研究技术。结构化定性内容分析的优势在于其基于理论、基于规则的分类。当与基于矩阵的框架分析相结合时,可以跨主题和案例进行比较,从而识别模式。这使得能够对数据进行广泛而深入的分析,特别是处理大量数据集时——如本研究。

使用MAXQDA 2022软件(VERBI Software GmbH)结合演绎和归纳分类。演绎类别形成了基本框架,由归纳类别补充。两种方法之间出现的冲突,如类别系统中的冗余和由此产生的歧义,需要根据原始数据进行修订、标准化和重新检查。通过在创建类别系统时的高度灵活性以及对所有分歧和调整的透明、可追溯的文档记录来管理这些冲突。在类别开发过程中出现的任何分歧都在研究团队内进行讨论,直到达成共识。除了作者外,研究团队中的另一名编码员也参与以确保质量。具有良好的评分者间信度(κ=0.73)。

第一步,两名评分员阅读所有转录文本,写下讨论内容的简要摘要,并对似乎与他们相关的文本段落做出评论。第二步,基于文献综述和指南,演绎地开发主要主题类别。由两名评分员独立评估4个焦点小组,讨论结果,并修改和补充初步类别。然后根据主要类别评估整个材料。第三步,进行子类别的归纳开发。经过几轮讨论,分解整个类别系统,然后独立评估整个材料。第四步,根据主题组织陈述矩阵,并最终基于引文创建文档。

伦理考虑

这项针对患者的焦点小组研究是一项广泛研究的一部分,该研究还包括针对医生的焦点小组和对德国人口的代表性调查,以调查对使用AI进行放射学诊断的态度。该研究获得了于利希研究中心研究伦理委员会(FRAIM.20221005)的批准。在经验研究前,所有参与者均提供了书面知情同意。数据经过假名化处理并存储在受保护的数字环境中。参与者因参与获得了100欧元(117美元)。

结果

概述

共进行了7个焦点小组会议,涉及34名年龄在23至85岁(平均49.06岁,标准差17.08岁)的成年人。15名参与者为女性,19名为男性。大多数(30/34,88.2%)报告了Abitur(德国允许大学学习的高中毕业证书)作为其最高普通教育水平。总共4名(11.8%)参与者报告完成了10年正规教育(德国"Realschul-Abschluss, Mittlere Reife"或同等学历)。大多数参与者(25/34,75.8%)有工作。几乎所有人都报告有定期家庭医生(32/34,94.1%)并接受过至少1次放射学扫描(32/33,97%)。9项技术交互亲和力量表的总体得分表明样本对技术有相对较高的亲和力(平均4.14,标准差1.04;Cronbach α=0.94)。

以下结果突出了从患者角度看在放射学诊断中使用AI的机遇和风险,以及能够促进其接受度和信任的情况。参与者陈述的引用提供了焦点小组编号(FG)和参与者编号(#)。原始陈述已翻译成英文以供出版。

焦点小组讨论中出现了以下方面:(1)效率、数据完整性和质量保证;(2)数据隐私、透明度和可解释性;(3)医生的角色;(4)对医生与AI的信任;(5)医生的信任构建功能;(6)医患关系。

效率、数据完整性和质量保证

一般来说,所有参与者都认为使用AI提供了更高效和更准确诊断的机会。然而,由于AI带来的更高效工作流程和更短的阅读时间仅在这些改进缩短了放射学预约等待时间、使疾病能够更早发现并让医生有更多时间照顾患者时才被积极评价。

参与者认为利用AI减少人为错误并在诊断中实现高准确性的潜力是积极的,特别是在难以识别的异常情况下:

"这显然是一个机会,可以诊断出否则会被忽视的问题。因为AI从不疲倦,可以说,犯的错误更少,这取决于它的训练方式。"[FG3#1]

尽管如此,许多参与者表达了对误诊的担忧。他们主要怀疑数据的质量,即"AI系统通常有一种偏见,这是由于训练造成的,即机器被输入了什么。"[FG6#2]

此外,参与者担心AI市场的日益商业化将导致公司纯粹基于经济方面采取行动。这不仅可能导致数据验证不足以及由于数据集缺乏平衡和多样性而对某些患者群体的歧视,还可能导致公司为了自身利益操纵算法:

"我认为关键在于,如果你最终陷入这种公司竞争,自然可能导致想要建立自己的公司没有真正的专业知识或经验。然后你会有点风险,因为他们然后向大学医院或放射科诊所提供倾销报价,他们的软件然后被使用仅仅因为他们提供最便宜的价格,但它不好。"[FG4#2]

仔细的质量保证,无论是在AI算法的开发和批准还是在它们的持续应用中,都被强调为接受的基本前提(表1)。参与者强调,数据质量(在范围、多样性和持续更新方面)至关重要,必须通过质量标准和法规来确保。他们还认识到科学在建立对算法质量的信任方面发挥着重要作用。参与者认为,使用AI进行诊断的准确性必须比不使用AI更好:

"AI最终必须更好一些,否则完全没有意义——至少从患者的角度来看。"[FG4#4]

一些参与者发现,为了信任技术而对技术提出比对医生更高的要求是矛盾的。

"我一直问自己的是,我们现在总是为技术设定98、99%的要求,然后最初的问题总是出现:人类的准确性有多高?有这么多错误。所以我问自己为什么我们对技术如此严格。所以我也没有这个问题的答案。但我已经多次注意到,我们简单地为技术设定了比为我们自己高得多的标准。"[FG5#5]

类别 说明性引文
质量标准 "……必须也有如何设置此类AI或如何为其提供数据的黄金标准。"(FG6#4)
验证研究 "……我可以信赖它。必须进行验证。"(FG6#6)
独立认证 "软件必须经过独立认证。"(FG4#3)
监管 "政府和政治组织绝对应该创造法律框架。"(FG3#4)
科学监测 "因此必须进行科学监测并不断质疑:使用该技术产生的结果是否仍然非常接近最终结果,即疾病?"(FG2#3)
比放射科医生更高的准确性 "我希望有99左右的高准确性。是的,已经比人类更好。不仅仅是通过准确性来衡量。人类作为一个整体可以做得比AI更多;他们不仅限于病例。他们有许多许多其他能力,这就是为什么它是一个因素,我希望比仅仅说'好吧,AI目前超过人类'多一点。它应该比仅仅高出几个百分点显著更好。"(FG5#1)
数据保护 "所以对我来说重要的是,例如,此类数据不能被滥用。无论是由雇主、保险公司还是公司等第三方。"(FG4#4)
数据安全 "我们已经看到医院如何被黑客攻击,医生办公室如何被黑客攻击。我对这一点非常非常怀疑。"(FG3#3)
选择自由 "对我来说重要的是,只要我能够,我就被允许自己决定:是否使用AI?"(FG6#4)
透明度 "输入了多少数据等等,这样我就可以自己更好地评估它。有人必须向我解释这一点。"(FG6#4)
可解释性 "使用深度学习有很好的理由。命中率是最好的。即使我不懂技术,只要它有效,我就不在乎。"(FG4#2)
"当AI诊断事物时,知道为什么以及它基于什么标准做出诊断会很好。是的,我不知道我是否会信任它。"(FG7#5)

数据隐私、透明度和可解释性

大多数参与者认为德国现有的数据保护足以用于放射学中的AI使用。然而,少数参与者对为AI开发及其应用收集和存储数据表示极度不适。这些参与者强调了保持选择自由的重要性。

确保AI使用的透明度对所有参与者都很重要。作为技术外行,参与者觉得自己无法评估诊断中AI的质量。考虑到误诊的潜在严重后果,应披露使用的训练数据类型,并明确说明和传达算法的准确性。开发软件的公司声誉被认为是软件可信度的良好指标。尽管透明度被视为接受AI使用的必要前提,但参与者不确定如果他们个人受到影响,这是否有助于建立对AI诊断的信任。

参与者对AI诊断的可解释性表达了对比态度。一个群体认为只要证明了卓越性能,AI的"黑箱"特性就不是问题。这个论点并没有说服同样规模的认为AI的"黑箱"特性有问题的群体。对于这些参与者来说,AI得出结果的过程必须可重建,才能信任AI诊断、澄清误诊并分配责任。

表1列出了患者对放射学诊断中使用AI要求的框架条件。引文是各自类别的典型例子。

医生的角色

满足AI使用的技术要求和框架条件并不自动导致愿意选择使用AI的放射科医生。

在需要通过放射学澄清疑似严重神经系统疾病(如多发性硬化症)的情况下,除3名参与者外,所有参与者都表示会选择使用AI的放射科诊所。然而,这种偏好取决于放射科医生在与转诊医生协商后仍对异常的临床相关性解释和最终诊断负责。

除1人外(他更喜欢在所有情况下使用自动化AI),参与者强烈认为AI应仅作为经验丰富的医生手中的工具使用:

"如何解释这一点、它对个别病例的相关性以及如何处理的决定必须不受限制地留在医生手中。"[FG2#5]

对医生与AI的信任

参与者认为独立的医疗评估对信任AI诊断很重要。当主治医生怀疑AI的诊断时,这一点尤为明显。

如果发现需要治疗的异常,AI诊断并不会自动导致愿意接受治疗。只有1名参与者提到他们会信任AI诊断并遵循治疗。另一方面,只有少数人在这种情况下无条件信任医生的判断。大多数人追求安全策略,希望通过寻求第三意见来消除不确定性。也可以再次使用AI支持的程序,但在绝大多数情况下,认为需要医生再次审查AI结果。

医生的信任构建功能

医生重要角色的原因之一是检查AI输出的要求。许多参与者不仅要求进行合理性检查,还要求通过额外的独立评估验证AI输出。对大多数参与者来说,决定性因素是仅归因于医生并被认为对确保基于个别病例的平衡结果必不可少的特征和技能(表2)。在他们看来,医生对人类有整体看法,使他们能够根据患者的整个传记对临床情况进行分类,并考虑可能与诊断相关的个体因素。

类别 说明性引文
防止误诊的检查 "我看到的风险是机器仍然会出错,仍然有人必须检查诊断是否正确。"(FG5#2)
通过独立诊断进行备份 "……一方面,你想通过AI获得支持,但另一方面,你不能100%依赖它。相反,医生本人必须每次评估图像并形成自己的意见。"(FG4#2)
考虑患者的个体性 "对我来说,医生仍然是理解整个人类系统的那个人。而AI只是评估数据并从中得出结论的锡制白痴。所以AI总是只有一个焦点:请现在评估这些图像数据。并输出结果。"(FG3#4)
通过直觉、灵活性和创造力扩展诊断背景 "……AI无法实现如此整体和创新的东西。人类固有的创造力,最终在做出诊断时需要。"(FG5#1)

还指出,医生可以利用他们的智力能力偏离常规。他们的直觉、创造力和灵活性使他们能够做到这一点。正是医生的这些品质在识别超出特定问题的异常和诊断罕见疾病方面受到高度重视。

然而,参与者同时对医生的信任构建功能是否能够实现表示怀疑。在他们看来,使用AI可能导致放射科医生能力下降。最大的风险被视为医生对AI输出的过度自信以及对结果的关注和监测不足:

"当然,这将导致质量下降,因为整个链条中的医生都会依赖AI,事情会更快地被检查:AI给出这个和那个诊断,再看一眼:是的,没问题。如果主治医生得到这个,他说:是的,另一位医生已经同意,所以一切都没问题,我们将这样处理。"[FG5#2]

此外,参与者假设AI与放射科医生的组合只是向自动化AI过渡的一个阶段。参与者对此发展表示极大担忧:

"因为我看到一点时间线。我认为一旦AI介入,迟早会归结为第三点:自动化AI。因为也许一开始你更信任放射科医生,因为他们经验更丰富。然后AI已被证明如此多次,以至于你认为,好吧,AI有最终决定权。"[FG3#6]

医患关系

参与者认为保留医患关系的社会和情感方面很重要(表3)。这不仅仅是关于沟通,而是关于体验同理心、相互交换关系以及感觉自己处于良好状态的感觉。对参与者来说,知道即使使用AI,医生仍会继续对他们的患者负责至关重要。对他们来说,重要的是医生基于患者的福祉做出决定。对患者而言,这意味着医生不仅基于知识,还基于价值观行事。此外,医生应该向患者解释什么是AI、如何使用它、如何评估其结果,最重要的是AI支持诊断的附加值是什么。

大多数参与者担心医患关系可能受到威胁:

"我可以看到这在诊所中成为常态的危险。AI结果在那里:砰,就这样做,继续前进。所以医生可能会花更少的时间进行个人咨询,不再仔细看患者。"[FG2#2]

他们怀疑通过AI提高效率来减轻医生工作量实际上是否会为患者带来更多时间。相反,他们担心医疗保健中的非人性化和去个性化会增加。

类别 说明性引文
建立人际关系 "对我来说,与医生在一起并看到他再次仔细查看它非常重要。在那一刻,患者感觉被照顾得非常好,而不仅仅是一张纸在手中,这一点非常非常重要。"(FG1#1)
对患者负责 "对我来说,风险基本上在于机器根据我的身体提供的事实或疾病显示的事实做出诊断。但这不仅仅是这些。责任也在这里发挥作用。"(FG1#3)
基于道德价值观做决定 "对我来说,AI代表逻辑。对我来说,医生代表良知或人类特质以及犹豫。所以不是像:一个或零,一个或零。"(FG7#3)
解释使用AI的个人附加值 "我的意思是,当患者到达并说'是的,你为什么要这样做?'时,医生至少必须能够解释他为什么这样做,优势是什么,以及患者将从中获得什么。"(FG2#4)

讨论

主要发现

本研究的结果表明,患者总体上对在放射学诊断中使用AI持开放态度。这与其他研究表明各种人群对其他医疗领域AI的开放态度一致[45,46]。患者认识到基于扩展医学知识的更准确、更快诊断的潜力,同时强调不仅在批准期间而且在持续应用中质量保证的重要性。

然而,本研究的深入讨论表明,上述优势只有在同时以使AI使用为患者带来真正附加值的方式设置医疗保健系统的情况下,才会增加对AI的接受度。以患者为中心的护理是患者支持使用AI需要满足的最重要因素之一。特别是,这意味着医生应利用通过使用AI节省的时间为患者提供更个性化的护理。合理化效果和成本节约——如更快的患者流动(即相同时间内更多患者)、人员节约,甚至AI替代放射科医生——是患者拒绝使用的主要原因。此外,预期的AI开发和应用日益商业化与对患者护理的负面影响相关联。这些方面在先前的研究中受到的关注太少。

本研究表明,决定AI接受度的不仅是技术特征——特别是高性能和可靠性;整个社会技术系统的质量也起着作用。

当涉及到如果怀疑需要放射学澄清的严重疾病,具体愿意选择使用AI的放射科医生时,这一点尤为明显。在这方面,患者感到不确定。在这种情况下,患者特别重视医生的角色和功能。如其他研究所示,患者非常重视由医生检查AI发现[47,48]。

此外,本研究能够通过表明所需不仅是合理性检查,而是扩展诊断背景的独立诊断来扩展先前发现。问题不在于AI是作为第一意见还是第二意见使用;相反,医生应该为诊断过程贡献特定的技能和能力,从患者角度看AI缺乏这些能力,如直觉、灵活性和创造力。只有这样,在参与者的观点中,每个病例的个体性才会得到适当考虑,并会发现超出AI训练的特定问题的异常。AI无法将孤立的影像结果整合到患者生活状况的更广泛背景中,这一点在放射学界也被讨论为当今AI系统的重要限制。经常强调放射科医生更细致的专业知识在诊断过程中的不可或缺性[49]。

然而,患者担心这些促进信任的医生功能可能会因过度依赖AI结果和医生能力下降而被削弱。随着向自动化AI的趋势既被预期又被担忧,这尤其令人担忧。这与放射科医生自己认为放射科医生不太可能被替代形成对比[50]。

结果表明,如果患者个人受到影响,他们实际上是否会真正选择AI诊断存在高度不确定性。如果医生怀疑AI结果,患者更信任医生而非AI结果的发现也表明了这一点。

本研究的结果表明,重要的不仅是医生的能力,还有医患关系。这一结果证实了先前的发现,即维持熟悉的医患关系对患者至关重要[51,52]。焦点小组中的深入讨论阐明了在使用AI时医患关系的哪些特征很重要。需要富有同理心的关系和医生对患者福祉负责。此外,患者强调医生应在个别情况下就使用AI的利弊承担咨询角色。这也包括能够提供有关AI质量的信息。各种研究表明使用AI的透明度以及患者希望被告知是否使用AI的重要性[53,54]。本研究的结果还显示,作为信息的受信任调解者,医生应在消除担忧和恐惧方面发挥核心作用。医患关系中的这些因素可以建立对诊断过程的信任。信任可以促进对使用AI的接受[55,56]。然而,AI也有潜力破坏以人为中心的医患关系[57,58]。本研究表明,这正是患者在放射学诊断中使用AI时所担忧的。

本研究的发现,特别是医患关系的重要作用,出现在德国高度发达的医疗保健系统的背景下,该系统以高标准为特征。通常,平等获得新技术得到保证,成本根据团结原则在系统内共享。在实施新技术之前会考虑伦理和监管问题。在结构不同的其他国家的医疗保健系统中,患者可能会认为其他因素与接受度和信任相关,或者以不同方式权衡这些因素。

优势和局限性

本研究使用创新的焦点小组方法检查了患者对放射学诊断中使用AI的看法。与许多先前的研究倾向于使用更抽象的方法不同,本研究使用场景作为刺激物,深入了解患者在影响他们个人的情况下对使用AI的推理。这种方法通过关注患者决定支持或反对使用AI的放射科医生的动机,扩展了当前研究。研究的一个局限性可能是患者受教育程度高且对技术有强烈亲和力。这两个因素都可能导致比一般人群对AI更积极的态度[59]。尽管使用了多种渠道来接触参与者,并且参与不需要事先了解AI知识,但通过患者组织和自助小组进行的自我选择和招募可能会引入一些选择偏差。因此,结果可能对社会经济地位低且数字和健康素养低的患者的适用性有限。然而,这并不影响本定性研究中识别的论证模式的有效性。尽管如此,使用在社会经济地位和数字素养方面更具异质性的样本验证结果可能会进一步加强结论。

结论

本研究表明,患者总体上对在放射学诊断中使用AI持开放态度,这取决于社会技术系统的设计。决定性的不仅是AI的性能;需要广泛的质保措施,最重要的是以确保为患者带来真正附加值的方式将AI整合到医疗保健系统中。同时,研究表明,在个人参与的情况下,使用AI的决定——超越感知的抽象优势和劣势——在很大程度上取决于医生在诊断过程中建立信任的作用。因此,需要使用AI的框架条件,避免限制医生独立行动并将他们降级为"AI信使"的约束。必须防止对AI结果的过度自信和能力下降。应保持医患关系的完整性。在此基础上,患者在医生指导的诊断过程中不会感到"受AI摆布",而是感到"处于良好状态"。这有助于克服现有的不确定性。通过加强医生在使用AI时的信任构建作用,可以促进接受度和信任。

致谢

作者感谢德国联邦研究、技术和空间部对本研究的财政支持。作者还要感谢所有参与本研究的患者。作者还感谢"超越性能:探索脑医学中人工智能框架"(FRAIM)项目协调员Bert Heinrichs教授对本研究的支持。特别感谢Katrin Heyl,理学硕士,她参与了焦点小组的招募和组织,以及作为内容分析中的编码员。作者声明在创建手稿的任何阶段均未使用人工智能。

资金

经验研究是德国联邦研究、技术和空间部资助的"超越性能:探索脑医学中人工智能框架"(FRAIM)项目(资助号01GP2113A)的一部分。资助者未参与研究设计、数据收集、分析或解释,或手稿撰写。

数据可用性

本研究中使用和分析的数据集不可用,因为它们受《通用数据保护条例》(第9条)保护。

作者贡献

作者负责定义作为"超越性能:探索脑医学中人工智能框架"(FRAIM)项目内经验子项目的概念,并参与撰写资金申请。作者进行了研究,收集和分析了数据,并撰写了手稿。

利益冲突

无声明。

【全文结束】