医疗中心借助人工智能和联邦学习提高癌症检测水平Medical Centers Tap AI, Federated Learning for Better Cancer Detection

环球医讯 / AI与医疗健康来源:blogs.nvidia.com美国 - 英语2024-09-21 00:00:00 - 阅读时长4分钟 - 1844字
美国顶尖医疗中心和研究机构的专家委员会利用英伟达支持的联邦学习来评估其对癌症检测的影响。
人工智能联邦学习癌症检测医疗中心数据隐私英伟达医学成像肾细胞癌MONAIFlywheel医疗保健
医疗中心借助人工智能和联邦学习提高癌症检测水平

美国顶尖医疗中心和研究机构的一个专家委员会正在利用英伟达驱动的联邦学习,来评估联邦学习和人工智能辅助标注对训练用于肿瘤分割的人工智能模型的影响。

联邦学习是一种在不降低数据安全性或隐私性的情况下,基于不同数据源的数据开发更准确、更通用的人工智能模型的技术。它允许多个组织协作开发一个人工智能模型,而敏感数据无需离开其服务器。

威斯康星大学麦迪逊分校放射学副教授约翰·加勒特(John Garrett)表示:“由于隐私和数据管理的限制,在不同站点之间共享数据并将其汇总在一个地方变得越来越复杂——而且成像人工智能的发展速度比研究机构签订数据共享合同的速度还要快。实际上,采用联邦学习在多个站点同时构建和测试模型是跟上发展的唯一途径。这是一个不可或缺的工具。”

加勒特是影像信息学和医学学会(SIIM)机器学习工具和研究小组委员会的成员,该委员会由临床医生、研究人员和工程师组成,旨在推动医学成像人工智能的开发和应用。英伟达是 SIIM 的成员,自 2019 年以来一直与该委员会就联邦学习项目进行合作。

委员会主席哈立德·尤尼斯(Khaled Younis)表示:“联邦学习技术符合 GDPR、HIPAA 等隐私法规,增强了数据隐私和安全性。此外,我们看到模型的准确性和泛化能力得到了提高。”

为了支持他们的最新项目,该团队——包括来自凯斯西储大学、乔治敦大学、梅奥诊所、加利福尼亚大学圣地亚哥分校、佛罗里达大学和范德堡大学的合作者——利用了英伟达 FLARE(NVFlare),这是一个开源框架,包括强大的安全功能、先进的隐私保护技术和灵活的系统架构。

通过英伟达学术资助计划,该委员会收到了四块英伟达 RTX A5000 GPU,这些 GPU 被分配到参与的研究机构,用于建立他们的联邦学习工作站。其他合作者在云端和本地服务器中使用英伟达 GPU,突出了 NVFLare 的灵活性。

破解联邦学习的密码

六个参与的医疗中心中的每个中心都为该项目提供了约 50 项医学成像研究的数据,重点是肾细胞癌,一种肾癌。

范德堡大学计算机科学助理教授、生物医学数据表示和学习实验室主任袁凯·霍(Yuankai Huo)表示:“联邦学习的理念是在训练过程中我们交换模型而不是交换数据。”

在联邦学习框架中,初始的全局模型向客户端服务器广播模型参数。每个服务器使用这些参数建立一个基于组织专有数据训练的本地模型版本。然后,每个本地模型的更新参数被发送回全局模型,在那里它们被聚合以产生一个新的全局模型。这个循环重复,直到模型的预测在每次训练轮次中不再提高。

该小组对模型架构和超参数进行了实验,以优化训练速度、准确性以及将模型训练到所需精度水平所需的成像研究数量。

借助英伟达 MONAI 进行人工智能辅助标注

在项目的第一阶段,用于模型的训练数据是手动标注的。对于下一阶段,该团队正在使用英伟达 MONAI 进行人工智能辅助标注,以评估与传统标注方法相比,借助人工智能分割的训练数据在模型性能上的差异。

加勒特表示:“联邦学习活动通常面临的最大挑战是不同站点的数据不是非常统一。人们使用不同的成像设备,有不同的协议,并且对数据的标注也不同。通过在添加 MONAI 的情况下对联邦学习模型进行第二次训练,我们旨在发现这是否能提高整体标注的准确性。”

该团队正在使用 MONAI Label,这是一个图像标注工具,使用户能够开发定制的人工智能标注应用程序,减少创建新数据集所需的时间和精力。专家将在用于模型训练之前验证和完善人工智能生成的分割。

手动和人工智能辅助标注阶段的数据都托管在 Flywheel 上,这是一个领先的医学成像数据和人工智能平台,已将英伟达 MONAI 集成到其产品中。

项目完成后,该团队计划发布他们的方法、标注的数据集和预训练模型,以支持未来的工作。

加勒特说:“我们不仅对探索这些工具感兴趣,而且还将发表我们的工作,以便其他人能够在整个医疗领域学习和使用这些工具。”

申请英伟达学术资助

英伟达学术资助计划通过为研究人员提供世界级的计算访问和资源来推进学术研究。目前,认可学术机构的全职教职员工可以申请,他们正在使用英伟达技术来加速模拟和建模、生成式人工智能和大型语言模型的项目。

未来的申请周期将侧重于数据科学、图形和视觉以及边缘人工智能(包括联邦学习)的项目。

类别:深度学习 | 生成式人工智能 | 研究

标签:人工智能 | 教育 | 医疗保健和生命科学 | 社会影响

大健康
大健康