人工智能(AI)正在成为医学影像中不可或缺的工具,帮助放射科医生更快、更准确地分析扫描结果。然而,AI模型需要大量的标注数据才能正常工作,这意味着放射科医生仍然需要花费大量时间手动标记图像。
由约翰斯·霍普金斯大学的研究人员领导的一项新国际项目提供了解决方案——AbdomenAtlas,这是迄今为止创建的最大腹部CT扫描数据集。
AbdomenAtlas 数据集包含了来自全球145家医院的超过45,000个3D CT扫描图像,涵盖了142种不同的解剖结构,使其比下一个最大的数据集_TotalSegmentator V2_ 大36倍。
这个庞大的扫描集合预计将大大改进AI训练,使机器能够更好地检测器官、肿瘤和疾病。该数据集及其应用最近发表在《医学图像分析》期刊上。
过去,放射科医生需要手动标注CT扫描中的器官,这一过程耗时数千小时。为了说明这一挑战,标记45,000个扫描图像中的六百万个解剖结构将需要一位专家从公元前420年(希波克拉底时代)开始不间断地工作到2025年。显然,这项任务仅靠人力是无法完成的。
为了加快进程,约翰斯·霍普金斯大学团队在艾伦·尤尔教授的带领下,使用AI模型处理了大部分标注工作。他们的方法结合了三个在现有标注数据集上训练的AI系统,用于预测新未标注扫描图像中的解剖结构。
这些AI模型通过颜色编码的关注图突出显示需要审查的区域。一个由12名专家放射科医生和医学实习生组成的团队手动检查并优化了AI的预测结果。
这种方法极大地减少了标注扫描所需的时间。对于肿瘤标注,速度提高了10倍,而对于器官标注,则提高了500倍。
这使得研究人员能够在不到两年的时间内构建出最大的完全标注腹部器官数据集——这项任务如果仅靠人力,则需要超过2,000年。
随着更多扫描图像的添加以及人工和真实肿瘤样本的增加,该数据集将继续增长。这些新增内容将有助于AI模型在检测癌症、诊断疾病方面取得进步,甚至可以创建患者的“数字孪生”用于个性化医疗。
除了训练AI外,AbdomenAtlas 还作为评估其他医学影像算法的基准。通过在如此庞大的数据集上测试AI模型,研究人员可以更好地确保这些模型在实际医疗环境中可靠运行。
该团队已经在国际医学影像会议的_BodyMaps Challenge_等竞赛中使用了该数据集,以鼓励开发既准确又适用于临床使用的AI技术。
尽管规模庞大,AbdomenAtlas 仅代表美国每年进行的CT扫描的0.05%。研究人员希望更多的医院和机构能够合作扩大该数据集。他们认为,共享数据和跨机构合作对于推动医学AI的发展至关重要。
通过创建_AbdomenAtlas_,该团队提供了一个强大的资源,可能改变医学影像领域。随着AI的不断发展,像这样的数据集将有助于确保机器能够比以往任何时候更快、更准确地协助医生诊断疾病。
(全文结束)


