随着谷歌最新突破,AI进入3D医学影像的核心With Google’s Latest Breakthrough, AI Reaches the Core of 3D Medical Imaging

环球医讯 / AI与医疗健康来源:analyticsindiamag.com美国 - 英语2024-11-05 11:37:00 - 阅读时长5分钟 - 2365字
谷歌推出CT Foundation,通过1,408维向量捕捉器官、组织和异常的关键细节,加速3D医学影像处理和诊断。
AI3D医学影像医学影像CT扫描谷歌CTFoundation大型语言模型诊断治疗患者护理
随着谷歌最新突破,AI进入3D医学影像的核心

AI正在积极改变医疗行业,尤其是在医学影像领域。这种数据驱动的方法帮助医生更快、更准确地诊断和治疗患者。技术加快了成像过程,并支持每位患者的个性化治疗计划。

AI在成像过程中的作用是什么?

通过分割,特定结构在图像中被突出显示,有助于早期和准确地检测疾病。预处理技术进一步提高了图像质量,通过重建不完整或有噪声的计算机断层扫描(CT)数据。除了诊断,预测分析使医生能够预测疾病的进展速度并建议潜在的治疗方法。质量控制措施确保图像清晰无伪影,以便可靠使用。同时,连续成像允许持续监测,因此可以根据需要随时调整治疗方案。

AI在CT扫描中的直接应用

CT扫描是一种3D成像技术,在检测肺癌、神经问题和创伤等疾病方面发挥着关键作用。仅在美国,每年就进行超过7000万次检查。科技巨头谷歌最近宣布发布CT Foundation,其新的3D CT体积医学基础工具。

根据官方博客文章,CT Foundation利用谷歌在2D医学成像方面的先前经验,包括胸部X光、皮肤病学和数字病理学。该工具基于VideoCoCa,简化了处理DICOM格式CT扫描的过程,通过创建一个1,408维向量来捕捉器官、组织和异常的关键细节。

宣布CT Foundation,这是一种新的医学影像嵌入工具,接受计算机断层扫描(CT)体积作为输入,并返回一个小而信息丰富的数值嵌入,可用于快速训练模型。了解更多并亲自试用: pic.twitter.com/hXKN8uTh4V

—— 谷歌AI (@GoogleAI) 2024年10月21日

CT Foundation使研究人员能够更高效地训练AI模型,所需数据更少,显著减少了与传统方法相比所需的计算资源。研究人员还可以免费使用其API。将AI集成到复杂的3D CT扫描解释任务中,提供了先进的分析工具,帮助放射科医生发现可能被忽略的最小异常。

例如,AI驱动的方法现在简化了中风患者的血流评估,提供实时见解,加速关键护理情况下的治疗决策。Rafał Obuchowicz及其同事在COVID-19研究中发现,3D CT分析揭示了感染后癌症患者的纤维化肺变化,增强了对感染引起的脆弱性的总体理解。生成对抗网络(GANs)用于增强CT图像重建,填补缺失数据。此外,UnetU这一深度学习工具去噪图像并增强材料区分,减少处理时间并支持更详细的分析。这种深度学习的分割提供了彻底的诊断见解,取代了手动注释,提高了工作流程效率,最终通过增强的诊断清晰度改善了患者结果。

大型语言模型如何分析医学扫描?

根据美国国家医学图书馆的数据,大型语言模型(LLMs)有能力提高迁移学习效率,整合多模态数据,促进临床互动,并优化医疗成本效益。论文还指出,对于LLMs至关重要的变压器架构在医学领域越来越受到关注。

NIH关于LLMs临床应用的潜在流程图

来源:大型语言模型在医学图像处理中的作用,NCBI,PMC

ChatGPT的亮点

根据今年早些时候由美国国家医学图书馆发布的另一篇论文,ChatGPT在提高临床工作流程效率和诊断准确性方面发挥着重要作用。它涵盖了医学影像的多个领域,如图像描述、报告生成和分类、从报告中提取发现、回答视觉问题和进行可解释的诊断。报告还指出,研究人员和临床医生之间的合作是充分利用LLMs在影像中的应用所必需的。

LLMs在放射学中的应用

今年1月,北美放射学会发布了一篇关于放射学中的聊天机器人和大型语言模型的论文。该论文讨论了包括考虑文本和图像的多模态模型在内的LLMs。“这些模型有潜力改变放射学实践和研究,但在监督环境中实施之前必须进行优化和验证。”文中提到。该论文还提到了幻觉、知识截止日期、复杂的推理能力差、倾向于延续偏见和随机性等当前放射学中的一些主要局限性。

发展的加速步伐

加州大学洛杉矶分校的两名研究人员Eran Halperin和Oren Avram最近开发了一种AI驱动的基础模型,可以准确分析医学3D影像。该模型SLIViT(通过视觉变压器切片集成)可以在比人类专家更短的时间内分析MRI和CT扫描。

SLIViT利用大量注释的2D医学图像的知识,即使在3D训练数据有限的情况下也能有效执行3D成像任务。

—— Simona Cristea (@simocristea) 2024年11月2日

谷歌的CT Foundation进入了一个已经由微软通过其Project InnerEye涉足的领域,这是一个用于医学影像AI的开源软件,用于深度学习研究。该项目也在微软关于“生物医学影像”的博客中有所介绍,该博客讨论了使用AI解决医学影像的速度、量化和成本挑战。博客还讨论了各种研究重点领域,包括用于图像重建的机器学习、放射治疗图像分割、眼科、数字病理学、流行病准备和微软的连接成像仪器项目。

CT Foundation仅用于研究

随着工具的发布,谷歌还分享了一个Python笔记本,一个可用的演示笔记本,用于使用公共数据训练模型,包括用于肺癌检测的模型。谷歌还在六个与头部、胸部和腹部相关的临床任务中测试了该模型。每个测试都涉及检测颅内出血、肺癌和多种腹部异常等状况。结果显示,即使在训练数据有限的情况下,模型的曲线下面积(AUC)得分也超过了0.8。AUC的测量范围在0.0到1.0之间,1.0表示完美模型,0.5表示随机机会。尽管如此,该工具尚未准备好用于医疗诊断。

“我们开发此模型仅用于研究目的,因此不得用于患者护理,也不得用于诊断、治愈、缓解、治疗或预防疾病。例如,该模型和任何嵌入不得用作医疗器械。”谷歌表示。

随着机器学习演变为AI并继续发展,它承诺提供更准确的诊断、更少的错误和更好的结果,最终将医学影像提升到前所未有的水平。


(全文结束)

大健康
大健康