在本年度的Google I/O大会上,谷歌推出了MedGemma,这是一种基于当前Gemma 3架构设计的两个大型AI语言模型,用于分析医学文本和图像。MedGemma旨在显著加速新的医疗应用的开发。多模态的MedGemma 4B模型可用于创建分析放射图像、总结临床数据或其他医疗任务的AI应用。
由于其紧凑的尺寸,MedGemma可以高效地针对特定用例进行微调。根据谷歌的说法,在MedQA基准测试中,MedGemma 27B在临床知识和医疗推理方面表现与更大的模型如GPT-4o相当,尽管DeepSeek R1、Gemini 2.5 Pro和GPT-o3仍领先于MedGemma 27B。
MedGemma模型是免费提供的,可以自托管,并且可以在本地或Google Cloud平台上使用。MedGemma 4B和MedGemma 27B(仅文本)版本现在可以在Hugging Face和Model Garden上找到,这是一个由谷歌提供的AI和机器学习模型库。
这些模型可以与其他工具结合,以解决复杂任务,例如通过网络搜索查找最新的医疗信息,或使用FHIR解释器处理和创建标准化的FHIR格式健康数据。更多详细信息可以在官方MedGemma文档中找到。
此外,谷歌还展示了AMIE(Articulate Medical Intelligence Explorer)的最新发展——这是一种与Google DeepMind共同开发的用于医疗诊断对话的AI代理。新的多模态版本的AMIE还可以解释医学图像信息,如照片、实验室结果或心电图,并利用这些信息进行更精确的诊断。该系统专门设计用于请求此类数据、分析并将其整合到对话中。
疾病管理
AMIE AI代理旨在支持跨多次就诊的慢性疾病管理。为此,使用了两个代理:一个对话代理和一个管理代理,后者根据临床指南创建结构化的治疗和监测计划。
整个系统基于当前的Gemini模型,这些模型已经优化了多模态处理和复杂的医疗推理。用于AI训练的数据包括医学发现、摘要和真实的临床对话。根据谷歌的一项研究,AMIE在模拟患者聊天咨询中的表现优于真正的全科医生,尤其是在解释多模态数据(如图像、文本、发现)方面。据说该系统还表现出更多的同理心。
AMIE使用两个代理工作:对话代理负责进行对话并收集信息,管理代理(Mx Agent)则根据指南和患者数据创建和优化个性化的治疗计划。
(全文结束)


