GPT-5医疗能力突破：2025研究显示其测试成绩超越专家 - AI与医疗健康

GPT-5医疗能力突破：2025研究显示其测试成绩超越专家GPT-5 Medical, 2025 Studies Show It Beats Experts On Tests

环球医讯 / AI与医疗健康来源：binaryverseai.com美国 - 英语2025-08-27 02:27:06 - 阅读时长4分钟 - 1503字

2025年两项研究证实GPT-5在医学问答测试MedQA中取得96.3%准确率，超越其他AI模型并展现跨模态临床推理能力，在脑肿瘤MRI分析等专项测试中表现接近临床应用门槛，揭示AI医疗应用从单模态识别向多模态综合诊断的重大突破，但需配备监督机制确保安全性。

GPT-5医疗能力：高级医学推理能力综述

2025年8月19日 Ezzah报道

基准测试显示GPT-5在MedQA测试中达到**96.3%**准确率，略高于GPT-5 Mini的96.2%和Claude 4 Opus的96.1%，显著领先于Grok 4的92.5%。这标志着AI医学推理能力迈上新台阶，每百项测试中错误更少且诊断支持更稳定。

研究来源：vals.ai MedQA基准测试（2025年8月12日）

临床实践中持续存在的问题正在得到解答：AI能否在真实患者数据中实现跨模态推理？最新研究证实GPT-5的医学能力已超越单纯事实复述，在包含脑肿瘤MRI图像的神经肿瘤学测试中展现出实质进展。这种进步不是技术噱头，而是切实的临床推理能力提升。

达里亚·乌尼塔斯博士指出："GPT-5能够预测我们尚未进行的实验结果。"这项声明虽显大胆，但最新发表的两篇论文提供了实证支持：一篇评估多模态医学推理广度，另一篇聚焦高风险领域脑肿瘤MRI解读。研究表明GPT-5作为通用推理引擎，在保持专业性的同时仍存改进空间。

传统AI系统受限于单模态处理能力，仅能检测结节或解析文本。GPT-5革新性地整合文本、实验室数据、影像等多元信息，其多模态处理能力对安全分诊、二次阅片和医患沟通具有变革意义。研究团队验证了GPT-5在课堂式问题解答与专科影像模式识别间的迁移能力。

通过MedQA、MMLU医学子集、USMLE题库及MedXpertQA MM等测试，GPT-5展现出超越GPT-4o的能力。在零样本链式推理中，模型不仅能给出答案，更能解释推理过程。与人类医学生的对比显示：

模型	文本推理	文本理解	多模推理	多模理解	综合表现
人类医学生	41.74	45.44	45.76	44.97	45.53
GPT-5	56.96	54.84	69.99	74.37	72.18

基于BraTS数据集的测试显示，GPT-5系列模型在胶质瘤、脑膜瘤和转移瘤分类中达到43.71%宏观准确率（GPT-5）和44.19%（GPT-5 Mini），虽未达临床自主诊断标准，但已展现出辅助诊断潜力。研究强调需建立监督机制进行校准验证。

胰腺炎治疗过程中出现纵隔气肿的病例，GPT-5成功识别出博弗莱瓦综合征，推荐水溶性造影检查、禁食管理及广谱抗生素治疗。这种基于时间序列的动态推理能力，标志着AI从单一识别向综合诊断的飞跃。

医疗机构应将GPT-5定位为智能决策层，并采取以下措施：

需通过前瞻性试验验证模型稳定性，特别是在跨机构影像设备差异应对方面。建议保持开发集与验证集分离，界面设计需清晰展示不确定信息。达里亚博士评价："它已超越助手角色，更像一位严苛的导师。"

预计短期内将在三个领域取得突破：

建议医疗团队：

【全文结束】