全球对自动化诊断、预测医学和日益复杂的模型充满热情之际,斯坦福医学院最近的一项研究引起了人们对一个令人不安的差距的关注:人工智能(AI)尚未解决现代医疗保健中最昂贵——也可能是最关键——的问题。这指的是庞大的行政成本,在美国每年超过1万亿美元,约占所有医疗支出的四分之一。
该分析揭示了当代AI的核心矛盾:虽然模型在复杂任务上迅速进步,但在基本但关键的操作活动中仍然失败。这揭示的不仅仅是简单的技术限制——它指出了AI被训练做的事情与现实世界实际需求之间存在的结构性脱节。
对AI"魅力"的迷恋——以及对本质的忽视
医疗保健中许多AI研究集中在高声望任务上:解读影像检查、预测疾病或协助复杂诊断。这些应用无疑很重要——但它们仅代表系统的一小部分。
斯坦福研究强调,真正支撑医疗保健获取的机制在别处:诸如程序授权、计费、理赔管理和保险分析等行政流程。
这些任务虽然不太显眼,但决定了谁接受治疗、何时接受以及以什么成本接受。它们也是医疗专业人员工作负荷过重和职业倦怠的主要来源。
隐含的批评很明确:AI已被导向解决从技术角度看"有趣"的问题——而不一定是那些从系统角度看最具影响力的问题。
隐形挑战:为何AI在操作层面失败
解决行政任务似乎比诊断疾病更简单——但实际上恰恰相反。
这些流程涉及复杂的流程、多个系统、模糊的规则和不断的例外情况。与受控的基准测试不同,行政世界是混乱的、碎片化的且高度情境化的。
研究本身指出,直到最近,甚至还没有可靠的指标来评估AI在这些真实工作流程中的表现。
这直接关联到AI社区中日益增多的批评:"基准测试幻觉"。模型可能在标准化测试中表现令人印象深刻,但在变量不可预测且不完整的现实环境中却会失败。
换句话说,当前AI擅长解决定义明确的问题——但在面对现实世界的模糊性时仍然脆弱。
错位创新的风险
这一差距不仅是技术性的——它也是经济和社会性的。
如果AI继续只在系统影响较小的领域发展,就有可能创造一种"错位"的创新:高度复杂,但对社会主要瓶颈的回报有限。
1万亿美元这个数字不仅仅是一个令人印象深刻的数字——它代表了效率低下、医疗延误以及获取医疗保健的真实障碍。
在投资数十亿美元开发日益强大的模型的同时忽视这个问题,可能意味着延续——甚至扩大——现有的不平等。
更现实的方法:减少炒作,更多基础设施
尽管诊断严厉,但研究并非悲观。相反:它指出,只要重点改变,我们"接近"取得重大进展。
研究的主要贡献之一是开发了更真实的测试环境,能够模拟完整的行政工作流程。
这表明了一个重要的范式转变:摆脱抽象评估,将AI更接近现实世界的操作复杂性。
此外,人们越来越认识到,有效解决方案不仅来自更强大的模型,还来自:
- 来自真实世界流程的更具代表性的数据
- 与现有系统的整合
- 以人为中心的工作流程设计
- 在实际环境中的严格评估
最大的教训:智能不仅仅是性能
"1万亿美元问题"揭示了关于当前人工智能状态的一个令人不安的事实:技术能力并不等同于实用价值。
AI的历史在不同时期表明,实验室中的惊人进展并不总是转化为现实世界的影响。当前情景表明,我们正面临又一次这样的转变。
如果AI的下一阶段要真正具有变革性,它将需要应对那些不那么吸引人——但远为相关——的挑战。
结论
斯坦福的研究起到了战略警示作用:AI在医疗保健中的未来不仅由其预测疾病的能力决定,还由其驾驭——并简化——定义医疗获取的官僚复杂性的能力决定。
解决1万亿美元问题不仅仅关乎效率。从根本上说,这是一个关乎公平、可持续性和优先级的问题。
而这或许正是真正的智能——无论是人工的还是其他的——开始展现自身的地方。
【全文结束】

