摘要
背景:医学人工智能(AI)这一快速发展的领域是否会复制、加剧或可能纠正已知的健康研究与疾病负担之间的不匹配,目前尚不清楚。
方法:我们从OpenAlex识别了197,844篇医学AI文章(2015-2025年),并使用经过验证的关键字词典(F1 = 86.2%)将它们映射到115个2023年全球疾病负担三级原因,覆盖了全球94.1%的伤残调整生命年(DALYs)。研究关注度指数(RAI)量化了每种疾病的出版物份额与其DALY份额的关系。多变量回归确定了AI关注度的驱动因素。模拟建模评估了AI的纠正潜力。
发现:AI研究与疾病负担呈中度相关(Spearman rs = 0.477;95% CI 0.318-0.615),但存在极端集中现象:前10种疾病占了54.4%的出版物。皮肤黑色素瘤(RAI 53.0)、脑癌(14.2)和乳腺癌(11.4)被过度研究;道路伤害(RAI 0.028;7470万DALYs,57篇出版物)、腹泻疾病(0.034)和焦虑障碍(0.036)则被研究不足。AI与高收入国家疾病负担的相关性(rs = 0.619)比与低收入国家疾病负担的相关性(0.239)高出2.6倍。基准数据集的可用性、研究社区规模和高收入国家疾病负担份额预测了AI关注度(R² = 0.71);而疾病负担本身并不显著。按照常规发展,AI将加剧这种差异;为研究不足的疾病战略性创建数据集可以使AI成为一种净纠正力量。
解释:医学AI研究通过数据可用性放大了研究-负担不匹配:研究人员研究的是有基准数据集的疾病,而不是造成最大痛苦的疾病。对高负担、研究不足的疾病进行数据集的战略性投资,可以将AI转变为一种纠正机制,实现传统研究从未达成的匹配。
关键词:文献计量学、人工智能、疾病负担、健康公平、研究优先级设定、全球健康、伤残调整生命年、基准数据集
【全文结束】

