关于NYUTron
纽约健康科学图书馆致力于支持纽约大学朗格尼健康中心(NYU Langone Health)的创新AI项目,其中NYUTron(读音:new-tron)是重要成果。该项目由神经外科、放射学和数据科学助理教授埃里克·奥曼博士(Dr. Eric Oermann)与运营数据科学和机器学习主任尹阿芬亚纳冯格斯博士(Dr. Yin Aphinyanaphongs)共同领导。NYUTron是基于纽约大学朗格尼健康中心十年住院记录临床文本训练的大型语言模型(LLM)平台,旨在处理非结构化文本并执行分类及数值预测任务。
NYUTron的研究成果已发表于《自然》杂志,其影响力在替代计量指标(非传统学术引用的指标,包含社交媒体提及、下载量及在线讨论等)评估中达到99百分位,充分证实了其在科学界的广泛影响。
NYUTron实施要点
核心特性:
- 1.9亿参数
- 基于387,144名患者41亿词临床记录(已识别版本)训练
- 可灵活微调以处理非结构化文本的分类与回归任务
有效性验证:
- 预测院内死亡率
- 填充合并症指数
- 预测30天全因再入院率
- 估算住院时长
- 预测保险拒赔
提升医疗领域的自然语言处理能力
该平台提供已去除受保护健康信息(PHI)的脱敏模型,纽约大学朗格尼健康中心(NYULH)全体教职员工可免费使用。如需获取脱敏模型,请向预测分析部门(PAU)提交申请。
我们鼓励纽约大学朗格尼健康中心成员将此模型用于自身预测任务。江LY等人的健康系统级语言模型研究论文提供了潜在应用场景及技术细节参考。
未来规划
NYUTron团队计划扩展模型类型,包括BERT类模型(双向编码器表示变换器,通过双向上下文理解语言细微差异)及生成式模型。团队目标是为电子健康记录(EHR)构建通用自然语言处理(NLP)工具接口。
江LY, 刘XC, Nejatian NP, 等. "Health System-scale Language Models are All-purpose Prediction Engines". 自然. 2023年7月; 619(7969): 357-362. doi: 10.1038/s41586-023-06160-y. PMID: 37286606; PMCID: PMC10338337.
关键资源
- 研究论文:阅读全文
- 代码库:GitHub平台技术文档
- 申请表:模型权重获取通道
如有关于纽约大学朗格尼健康中心AI应用的疑问,请联系:DAAIT@nyulangone.org
【全文结束】

