专家访谈:德克萨斯大学维布蒂·古普塔博士谈人工智能在医疗健康研究中的应用
2026年2月20日 • 下午2:31
作者:哈里森·曹
在专家系列研讨会中,德克萨斯大学医学分部(UTMB)公共卫生与人口健康学院(SPPH)生物统计与数据科学系副教授维布蒂·古普塔博士分享了现代人工智能方法在医疗健康领域的应用概况,并介绍了UTMB团队如何为机器学习赋能的研究提供支持。
医疗人工智能的实践框架
大数据无处不在,但价值源于将数据转化为决策。古普塔博士阐述了当前人工智能工具箱——特别是深度学习和新兴的生成式AI方法——如何自动化部分模式识别过程,这些过程以往需要大量人工特征工程,使得规模化分析复杂数据类型(如影像、音频信号、长期传感器流及高维临床记录)成为可能。
他特别强调并非所有问题都需要机器学习:若任务简单且具有确定性,传统分析流程可能是更优选择。当输入数据复杂、体量庞大或人类难以一致解读时(例如放射学/病理学影像、语音信号、可穿戴设备传感器流或大型电子健康记录衍生的时间序列),机器学习和深度学习才最显价值。
研究支持的四大方向
古普塔博士在演讲中概述了其构建方法并可通过咨询与合作支持UTMB项目的四个关键领域:
1) 医疗健康领域的机器学习与深度学习
他梳理了团队普遍面临的端到端研究流程:明确研究问题、识别与整理合适数据、投入大量精力进行清洗预处理、选择适配数据类型模型、以及开展超越单一数据集的性能评估。此阶段团队常需协助判断是否值得采用深度学习方法,或更具解释性的模型能否更快更清晰地解答问题。
2) 移动健康与数字健康分析
古普塔博士讨论了处理移动健康及可穿戴设备传感器数据的挑战——"混乱"数据是常态:缺失值、离群点、采样不一致及设备噪声极易破坏下游结果。其前期工作聚焦构建预处理流程,使可穿戴设备与智能手机衍生数据集适用于医疗健康场景的AI/ML应用。
3) 多模态数据整合
他反复强调融合多源数据(如临床变量+影像+基因组学)的价值远高于孤立建模。以前列腺癌风险预测项目为例,整合多源数据显著提升预测性能,优于单一模态模型,并说明此类多模态流程应如何以结构化、可验证方式设计。
4) 伦理人工智能、公平性与透明度
古普塔博士指出偏差可能在多个环节产生:失衡的输入数据、基于倾斜数据的模型训练、以及输出校准与使用方式。其研究与培训工作涵盖检测缓解偏差的方法,支持更透明负责的部署实践——当模型影响临床决策或资源分配时尤为重要。
从模型到临床的转化挑战
研讨会核心观点指出:构建模型与部署安全可靠、可泛化的系统之间存在显著鸿沟。医疗人工智能通常需要:
- 跨多数据集与场景的验证,
- 谨慎测试单机构或患者队列之外的泛化能力,
- 以及系统投入实践后对公平性与性能漂移的持续监测。
这种转化负担真实存在,但也明确了团队早期所需要素:更精准的问题定义、更扎实的数据准备、以及匹配实际应用场景的评估计划。
【全文结束】

