佛罗里达大学健康学院(USF Health)和威尔康奈尔医学院的研究人员,作为一项广泛的多机构项目的一部分,研究语音作为疾病生物标志物,已经达到了一个重要里程碑,发布了他们第一个临床验证的语音数据集到一个在线人工智能平台。这将成为全球研究人员的宝贵资源。
该项目由美国国立卫生研究院(NIH)资助,名为“语音作为健康生物标志物”,旨在建立一个包含10,000个人类声音的道德来源的人工智能数据库,这些声音来自患有不同疾病的患者,以帮助医生根据患者的声音诊断和治疗疾病,如癌症和抑郁症。
首次数据发布包括来自美国和加拿大306名参与者的超过12,500个单独录音。该数据集将在多个平台上发布,包括Health Data Nexus,并向研究语音的健康研究社区开放。此次发布是在为期四年的1400万美元项目的第二年末进行的,未来两年内还将有几次额外的发布。到项目结束时,该数据集将成为世界上最大的AI语音和健康数据库。
USF健康莫萨尼医学院的Yaël Bensoussan博士表示:“这些初步录音中包含了大量信息,我们非常期待收到反馈,因为我们正在开发一个无与伦比的科学社区资源。对我们来说,了解人们如何利用这些初始数据以及可以回答哪些临床问题是至关重要的。”
作为NIH共同基金Bridge2AI计划资助的四个精准健康数据项目之一,“语音作为健康生物标志物”项目旨在通过训练AI模型识别人类语音中的变化,引入一种变革性的新方法来诊断和治疗疾病,具有广泛的临床应用前景。
该项目由USF领导,与威尔康奈尔医学院及美国和加拿大的其他10个机构合作。USF健康莫萨尼医学院的Yaël Bensoussan博士和威尔康奈尔医学院英格兰格精密医学研究所所长Olivier Elemento博士是该项目的共同首席研究员。
尽管之前利用语音和AI检测疾病的研究令人鼓舞,但由于数据集规模小以及数据安全、所有权和偏见方面的担忧,这些研究受到了限制。“语音作为健康生物标志物”项目通过汇集医疗语音、AI工程和伦理专家,生成一个使用隐私保护AI的标志性语音数据库,解决了这一不足。
威尔康奈尔医学院的Olivier Elemento博士表示:“人工智能正在彻底改变我们检测和理解疾病的能力,而这一开创性的语音数据集是这一旅程中的重要一步。这些临床验证的数据结合尖端的AI技术,为新的诊断可能性和开创性的创新铺平了道路,将全球范围内的患者护理推向新的高度。”
新发布的数据集因其录音的广泛性和质量而特别引人注目,这些录音从多个机构的门诊临床环境中收集而来。数据经过临床验证并在各地点标准化,所有参与者都执行相同的测试和声学任务。三种类型的声学任务——呼吸、语音和言语与语言——包括超过20项任务,如静息呼吸、咳嗽、长时间间隔发音“E”、朗读特定段落、自由讲话和其他与语音相关的活动。
Bensoussan博士表示:“这种高质量、标准化的数据对于验证现有语音算法和推动新发现的发展至关重要。研究人员可以将其用作基准数据集,以确认他们的算法是否有效。例如,一些初创公司已经使用其专有数据开发了诊断语音生物标志物的算法,我们的数据集可以用来验证这些算法是否也适用于不同类型的疾病患者。”
伴随数据发布的是Bridge2AI语音准备工具包,提供了一系列工具供研究人员预处理和利用数据。Bridge2AI联盟还将于2025年4月22日至24日在佛罗里达州坦帕市举办Voice AI研讨会和黑客马拉松,连接临床科学家、研究人员、患者和AI领域的顶尖人才,推进语音AI在医疗保健中的应用和数据库在开创新发现中的实用性。
Bensoussan博士表示:“这样规模和范围的工作是一项团队努力,美国和加拿大的许多研究人员和机构共同努力,推动医疗保健领域的发现。通过这项工作及其将在世界其他地方促进的研究,我相信你会看到很多进展和一些非常有影响力的产品开发。”
“语音作为健康生物标志物”项目主要研究人员
- Yaël Bensoussan,MD,USF健康莫萨尼医学院(共同首席研究员)
- Olivier Elemento,PhD,威尔康奈尔医学院(共同首席研究员)
- Alexandros Sigaras,威尔康奈尔医学院
- Anaïs Rameau,MD,威尔康奈尔医学院
- Maria Powell,PhD,范德比尔特大学
- Ruth Bahr,PhD,南佛罗里达大学行为与社区科学学院
- Philip Payne,PhD,圣路易斯华盛顿大学
- David Dorr,MD,俄勒冈健康与科学大学
- Jean-Christophe Belisle-Pipon,PhD,西蒙弗雷泽大学
- Vardit Ravitsky,PhD,蒙特利尔大学
- Satrajit Ghosh,PhD,麻省理工学院
- Jennifer Siu,MD,多伦多病童医院
- Frank Rudzicz,PhD,多伦多大学
- Jordan Lerner-Ellis,PhD,多伦多大学
(全文结束)


