一项新的研究开发出一种基于人工智能的融合模型,使用来自亚马逊Alexa和谷歌Home等设备的语音录音,在帕金森病筛查中表现出高度准确性和公平性,显示出在家庭环境中实现大规模早期检测的巨大潜力。
帕金森病(PD)是一种神经退行性疾病,其早期诊断仍然是临床面临的挑战。语音方面的细微变化通常先于更明显的运动症状出现,而这些变化对于非专业人士来说往往难以察觉,这为早期检测和干预提供了机会。随着语音激活的智能音箱在家庭中的普及,研究人员正在探索这些日常设备与先进人工智能方法结合后,是否能够实现可及性强、非侵入性的帕金森病大规模筛查。
在这项研究中,研究人员开发并验证了一种深度学习框架,该框架使用了来自1306名参与者的英语全字母句发音录音,其中包括392名确诊为帕金森病的个体。数据集涵盖了在家庭和临床环境中录制的声音,确保了年龄、性别(53.2%为女性)和种族背景的多样性。研究人员采用了复杂的语音处理模型——Wav2Vec 2.0、WavLM和ImageBind来提取细致的语音特征,捕捉可能指示帕金森病的微妙动态。这种新颖的融合架构将不同的语音嵌入对齐,以创建统一的特征空间,从而提高了区分帕金森病与非帕金森病病例的能力。在分层随机测试中,该模型实现了接收者操作特征曲线下的面积(AUROC)为88.9%,总体准确率为85.7%。重要的是,偏差分析证实了该模型在所有关键人口统计群体中的公平性能,并且在不同的帕金森病阶段和病程中均具有稳健性。进一步的外部验证显示,在两个独立的临床队列中,AUROC分别为82.1%和78.4%,在一个通用的非临床自发英语语音数据集中为77.4%,突出了该模型适应现实世界自然语音输入的能力。错误分析表明,误分类倾向与某些年龄组相关,这与临床实践中帕金森病诊断的复杂性相呼应。
研究结果表明,低成本、广泛使用的语音助手未来可能在家庭环境中的早期和公平的帕金森病筛查中发挥变革性作用,从而减少诊断延迟并改善医疗服务的获取,尤其是在服务不足的人群中。对于临床实践而言,此类技术可以促进更早的转诊、纵向语音追踪和更高效的病例发现,前提是建立适当的隐私保护措施和临床路径。未来还需进一步的前瞻性研究来验证其临床影响并优化与现有医疗系统的整合,以确保在不同语言和现实环境中具有可靠性。
参考文献
Adnan T 等人. 一种利用半监督语音嵌入检测帕金森病的新融合架构. npj Parkinsons Dis. 2025;11:176.
【全文结束】


