AI模型结合语音和脑电活动诊断抑郁症AI model combines speech and brain activity to diagnose depression

环球医讯 / AI与医疗健康来源:www.news-medical.net立陶宛 - 英语2024-11-21 09:00:00 - 阅读时长3分钟 - 1352字
立陶宛考纳斯科技大学的研究人员开发了一种结合语音和脑电活动数据的AI模型,用于更准确地诊断抑郁症。
AI模型抑郁症诊断语音脑电活动多模态方法准确率MODMA可解释人工智能心理健康
AI模型结合语音和脑电活动诊断抑郁症

抑郁症是最常见的精神疾病之一。据估计,全球有2.8亿人受此病影响,因此,立陶宛考纳斯科技大学(KTU)的研究人员开发了一种人工智能(AI)模型,该模型能够通过语音和脑神经活动来识别抑郁症。这种多模态方法结合了两种不同的数据源,可以更准确和客观地分析一个人的情绪状态,开启了抑郁症诊断的新阶段。

“抑郁症是最常见的精神障碍之一,对个人和社会都有毁灭性的影响,因此我们正在开发一种新的、更客观的诊断方法,未来可能会普及到每个人。”KTU教授兼该项发明的作者之一Rytis Maskeliūnas表示。

科学家们认为,尽管大多数抑郁症的诊断研究传统上依赖于单一类型的数据,但新的多模态方法可以提供更好的关于一个人情绪状态的信息。

这种结合语音和脑电活动数据的方法在诊断抑郁症方面达到了97.53%的惊人准确率,显著优于其他方法。“这是因为语音为研究提供了我们目前还无法从大脑中提取的数据。”Maskeliūnas解释道。

KTU博士生Musyyab Yousufi也参与了这项发明,他指出选择这些数据经过了深思熟虑:“虽然人们普遍认为面部表情可能更多地揭示一个人的心理状态,但这种数据很容易被伪造。我们选择了语音,因为它可以微妙地揭示情感状态,而诊断会影响语速、语调和整体能量。”

此外,与脑电图(EEG)或语音数据不同,面部可以直接在一定程度上识别一个人的状态严重程度。“但我们不能侵犯患者的隐私,而且从多个来源收集和组合数据对于未来的应用更有前景。”KTU信息学院教授表示。

Maskeliūnas强调,所使用的EEG数据集来自多模态开放数据集用于心理健康分析(MODMA),因为KTU研究小组代表的是计算机科学领域,而不是医学领域。

MODMA的EEG数据是在参与者清醒、休息且闭眼的情况下收集和记录的,持续时间为五分钟。在音频部分的实验中,患者参与了一个问答环节和几个旨在捕捉其自然语言和认知状态的阅读和描述图片的活动。

收集的EEG和音频信号被转换成频谱图,以便可视化数据。应用了特殊的噪声滤波器和预处理方法,使数据去噪并可比较,然后使用修改后的DenseNet-121深度学习模型来识别图像中的抑郁症迹象。每个图像反映了信号随时间的变化。EEG显示了脑电波形,而声音则显示了频率和强度分布。

该模型包括一个自定义分类层,训练用于将数据分为健康或抑郁两类。成功分类后进行了评估,然后评估了应用程序的准确性。

未来,这种AI模型可以加快抑郁症的诊断速度,甚至实现远程诊断,减少主观评价的风险。这需要进一步的临床试验和程序改进。然而,Maskeliūnas补充说,后者方面可能会带来一些挑战。

“这类研究的主要问题是缺乏数据,因为人们往往对自己的心理健康问题保持私密。”他说。

KTU多媒体工程系教授还提到,算法需要改进,不仅准确,还要向医疗专业人员提供导致诊断结果的原因。“算法仍然需要学会如何以可理解的方式解释诊断。”Maskeliūnas说。

据KTU教授介绍,由于对直接影响人们的AI解决方案的需求不断增长,如医疗、金融和法律系统等领域,类似的高要求变得越来越普遍。这就是为什么可解释的人工智能(XAI)正在获得动力,它旨在向用户解释模型为何做出某些决策,以增加他们对AI的信任。


(全文结束)

大健康
大健康