在当今世界,社交媒体成为了一个表达思想、意见和感受的平台。人们在这里分享自己的想法,测试他人的反应,并获得实时反馈以及支持和认可。对于一些人来说,通过屏幕分享可能比面对面交流更容易,即使他们并没有完全意识到这一点。
“在社交媒体上,人们往往认为他们的在线身份和现实生活中的身份是有区别的。有些人觉得在这种匿名或距离感的环境下,更容易披露诸如绝望感或离婚、失业等经历。”爱荷华州立大学信息系统和商业分析助理教授张文丽说。“这些数字痕迹正是我们想要提取的信息。”
张文丽是研究团队的一员,他们开发了一种深度学习模型,用于在社交媒体上检测心理健康症状和风险因素。他们的研究《使用社交媒体上的数字痕迹进行抑郁症检测:一种知识感知的深度学习方法》发表在《管理信息系统杂志》上,重点关注抑郁症。
根据美国国家心理健康研究所(NIMH)的数据,2021年约有2100万美国成年人(占所有美国成年人的8.3%)经历了至少一次重度抑郁发作。其中,约61%的人接受了治疗。
“抑郁症和其他心理健康障碍常常被诊断不足,因此也未得到充分治疗。”张文丽说。“由于耻辱感,患者可能在医生办公室进行健康筛查时不愿意如实回答问题,因此我们的目标是识别并提供另一种互补的方法。”
潜在应用
张文丽强调,“深度知识感知抑郁症检测框架”在个人、公共卫生专业人员、政策制定者和研究人员中都有潜在的应用。
社交媒体公司可以使用该模型创建一个早期预警系统,建议用户何时寻求帮助,并提供资源。公共卫生专业人员和政策制定者可以通过群体层面的数据确定哪些地区或人群需要更多的心理健康服务。
对于研究人员来说,该模型提供了收集多年人口数据的独特机会。
“例如,我们可以查看过去十年的X(以前的Twitter)数据,并将其与不同事件关联起来——战争、大流行病等。通过调查问卷我们无法获得这种级别的数据。”张文丽说。
张文丽指出,其他研究人员已经开发了用于在社交媒体上检测抑郁症的模型;然而,“深度知识感知抑郁症检测框架”与现有工作不同,因为它将抑郁症的风险和症状的医学术语与个人在社交媒体上的帖子进行比较。
“之前的研究着眼于带有积极或消极情感的帖子,我们认为这并不适用于抑郁症检测,因为有人可能会抱怨一部糟糕的电影或恶劣的天气等,但这并不是抑郁症的指标。因此,我认为这是我们的模型与其他先前研究之间的巨大差异。”张文丽说。
张文丽及其研究团队使用超过130万条存档的Reddit帖子和2,500篇WebMD条目训练了他们的模型,使其能够检测抑郁症的症状和风险。张文丽表示,该模型还可以使用其他社交媒体平台和数据集,另一项正在审查的研究表明,新版本的模型可以检测其他心理健康障碍。
伦理和隐私问题
张文丽及其合著者表示,使用社交媒体检测慢性疾病症状和风险因素可能是一种成本效益高的干预措施,因为公开帖子提供了大量、多样且免费的数据集。然而,他们认识到存在需要解决的伦理和隐私问题。
“解决滥用风险并确保负责任地使用基于社交媒体的抑郁症检测机器学习模型涉及伦理考虑、法律保障和技术措施的结合。”张文丽说。
张文丽表示,社交媒体平台在为健康相关的机器学习模型收集数据时应优先考虑知情同意,即使数据是匿名的。这包括传达数据收集的目的和用途,并从用户那里获得明确的同意。
她还表示,社交媒体公司应确保数据收集、存储和使用的做法符合隐私法和法规,包括《通用数据保护条例》和《健康保险可移植性和责任法案》。
“政策制定者可以建立由隐私、数据伦理和心理健康专家组成的伦理监督委员会或审查委员会,指导研究和机器模型开发的伦理影响。”张文丽说。“研究人员也有责任与利益相关者和公众分享基于社交媒体的抑郁症检测模型的潜在好处和局限性。”
未来,张文丽及其团队希望扩展他们的模型,包括其他健康方面,如糖尿病、心脏病和哮喘。他们设想结合社交媒体上的照片、视频和音频来捕获更多的行为数据。例如,频繁出现油腻或高热量食物的图片可能预示心血管疾病的风险,而显示高空气污染水平的图像可能警告哮喘患者。
张文丽表示,机器学习不是传统医疗保健的替代品,而是另一种辅助个人并为医疗服务提供者和政策制定者提供群体层面数据的方法。
(全文结束)