摘要
引言:本研究考察了非专家人类(对痴呆症不熟悉的年轻人)和大型语言模型(LLMs)如何在转录文本中感知痴呆症——识别可能表明认知能力下降的迹象。人类的感知至关重要,因为它往往是促使人们寻求医学评估的主要动因。考虑到LLMs作为筛查工具的巨大潜力,它们的感知能力同样具有重要研究价值。
方法:研究人员让人类和LLMs直观判断转录的图片描述是来自痴呆症患者还是健康对照组。我们使用高级专家指导的特征表示文本,并采用逻辑回归建模感知过程并分析相关系数。
结果:人类的判断表现出不一致性,主要依赖于狭窄且有时具有误导性的一组线索。相比之下,LLMs运用了更丰富、与临床诊断更一致的特征集。值得注意的是,两组都表现出明显的假阴性倾向,即未能识别出实际存在的认知障碍。
讨论:本研究突显了教育人类和LLMs识别更广泛的与痴呆症相关的语言信号的必要性。同时,研究也强调了可解释性在痴呆症研究中的核心价值,这有助于提升诊断工具的透明度和可信度。
亮点:可解释人工智能(AI)技术成功揭示了人类和大型语言模型(LLMs)与痴呆症相关的语言线索。LLMs能够对图片描述进行专家定义特征的可扩展提取,使用比人类更广泛的线索来检测痴呆症,并与临床诊断结果保持更高的一致性。研究发现人类和LLMs均存在假阴性问题;特别值得注意的是,LLMs倾向于将语言流利度视为认知健康的标志。深入理解非专家的感知模式可以指导公众教育策略,提高对认知障碍的早期识别意识。
【全文结束】

