聊天机器人的“大脑”可能随年龄减缓Chatbot "Brains" May Slow with Age

环球医讯 / AI与医疗健康来源:www.healthday.com美国 - 英语2024-12-23 21:00:00 - 阅读时长2分钟 - 983字
一项新研究发现,随着年龄的增长,人工智能程序开始表现出轻度认知障碍,这可能影响其在医疗诊断和护理中的应用。
人工智能大型语言模型认知能力蒙特利尔认知评估医疗诊断人类医生年龄认知衰退
聊天机器人的“大脑”可能随年龄减缓

周一,2024年12月23日(HealthDay News)——不仅仅是人类在变老时会失去一些脑力。根据12月20日发表在《英国医学杂志》(BMJ)上的一项新研究,人工智能(AI)程序在老化过程中也开始显示出轻度认知障碍的迹象。

由耶路撒冷希伯来大学神经学家罗伊·戴安博士领导的研究团队写道:“不仅神经科医生不太可能很快被大型语言模型取代,而且我们的研究结果表明,他们可能很快会发现自己需要治疗新的虚拟患者——表现出认知障碍的人工智能模型。”

在这项研究中,研究人员评估了主要公开可用的AI程序的认知能力,这些程序也被称为“大型语言模型(LLMs)”。AI正在测试其在医疗治疗中的应用能力,但研究人员在期刊新闻发布会上写道:“如果我们依赖LLMs进行医疗诊断和护理,我们必须检查它们对人类缺陷(如认知衰退)的易感性。”

AI程序回答了蒙特利尔认知评估(MoCA)测试的问题,这是一种标准测试,用于检查老年人的大脑衰老和早期痴呆的迹象。测试的最高得分为30分,通常认为26分或以上为正常。

结果显示,ChatGPT 4.0在测试中得分最高,为26分。ChatGPT和Claude 3.5 “Sonnet”均得25分,Gemini 1.0仅得16分。研究人员写道:“没有任何大型语言模型‘通过’了MoCA测试,用一位美国总统的话来说。”

所有AI程序在视觉空间技能和组织任务方面表现不佳,例如按升序连接数字和字母的任务。“聊天机器人似乎在需要视觉执行功能和抽象推理的任务上存在困难,而像相似性测试这样的任务,需要文本分析和抽象推理,它们表现得非常出色。”研究人员写道。

事实上,这种损伤模式类似于患有后部皮质萎缩的人类患者,这是阿尔茨海默病的一种变体。研究人员表示:“此外,与人类一样,年龄是认知衰退的关键决定因素:‘较老’的聊天机器人,就像较老的患者一样,在MoCA测试中的表现更差。”

例如,Gemini 1.0和Gemini 1.5两个版本的测试结果相差6分。“由于这两个Gemini版本的‘年龄’相差不到一年,这可能表明痴呆症迅速进展。”研究人员写道。

这些缺陷突显了AI在替代人类医生方面面临的巨大挑战。或者更温和地说——“这些发现挑战了人工智能将很快取代人类医生的假设。”研究团队总结道。

对您的意义

不要期望AI很快就能替代人类医生的判断。


(全文结束)

大健康
大健康