聊天机器人的“大脑”可能随年龄减缓 - AI与医疗健康

聊天机器人的“大脑”可能随年龄减缓Chatbot "Brains" May Slow with Age

环球医讯 / AI与医疗健康来源：www.healthday.com美国 - 英语2024-12-23 21:00:00 - 阅读时长2分钟 - 983字

一项新研究发现，随着年龄的增长，人工智能程序开始表现出轻度认知障碍，这可能影响其在医疗诊断和护理中的应用。

周一，2024年12月23日（HealthDay News）——不仅仅是人类在变老时会失去一些脑力。根据12月20日发表在《英国医学杂志》（BMJ）上的一项新研究，人工智能（AI）程序在老化过程中也开始显示出轻度认知障碍的迹象。

由耶路撒冷希伯来大学神经学家罗伊·戴安博士领导的研究团队写道：“不仅神经科医生不太可能很快被大型语言模型取代，而且我们的研究结果表明，他们可能很快会发现自己需要治疗新的虚拟患者——表现出认知障碍的人工智能模型。”

在这项研究中，研究人员评估了主要公开可用的AI程序的认知能力，这些程序也被称为“大型语言模型（LLMs）”。AI正在测试其在医疗治疗中的应用能力，但研究人员在期刊新闻发布会上写道：“如果我们依赖LLMs进行医疗诊断和护理，我们必须检查它们对人类缺陷（如认知衰退）的易感性。”

AI程序回答了蒙特利尔认知评估（MoCA）测试的问题，这是一种标准测试，用于检查老年人的大脑衰老和早期痴呆的迹象。测试的最高得分为30分，通常认为26分或以上为正常。

结果显示，ChatGPT 4.0在测试中得分最高，为26分。ChatGPT和Claude 3.5 “Sonnet”均得25分，Gemini 1.0仅得16分。研究人员写道：“没有任何大型语言模型‘通过’了MoCA测试，用一位美国总统的话来说。”

所有AI程序在视觉空间技能和组织任务方面表现不佳，例如按升序连接数字和字母的任务。“聊天机器人似乎在需要视觉执行功能和抽象推理的任务上存在困难，而像相似性测试这样的任务，需要文本分析和抽象推理，它们表现得非常出色。”研究人员写道。

事实上，这种损伤模式类似于患有后部皮质萎缩的人类患者，这是阿尔茨海默病的一种变体。研究人员表示：“此外，与人类一样，年龄是认知衰退的关键决定因素：‘较老’的聊天机器人，就像较老的患者一样，在MoCA测试中的表现更差。”

例如，Gemini 1.0和Gemini 1.5两个版本的测试结果相差6分。“由于这两个Gemini版本的‘年龄’相差不到一年，这可能表明痴呆症迅速进展。”研究人员写道。

这些缺陷突显了AI在替代人类医生方面面临的巨大挑战。或者更温和地说——“这些发现挑战了人工智能将很快取代人类医生的假设。”研究团队总结道。

不要期望AI很快就能替代人类医生的判断。

(全文结束)