生成式AI如何改变医学教育How Generative AI Is Transforming Medical Education

环球医讯 / AI与医疗健康来源:magazine.hms.harvard.edu美国 - 英语2024-10-16 03:00:00 - 阅读时长11分钟 - 5255字
哈佛医学院正在将生成式AI融入课程,以培训下一代医生
生成式AI医学教育哈佛医学院医疗保健临床决策AI技能医学执照考试学生培训数据偏见创新奖
生成式AI如何改变医学教育

在2022年11月公开发布后的几周内,ChatGPT已经开始显得无处不在,而Bernard Chang(MMSc '05)已经开始思考这对未来医学教育意味着什么。“也许每隔几十年就会发生一次真正的医学教学革命,我们对学生的要求也会随之改变,”哈佛医学院(HMS)医学教育院长Chang说,“现在就是这样的一个时代。”

到2023年,研究发现最初的公共版本ChatGPT能够在USMLE(美国医学执照考试)中达到及格水平。2023年3月发布的更强大版本的ChatGPT,在某些医学知识和临床推理测试中超过了医学生、住院医生甚至执业医师的表现。如今,有许多大型语言模型的能力与ChatGPT相当。那么,这将如何影响今天的医学生以及教育他们的机构呢?

Chang表示,上一次医学教育的革命发生在20世纪90年代中期,当时互联网开始广泛普及。“最初我们只是在上面玩游戏,”他说,“但很快它变得不可或缺,而现在生成式AI也是如此。几年之内,它将被整合到一切事物中。”

哈佛医学院(HMS)正在通过将生成式AI(也称为genAI)纳入课程来应对这一转变。“现在是回应这一呼吁的合适时机,”Chang说,“我们没有等待其他学校的做法,一方面是因为作为机构,我们希望处于这一领域的前沿,另一方面是因为这是对学生有益的事情。”

融入AI

今年秋季,HMS为所有进入健康科学与技术(HST)轨道的新学生开设了一个为期一个月的AI在医疗保健中的应用课程。“据我所知,没有其他医学院这样做,”Chang说,“尤其是在开学的第一个月。”该课程探讨了AI在医学中的最新应用,批判性地评估其在临床决策中的局限性,并且至关重要的是,让学生了解医学将发生变化的事实。Chang补充道:“在这个时代,如果他们想成为医师科学家或医师工程师——这是HST课程的目标——他们不仅需要成为一名好的倾听者、好的医疗访谈者和好的床边医生,还需要具备良好的数据技能、AI技能和机器学习技能。”每年大约有30名学生注册HST轨道,其中许多人还将获得硕士学位或博士学位。

本学期启动的医学AI(AIM)博士轨道进一步推动了AI整合教育。“生物信息学的学生越来越兴奋地谈论AI,并询问我们是否可以提供一个AI博士学位,”Blavatnik研究所生物医学信息学系主任Isaac Kohane(Marion V. Nelson生物医学信息学教授)说,“我们不知道会有多少需求,但最终我们收到了超过400份申请,争夺七个名额。”

“就像任何重大技术爆发一样,”Kohane说,“在头几年,劳动力市场将出现巨大缺口。因此,我们希望培养既了解医学又理解可以通过AI解决的真实医疗问题的研究人员。”

为此,HMS还为对这项技术感兴趣的医学生和教职员工开辟了第三条途径:去年宣布的院长创新奖,用于在教育、研究和管理中使用人工智能,每个项目可获得高达10万美元的资助。“这些补助金真正展示了HMS在尝试将这些令人惊叹的新工具整合到我们的工作和学习方式中的领先地位,”MD-PhD学生Arya Rao(同时也是获奖项目的共同获得者,研究AI在临床培训中的应用)说,“我很感激能有这个经验带入我的医学职业生涯。”

与HMS合作的医院也在将AI纳入其临床工作流程。例如,Brigham and Women’s Hospital正在测试一种环境记录工具,该工具可以记录临床笔记,使医生能够花更多时间与患者互动。随着这些工具的实施,Chang表示,它们将使学生能够更多地与患者交谈,而不是不断转向屏幕查看信息。这也将帮助他们更快地过渡到更高层次的学习和更高级的主题,如倾听。

“人们常常认为生成式AI会剥夺沟通的人性化,”研究生教育办公室教育奖学金和创新助理院长Taralyn Tan说,“但我实际上认为,它可以作为一种机制,通过减轻医生的许多行政任务负担,重新将人性化元素引入临床实践。”

Rao同意这一观点。“医学的真正魅力,参与其中的原因,是你能够与患者建立的联系,”她说,“如果你看看医生每天花在查阅病历和写笔记上的时间,那是几个小时。AI可以释放一些时间,让我们能够投入到真正来这里的目的——帮助人们。”

Ellen和Melvin Gordon杰出医学教育教授、学习环境指导委员会主席Richard Schwartzstein看到了整理记录和其他此类职责的价值,但他警告说,过度依赖AI可能会导致学生的准备不足。“我们需要将其置于真实的床边医学背景中,强调推理和批判性思维,”Schwartzstein说,“床边临床医生如何有效使用AI?临床医生需要注意什么?临床医生仍然需要擅长哪些方面才能适当使用AI?”

例如,Schwartzstein指出,AI可以帮助医生追踪患者可能接触过的全球各地的病原体,而医生对此并不熟悉。“我现在可以通过互联网做到这一点,”他说,“但AI可以进行更广泛和更快的搜索。不过,缺点之一是它不会告诉你它参考了哪些来源,因此你无法确定信息是否来自你信任的期刊。”

Schwartzstein强调,检查AI的结果是关键,同时能够将AI提供的选项与患者的实际症状和病史相匹配。“AI不善于解决问题,这是医学中最难的部分之一,”Schwartzstein指出。HMS和Beth Israel Deaconess Medical Center的研究人员的一项研究发现,尽管ChatGPT在诊断方面准确,但在诸如考虑为什么应该问某些问题而不是仅仅问什么等推理任务上,它比经验丰富的医生犯更多的错误,表现优于住院医生但不如主治医生。

Schwartzstein表示,学生在分析实验室数据时也可能过度依赖AI。“解释测试结果和进行归纳模式练习有助于他们学习批判性思维,”他说,“大多数因可能的诊断错误引起的医疗事故并不是奇怪的病例。它们是基本的病例,人们会在这些病例中犯思维错误。因此,虽然在资源不足地区没有附近医生支持的护士从业者使用AI处理这类案件会很好,但对于医生来说,缺乏这种训练和思维能力将是问题。”

然而,Kohane认为,一旦医生有了几年的实践经验,“有一个一致的AI代理监督我们的行动并捕捉错误将是一个巨大的胜利。”他指出,有时经验丰富的医生因为疲劳或身体不适而犯新手错误,因此由AI检查我们的工作可能会显著提高医院的死亡率和发病率。

实际应用

但AI不是也以出错著称吗?ChatGPT的“幻觉”——例如在回答“步行穿越英吉利海峡的世界纪录是什么?”这样的问题时,提供了详细但非常错误的答案——已经成为网络梗。Kohane表示,这个问题预计会随着时间的推移而改善,但他指出,即使在今天,“AI犯的错误类型与人类不同,因此它可以是一个很好的合作伙伴。”他指出,底层技术正在改进,而且它极大地扩展了医生可以用来诊断的数据池。例如,一个基于近一百万份心电图训练的机器学习模型在诊断三十八种疾病方面的表现与心脏病专家相当甚至更好。“想象一下,这在初级保健医生手中会有多大的潜力,”Kohane说。

当这些巨大的数据集通过电子健康记录(EHR)和患者可穿戴设备输入进行补充时,可以变得更加全面。Kohane指出,“生成式AI不必仅从试验和医学期刊中提取数据。如果现实生活中的数据是在知情和透明的情况下收集的,这些额外的信息可以帮助医生看到他们可能看不到的东西。”

这种类型的数据已经在Brigham and Women’s的内科学生试点项目中使用。“当他们在病房时,”Chang说,“学生只能从恰好在医院的患者那里学习。但这个工具可以访问课程目标和患者EHR,因此它可以将学生实际遇到的情况与我们的学习目标进行比较。”Chang相信,几年之内,这种用例将成为常态。“在轮转之前,学生可以在手机上访问一个应用程序,该应用程序会说,‘早上好,我建议你去看看这三个患者,’因为这些患者代表了学生知识中的空白。”

AI训练数据中的偏见问题也得到了充分记录。正如Schwartzstein及其同事在《CHEST》杂志上发表的一篇论文中指出的那样,AI本身容易重现其学习材料中固有的偏见,至少有一项研究表明,这种循环可以回到人类身上,传递AI的偏见。

与此同时,有证据表明,反馈也可以朝相反方向起作用。Brigham and Women’s最近的一项研究表明,增加AI训练数据集中的细节可以减少观察到的差异,而麻省总医院一名儿科医生正在进行的研究正在训练AI识别教师对学生评价中的偏见。“无论信息来源如何,都会有很多偏见,”Tan说,“但我们必须密切关注这一点。如果我们能够以协同的方式利用AI——例如,放入特定的文章、引用、我们知道有效的工具,并要求它从反映该领域最新进展的资源中提取信息,同时保持对这些问题的意识——AI可以成为促进教育公平的有用工具。”

因此,解决方案的一部分在于了解用于创建AI工具的数据。Chang提到了HMS的“导师机器人”,这些机器人接受的是自产课程的培训。“我们使用ChatGPT作为引擎,”他说,“但通过我们提供的语言和课程信息对其进行限制。如果不这样做,来HMS有什么特别之处呢?”

鉴于所有这些变化,当今年的这批学生毕业时,HMS学位将有何特别之处?如果AIM博士项目的学生今天毕业,“他们会立即收到所有竞争激烈的医院和大学的顶级工作邀请,”Kohane说。“我估计60%的毕业生将进入工业界。但当他们五六年之后毕业时,他们将在学术和研究领域找到很多机会。”

这部分原因在于受过这些技术培训的学生的适应能力,Tan说。“很难预测这会走多远,”她说,“但明天最成功的医生和研究人员将是那些能够利用生成式AI进行创新和战略规划的人。提出解决方案的人将是那些使用这些工具的人。”

推进医学教育创新

2024年3月,HMS宣布了33位院长创新奖获得者,这些奖项用于在教育、研究和管理中使用人工智能。以下是与医学教育相关的项目样本。

未来的患者角色:交互式大语言模型增强的哈佛临床培训伴侣

Arya Rao, Marc Succi, 和 Susan Farrell

为学生提供在标准化患者上练习临床技能的机会是医学院的重要部分,Rao说。当“就诊”结束后,学生将由扮演患者的演员和教授对其临床推理、沟通技能等方面进行评分。但这需要时间和成本,因此Rao、HMS放射学助理教授Marc Succi(麻省总医院)和评估与评估副院长Susan Farrell(综合临床技能OSCE考试主任)正在开发定制的大语言模型,这些模型可以作为标准化患者。他们将这些模型称为SP-LLMs,并用HMS课程的具体材料对其进行强化。学生可以通过文本和语音与这些模型互动,收集病史、获取诊断信息并启动临床管理,同时练习沟通技能。

“一个不错的功能是,当‘就诊’结束后,”Rao说,“SP-LLM还会向学生提供关于这次会面的反馈,既是患者又是导师。由于工具随时可用,学生可以在见到真实患者之前获得更多的实际经验。”

开发生成式人工智能评分和学习工具

Greg Kuling, Jay Vasilev, Samantha Pullman, Randy King, Barbara Cockrill, Richard Schwartzstein, 和 Henrike Besche

HMS的Pathways课程轨道强调独立学习和基于案例的协作课堂作业。Schwartzstein和他的同事们开发了一个系统,可以批量自动评分简答题,总结学生的优点和缺点,识别概念挑战并建议个性化的教学策略。2015年担任开发Pathways课程指导委员会主席的Schwartzstein表示,他为一个班级170名学生对单个开放性问题的所有回答进行评分并提供反馈大约需要8个小时。“我无法为家庭作业做这件事,”他说,“但如果AI可以做到,那将对他们非常有帮助。”简化这一过程将使学生能够做更多的练习,从而“更多地练习是否正确将所学原则应用于案例研究”。

利用生成式AI创建以学习者为中心和基于证据的课程大纲

Taralyn Tan 和 Krisztina Fischer

Tan和HMS放射学助理教授Krisztina Fischer(Brigham and Women’s兼职)正在研究在Tan的Teaching 100课程中使用AI,开发并试点一个工具,该工具使用生成式AI创建课程大纲,目标是让其他HMS教师采用。在课程中,Tan的学生首先尝试自己创建以学习者为中心和基于证据的课程大纲组件,然后与AI一起完成相同的工作。“这门课有两个元目的,”Tan说,“因为学生们既体验了自己的教学,也从学习者的角度体验了。”Tan还允许她的学生在课堂上除最终项目外使用AI。“当我问他们关于这一点时,最常见的回答是他们不知道如何使用它,”她说,“这说明了与学习者互动的基本能力的需求。”


(全文结束)

大健康
大健康