西奈山的研究人员开发了一种策略,旨在更高效地在医疗环境中使用人工智能(AI),潜在地将费用减少高达17倍,同时保持性能。这项由西奈山伊坎医学院的研究人员进行的新研究揭示了部署大型语言模型(LLMs)的新方法。这些策略详细记录在《npj数字医学》杂志上,旨在维持成本效益和高性能,可能彻底改变医院管理运营任务的方式。
研究提供了宝贵的见解,展示了如何利用AI工具来简化各种医疗任务,节省时间并减少运营成本,同时在高工作负载下保持可靠性。共同资深作者Girish N. Nadkarni(西奈山伊坎医学院Irene和Arthur M. Fishberg医学教授,西奈山医疗系统数据驱动和数字医学(D3M)部门主任)在新闻发布会上表示:“我们的研究结果为医疗系统提供了一个路线图,以高效集成先进的AI工具,自动化任务,潜在地将大型语言模型(LLMs)的应用编程接口(API)调用成本减少高达17倍,并确保在高工作负载下的稳定性能。”
每天,医院都会生成大量数据,高效的管理变得至关重要。像OpenAI的GPT-4这样的大型语言模型为自动化和提高工作流程效率提供了有前景的解决方案。然而,这些模型带来了显著的运营成本,这成为广泛采用的财务障碍。该研究的动力在于找到实用的方法,在保持性能的同时降低成本,使医疗系统能够自信地大规模使用LLMs。第一作者Eyal Klang(西奈山D3M生成式AI研究计划主任)在新闻发布会上表示:“我们的研究动力在于找到实用的方法,在保持性能的同时降低成本,使医疗系统能够自信地大规模使用LLMs。我们对这些模型进行了压力测试,评估它们在同时处理多个任务时的表现,并确定了既能保持高性能又能控制成本的策略。”
研究团队使用真实患者数据评估了10个大型语言模型,以确定它们对各种临床问题的响应。在超过300,000次实验中,他们增加了任务的复杂性,评估模型在高压下的表现,同时测量准确性和遵循临床指令的情况。经济分析表明,任务分组可以显著减少与AI相关的成本,而不会影响性能。
研究发现,将多达50个临床任务(如临床试验的患者筛选和药物安全审查)组合在一起,可以让模型同时处理这些任务而不显著降低准确性。这种方法可以优化工作流程,将API成本减少高达17倍,每年可能为大型医疗系统节省数百万美元。
Nadkarni补充道:“认识到这些模型在高认知负荷下开始挣扎的点对于维护可靠性和运营稳定性至关重要。我们的研究结果强调了在医院中整合生成式AI的实用路径,并为在现实世界限制内进一步研究大型语言模型的能力打开了大门。”
一个意外的发现是,当这些模型被推向认知极限时,它们的表现会出现不可预测的下降。“这项研究对如何将AI整合到医疗系统中具有重要意义。将任务分组不仅减少了成本,还节省了资源,这些资源可以更好地用于患者护理。”共同作者David L. Reich(西奈山医疗系统的首席临床官)补充道。
未来的研究将进一步探索这些模型在实时临床环境中的表现及其与医疗团队的互动。目标是建立一个可靠的框架,将AI整合到医疗系统中,平衡效率、准确性和成本效益,以提升患者护理水平。这一开创性的研究标志着更智能、更经济地使用AI在医疗领域的关键一步,有望推动创新并改善患者结果。
(全文结束)


