五角大楼宣布完成识别医疗AI漏洞的试点项目DOD announces completion of pilot to identify medical AI vulnerabilities

环球医讯 / AI与医疗健康来源:www.nextgov.com美国 - 英语2025-01-03 06:00:00 - 阅读时长2分钟 - 860字
五角大楼通过与多个机构合作,成功完成了识别医疗AI漏洞的试点项目,发现了超过800个潜在漏洞和偏见,旨在提高军事医疗服务的安全性和可靠性,并推动负责任的生成式AI技术的应用和发展。
五角大楼医疗AI试点项目大型语言模型军事医疗服务漏洞识别HumaneIntelligence红队测试国防部卫生保健管理系统国防卫生署临床笔记总结医疗咨询聊天机器人系统弱点偏见基准数据集负责任使用AIMatthewJohnson任务组Lima人工智能快速能力单元国防创新单位
五角大楼宣布完成识别医疗AI漏洞的试点项目

五角大楼宣布其首席数字和人工智能办公室(CDAO)于周四表示,已“成功完成”了一项生成式人工智能试点项目,该项目旨在识别使用大型语言模型增强军事医疗服务时可能存在的漏洞。该试点项目由Humane Intelligence(一家技术非营利组织)通过其众包AI红队保证计划进行。国防部卫生保健管理系统项目执行办公室和国防卫生署也参与了此次试点。

CDAO的大型语言模型(LLM)试点项目专注于识别使用新兴工具进行临床笔记总结和医疗咨询聊天机器人时可能出现的系统弱点和缺陷。国防部表示,超过200人参加了这项红队测试工作,其中包括部门内的临床提供者和医疗分析师,他们“比较了三种流行的LLM”。

据新闻稿称,该倡议发现了使用这些LLM增强军事医疗服务时超过800个“潜在漏洞和偏见”。国防部表示:“此次演习将通过开发基准数据集产生可重复和可扩展的输出,这些数据集可用于评估未来供应商和工具是否符合性能预期。此外,这些发现将在塑造国防部关于负责任使用生成式AI(GenAI)的政策和最佳实践中发挥关键作用,最终改善军事医疗服务。”

负责CDAO的负责任AI部门负责人Matthew Johnson也在一份声明中表示:“该计划作为生成大量测试数据、提出考虑领域和验证缓解选项的关键路径,将塑造未来的研究、开发和保障,以确保未来可能部署的GenAI系统的安全性。”

CDAO自2022年6月开始运营以来,一直致力于测试、扩展和简化国防部AI能力的采用和使用。该办公室于2023年8月启动了一个名为任务组Lima的生成式AI特别工作组,以更好地研究和了解如何以负责任和战略的方式使用新兴技术。尽管该部门上个月结束了该工作组,但还创建了一个人工智能快速能力单元,以执行该小组的建议。CDAO表示,该新项目与国防创新单位合作,“将领导加速和扩大前沿AI驱动工具(包括前沿模型)在整个国防部的部署”。

在周四的公告中,国防部表示,作为其众包AI红队保证计划的一部分进行的试点项目“将是加速CDAO的AI快速能力单元的关键”。


(全文结束)

大健康
大健康