Whisper 转录工具在医疗领域的准确性引发担忧Concerns raised over accuracy of Whisper transcription tool in healthcare

环球医讯 / AI与医疗健康来源:dig.watch美国 - 英语2024-10-30 21:00:00 - 阅读时长2分钟 - 584字
研究人员发现OpenAI的Whisper转录工具在医疗转录中有时会生成虚构的句子,特别是在处理有语言障碍患者的音频样本时。
Whisper转录工具医疗领域准确性担忧虚构句子医患交流失语症患者AI工具复杂性适用性持续监督
Whisper 转录工具在医疗领域的准确性引发担忧

研究人员发现,由OpenAI开发的Whisper AI转录工具在医疗转录中有时会生成虚构的句子。这款名为Whisper的AI转录工具被数千名临床医生和卫生系统使用,据称已转录了约700万次医疗对话。尽管它能够准确总结许多医患交流,但康奈尔大学和华盛顿大学的研究人员发现,该工具在某些情况下会完全生成虚构的句子,有时甚至添加无关或无意义的短语。

这项研究于6月在巴西举行的计算机械协会FAccT会议上提出,指出Whisper在大约1%的转录中出现错误,经常在对话中的沉默期间产生“幻觉”——即虚构的陈述。这些不准确性在包含失语症患者(一种导致频繁停顿的语言障碍)的音频样本中尤为常见。在一个案例中,Whisper插入了一些更典型的YouTube视频短语,如“谢谢观看!”

Nabla公司意识到这一问题,表示正在努力解决这些“幻觉”。对此,OpenAI强调其致力于减少此类错误,尤其是在像医疗这样的高风险环境中。OpenAI的一位发言人指出,Whisper的使用政策不鼓励其在关键决策情境中的应用,并且针对开源使用的指导建议避免在高风险领域部署。

该研究的结果突显了在医疗等敏感环境中应用AI工具的复杂性,因为精确的沟通至关重要。鉴于Whisper已在40个医疗系统中使用,这一问题引发了关于AI转录工具在医疗环境中的适用性及其部署所需持续监督的广泛讨论。


(全文结束)

大健康
大健康