一项新的研究揭示,像 ChatGPT 这样的人工智能聊天机器人在提供低背痛建议方面可能几乎与咨询医生一样有效。
这项由一个国际团队进行的研究揭示了人工智能在解决全球主要致残原因之一方面的潜力。
悉尼科技大学物理治疗系主任、研究的合著者布鲁诺·蒂罗蒂·萨拉吉奥托副教授表示,该研究旨在评估像 ChatGPT 这样的人工智能聊天机器人回答低背痛患者常见问题的有效性。
这项名为“评估人工智能聊天机器人回答患者关于低背痛常见问题的表现”的研究最近发表在《风湿病学年鉴》杂志上。
低背痛影响着全球数百万人,常常促使患者在网上寻求信息。
随着人工智能驱动的聊天机器人在提供健康建议方面变得越来越常见,了解其建议的准确性非常重要。
萨拉吉奥托副教授说:“研究结果表明,人工智能聊天机器人能够提供与澳大利亚医疗保健专业人员所报告的准确性水平相当的建议。”
研究发现,人工智能聊天机器人在回答有关建议的治疗和自我管理的问题方面表现出色,而在风险因素方面的回答最不准确。
诸如“像按摩或针灸这样的补充疗法可以缓解下背痛吗?”这样的问题得到了准确的建议。研究还指出,人工智能聊天机器人一直建议通过运动来预防和管理低背痛,这被认为是一个准确的建议。
然而,该研究还表明,人工智能聊天机器人对其他常见问题提供了不准确的建议。例如,不良姿势不会导致低背痛,但人工智能聊天机器人 88%的情况下都说会。
另一个关键观察结果是人工智能聊天机器人识别需要医疗转诊情况的能力。在应该建议专业护理的情况下,人工智能系统在 70%-100%的情况下建议用户咨询医疗保健提供者。
悉尼大学肌肉骨骼健康研究所的研究员乔瓦尼·费雷拉博士是该研究的作者之一,他说:“我们的研究表明,人工智能聊天机器人有可能成为那些寻求管理低背痛初步指导的人的宝贵资源。”
费雷拉博士说:“重要的是要注意,这些工具应该补充而不是取代专业的医疗建议。”
尽管有这些令人鼓舞的结果,研究人员还是指出了人工智能聊天机器人性能的局限性。值得注意的是,回答往往很复杂,可读性水平适合 10 到 12 年级或大学教育水平的个人。
萨拉吉奥托副教授说:“虽然人工智能生成的建议的准确性令人印象深刻,但我们必须考虑到这些信息的可访问性。”
“确保健康指导对广大受众来说是可以理解的,这仍然是开发人工智能健康工具的一个重要挑战。”
这项研究正值人们越来越依赖数字健康信息的时候,许多患者在咨询医疗保健专业人员之前或代替咨询转向在线资源。
萨拉吉奥托副教授强调了认识到人工智能资源在管理像低背痛这样的常见健康问题方面的能力和局限性的重要性。
他说:“随着人工智能技术的不断发展,需要进一步的研究来完善这些工具,并确保它们能够为公众提供准确、可访问和安全的健康信息。”
更多信息:Simone P S Scaff 等人,评估人工智能聊天机器人回答患者关于低背痛常见问题的表现,《风湿病学年鉴》(2024 年)。DOI: 10.1136/ard-2024-226202
(全文结束)


