一个新的由Retraction Watch背后的监督机构发起的倡议,目标是揭露有缺陷或伪造的医学科学研究,并为此筹集了近100万美元的资金。
科学诚信中心刚刚启动了“医学证据项目”,这是一个为期两年的努力,旨在识别对健康指南产生负面影响的已发表医学研究,并确保人们能够听到这些信息。该项目获得了开放慈善基金会90万美元的资助,并将配备最多五名调查人员的核心团队,使用法医元科学研究工具来识别科学文章中的问题,并通过Retraction Watch(科学监督领域的首要网站)报告其发现。
“我们最初成立科学诚信中心是为了支持Retraction Watch,但我们一直希望能够在研究问责领域做更多的事情。”科学诚信中心执行主任兼Retraction Watch联合创始人伊万·奥兰斯基在宣布资助的帖子中表示,“‘医学证据项目’使我们能够支持关键分析并传播这些发现。”
根据《自然》杂志报道,这些有缺陷和伪造的文件令人头疼,因为它们会扭曲元分析——即将多个研究的结果结合起来以得出更具有统计学意义结论的综述。如果一两个虚假的研究进入元分析,它们可能会对卫生政策产生影响。
例如,在2009年,欧洲的一项指南建议在非心脏手术中使用β受体阻滞剂,这是基于千禧年之交的研究,但后来这些研究受到了质疑。多年后,一项独立审查表明,该指南可能导致英国每年1万人死亡。
该项目由科学诚信顾问詹姆斯·希瑟斯领导,计划开发软件工具,追踪匿名举报者的线索,并支付同行评审员检查他们的工作。他们计划每年至少识别10个有缺陷的元分析。
团队选择此时行动非常明智。正如Gizmodo此前报道的那样,AI生成的垃圾科学正在涌入学术数字生态系统,出现在从会议论文到同行评审期刊的各种地方。哈佛肯尼迪学院《误报评论》发表的一项研究发现,通过Google Scholar检索的样本论文中有三分之二包含GPT生成文本的迹象——甚至在主流科学出版物中也是如此。其中约14.5%的虚假研究集中在健康领域。
这尤其令人担忧,因为Google Scholar不区分同行评审研究和预印本、学生论文或其他不太严谨的工作。一旦这种副产品被纳入元分析或被临床医生引用,就很难解开后果。“如果我们不能相信我们读到的研究是真实的,”一位研究人员告诉Gizmodo,“我们就有可能基于错误信息做出决定。”
我们已经看到了无稽之谈是如何溜进来的。2021年,《阿拉伯地球科学杂志》撤回了超过40篇论文,这些研究如此混乱以至于像是AI生成的填字游戏。就在去年,Frontiers出版社不得不撤回一篇包含解剖学上不可能的AI生成的大鼠生殖器图像的论文。
我们已经进入了数字化石时代,AI模型开始保存和传播无意义的短语,就像它们是真正的科学术语一样。例如,今年早些时候,一组研究人员发现了一组来自1959年生物学论文的混乱词汇嵌入在包括OpenAI的GPT-4在内的大型语言模型的输出中。
在这种情况下,“医学证据项目”的目标更像是急救而不是清理。团队正在应对大量存在缺陷的信息,这些信息隐藏在显而易见的地方,其中许多信息如果被表面接受,可能会带来非常真实的健康后果。
(全文结束)


