担心新医学研究？先读这篇指南

——表象之下另有玄机，掌握这些技巧可避免困惑

2019年8月，广受尊敬的《美国医学会儿科学杂志》发表了一项颇具争议的研究：加拿大孕妇若接触较高水平的氟化物（如饮用水中的氟），其子女智商偏低的概率更高。部分媒体报道使用了夸张标题，声称氟化物暴露"会降低"智商。尽管学者和记者迅速指出该研究存在诸多缺陷——无法证明因果关系，且仅显示男孩智商下降而女孩未受影响——但负面影响已然形成。公众在社交媒体上纷纷表达对氟化物潜在危害的担忧。

我们对科学研究及其报道者抱有极大信任，但判断某项研究是否值得改变生活方式实属不易：额外一小时屏幕时间真的危害巨大吗？给儿童喂食加工肉类会增加其癌症风险吗？

作为接受过生物统计学与流行病学培训的儿科医师兼医学记者，我向多位专家请教了家长如何评估所读研究的质量。以下是下次看到科学报道时需牢记的八项要点。

1. 湿漉漉的路面不会导致下雨

换言之，相关性不等于因果性。这是健康记者在报道两类事物关联性研究时最容易陷入的陷阱——例如"喝咖啡者寿命更长"的研究，但未确证咖啡饮用（原因）导致长寿（结果）。此类研究通常称为观察性研究。

约翰斯·霍普金斯大学彭博公共卫生学院流行病学教授伊丽莎白·普拉茨（Elizabeth Platz）指出，在设计和分析研究时，专家需充分解答多个问题才能确定因果关系。以吸烟与肺癌研究为例，研究人员需证明香烟化学物质以特定方式影响肺组织导致癌症，且这些变化发生在暴露之后，还需验证结果可重复性。许多研究历经数年甚至数十年仍无法证实因果关系。

2. 老鼠并非人类

大型人体临床试验成本高昂、操作繁琐且可能危及人类健康，因此研究人员常先选用生理结构类似人类的动物（如果蝇、蠕虫、大鼠、狗或猴子）进行实验。

若看到"阿司匹林在老鼠中抑制肠癌"等夸张标题，该发现虽具潜在价值，但在人体验证相同结果可能需数年甚至数十年（或永远无法实现）。

3. 研究质量至关重要

就研究设计而言，质量参差不齐。医学领域中，随机临床试验和系统性综述最具权威性。在随机临床试验中，研究人员通常将受试者分为至少两组：一组接受测试对象（如新药或每日锻炼），另一组接受现行标准治疗（如高胆固醇用他汀类药物）或安慰剂。为减少偏差，受试者与研究人员理想状态下应不知分组情况。

系统性综述同样重要，研究人员汇集5至100多项随机对照试验，梳理结论中的规律与一致性。此类研究有助于揭示特定证据体系的潜在共识。

其他严谨性较低的研究包括：队列研究（长期追踪大群体观察疾病发展）、病例对照研究（先确认疾病如癌症，再回溯致病原因）、横断面研究（通常为问卷调查，探究疾病与暴露的关联但无法确定因果）。

质量谱系末端是病例报告（描述单个患者情况）和病例系列（多份病例报告合集），虽质量最低却常激发更高质量研究。

4. 数据可能被误读

统计学显著性最易使普通读者困惑。当研究或媒体报道称发现"具有统计学显著性"，意指结果偶然发生的概率很低。

但统计学显著未必具有临床意义，即可能不影响日常生活。假设一项随机对照试验将200名偏头痛患者均分两组：一组服预防药物，另一组服安慰剂。六个月后，服药组11人、安慰剂组12人每周至少发作一次偏头痛，但服药组11人出现手臂刺痛副作用。若统计显示服药组偏头痛概率显著降低，差异仍可能小到不足以推荐该药物——仅1%的患者获益，且需权衡潜在副作用。

反之亦然。若研究称规律运动缓解30%慢性疼痛患者症状，看似比例高。但若仅10人参与，实际仅3人受益。该发现或无统计学显著性，却可能具临床价值——鉴于慢性疼痛治疗选择有限，值得开展更大规模试验。

5. 样本越大通常越可靠

科学家或许永远无法完全掌握某领域的真相，但可通过高统计效力研究逼近真相。

斯坦福医学院医学与健康研究政策教授约翰·约安尼迪斯（John Ioannidis）通过邮件解释："效力反映研究在信号存在时检测到它的概率。"

提升研究效力最直接的方式是扩大样本量。1000人的试验通常比500人的更有力。简言之，大样本研究比小样本更接近真相。

6. 并非所有结论都适用于你

若报道称某高质量研究兼具统计与临床意义，下一步需判断结论是否与你相关。

例如测试缓解关节炎新药时，研究者可能仅纳入无其他疾病的关节炎患者，排除服用干扰药物者，并按年龄、性别或种族招募。既往心脏病研究就曾主要针对白人男性。

我们每个人在基因与环境上皆独特，生活远不如实验受控。因此请将每项研究视为信息参考：随时间推移，某结论是否重要到足以改变临床建议将逐渐清晰。这引出相关理念……

7. 单个研究仅是单个研究

若单个研究足以改变医疗实践与公共政策，医生将陷入"溜溜球医学"——建议朝令夕改。这通常不会发生，故当标题以"一项研究发现"开头或结尾时，需谨记单个研究 unlikely 改变整体医疗路径。若研究设计严谨且经重复验证，未来或可影响医疗指南。若主题关乎你或家人，值得咨询医生该结论是否足以支持调整健康选择。

8. 并非所有期刊质量相当

正规科学期刊通常发表经严格客观同行评审的研究，这是科研出版的黄金标准。辨别优质期刊的方法之一是查看高影响因子——该数值主要反映特定期刊文章在特定年度被引用的平均频率（需注意低影响因子期刊仍可发表优质成果）。PubMed数据库收录的研究文章与书籍章节多属同行评审。

此外存在"掠夺性期刊"，由非正规出版商运作，为收取费用几乎不经评审即发表任何研究（正规期刊也可能收费，但仅限论文录用后用于覆盖成本或设置付费墙）。部分研究人员因"不发表即淘汰"压力选择此类期刊。然而，因其名称或形式常与正规期刊相似，区分颇具挑战。若文章存在语法错误、图像失真，或期刊缺乏明确编委会与实体地址，可能属掠夺性期刊——但即便经验丰富的研究者也偶遭蒙蔽。

阅读研究报道既启迪思维又引人入胜，但极少研究深刻到足以改变日常生活。下次看到耸动标题时，请先阅读全文——若能获取，务必查阅原始研究（PubMed或谷歌学术是良好起点）。如有时间，与医生讨论该研究，并查看美国疾病控制与预防中心、世界卫生组织、美国儿科学会、美国心脏病学会或国家癌症研究所等权威机构是否发表评论。

医学非精确科学，日日演进。在充满灰色地带的领域，当标题有时试图迫使我们非黑即白地看待问题，请以这些技巧引导求知欲。它们或能助你判断何时——以及何时不——为自己和家人做出特定健康与生活选择。

阿米塔·卡拉查兰德兰（Amitha Kalaichandran）医学博士是多伦多的儿科住院医师、流行病学家兼作家，目前正撰写一本批判性探讨传统与非传统疗愈方法科学依据的著作。

【全文结束】