A
A
A

自然实验:当故事成为数据

·5 hours ago发布

自然实验(Natural Experiment)是指真实世界中发生的、并非由研究者操控和分配的事件,却自然形成了对照组与暴露组,其逻辑类似随机实验,可用于推断因果关系。

 

上次《说药》(见 讲故事与看数据)时我指出,即使故事是100%真实的,它也不会是一个有价值的数据点(datum),因为产生这个数据的条件是自然的,没有得到严格控制。但是在现实生活的很多场景中,人群不可能任意“分组”,政策也不可能“随机”制定,这就给研究者带来了相当的困扰:我想知道条件 A 是否会导致结果 B,可我却没法进行真正的“对比实验”。

 

这时,“自然实验”就显示出了不可替代的重要性。

 

临床试验的“修饰语”

 

说到医药学里的临床试验,很多人的第一反应是“双盲”。其实“双盲”还不是最重要的,公开标签(open label)的临床试验也是很常见的。如果我们把有效临床试验的修饰语都说完整了,应该是“大样本、随机分组、对照和双盲试验”。

 

为什么要大样本?上次在讨论数据时我已经说了,那是为获得有“统计意义”的结果,这里不再赘述。

 

那么,为什么要随机分组呢?因为受试者之间是有差异的:人种、年龄、性别、本人疾病史和家庭病史、饮食与作息、等等。只有将他们随机分组,才有可能抵消这些差异而引起不同效果。

 

最后再说“对照”。这个很容易理解,不怕不识货,就怕货比货嘛。但这恰恰是困扰研究者的一个大问题,很多时候过不了“伦理”这道坎。我们不能为了证明霍乱(Cholera)的来源而故意污染饮水,也无法为了验证空气污染是否减短寿命而故意让人吸入煤烟。这时,我们只能依靠现实世界里的偶然事件、历史政策,甚至自然力量本身来完成“对照试验”。

 

伦敦霍乱与公共水泵

 

19 世纪的欧洲经常爆发霍乱,人口拥挤的伦敦是重灾区之一。

 

当时大家对致病原的认知很有限,很多传染病,包括霍乱,都被认为是“坏空气”也就是所谓的“瘴气”引发的。

 


约翰·斯诺,英国麻醉学家、流行病学家

 

但当时伦敦的医生约翰·斯诺(John Snow)注意到了一个用“瘴气”解释不通的现象:在同一个社区里,大家都呼吸着同样的空气,但是有些人会得霍乱,而另一些人却不得。这是为什么呢?

 

1854 年 8 月,伦敦 Soho 地区再次爆发了霍乱疫情,蔓延迅猛,10 天内就有 500 多人死亡。而早就怀疑“瘴气理论”的斯诺医生决定认真仔细地研究这场瘟疫的来龙去脉。他开始在伦敦街巷中穿梭往返,挨家挨户地敲门询问,调查否有人感染或死亡,然后把所有死亡患者的地址标在 Soho 的地图上,最终形成的图像毫无争议地把霍乱的发病起源指向了百老汇大街(Broad Street)的一口公共水泵,由此,世界上第一张流行病空间因果图诞生了。

 

如果你猜想绝大数霍乱患者都住百老汇大街公共水泵的附近,你猜对了,但这只是“大样本”,还没有“随机分组”和“对照”呢。

 

在没有疫情的时候,选择住在百老汇大街公共水泵附近的居民并没有什么特殊的地方。这意味着,距离最近居民去那里泵水的可能性最高,形成了城市布局自然创造的准随机分组。那么“对照”呢?这就更有意思了:即使住在百老汇大街公共水泵附近的居民,因为某种原因不去该水泵汲水,就不染病;相反,居住在远处的少数伦敦人,因为喜欢“百老汇大街井水的味道”,而每天让佣人专程去打水,结果还是染上了霍乱。

 

斯诺医生用这些“数据”构建起了霍乱疫情的因果链:“不是空气,不是距离近,也不是 Soho区域,而是百老汇大街的井水。” 他劝说当地政府拆掉了这口井的水泵,几天之内,新发病例断崖式下降。

 

供暖线背后的空气、煤烟与寿命

 

斯诺的研究是自然实验史上第一个最经典的案例。近 160 年后,在经济学和公共卫生领域,中国也出现了一个同样震撼世界的“自然分组实验”的契机——秦岭-淮河冬季供暖政策分界线。[注]

 

上世纪 50-60 年代,中国城市冬季集中供暖,出于资源有限和行政管理便利,供暖以秦岭-淮河为界:该线北侧城市提供统一集中的冬季供暖,主要能源是燃煤;而该线南侧的城市则不提供集中冬季供暖,没有统一的燃煤系统,居民或依赖小型电暖、燃气炉等。

 

这个边界的划定并非为了研究疾病和环境污染,却在之后的几十年内造成了明显而长期的环境差异:淮河以北城市每年冬季燃煤取暖会导致更严重的 PM2.5 颗粒污染,而淮河以南城市冬季无集中燃煤供暖,空气相对更清洁。因为该边界本身固定、长期不变,使得研究者能通过对比边界附近南北两侧“高度相似但污染不同”的城市和人群完成接近“对比实验”的因果分析。

 

研究团队在边界两侧附近选定城市与居民,确保文化、饮食、经济发展水平、社会结构接近,然后统计空气中 PM2.5 颗粒浓度、相关疾病发病率(肺部、心血管、中风)、预期寿命与死亡率和医疗住院记录等健康指标。

 

研究结果显示,北方城市冬季空气污染显著高于南方;与之对应,边界北侧居民的心肺和中风相关疾病明显更多,平均寿命也呈现有统计意义的下降趋势。

 

这个自然实验的价值不仅在于描述“空气污染会影响居民的健康和寿命”这样的简单相关,而是利用政策边界制造的准随机暴露差异排除其他因素,从而成立真正的因果推论。

 

说了半天,到底什么是“自然实验”?

 

自然实验指真实世界中发生的、并非由研究者操控和分组的事件,却自然形成了对照组与暴露组,其逻辑类似随机分组实验,可用于推断因果关系。自然实验有三大核心特征:第一,条件变化由外部力量决定,而非研究者干预;第二,人群被分到不同条件并非完全自主选择,而是接近“随机分组”;第三,研究者只能观测与分析,而不能重新分配条件。他们记录事件自然带来的差异,比较结果,试图像真正实验一样“利用现实世界的随机性”。

 

自然实验的魅力在于,它通常回应的都是重大、现实、无法被设计实验的问题,却能给出接近因果证明的答案。它在流行病学、经济学、气候科学、社会科学等领域都扮演很关键的角色。

 

科学家的任务就是洞察、记录、对比和推断。

 

2025年12月于上海

 

资料来源:

[注]   Yuyu Chen, Avraham Ebenstein, Michael Greenstone & Hongbin Li “Evidence on the impact of sustained exposure to air pollution on life expectancy from China's Huai River policy” Proceedings of the National Academy of Sciences of the United States of America (PNAS), Vol. 110, Issue 32, 2013, pp. 12936–12941. DOI: 10.1073/pnas.1300018110.

作者简介

 

贵柏曾在默沙东新药研究院工作多年,潜心钻研药物化学,颇有建树。几年前回国加入药明康德,从事业务开发、项目管理和驻美运营。梁博士是《新药的故事》一书的作者。他以长期的积累、独特的视角和生动的文字,通过《老梁说药》栏目讲述新药研发“背后的故事”,令人耳目一新,脑洞大开。梁贵柏博士目前是偕怡制药联合创始人兼首席科学家,欢迎读者通过邮箱gbliang55@hotmail.com与梁博士联系。

 

编辑 | 毛冬蕾

mao.donglei@PharmaDJ.com 

访问研发客网站,深度报道和每日新闻抢鲜看

下载PDF
0
发布文章
0
关注人数