知事 

拐点究竟何时到来?为什么很难有个准信儿?

知事

关注

确定不再关注此人吗

原标题:拐点究竟何时到来?为什么很难有个准信儿?

来源:丁香园

本文作者:KellyWeaver,慕尼黑大学流行病学硕士在读

到今天为止,新型冠状病毒肺炎的疫情已经发酵一个多月了。期间,网络上不停涌现出形形色色的预测。不过,这些预测的结果之间差距实在是非常大,简直让人丈二和尚摸不着头脑。

据人民日报报道,钟南山院士在 11 日的一次远程视频病例讨论会议中说:‘从目前来看,疫情拐点还无法预测,但峰值应该在 2 月中下旬出现。疫情拐点由返程高峰的防控情况决定。’他同时表示,没有任何人可以做出一个严格的拐点预测。

预测此次疫情的趋势,为什么这么难呢?‘拐点’究竟何时到来?胜利的终点又在何方?我们到底应该如何看待各类‘预言’呢?

丁香园邀请来流行病学的专业人士给大家讲讲。

精确的预测,需要怎样的数据?

通常情况下,在数据能够支持的前提下,预测模型自然是越贴近现实越好。那尽量贴近现实的预测,需要什么样的数据呢?

越精确、越贴近现实的预测,需要越大的样本量支撑,而且模型也越复杂。

例如,在流感数据预测中效果不错的机器学习法,需要至少好几年、多则几十年的高质量数据,才能得到相对满意的预测。

然而,此次‘新冠肺炎’是一个暴发中的新发传染病疫情,我们面临的实际情况包括:

1)能够提取信息的时间窗很短,只有几十天;

2)公开数据的种类很少,几乎只有病例数能用。精确到每天的人群迁徙量、发热门诊量、呼吸疾病就诊量等,都很难得到;

3)对建模而言,更重要的是患者何时感染、何时开始有传染性。而这些数据,都很难再精确到‘天’以下,所以病例数的时间序列都只有每天一个点、总共三四十个点。

所以,总体来看,我们现在能获取的数据是很贫瘠的。这次的情况肯定是不适合了做类似流感那样的机器学习预测了。好比我们手上才几个枣,实在喂不饱大象啊。

那么,拿着这样的数据,来看看我们能干些什么呢?

在稍微有点专业性的模型里,只剩下一个对数据要求不那么高的选择了:基于人群区组(compartment)的 SEIR 模型。

用 SEIR 模型,就可以精确预测了吗?

SEIR 这个模型的‘基本款’是如此简单,以至于有点简陋,它假设:

1)R0(基本再生数)从头到尾都不变;

2)每个感染者和每个易感者接触的概率都是完全相等的;

3)不考虑超级传播者的存在;

4)不考虑漏诊。

结合现实情况,如果这个模型不经修正就直接套用,可能存在如下问题:

首先,由于新型冠状病毒感染者在潜伏期也能传染,全国各地目前的确诊人数并不能完全客观反应真实患者人数,在局部地区,甚至可能只能反映当地疫情的冰山一角;

第二,由于我国政府在疫情不同阶段采取了效果非常明显的封锁、排查措施,导致湖北以外地区人与人之间的接触频率下降,发现感染者的效率也明显不同于武汉乃至湖北。这些都会影响 R0;

第三,‘超级传播者’目前也已逐渐浮出水面,一个人传几十上百人的事时常见诸报端。

第四,全国 14 亿人,就算目前确诊 3 万人,显然,北京确诊患者传染与他同小区的其他人的概率,和他传染新疆克拉玛依的一位农民的概率肯定是不同的。

那么问题来了:如果希望数据预测能够尽可能贴近真实情况,每个省的数据应该如何加权?我国采取的减少外出、延长休假等措施,还有超级传播者,以及不同人之间传播概率不同,到底如何在模型中反映?

朋友,恭喜你,我们终于来到了传染病数学建模里最考验一个人知识功底的环节——定参数设计模型,也常被我们自嘲为‘拍脑袋’。

‘拍脑袋’时可能遇到的坑

其实,‘拍脑袋’这一表达更多是一种调侃。这只是说,相对于 1 就是 1、2 就是 2 的数据本身而言,如何设置模型参数、如何调整模型结构,就会变得非常主观了。

如果是像埃博拉、流感这样重复出现的疾病,起码建模时各种参数还能依靠以往的经验来设置;但遗憾的是,新型冠状病毒流行病学特征独特,潜伏期长、潜伏期可传染、传播能力更强、更少依赖超级传播者……这些,都使得预测模型无法直接套用 SARS 的各项参数,虽然两者都是冠状病毒。

而对于此次疫情的建模,到底能不能无限接近真实情况,就只能取决于建模者的知识基础、建模经验和谨慎程度了。

因此,我们就能看到,同样是 SEIR 模型,有的人只能发微博,还错得离谱;有的人发在预印本平台上,但结果也没好到哪儿去;有的人就可以发柳叶刀、NEJM。

事实上,目前互联网上流传的几个预测之间相差那么大,原因很大程度上就是在这个自由裁量的环节出现了分歧。

同样是‘拍脑袋’,有的人有理有据,会尊重现实状况调整模型的结构和假设,结论也充分尊重不确定性。因此,最后得到的模型,无论是对于防控还是决策,都具有参考价值。

而有的人,就真是在拍脑袋。 前文提到的 SEIR 模型的几个理想化的假设,一个都不调整;参数也设置得特别离谱。于是最后模型预测结果夸张无比,弄出比零防控措施的流感的感染人数还多几倍的结果,很没有参考意义。

所以,看一个模型的预测结果,绝对不能只关注结果本身。只有判断了模型的假设和参数是否合理,并与事实相互对照,才能采信或者拒绝预测结果。

  更大都坑还在后面,我们永远无法验证模型

模型要变得越来越准,离不开反复对照现实校正自身的过程。遗憾的是,与预测天气预报不同,这在传染病学,是很难做到的。

现实情况是不断变化的,而且有些变化甚至还可能是由于你的模型结果公之于众导致的。而且,时间拉得越长,发生变化的可能性就越高,你的预测还能‘说对’的可能性就会越来越低。

比如说,假设你做了一个模型,在 1 月 27 日的时候预测 2 月 1 日确诊病例过万。结果,29 日的时候,疑似病例的定义被放宽了一次,更多的人得到了筛查,于是,2 月 1 日那天的确诊病例数就高于你所预测的那个数字了。

所以,做传染病流行病学的建模,大家都认可一句名言:你永远不可能知道你是不是对的。

  总结:到底应该如何看待各类预测?

目前来看,想要对暴发中的新发传染病,做出精准的中长期趋势预测,仍然是一个世界性的难题。

总的来说,以目前的技术,我们能够有比较高把握做对的,是在假定一切条件不变的情况下,对未来数天内的疫情走势做出一个短期预测。所以,钟南山院士说的‘“拐点”尚未到来’、‘全国情况稳定,但武汉不太一样’等结论,实际上就是基于目前的情况所给出的数天内的短期预测,是实事求是、科学的。

而对未来更长时间的预测,虽然仍然可以做,但由于‘一切条件不变’这个假设没法在长时间下一直成立,最后预测的数字还能严丝合缝符合的几率是很低的。甚至,基本上可以说,如果预测的时期超过 2 周,那么就算最后对了,大概率也是蒙对的。如果错了,才是正常的。

因此,现在有些人去回顾 12 天前部分专家的预测,批判他们说‘说好的拐点,元宵节后也没来’,也是过于苛刻的。

对长期预测的模型,相比给出的夸张、绝对的数字,我们更应关注它对各类防控措施效果的预估,并且必须仔细推敲它的假设和参数是否合理。

所以,希望各位读完本文后能够明白:无论近期各路专家如何给出预测,只要是中长期的预测,那么即便预测正确,也应当知道,其中运气成分不小,不值得盲目崇拜;错了就更是正常的,没有任何必要指责。

务必理性看待预测结果,不盲目相信,也不盲目批评,这样就是对科学最好的尊重了。

本文由知事 转码显示查看原文

加载中...