疫情何时会出现拐点?学会用模型思维作出最接近的预测 | 36氪领读

疫情何时会出现拐点?学会用模型思维作出最接近的预测 | 36氪领读
2020年02月23日 09:30 36氪

36氪专门为读书设立了【36氪领读】栏目,筛选一些值得读的书,并提供一些书摘。希望你手边有一本称心的书,让读书这场运动继续下去。

针对本次新冠肺炎疫情,最近各国学者建立了不少模型。其中,《模型思维》一书中的SIR模型及相关模型被广泛使用,模型结合了传染病传播的特点(人传人、人口流动、潜伏期等),做出了非常多的预测。

头图来源 | 视觉中国

从科学角度看,预测未来事件的走向并不是一件容易的事情。当今科技发达,但气象局即便预报明天的天气依然有一定概率犯错,更不用说预测一周后天气,那会有更大的错误概率。天气预报况且如此,更不用说对依托社会互动行为发生的病毒流行疫情进行准确预测了。

但正如钟南山院士在回应路透社时所说的,数学模型实际上是一种科学的思维方式,气象预报、各种自然灾害等许多问题都需要通过建立模型和预测未来发生的可能性来推断。

针对本次新冠肺炎疫情,最近各国学者建立了不少模型。大致可以分为两类:一种是基于SIR模型及其变种进行动力学分析和预测;二是基于疫情数据进行拟合预测。其中,《模型思维》一书中的SIR模型及相关模型被广泛使用,模型结合了传染病传播的特点(人传人、人口流动、潜伏期等),做出了非常多的预测。

传染模型——最科学正规的模型

传染模型研究的是信息、技术、行为、信念、以及包括新型冠状病毒在内的传染病在人群中的传播。其实传播学在一定程度上就是传染病学,传染病模型在通信科学、市场营销学、流行病学的研究中发挥着核心作用。

先来看三个基础概念。第一个概念叫“相关人群”,代表所有可能会感染这个病毒的人的总数,用字母N代表相关人群的总数。

如果卖一支口红,相关人群就是所有可能买这支口红的人。通俗而言,也就是当你把这支口红放在他面前他一起会买。销售要解决的问题就是怎么让读者知道产品的存在,所以相关人群不等于全中国的人口,相关人群是市场上限。

第二个概念叫“已感染人群”,这些易感者可能会感染传染病、了解信息或采取行动。已经感染了病毒的人数,用It表示,t代表时间。

第三个概念叫“未感染人群”,是此时此刻“相关人群”中剩下的、还没有被病毒感染的人群,用St表示。

这三个概念有一个公式:St=N-It

病毒、信息等的传播,基本上有两种方式。一种叫广播,一种叫扩散。

我们可以同时允许广播和扩散来对这些传播情况建模,由此而得到的模型被称为巴斯模型(Bass Model),巴斯模型在营销学中起着核心作用。巴斯模型会生成r形曲线还是S形曲线,则取决于广播过程和扩散过程之间的相对优势。

广播模型描述了思想、谣言、信息或技术通过各类媒体进行的传播。这次新型冠状病毒疫情的大多数新闻都是通过广播形式传播的。但是,广播模型并不适用于在人与人之间传播的传染病。

扩散模型——病毒最重要的传播方式

我们现在面临的新型冠状病毒最重要的传播方式就是“扩散”。

扩散是人传人,我们是被自己接触到的人给传染。它的特点是已经被感染的人越多,传染的速度就越快。大多数传染病,以及关于产品、思想和技术突破的信息,都是通过口口相传而传播开来的,扩散模型刻画了这些过程。

扩散模型假设,当一个人采用了某种技术或患上了某种传染病时,这个人有可能将之传递或传染给与他接触的人。在传染传染病的情况下,个人的选择不会在其中发挥任何作用。

一个人患上某种传染病的概率取决于诸如遗传、病毒(细菌),甚至环境温度等因素。在炎热潮湿的季节,疟疾的传播速度要比在寒冷干燥的季节快得多。

假定人群是随机地混合在一起,那么扩散传播的公式是:

其中的Pd代表扩散传播的概率,也是一个常数,但是我们看到,这时候新被感染的人数跟已经被感染的人数在人群中所占的比例有关。扩散的传播曲线是常说的“S曲线”。

其实我们接触了很多产品,比如某些APP,一开始并没有大张旗鼓的宣传,主要靠人传人。一开始好几天使用的人数都很少,所以传播速度也慢,然后终于慢慢迎来拐点。等到相关人群都用上了,扩散就算结束。整个过程是开始慢、中间快、后来又变慢,这就是“S曲线”。

其实,传播病的传播也满足S曲线。

一开始我们并没有意识到新型冠状病毒疫情的严重性,仍旧不戴口罩出门,但是等我们发现所在城市出现了病例,当地人很快就戴上了口罩,更加注意防寒保暖、室内通风和个人卫生。对改变习惯来说,你的朋友、你身边的人比媒体更有说服力。

R0、超级传播者——抗击新冠必知的概念

还有一个传播路径值得我们注意,SIR 模型在流行病学中占据了中心位置。最近数据科学专家们在做疫情拐点预测是也多是用SIR模型及它相关的模型。

SIR模型是采用传染病动力学方法建立的传染病模型。SIR模型将总人口分为三类:易感者(susceptibles),感染者(infectives),痊愈者(recovered)。

SIR模型中存在一个关键参数,即第一个概念基本再生数R0。

R0就是接触概率乘以扩散概率与痊愈概率之比。包括这次的新型冠状病毒在内的传染病,如果R0大于1,那么这种传染病就可以传遍整个人群,而R0小于1的传染病则趋于消失。通俗解释,即是一人得病,可传染的其它人数量。

所谓接触概率,就是病毒携带者携带的病毒与非携带者接触的概率。艾滋病一般通过性接触和共用针头传播;白喉通过唾液传播;流感病毒通过空气传播。因此,我们知道,流感的接触概率高于白喉,白喉的接触概率又高于艾滋病。

但是,艾滋病的R0,也就是它的传染能力远低于麻疹等传染病,这是因为它的接触概率也比较低,传染条件很苛刻。

第二个概念是超级传播者。

什么是“超级传播者”?钟南山早期针对超级传播者说过:“听任传播一直在发展,病原体不断适应人体的情况,变得越来越强大,就有可能产生超级传播者。“当然我们希望尽量不要产生,不要产生的前提是不要让它自由地扩散,这是最关键的。”

实际上,在传染病传播方面,并非所有感染者的传染性都一样,一些患者传染性更强。80%的感染都是由20%的感染者传播的,这种现象被称为80/20法则。这一现象并不是只出现在人类中,动物也是如此。一个我们非常熟悉的例子就是2003年爆发的传染性非典型肺炎SARS。香港和新加坡75%的患者由超级传播者感染。

流行病学家们将位置在度很高的中心节点上的人称为“超级传播者”(super spreaders)。超级传播者加速了艾滋病和SARS的早期传播。

超级传播者不一定是社交明星或“人脉”特别广的人,可能从事某种特定的行业职业,比如收费站的收费员、银行柜员、牙科医生,这类职业的人会每天与属于不同社交网络的人接触。

《模型思维》特别提到了历史上最有名的超级传播者,她的绰号叫“伤寒玛丽”。这个人只是纽约的一名上门服务的厨师。她从这一家再到另一家,将伤寒感染给每一个接触者。给雇佣她的人带来了特别深重的灾难!

我们不能忽略掉这样一个事实:高度数节点不但能够更快地传播传染病,而且会更快地患上传染病。

也就是说,如果一个人朋友的数量是另一人的三倍,那么他患上传染病的可能性也是后者的三倍,同时传播这种传染病的可能性也是后者的三倍。因此,他对传染病传播的总贡献将是另一个人的九倍!

所以,天天接触成百上千号人,甚至是上万的人的职业,一定更要严防死守做好防疫,而不是追求表面的稳定!

我们身处一个数据爆炸的大数据时代,但仅拥有数据是远远不够的,必须学会让数据说话,模型就是让数据说话的秘诀,模型将帮助我们从掌握信息提升到拥有智慧。《模型思维》详细讲解了24种模型,从正态分布、幂律分布到马尔可夫模型、传染模型等,这是一套跨学科的思维模型集合,芒格说过,要想成为具有普世智慧的人,掌握几个思维模型就够了。

具体到这次疫情,我们希望通过多种模型,科学客观地评估病毒传染性的强弱,以及预测患病人数规模和峰值时间,不仅能帮助疫情相关的决策者实施必要的防控措施,还能帮助政府企业评估疫情对经济的影响,也能协助投资者们灵活应对巨大的不确定性。

书名:《模型思维》(The Model Thinker ) 

作者:【美】斯科特·佩奇(Scott Page)

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部