9月24日,国际权威期刊《先进科学》(Advanced Science)发表了中科院昆明动物研究所马占山学科组关于新冠肺炎(COVID-19)流行爆发规律的研究结果。
该研究主要解决了新冠肺炎流行预测领域如下三项难题:(1)流行拐点预测,即何时达到感染高峰拐点,高峰感染数量是多少?(2)聚集感染临界点,即如果超越临界点则可能导致流行爆发,控制在临界点之下则可能将其清零、从而避免大规模爆发。(3)评估社区接触传染与远程输入传染的相对重要性。 这些问题具有显而易见的实际意义, 特别是流行拐点和聚集感染临界点的预测也是疫情期间人们通常所关注的问题。该项研究于年初已经成功预测了国内各省新冠流行拐点的发生,其准确率超过80%(82%-99%),并成功判断国内疫情在拐点之后将逐步“清零”。同时对居家隔离等防疫措施在控制疫情中所起的作用做出了评估。三月初研究报告以预印本发布在arxiv(https://export.arxiv.org/abs/2003.03714)和medrxiv( https://www.medrxiv.org/content/10.1101/2020.03.25.20043893v1)。文章投稿后,随着国外疫情的发展,为了进一步检验其预测方法的有效性,研究人员先后三轮采用各国更新的感染数据验证,取得了类似的成功结果。采用截止6月12日数据,成功预测了68个国家或地区的拐点,其精度超过80%。但对于其他一些国家,包括重灾区美国、巴西、印度,拐点似乎仍然遥遥无期。
研究人员将新冠病毒的感染动态看作是全球时空范围内的“宏种群”动态来模拟建模。共采用了三项经典生态学模型:种群聚集临界密度概念和估计模型用于估计新冠病毒聚集感染的临界水平;潜在生物多样性计算模型,用于估计新冠病毒流行的拐点;Hubbell中性模型用于估计社区接触传染与远程迁徙传染的相对重要性。前两个方法系马占山先前原创,而第三种方法系根据Stephen Hubbell著名的生物多样性和生物地理学中性理论提出的一个新指数:基础迁徙传染数与基础接触感染数之间的比率。这一指数(比率)越高,说明远程迁徙传播在病毒感染中所起作用越强。 这一指数越低,说明社区接触传播在病毒感染中所起作用更强。显然这一指数对于指导防疫措施和政策的制定具有重要意义。
聚集感染临界水平m0对应于新冠病毒“宏种群”处于随机分布状态。超过m0则意味着 可能发生聚集感染,如果没有积极干预进一步发展可能会导致大爆发。而低于 m0, 则意味着疫情已经稳定,如果保持防疫措施则可能“扑灭”疫情。聚集感染临界水平类似于森林火灾在星星之火燎原之前的临界点,或者水在变成蒸汽时的临界温度(100℃)。这些现象在物理学中是“渗透理论”的研究范围。聚集感染临界水平之下,感染会否灭绝取决于另外一项生态学参数—— Allee效应临界点。如果达到或低于Allee临界点,则新冠病毒可能会灭绝消失。遗憾的是目前关于新冠病毒Allee效应参数尚没有研究;其原因主要是该概念起源于动物生态学,如何将其应用于病毒种群动态研究仍需进一步探索。
新冠疫情拐点的预测方法来自于“潜在生物多样性”(也称“暗生物多样性”)的概念和方法。这一概念类似于物理学中暗物质的概念,核心是推断潜在未知的感染数量。该方法由作者先前研究“潜在(暗)生物多样性”时提出并验证。在应用于新冠疫情拐点预测时有两点需注意:其一,必须采用非线性优化建立模型,而且对某些模型参数可能需要做出必要的约束;其二,一般只能预测单峰爆发,换句话说,对于二次感染爆发则必须重新建立新的预测模型。
该研究所需要的数据仅仅是互联网大众平台每天公布的新增感染数,因此实施应用其实非常简单。该研究还试用了近年来受到广泛关注的基于相变分析或灾变理论等的拐点分析技术,但最终都不如非常简单的“潜在生物多样性模型”有效。需要指出的是,该预测方法虽然能够在一定程度上预先估计出拐点,也就是真正意义上的预测,这主要得益于作者“潜在(暗)生物多样性模型”的优异表现,但任何预测都有局限性,受数据和时空约束。因此,对于目前大部分国家仍然无法估计出拐点这一现实并不应该意外,最大的可能性是在那些地区,疫情的流行仍然处于扩张期,距疫情拐点太远所致。实际上,研究发现某些国家(地区)拐点要在将近一年以后才可能发生。或许令人悲观的是,最新的模型运行发现,有些国家或地区拐点的发生极有可能是一年以后。
此外,由于拐点是指疫情感染(高峰)的转折点(而不是疫情的结束), 当拐点发生时人们可能对其浑然不知。因此,就疫情拐点预测而言,即使“马后炮”式的预测也可能具有重要的实际意义。该方法有时候会给出“马后炮”预测。一个非常简单实用的办法就是采用当天最新感染数据每天运行预测软件,直至成功发现拐点。“马后炮”的出现说明建模数据的时间点已经太多。需要指出的是,模型的预测会受防疫措施的持续影响,干预措施的突然改变不可避免地会影响拐点的出现,遇到这种情形,最有效的办法往往是对模型运行的初始点做适当调整(相当于坐标平移)。对于境外输入等严重受人为因素影响的情形,也可能需要类似的数据预处理,甚至建立类似于第二波流行爆发的新一轮模型。
该研究得到了国家自然科学基金、云岭产业技术领军人才项目、云南省科技厅国际合作项目,遗传资源与进化国家重点实验室、以及中科院动物遗传与进化交叉创新卓越中心的支持。
论文链接:https://onlinelibrary.wiley.com/doi/10.1002/advs.202001530