发表在第22卷第11名(2020): 11月

本文的预印本(早期版本)可在https://preprints.www.mybigtv.com/preprint/23853,首次出版
系统因素对中国新型冠状病毒病暴发结局的影响:因子分析研究

系统因素对中国新型冠状病毒病暴发结局的影响:因子分析研究

系统因素对中国新型冠状病毒病暴发结局的影响:因子分析研究

原始论文

1中山大学公共卫生学院(深圳),中国广州

2中山大学智能系统工程学院,中国广州

3.中山大学岭南学院,中国广州

*这些作者贡献相同

通讯作者:

杜向军博士

公共卫生学院(深圳)

中山大学

新港西路135号

广州,510275

中国

电话:86 020 83226383

电子邮件:duxj9@mail.sysu.edu.cn


背景:新型冠状病毒病在全球范围内蔓延,形成新一轮大流行。中国政府在疫情早期实施了强有力的干预措施,包括严格的旅行禁令和保持社交距离政策。优先分析影响疫情结果的不同因素对于精确预防和控制传染病非常重要。我们提出了一个解决这一问题的新框架,并将其应用于来自中国的数据。

摘要目的:本研究旨在系统地确定中国国家层面和城市层面对COVID-19控制的影响因素。

方法:收集了来自中国343个城市的每日COVID-19病例数据和相关多维数据,包括旅行相关、医疗、社会经济、环境和流感样疾病因素。使用相关性分析和可解释的机器学习算法来评估疫情期间(即2020年1月17日至2月29日)各因素对新病例和COVID-19增长率的定量贡献。

结果:许多因素与COVID-19在中国的传播相关。与旅行相关的人口流动是中国新增病例和COVID-19增长率的主要影响因素,其贡献率分别高达77%和41%。与旅行相关的因素存在明显的滞后效应(前一周vs当前一周:新增病例,45% vs 32%;COVID-19增长率,21%对20%)。来自非武汉地区的旅行是对COVID-19增长率影响最大的单一因素(贡献:新增病例,12%;COVID-19增长率为26%),其贡献不容忽视。作为疫情控制力度的衡量指标,城市流量对新增病例和COVID-19增长率的贡献分别为16%和7%。社会经济因素在中国COVID-19的增长率中也发挥了重要作用(贡献率为28%)。其他因素,包括医疗、环境和流感样疾病因素,也推动了中国新发病例和COVID-19的增长率。根据我们对单个城市的分析,与北京相比,武汉的人口流动和温州的内部流动是温州新增病例增加的驱动因素。 For Chongqing, the main contributing factor for new cases was population flow from Hubei, beyond Wuhan. The high COVID-19 growth rates in Wenzhou were driven by population-related factors.

结论:许多因素导致了中国COVID-19疫情的结果。各种因素(包括特定的城市层面因素)的不同影响强调了精确、有针对性的战略对控制COVID-19疫情和未来传染病疫情的重要性。

中国医学网络学报2020;22(11):e23853

doi: 10.2196/23853

关键字



出现了一种新的肺炎,后来被命名为COVID-19 [1].COVID-19是由新型SARS-CoV-2病毒引起的,已成为全球重大健康威胁[23.].由于新冠肺炎疫情早期的大规模人口流动,疫情在中国迅速蔓延。为控制新冠肺炎疫情蔓延,中国政府迅速采取严格干预措施,于2020年1月23日和24日对武汉及湖北周边城市实施隔离,禁止公共交通,取消集会活动,延长春节假期,推迟学校开学,并制定监测、检测和隔离政策[45].事实证明,这些有力措施有效减缓甚至阻止了新冠肺炎疫情在中国的蔓延。全国新增病例总数迅速下降,过去几个月一直保持在较低水平[67].

COVID-19的传播取决于许多因素。人类对SARS-CoV-2的感染程度为naïve,但目前没有证据表明病毒发生了巨大变化[8].迄今为止,许多基于统计和机制模型的研究探索并证实了人口流动对COVID-19传播的影响[9-11].中国各城市的社会经济状况、气候条件和干预措施各不相同。因此,区域系统、资源和国家应对公共卫生风险和事件的能力与疫情结果直接相关[12].此外,医疗资源的配置和其他相关因素,如医院病床数量,对控制疫情有积极作用[1314].此外,许多社会经济因素,如人口数量、人口密度和社会活动,都是疾病传播的媒介[15].研究已证实环境因素影响病原体的季节性传播,但环境因素对COVID-19的影响仍存在争议[16-19].此外,虽然以前的上呼吸道感染可能与人类冠状病毒感染有关,并对SARS-CoV-2提供了一些交叉保护,但以前的上呼吸道感染与COVID-19之间的关系尚不清楚,必须进一步研究[20.].因此,虽然已经分析了多个影响因素对COVID-19暴发结果的综合作用[21],尚未进行全面的分析。

我们收集了一个全面的数据集,并使用相关性分析和机器学习算法来识别和评估影响中国COVID-19暴发结果的国家级和城市级因素。


数据

数据收集

截至2020年3月1日,全国大部分地级市新增确诊病例已降至0例。因此,本研究收集了2020年1月17日至2月29日中国343个地级市的数据并用于研究。这一时期也是中国新冠肺炎疫情的主要爆发时期。数据以周为单位进行评估,包括以下6周:第1周,1月17日至23日;第二周,1月24-30日;第三周,1月31日至2月6日;第四周,2月7日至13日;第五周,2月14日至20日;第二周,2月21日至29日。每周,没有新病例的城市被排除在进一步分析之外。 Weekly new cases and COVID-19 growth rates were considered response/dependent variables, and a variety of regressors/independent variables were included in this study. These independent variables were divided into the following 6 categories: travel-related (current week), travel-related (previous week), medical, socioeconomic, environmental, and influenza-like illness (ILI) variables (Table S1 in多媒体附件1).

新增病例和COVID-19增长率

新冠肺炎确诊病例数据从卫健委每日官方报告中下载,每周累计新增病例数据提取。繁殖数量(R代理)作为COVID-19增长率的指标,增长率定义为下一周新增病例数与当周新增病例数的归一化[22],具体如下:

式中w为周,取值范围为1-6,N为周累计新增病例数,i为第i个城市。

旅游相关的因素

国内每日人口流动数据来源于百度黔西[23].数据来源于百度定位服务和百度天雁定位交通信息系统。系统实时收集使用百度服务的用户自愿上传的位置信息,并根据全球定位系统、Wi-Fi位置、IP地址、信号塔信息绘制人口迁移地图。我们从这张地图中获得了与旅行相关的城市级别的人群运动信息。本研究采用了以下5个城市级测量值:武汉人口流(武汉流)、湖北不含武汉的人口流(湖北/非武汉流)、中国大陆地区不含湖北的人口流(非湖北流)、城市内部人口流(城市内部流)、城市内部活动强度(城市内部流指数),城市内部活动强度是通过人口对城市内部人口流进行归一化得到的。每周的测量是根据每日数据的总和得出的。由于COVID-19的潜伏期,本研究将前一周的旅行相关因素与当前一周的旅行相关因素分开考虑。将湖北/非武汉流量和非湖北流量测量值结合得到非武汉流量测量值,将城市内部流量和城市内部流量指数结合得到城市流量测量值。

医学因素

医生数量、医院数量、床位数量、门诊人数和急诊人数均来自2018年版《中国卫生与计划生育统计年鉴》[24].门诊数据仅提供省级数据,因此按每个城市人口的比例获得城市级别的值。新冠肺炎治疗医院数量的数据摘自省级卫生健康委员会发布的公告。每个城市的数值在6周内保持不变。

社会经济因素

社会经济因素,包括人口数量、人口密度、国内生产总值、人均收入和65岁以上人口比例,均来自2018年中国城市统计年鉴[25].除65岁以上人口比例外,所有社会经济数据均为城市一级。每个城市使用65岁以上人口百分比的省级数据。每个城市的数值在6周内保持不变。

环境因素

各城市的每日气候数据,包括最高气温、最低气温、平均气温、相对湿度和绝对湿度,均从中国气象局网站[26].每周数据由每日数据的平均值计算。

伊犁因素

根据中国国家流感中心的周报数据,计算出2016年至2018年每个城市ILI发生的平均百分比。该数据基于中国31个省份554家哨点医院的检测样本数量。

相关分析

斯皮尔曼相关用于评估单个因素与新病例数或COVID-19增长率之间的关系。本研究的显著性水平为0.05。

机器学习框架

特征选择和特征重要性

首先,利用XGBoost框架(极限梯度增强)建立非线性回归树模型[27],用于拟合每周新增病例和COVID-19增长率。接下来,迭代顺序向后浮动选择以训练XGBoost [2829]模型,通过最小化均方误差得到最终模型。序列向后浮动选择是一种基于贪婪搜索算法的序列特征选择方法。它从完整的特征集中逐个移除特征,并计算误差函数。当误差达到最优水平时,将剩余特征的组合视为最优特征组合。最后,根据树模型拆分因子的次数确定每个选定因子的重要性,树模型由XGBoost确定。每周,每个因素的贡献百分比根据其相对重要性计算[30.].

形状加性解释分析

沙普利加性解释[31是一种可解释的方法,用于分析机器学习模型的输出。使用SHAP分析来计算每个城市和每周所选因素的贡献。为每个数据样本生成一个预测值(即SHAP值),并将预测值统一分配给样本的每个特征。下式显示了如何计算机器学习模型的预测值:

y= y基地+ f (xi1) + f (xi2+)    (2)

在这个方程中,第i个样本被定义为x,第i个样本的第j个特征定义为xij,则机器学习模型对样本的预测值为y,将模型的参考值(即目标样本变量的均值)定义为y基地.此外,f (xij)为x的SHAP值ij.f (xij)>0表示该特征增加了预测值,具有正贡献;否则,该特征降低了预测值,具有负贡献。

SHAP包[32]根据训练好的XGBoost模型[计算边际贡献值(即SHAP值)]33-35].SHAP值用于衡量不同重要因素对每个城市的贡献。


单因素分析

基于单因素Spearman相关分析,许多因素与中国新增病例数和COVID-19增长率均显著相关(图1).除相对湿度外,其他因素均与至少1周内新增病例数显著相关。同样,只有旅行相关(当前和过去几周)、医疗和社会经济因素与至少一周内的COVID-19增长率显著相关,而环境和ILI因素与COVID-19增长率不相关(图1).武汉流动、湖北/非武汉流动及其前几周对应措施均与6周新增病例数呈正相关,而城市内部流动指数与6周新增病例数呈负相关。许多因素与至少5周的新病例数显著相关,但只有武汉前一周的流量和人口密度与至少5周的COVID-19增长率显著相关(图1).

图1。新冠肺炎新增病例(左)与增长速度(右)相关因素分析。每个因素从上到下的圆点表示连续6周(2020年1月17日至2月29日)对应的斯皮尔曼相关系数。显著相关性用红色表示。流感样疾病。
查看此图

基于机器学习算法的多因素分析

我们的附加分析表明,许多因素相互相关(图S1 .)多媒体附件2).因此,需要一种非线性方法来评估相关因素对中国COVID-19传播的贡献。机器学习方法很适合解决非线性问题,我们使用了XGBoost [2830.]为本研究创建非线性回归树模型。基于XGBoost框架中的交叉验证程序选择重要因素。图S2多媒体附件2显示为最终模型选择的因素的数量。在所有6周中,没有一个单一因素被一致地选择,但可以获得总体贡献百分比(图2多媒体附件2).图2显示本周与旅行相关的因素(贡献:新病例,32%;COVID-19增长率,20%)和前一周的相关措施(贡献:新病例,45%;COVID-19增长率,21%)是推动新病例数和COVID-19增长率变化的主要因素,总贡献率分别为77%和41%。对于新增病例,其他因素的贡献不超过10%。对于COVID-19的增长率,社会经济因素也很重要,它们的综合贡献率为28%。其他因素也影响了中国COVID-19的增长率,其中环境、ILI和医疗因素分别占14%、10%和7%。在新增病例中,占比>10%的主要个体因素是武汉人流、城市人流和非武汉人流,综合贡献率(即出行相关措施和前一周相应措施)分别为49%、16%和12%。对于COVID-19的增长率,主要影响因素是非武汉流动、人口密度、ILIs和武汉流动,分别占26%、10%、10%和9%。其余对COVID-19增长率贡献不低于5%的因素为城市流量(本周和前一周)、人口数量、COVID-19医院数量、最低温度、绝对湿度和人均收入,其贡献分别为7%、6%、6%、6%、6%和5% (图2).

图2。各种因素对中国COVID-19新增病例和COVID-19增长率的贡献流感样疾病。
查看此图

城市层面因素分析

SHAP是解释个别预测的一种方法[3135通过计算每个因素的贡献,并将其与基于博弈论的预测进行比较。多媒体显示每个城市每个选定因素的详细SHAP值。SHAP值解释了不同因素对每个城市COVID-19疫情结果的贡献。为了进行演示,我们从北京、温州和重庆(分别为106、221和179例)和第一周的COVID-19增长率(分别为4.08、36.83和6.63)中选取了一些新病例(分别为106、221和179例)。图3).第二周,武汉流动和城市内部流动(前一周)是导致温州新增病例增加的主要因素(SHAP值总体为90.75),湖北/非武汉流动是导致重庆新增病例增加的主要因素(SHAP值为118.66)(图3A).对北京而言,人口密度和武汉人流是影响新增病例数的前2位因素,两者的SHAP值之和为41.29,远小于温州和重庆的SHAP值。这也意味着北京的因素与新增病例相关的数量要少于温州和重庆的因素(分别为106例与221例和179例)(图3A)。此外,温州与北京、重庆的第一周新冠肺炎增长率差异(分别为36.83比4.08、6.63)是由人口数量、非湖北流动、人均收入、65岁以上人口占比等因素造成的(SHAP值分别为10.87、1.67、1.64、1.48)(图3B).其中,人口数量对疫情增速的贡献均为正,温州的贡献更大,而非湖北地区的人口流动和人均收入对疫情增速的贡献为正,其他城市为负,说明了这些因素对温州疫情增速较高的重要性。北京新冠肺炎医院数量的贡献大于温州和重庆(SHAP值分别为6.06 vs 0.93和1)(图3B)。

图3。北京、温州和重庆选定因素的SHAP值。(A)第二周新发COVID-19病例。(B)第一周COVID-19的增长率。采用非线性回归树模型选择影响因素。SHAP:有形状的加性解释。
查看此图

主要结果

在这项研究中,我们应用机器学习方法,基于从中国343个城市收集的多维数据,描绘了不同因素对每周新病例和COVID-19增长率的贡献。在疫情期间(即2020年1月17日至2月29日),与旅行相关的因素是中国新病例数量和COVID-19增长率的主要贡献者,增长率也受到其他因素的影响,包括人口密度等社会经济因素[36].相关因素在城市层面的差异导致了COVID-19暴发的不同结果,并为未来的有针对性的防控方法提供了启示。

我们的简单相关分析和机器学习探索结果表明,中国COVID-19疫情的进展受到多种因素的影响。基于我们的非线性机器学习方法,我们发现中国新增病例和COVID-19增长率的最重要贡献者是与旅行相关的因素,并且与旅行相关的因素具有明显的不可忽视的滞后效应。此前已有研究表明,来自武汉的人口流动是中国新冠肺炎新增病例的驱动因素,我们已经证实了这一点[23738].此外,我们发现,来自武汉以外地区的人口流动和城市内部流动对中国新增病例和COVID-19增长率有显著贡献,来自非武汉地区的人口流动是COVID-19增长率的主要贡献者(图2).城市内部流动也导致了COVID-19病例的增加和疾病的传播,但其影响有限。来自非武汉地区的人口流动的重要贡献,强调了在疫情期间监测和限制来自疫情中心以外地区的人口流动的重要性。这可能与这样一个事实有关,即人们为了顺利返回家乡,避免麻烦,他们可能会绕道而行。因此,有关部门应关注所有游客,而不仅仅是直接来自武汉的游客,特别是考虑到人口流动的滞后效应。

我们的研究还表明,其他因素对中国COVID-19疫情发展的贡献不可忽视,特别是对COVID-19的增长速度。在中国,社会经济因素对COVID-19增长率的贡献与旅行相关因素相当[39) (图2).主要的社会经济因素是人口密度;人口密度越高,二次感染概率越高,新增病例增长越快。在本研究考虑的所有因素中,医疗资源相关因素对中国新冠肺炎病例的贡献最小,这可能表明中国大多数城市有足够的医疗资源。有趣的是,在所有医疗因素中,COVID-19增长率的主要贡献因素是COVID-19医院的数量。该因素的贡献率为6%,相当于所有医疗因素贡献率的85%以上,说明各城市设立新冠肺炎定点医院的做法对控制病例增长是有效的。我们的研究结果还表明,环境和ILI因素对中国COVID-19的增长率有影响,但与旅行相关因素和社会经济因素相比,它们的影响较小。因此,环境因素和ILI因素的贡献应认真解读并进一步研究[4041].

基于博弈论中使用的SHAP值,我们能够区分不同城市层面因素的个人贡献,这对精确和有针对性的控制策略具有重要意义。例如,与首都北京这个人口众多、人口流动中心的超级特大城市相比,温州和重庆第二周的新增病例更多,但影响因素不同。温州新增病例增加的主要原因是武汉流动和城市内部流动(前一周),而重庆是湖北/非武汉流动(前一周)的驱动因素。为了减少温州的新冠肺炎病例,除了限制武汉的人口迁移外,还需要采取措施,比如减少城市内的社交活动。重庆作为与湖北相邻的城市,更应该重视湖北游客。温州首周新冠肺炎疫情增速较高,除与出行相关的因素外,主要是社会经济因素,包括人口数量、人均收入、65岁以上人口占比等。我们的研究是第一个评估不同城市层面因素对疫情结果的贡献的研究,我们的结果和方法有助于有针对性地控制传染病。

限制

这项研究有几个局限性。首先,虽然我们评估了尽可能多的因素,但可能会遗漏一些重要因素。例如,尽管我们纳入了与社会距离政策相关的措施,如城市内部流动和城市内部流动指数,但其他详细的控制政策[42都不见了。其次,由于因素之间的多重共线性和模型中的黑盒效应,我们的结果可能在生物学上并不合理,需要仔细解释。因此,负的SHAP值不应被解释为具有负面影响的因素。相反,负的SHAP值可能表明影响不佳和贡献小。第三,未来需要更多的医疗资源数据,特别是疫情期间医疗资源再分配的数据,这对未来有效的资源安排很重要。第四,虽然我们使用了强大的机器学习方法来处理不同因素之间的复杂关系,但它可能不是最合适的方法。因此,应该探索其他方法,特别是本研究的数据覆盖时间较短,并且由于强干预而表现出巨大的变化。尽管如此,我们的定量结果和提出的方法阐明了不同因素对爆发结果的贡献,并有助于精确预防和控制传染病。

结论

新冠肺炎疫情防控是一项系统工程。了解重要的致病因素,制定相应的防控策略,有助于制定有效的防控措施。除了来自武汉的人口流动外,其他地方的人口流动和城市内部流动也对中国新冠肺炎病例数量和增长速度产生了影响。社会经济因素,特别是人口数量和密度,对中国COVID-19的增长率也起着非常重要的作用。基于本研究提出的框架,探讨了具体因素对个别城市的贡献。疫情仍在全球范围内蔓延,许多国家正在经历疫情严重反弹。我们在本研究中提出的结果和框架对于探索最优和精确的控制策略是有帮助和有用的。

致谢

作者要感谢成千上万的疾病控制和预防中心的工作人员、卫生工作者和数据科学家,他们不断收集数据,并致力于遏制COVID-19在中国和其他地方的传播。国家重点研发计划项目(2020YFC0840900)、国家自然科学基金项目(31970643 & 81961128002)、深圳市科技计划项目(KQTD20180411143323605)、广东省前沿科技创新计划项目(2019B020228001 & 2019B111103001)资助。

作者的贡献

XD和ZC设计了研究。ZC, FT, CC, CZ, YG, RL, ZH, YT, TX, YXu, YS, FW, PD, GL收集并分析数据。XD, YJ, HZ, YC LS, YShu对数据进行解释。XD, ZC和FT准备了手稿。XD, GL, YJ, HZ, YC, LS, YShu编辑论文。所有作者审阅并批准了所提交的手稿。

利益冲突

没有宣布。

多媒体附件1

表S1。所有影响因素的集合。

ZIP文件(ZIP Archive), 131 KB

多媒体附件2

补充资料,包括图S1、图S2、表S2。

DOCX文件,704 KB

多媒体

每个城市各选定因子的沙普利相加解释值。

ZIP文件(ZIP Archive), 32kb

  1. Gorbalenya AE, Baker SC, Baric RS, de Groot RJ, Drosten C, Gulyaeva AA。与严重急性呼吸综合征相关的冠状病毒:将2019-nCoV分类并命名为SARS-CoV-2。Nat Microbiol 2020 april r;5(4):536-544 [免费全文] [CrossRef] [Medline
  2. 朱楠,张东,王伟,李霞,杨波,宋娟。2019年中国肺炎患者的新型冠状病毒。N Engl J Med 2020 Feb 20;382(8):727-733 [免费全文] [CrossRef] [Medline
  3. 世界卫生组织。冠状病毒疾病(COVID-19)每周流行病学更新和每周行动更新。URL:https://www.who.int/emergencies/diseases/novel-coronavirus-2019/situation-reports/[2020-06-09]访问
  4. Kraemer MUG, Yang C, Gutierrez B, Wu C, Klein B, Pigott D.人员流动和控制措施对中国新冠肺炎疫情的影响。科学2020年5月01日;368(6490):493-497 [免费全文] [CrossRef] [Medline
  5. 田华,刘勇,李勇,吴超,陈波,Kraemer MUG。中国新冠肺炎疫情前50天传播控制措施调查科学2020五月08;368(6491):638-642 [免费全文] [CrossRef] [Medline
  6. 李震,陈强,冯磊,Rodewald L,夏勇,于慧。主动病例发现与病例管理:应对COVID-19大流行的关键。柳叶刀2020 july 04;396(10243):63-70 [免费全文] [CrossRef] [Medline
  7. 陈松,杨军,杨伟,王超,Bärnighausen T.新年期间中国大规模人口流动期间的新冠肺炎防控。柳叶刀2020年3月07日;395(10226):764-766 [免费全文] [CrossRef] [Medline
  8. 李强,关旭,吴鹏,王旭,周林,童勇,等。新型冠状病毒感染的肺炎在中国武汉的早期传播动态N Engl J Med 2020年3月26日;382(13):1199-1207 [免费全文] [CrossRef] [Medline
  9. 安宰A,小林T,林顿NM,木下R,林林K,铃木A,等。评估旅行减少对新型冠状病毒感染(COVID-19)出口动态的影响。J临床医学2020年2月24日;9(2):601 [免费全文] [CrossRef] [Medline
  10. Chinazzi M, Davis JT, Ajelli M, Gioannini C, Litvinova M, Merler S,等。旅行限制对2019年新型冠状病毒(COVID-19)疫情传播的影响。科学2020 april 24;368(6489):395-400 [免费全文] [CrossRef] [Medline
  11. 杜忠,王磊,Cauchemez S,徐旭,王鑫,Cowling BJ,等。从武汉到中国其他城市的冠状病毒疾病运输风险新兴感染疫情2020年5月;26(5):1049-1052 [免费全文] [CrossRef] [Medline
  12. sars后15年:加拿大公共卫生应急响应的重要里程碑。通信代表2018年5月03日;44(5):98-101 [免费全文] [CrossRef] [Medline
  13. Kandel N, Chungong S, Omaar A,邢j . COVID-19疫情背景下的卫生安全能力:对182个国家《国际卫生条例》年度报告数据的分析。柳叶刀2020年3月28日;395(10229):1047-1053 [免费全文] [CrossRef] [Medline
  14. 梁玲,曾聪,何海杰,吴晨。新冠肺炎病死率与检测次数和政府效能呈负相关。科学通报2020年7月24日;10(1):12567 [免费全文] [CrossRef] [Medline
  15. 邱勇,陈旭,史伟。社会经济因素对2019冠状病毒病(COVID-19)在中国传播的影响。《大众经济》2020年5月09:1-46 [免费全文] [CrossRef] [Medline
  16. Price RHM, Graham C, Ramalingam S.病毒季节性与气象因素的关系。科学通报2019年1月30日;9(1):929 [免费全文] [CrossRef] [Medline
  17. 谢军,朱勇。中国122个城市环境温度与COVID-19感染的关系。科学总环境2020年7月01日;724:138201 [免费全文] [CrossRef] [Medline
  18. 曲刚,李霞,胡玲,姜刚。研究环境因素在新型冠状病毒传播中的作用势在必行。环境科学与技术2020 april 07;54(7):3730-3732 [免费全文] [CrossRef] [Medline
  19. 姚勇,潘杰,刘震,孟x,王伟,阚华,等。中国城市COVID-19传播与温度或紫外线辐射无关联。欧洲呼吸杂志2020年5月;55(5):2000517。[CrossRef] [Medline
  20. 孔伟,李勇,彭敏,孔东,杨霞,王林,等。流感样疾病患者的SARS-CoV-2检测。Nat Microbiol 2020 May;5(5):675-678。[CrossRef] [Medline
  21. 冉娟,赵松,韩林,廖刚,王凯,王明华,等。温度与新冠病毒传播力关系的再分析——基于154个中国城市的生态研究欧洲呼吸杂志2020年8月;56(2):2001253。[CrossRef] [Medline
  22. 罗伟,马宗德,刘东,Poirier C, Mandl KD, Lipsitch M,等。绝对湿度对COVID-19疫情传播率的作用。medRxiv预印本于2020年2月17日在线发布。[CrossRef
  23. 百度Qianxi。百度迁移。URL:http://qianxi.baidu.com/[2020-11-09]访问
  24. 中国卫生和计划生育统计年鉴2018。中国数据洞察。URL:http://cdi.cnki.net/Titles/SingleNJ?NJCode=N2019030282[2020-06-09]访问
  25. 国家统计局。2018中国城市统计年鉴。URL:http://www.stats.gov.cn/tjsj/tjcbw/201907/t20190708_1674721.html[2020-06-09]访问
  26. 中国气象局。天气预报。URL:https://tianqi.911cha.com/[2020-11-09]访问
  27. Chen T, Guestrin C. XGBoost:一个可扩展的树增强系统。2016年8月发表于:KDD '16:第22届ACM SIGKDD知识发现和数据挖掘国际会议论文集;2016年8月;加利福尼亚州旧金山,第785-794页。[CrossRef
  28. 王晓明,王志强,王志强,等。大尺度特征选择方法的比较研究。机器智能与模式识别1994;16:43 - 43 [免费全文] [CrossRef
  29. Raschka S. MLxtend:为Python的科学计算堆栈提供机器学习和数据科学实用功能和扩展。J Open Source software 2018 april;3(24):638。[CrossRef
  30. 石旭,王永德,李明泽,Palanisamy C,柴晨。基于XGBoost的驾驶评估与风险预测特征学习方法。Accid肛前2019年8月;129:170-179。[CrossRef] [Medline
  31. 伦德伯格SM,李SI。解释模型预测的统一方法。见:神经信息处理系统进展30 (NIPS 2017)。2017年发表于:第31届神经信息处理系统会议(NIPS 2017);2017;加州长滩。
  32. GitHub。世鹏科技电子包。URL:https://github.com/slundberg/shap[2020-11-09]访问
  33. Nohara Y, Matsumoto K, Soejima H, Nakashima N.使用改进的Shapley加法解释的机器学习模型解释。2019年9月发表于:BCB '19:第十届ACM生物信息学、计算生物学和健康信息学国际会议论文集;2019年9月;尼亚加拉瀑布,纽约,第546页。[CrossRef
  34. Mitchell R, Frank E.使用GPU计算加速XGBoost算法。计算科学2017年7月24日;3:e127。[CrossRef
  35. 伦德伯格,埃利昂GG,李思。树整体的一致性个性化特征归因。arXiv预印本于2019年3月7日在线发布。
  36. 贾建军,陆旭,袁勇,徐刚,贾杰,Christakis NA。人口流动驱动中国新冠肺炎时空分布自然2020年6月;582(7812):389-394。[CrossRef] [Medline
  37. 吴景涛,梁坤,梁桂明。武汉新型冠状病毒疫情在国内和国际传播的临近预测与预测:建模研究。柳叶刀2020年2月29日;395(10225):689-697 [免费全文] [CrossRef] [Medline
  38. 赵松,庄志,曹鹏,冉杰,高东,娄勇,等。量化2020年国内旅行与中国武汉新型冠状病毒(2019-nCoV)病例输出之间的关联:相关分析J Travel Med 2020年3月13日;27(2):taaa022。[CrossRef] [Medline
  39. 沈鑫,蔡超,李慧。量化社会经济活动和天气对新冠肺炎疫情全球传播的影响。arXiv预印本于2020年5月20日在线发布。
  40. 齐浩,肖松,石荣,沃德MP,陈勇,涂伟,等。中国大陆COVID-19传播与温度和湿度相关:时间序列分析科学总环境2020年8月01日;728:138778 [免费全文] [CrossRef] [Medline
  41. 冯立群,郑海阳,郑汉。气象条件和非药物干预共同决定中国41个城市COVID-19的局部传播性:一项回顾性观察研究。《柳叶刀》区域健康-西太平洋2020年9月2日100020-100020 [免费全文] [CrossRef
  42. 赖山,鲁克塔南柴,周林,普罗斯波,罗伟,弗洛伊德,等。中国控制COVID-19的非药物干预措施效果自然2020年9月;585(7825):410-413。[CrossRef] [Medline


伊犁:流感样疾病
世鹏科技电子:Shapley加法解释
XGBoost:极端梯度增强


R·库卡夫卡编辑;提交26.08.20;同行评议通过Y彭,吴,Z, J,赵;对作者12.09.20的评论;修订本收到日期:03.10.20;接受22.10.20;发表11.11.20

版权

©曹自成、唐峰、陈才、张驰、郭益辰、林瑞珍、黄志红、滕毅、谢婷、徐玉田、宋燕欣、吴峰、董佩佩、罗干峰、蒋亚文、邹华春、陈耀庆、孙礼涛、舒跃龙、杜向军。最初发表于《医疗互联网研究杂志》(//www.mybigtv.com), 2020年11月11日。

这是一篇开放获取的文章,根据创作共用署名许可(https://creativecommons.org/licenses/by/4.0/)的条款发布,允许在任何媒介上无限制地使用、分发和复制,前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。


Baidu
map