这是一篇根据创作共用署名许可协议(https://creativecommons.org/licenses/by/4.0/)发布的开放获取文章,允许在任何媒介上不受限制地使用、分发和复制,前提是正确引用了首次发表在JMIR公共卫生和监测上的原创作品。必须包括完整的书目信息,https://publichealth.www.mybigtv.com上的原始出版物的链接,以及此版权和许可信息。
人群水平实时逆转录聚合酶链反应(RT-PCR)循环阈值分布作为病毒载量的代理,可能是预测COVID-19动态的有用指标。
本研究的目的是确定平均Ct值的日变化趋势与COVID-19动态之间的关系,计算方法为按年龄划分的每日新冠肺炎住院人数、每日新增阳性检测人数、每日新冠肺炎死亡人数。我们进一步试图确定这些数据序列之间的滞后。
本研究的样本收集于2021年3月21日至2021年12月1日。记录所有转到伊朗德黑兰医学科学大学分子诊断实验室进行RT-PCR检测的患者的每日Ct值。从伊朗德黑兰省COVID-19患者信息登记系统中提取每日阳性检测数和按年龄分组的住院患者数。对时间序列变量建立了自回归综合移动平均(ARIMA)模型。然后进行交叉相关分析,以确定平均日Ct值与其他COVID-19动态相关变量之间的最佳滞后和相关性。最后,将通过互相关确定的最佳Ct滞后作为协变量纳入外生变量自回归综合移动平均(ARIMAX)模型计算系数。
日平均Ct值与日新住院人数呈显著负相关(23天时间延迟)。
对于COVID-19监测来说,找到一个可以预测社区疫情激增的良好指标非常重要。我们的研究结果表明,延迟30天的平均日Ct值可以预测COVID-19阳性确诊病例数量的增加,这可能是卫生系统的一个有用指标。
冠状病毒是人畜共患病原体,可在获得特定突变后传播给人类[
采用实时逆转录聚合酶链反应(RT-PCR)检测全球呼吸道样本中的SARS-CoV-2,作为常规监测手段。RT-PCR检测对诊断COVID-19具有较高的敏感性和特异性,比病毒培养方法周转时间更快;因此,该检测已成为诊断COVID-19的主要方法。RT-PCR对病毒载量有定性和定量的结果[
据我们所知,很少有研究研究使用人群水平的Ct值作为衡量社区COVID-19动态的指标。由于Ct值与疾病严重程度和传染性有显著关系,人群每日检测样本的平均Ct值越高,可能预测社区的疫情增长。海等[
为了解决这些问题,本研究旨在确定每日平均Ct值与COVID-19动态之间的关系,包括每日新冠肺炎住院人数、每日新增阳性检测人数、每日新冠肺炎死亡人数以及按年龄划分的新冠肺炎住院人数。我们进一步的目的是确定这些序列之间的滞后。
本研究的样本收集于2021年3月21日至2021年12月1日。纳入标准是从疑似感染COVID-19的个人身上获得的样本,并被转介到伊朗德黑兰的一个实验室以确认诊断。记录所有转到实验室进行RT-PCR检测的患者的每日Ct值结果。从伊朗德黑兰省COVID-19患者信息登记系统中提取9个月的每日阳性病例数和按年龄组划分的住院人数。
本研究包括上呼吸道样本(包括鼻咽和前鼻孔拭子样本),使用无菌涤纶薄拭子(塑料或铝柄)作为主要测试样本。样本由医生、护士、实验室专家和其他经过足够培训和经验的工作人员收集。所有生物样本都被送往伊朗德黑兰的伊朗医学大学分子诊断实验室。所有样品均采用Pishtazteb One-step RT-PCR COVID-19试剂盒(双靶基因诊断)进行分析,RNA提取采用Zybio核酸提取试剂盒(磁珠法)进行。为确认诊断,靶基因为SARS-CoV-2核衣壳基因和RdRp基因[
对所有转介到实验室的患者的每日Ct中位数以及按年龄组划分的每日COVID-19住院患者数量随时间的变化进行绘制。采用自回归综合移动平均(ARIMA)和外生变量自回归综合移动平均(ARIMAX)模型,确定伊朗德黑兰省每日平均Ct值与每日COVID-19住院人数、每日COVID-19死亡人数和每日阳性检测人数之间的显著相关性。
时间序列分析适用于处理具有时间趋势的一组数据[
在Yt表示非平稳时间序列数据,Y 't为首次差分后的时间序列。如果时间序列具有季节性趋势,则使用季节差异来稳定该序列。AR参数
其中C是常数;β1,β2,…,βp为AR模型术语;和ϕ1,ϕ2,…,ϕ问为MA模型项。通过自相关函数和偏自相关函数确定AR和MA参数的个数。
ARIMA模型的一般形式可以写成:
开发ARIMA模型的四个主要步骤包括检查均值和方差稳定性(见表S1)
模型参数采用最大似然法。为了确定最佳ARIMA模型,在通过残差检验(方差正态性和稳定性)的模型中,选取贝叶斯信息准则(BIC)和赤池信息准则(AIC)最低的模型作为最终模型。BIC和AIC公式表示如下:
其中m是观测数据的数量,k是模型中参数的总数,ln(
建立ARIMA模型,将日平均Ct值、日新型冠状病毒肺炎住院人数、日新增阳性检测人数、日新型冠状病毒肺炎死亡人数、日新型冠状病毒肺炎住院人数作为时间序列。中描述了ARIMA模型的详细推导方法
采用互相关函数评价日平均Ct值与每日新冠肺炎住院人数、每日新增阳性检测人数、每日新冠肺炎死亡人数、按年龄分组的新冠肺炎住院人数之间的时间延迟。采用之前拟合的ARIMA模型对独立变量(日平均Ct值)和因变量(每日COVID-19住院人数、每日新增阳性检测人数、每日COVID-19死亡人数、按年龄划分的COVID-19住院人数)进行预处理。互相关系数的数学表示如下:
其中C
式(8)和式(9)中,n为样本量,k为估计参数的个数,θ为所有参数值的集合,L(θ)为模型的似然值。
ARIMAX模型是对ARIMA模型的扩展,增加了一个解释性自变量。ARIMAX模型是多元回归分析与时间序列分析相结合的模型;因此,可以确定Ct值的不同滞后与其他研究变量之间关系的影响因子。ARIMAX模型公式如下:
其中x(t)是时刻t的自变量,β是其相关系数。Yt - 1)Y……t−p前一个值是因变量,εt…εt-q是时间序列的残差。确定x的滞后之间的关联和关联系数t + m时间序列和Y序列t,采用ARIMAX模型。使用互相关函数来寻找x之间的线性相关关系t + m和Yt对于不同的滞后,这可以帮助找到可能用于预测因变量的自变量的最佳滞后[
建立最佳ARIMAX模型的步骤。ACF:自相关函数;AIC:赤池信息准则;ARIMA:自回归综合移动平均;ARIMAX:带外生变量的自回归综合移动平均;BIC:贝叶斯信息准则;PACF:偏自相关函数。
由于本研究未使用个人数据,因此不需要正式的伦理评估或知情同意。该研究得到了伊朗医学科学大学伦理委员会的批准(伦理代码:IR.IUMS.REC.1400.799)。
研究变量的描述性统计。
变量 | 最大 | 最低 | 意思是(SD) | |
因变量:周期阈值 | 24.87 | 15.83 | 19.89 (1.33) | |
|
||||
|
住院人数 | 763 | 47 | 310.65 (260.259) |
|
阳性检测数量 | 925 | 42 | 396.48 (211.05) |
|
COVID-19死亡人数 | 72 | 0 | 15.98 (24.57) |
|
5岁以下住院患者人数 | 58 | 0 | 16.514 (10.23) |
|
5-17岁住院人数 | 41 | 1 | 12.35 (6.78) |
|
18-59岁住院人数 | 444 | 12 | 155.94 (91.61) |
|
60岁以上住院患者人数 | 330 | 3. | 123.58 (63.37) |
9个月周期阈值(Ct)及其他研究变量的变化趋势。
采用贝叶斯信息准则(BIC)和赤池信息准则(AIC)对自回归综合移动平均(ARIMA)模型进行优选。
变量 | 华宇电脑 | 日志的可能性 | 另类投资会议 | BIC |
周期阈值 | (1,0, - 1)一个 | -355.99 | 702.38 | 716.42 |
住院人数 | (1,0, - 1) | -1553.31 | -1231.24 | -1220.61 |
COVID-19检测阳性数量 | (1,0, - 1) | -1198.16 | 2494.99 | 2827.07 |
COVID-19死亡人数 | (1 0 2) | -933.16 | 1876.33 | 1893.88 |
5岁以下住院患者人数 | (1,0, - 1) | -905.64 | 481.26 | 494.797 |
5-17岁住院人数 | (1,0, - 1) | -819.80 | 393.80 | 407.322 |
18-59岁住院人数 | (1,0, - 1) | -1401.00 | 374.58 | 384.72 |
60岁以上住院患者人数 | (1,0, - 1) | -919.60 | 397.41 | 407.55 |
一个括号中的数字表示参数(
周期阈值(Ct)值与其他研究变量之间的交叉相关(y轴)。
周期阈值与其他研究变量之间存在高相关性滞后。
变量 | 滞后 |
|
|
另类投资会议一个 | HQICb | SBICc |
住院人数 | 23 | -0.25 | 02 | 15.34 | 15.95 | 16.85 |
阳性检测数量 | 30. | -0.34 | 02 | 15.83 | 16.83 | 8.24 |
COVID-19死亡人数 | 30. | -0.26 | 02 | 10.90 | 11.69 | 12.86 |
5岁以下住院患者人数 | 9 | -0.22 | .76 | 10.38 | 10.73 | 11.25 |
5-17岁住院人数 | 13 | -0.23 | 29 | 9.54 | 9.89 | 10.41 |
18-59岁住院人数 | 23 | -0.27 | .04点 | 14.24 | 14.85 | 15.75 |
60岁以上住院患者人数 | 23 | -0.30 | 07 | 13.54 | 14.15 | 15.05 |
一个AIC:赤池信息标准。
bHQIC: Hannan-Quinn信息标准。
cSBIC:施瓦茨贝叶斯准则。
用互相相关分析得到日Ct值与其他变量之间的最佳滞后后(
使用自回归综合移动平均和外生变量模型得到的估计系数。
变量和参数 | 系数(β) | 95%可信区间 |
|
||||
|
|||||||
|
Ct一个(23)b | -24.12 | -41.08 ~ -7.16 | .005 | |||
|
基于“增大化现实”技术c(1) | 获得 | .95到1.02 | <措施 | |||
|
妈d(1) | .87点 | -。96to –.78 | <措施 | |||
|
|||||||
|
Ct (30) | -1.52 | -2.86到- 0.18 | 03 | |||
|
AR (1) | .96点 | .89到1.03 | <措施 | |||
|
马(1) | -1.07 | -1.22到- 0.92 | <措施 | |||
|
马(2) | . 21 | .09到.34 | 措施 | |||
|
|||||||
|
Ct (30) | -16.87 | -28.93到-4.82 | <措施 | |||
|
AR (1) | .96点 | 0.84到1.07 | <措施 | |||
|
马(1) | .89 | -1.06到- 0.71 | <措施 | |||
|
|||||||
|
Ct (9) | 60 | -1.68到。47 | 低位 | |||
|
AR (1) | .96点 | 0.84到1.07 | <措施 | |||
|
马(1) | .89 | -1.06到- 0.71 | <措施 | |||
|
|||||||
|
Ct (13) | .40 | -1.30到0.50 | 点 | |||
|
AR (1) | .97点 | .92到1.03 | <措施 | |||
|
马(1) | .89 | -。99to –.79 | <措施 | |||
|
|||||||
|
Ct (23) | -11.87 | -21.81到-1.94 | 02 | |||
|
AR (1) | 获得 | .95到1.02 | <措施 | |||
|
马(1) | .85 | -。94to –.76 | <措施 | |||
|
|||||||
|
Ct (23) | -11.44 | -17.82到-5.07 | <措施 | |||
|
AR (1) | 获得 | 0.96到1.02 | <措施 | |||
|
马(1) | .90 | -。98to –.81 | <措施 |
一个Ct:周期阈值。
b括号中的数字表示延迟天数。
c基于“增大化现实”技术:自回归。
d移动平均线。
Ct值是病毒载量的一个很好的代表,它可以提供隔离病毒载量较高(Ct值较低)的人以及过去5天与这些人有过接触的人以降低传播率的可能性[
这一结果与Walker等人的研究结果一致[
海等[
用于测量不同地理区域人群水平Ct值的Ct值的测量方式或数据集质量保证的差异,可能会影响Ct值预测当地COVID-19流行波的效力。以往的研究表明,监测样本的群体水平Ct值的变化可能导致疾病爆发[
人群日平均Ct值与SARS-CoV-2检测阳性次数和时间延迟有关。在降低日平均Ct值30天后,预计新冠肺炎病例将增加。找到一个可以预测社区疫情激增的良好指标,对改善COVID-19监测至关重要。更快地预测新一波疾病将有助于卫生政策制定者启动适当的公共卫生政策,如实施封锁,以减少预期的大流行激增,并将为卫生系统提供机会,满足药品和设施的需求,以支持更多的患者。
附加数据涉及统计分析步骤和ARIMA模型的详细描述。
增强Dickey-Fuller
赤池信息标准
自回归
自回归综合移动平均
带外生变量的自回归综合移动平均
贝叶斯信息准则
循环阈值
汉南-奎因信息标准
移动平均线
逆转录聚合酶链反应
施瓦茨贝叶斯信息准则
没有宣布。