这是一篇开放获取的文章,根据创作共用署名许可(http://creativecommons.org/licenses/by/2.0/)的条款发布,允许在任何媒介上无限制地使用、分发和复制,前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。
2013年初,一种新型禽流感H7N9在中国出现。这件事很快就引起了公众的极大关注,并在互联网上引起了广泛讨论。大量有关资料通过各种来源在互联网络上公开提供。
本研究旨在根据互联网上公开的数据描述H7N9在中国的爆发,并通过将我们的发现与进行良好的常规现场流行病学研究进行比较来验证我们的调查。
我们搜索了截至2014年2月10日中国政府和主要大众媒体网站上关于H7N9疫情的可公开访问的互联网数据。两名研究人员使用自行设计的数据提取表格,独立提取、比较和确认每个H7N9确诊病例的信息。我们总结了H7N9确诊病例的流行病学和临床特征,并与现场研究的病例进行了比较。
根据我们截至2014年2月10日更新的数据,共发现334例H7N9确诊病例。中位年龄为58岁,67.0%(219/327)为男性。中国有15个地区报告了病例。发现5个家庭群集。在有相关资料的16.8%(56/334)病例中,69.6%(39/56)报告有动物接触史。在与确诊病例密切接触的1751人中,0.6%(11/1751)的人在7天监测期间出现呼吸道症状。在有相关资料的97.9%(327/334)病例中,死亡21.7%(71/327),出院20.8%(68/327),状态不确定57.5%(188/327)。我们将2014年2月10日之前和2013年12月1日之前的研究结果与常规现场研究的结果进行了比较,后者在数据收集方面的截止日期为我们的后一个截止日期。我们的研究表明,除病死率外,大多数流行病学和临床特征与现场研究相似(71/327,2月10日之前的数据为21.7%;45/138,我们12月1日前的数据为32.6%; 47/139, 33.8% for the field study), time from illness onset to first medical care (4 days, 3 days, and 1 day), and time from illness onset to death (16.5 days, 17 days, and 21 days).
我们基于互联网的调查结果与疫情的大多数流行病学和临床方面的常规实地研究结果相似。重要的是,公开的互联网数据对任何感兴趣的研究人员都是开放的,因此可以极大地促进对此类疫情的调查和控制。随着互联网数据提供工作的改进,基于互联网的调查有很大的潜力成为一种快速、经济、新颖的方法,以调查涉及相对较少的公众关注的突发事件,如H7N9疫情。
现代世界正越来越多地通过互联网联系在一起,互联网由各种私人、公共、商业、学术和政府网络组成的大型系统组成,促进了全球数十亿人之间快速和开放的数据交换[
互联网还为健康研究提供了新的机会。Eysenbach开发了一种分析谷歌查询的方法,以跟踪特定人群中的流感型疾病病例[
2013年初,一种新型禽流感H7N9在中国出现,引起了公众的强烈关注。在首例病例报告后,H7N9迅速成为互联网上广泛讨论的话题。大量相关信息通过各种渠道在互联网上公开,包括新闻报道、论坛、个人博客以及医院和政府部门的报告。在本研究中,我们旨在描述截至2014年2月10日在中国互联网上可获得的H7N9疫情数据,并通过将我们的研究结果与开展良好的H7N9疫情常规现场流行病学研究结果进行比较,探讨采用基于互联网的方法调查公共卫生问题的方法、可行性、有效性、优势和局限性[
我们从可靠的网站上收集了与H7N9疫情相关的公开互联网数据。Li及其同事的现场流行病学研究[
在李的研究中,H7N9病毒感染的疑似病例和确诊病例是根据2006年世界卫生组织(WHO)推荐的H5N1病例定义来定义的。通过中国不明原因肺炎病例监测系统确定了疑似病例。如果实验室检测,如实时逆转录聚合酶链反应检测、病毒分离和血清学检测,表明存在H7N9病毒,则认为该病例已确诊。一旦发现疑似病例,就进行初步现场调查,并由当地疾控中心获取呼吸道标本。截至2013年12月1日,通过实地调查收集了每例确诊病例的信息。
在我们的研究中,H7N9确诊病例是指那些在政府或非政府网站上声称是新发现的H7N9病例,并通过实验室检测或国家或省级组织的专家进行验证。
通过大量互联网资源报告了各种与h7n9相关的数据。本研究的数据仅来自2个网站类别:政府网站和主要媒体网站。这些类别按其可信度的顺序详细如下:
中国提供h7n9相关信息的政府机构网站是数据的主要来源。提供我们所需信息的5个最具代表性的政府机构是:(1)市卫生局;(2)国家、省、地级疾控中心;(三)国家卫生和计划生育委员会;(四)农业部;(5)世界卫生组织。
社交媒体网站被用作补充数据来源。设立H7N9禽流感疫情专题专栏或论坛的网站优先级高于其他网站。事实上,我们的大部分补充数据来自国内最受欢迎的两个公共网站:新浪和搜狐。两家公司的网站上都有专门的H7N9版块[
政府数据被认为是最值得信赖的,在这项研究中贡献了大部分数据。当政府网站的一些数据丢失时,他们从社交媒体网站上寻找信息。
我们纳入了香港卫生局网站上报告的2例病例,但没有搜索台湾的网站,因此台湾的少数病例未纳入本研究。澳门无病例报告。
为了避免那些能够获得H7N9病例官方个人数据的人依赖或重复官方报告和其他流行病学研究的总结或汇总结果,我们只从公众免费访问的网站上搜索和提取了这些病例的个人数据。这些数据主要包含在政府相关部门网站上发布的每日报告中。网站是根据有用性、可访问性和可信度来选择的。有用性是由信息的全面性和最新性决定的。为了获得每个H7N9确诊病例的数据,我们搜索了2013年3月31日(第一例病例报告日期)至2014年2月10日在CDC和其他国家、省和地级市卫生局网站上发布的每日报告。对社交媒体网站(主要是新浪和搜狐)进行补充搜索,以补充从政府网站获得的数据。根据发病日期、姓氏、人口统计数据(性别、年龄和地区)和暴露史确定病例。重复病例定义为发病日期、姓氏、性别、年龄、地区相同的病例。当多个网站报告病例时,我们使用了从国家到省到地级的最高级别政府网站的数据。
两名研究人员(MYD和YYY)使用自行设计的数据提取表格独立提取每个确诊病例的数据。如果认为有必要,通过反复检查网站和讨论来解决差异。提取数据包括(1)年龄、性别、城乡户籍、职业等人口统计学数据;(2)流行病学资料,如H7N9病毒潜在接触史、密切接触者人数、继发性病例、家族聚集病例、确诊方法等;(3)临床数据,如住院、重症监护病房(ICU)入院、急性呼吸窘迫综合征(ARDS)的发展、死亡以及这些临床结果的日期(见
采用描述性统计和分析统计方法,对H7N9确诊病例的流行病学和临床特征进行总结。使用SPSS 18.0版(SPSS Inc, Chicago, IL, USA)进行所有统计分析。
2013年2月17日至2014年2月10日,共发现334例H7N9感染病例。病例发生在以下15个区域(
案例主要来源于官方渠道,89.5%(299/334)来自政府网站,4.5%(15/334)来自非政府网站,6.0%(20/334)来自政府和非政府网站。
在334例H7N9确诊病例中,有56例有近期接触动物的信息,其中39例为有动物接触史的患者。动物暴露病例详细如下:(1)3例患者报告1例禽类暴露;(2) 10例患者报告多例禽类接触;(3) 3例患者暴露于鸽子、鹌鹑和宠物鸟;(4)其余23例未报告患者接触的动物类型。
2013年初至2014年2月10日中国H7N9确诊病例流行病学特征
特征 | H7N9确诊病例一个 | |||
|
基于互联网的数据 |
李的报告 |
最新的基于互联网的数据 |
|
病例总数 | 138 | 139 | 334 | |
|
|
|
|
|
|
病例数 | 132 | 139 | 327 |
|
中位数(位差b) | 61 (48 - 73) | 61 (46 - 73) | 58 (41 - 69) |
|
<5年,n/ n (%) | 3/132 (2.3) | 4/139 (2.9) | 6/327 (1.8) |
|
≥65年,n/ n (%) | 55/132 (41.7) | 58/139 (41.7) | 111/327 (33.9) |
男性,n/ n (%) | 93/132 (70.5) | 98/139 (70.5) | 219/327 (67.0) | |
|
|
|
|
|
|
城市 | 83/110 (75.5) | 101/139 (72.6) | 186/278 (66.9) |
|
农村 | 27/110 (24.5) | 38/139 (27.3) | 92/278 (33.1) |
家禽工人,n/ n (%) | 6/99 (6.1) | 9/139 (6.6) | 7/201 (3.5) | |
有无基础疾病,n/ n (%) | 3/3 (100.0) | 79/108 (73.1) | 5/5 (100.0) | |
发病前2周内接触有症状病例,n/ n (%) | 5 /不c(东北) | 5/120 (4.2) | 7d/ NE (NE) | |
|
12/26 (46.0) | 107/131 (81.7) | 39/56 (69.6) | |
|
鸡 | 7/12 (58.3) | 88/107 (82.2) | 12/39 (30.8) |
|
鸭子 | 3/12 (25.0) | 24/107 (22.4) | 4/39 (10.3) |
|
鸽子 | 1/12 (8.3) | 13/107 (12.1) | 1/39 (2.7) |
|
典型的鹌鹑都长 | 1/12 (8.3) | 2/107 (1.9) | 1/39 (2.7) |
|
宠物鸟 | 1/12 (8.3) | 3/107 (2.8) | 1/39 (2.7) |
|
直接接触家禽 | 9/12 (75.0) | 63/107 (58.9) | 17/39 (43.6) |
核酸检测确认,n/ n (%) | 58/78 (74.4) | 89/139 (64.0) | 71/91 (78.0) |
一个除另有说明外,本表数据为具有某种特征的患者人数、具有该特征数据的患者总数及所占百分比。
bIQR:四分位间距
cNE:不可估量
d截至2014年2月10日,浙江有2例病例未得到确诊。
2013年初至2014年2月10日中国H7N9确诊患者地理分布
在334例H7N9确诊病例中,3个省份报告了5个家庭聚集性病例:(1)上海市1名父亲(确诊)及其2名儿子(1例确诊,1例未确诊);(2)已婚夫妇,均为上海市确诊病例;(三)父子二人,均为山东坚信礼教徒;(四)父亲、女婿各一人,均为浙江坚信礼;(5)浙江省同一家庭确诊病例3例。在最后一个家庭群集中,该男子先患病,他的女儿和妻子在照顾他后患病。所有3名家庭成员均报告有相同的家禽接触史。截至2014年2月10日,这些案件的调查仍在进行中。
我们进行了亚组分析,比较2013年3月31日首次报告病例前后H7N9确诊病例的病死率。2013年3月31日前报告的29例病例中,死亡44.8%(13/29),病死率显著高于对照组(χ21= 15.1,
2013年初至2014年2月10日中国确诊H7N9感染患者的临床特征和医疗时间表
变量 | H7N9确诊病例一个 | |||
|
基于互联网的数据 |
李的报告 |
最新的基于互联网的数据 |
|
|
|
|
|
|
|
住院治疗 | 118/132 (89.4) | 137/139 (98.7) | 209/223 (93.7) |
|
ICU住院 | 30/56 (53.6) | 65/103 (63.1) | 33/61 (54.1) |
|
ARDSb | 14/18 (77.8) | 48/83 (57.8) | 16/23 (69.7) |
|
死亡 | 45d/ 138 (32.6) | 47/139 (33.8) | 71/327 (21.7) |
|
|
|
|
|
|
病例数 | 53 | 137 | 71 |
|
中位数(位差c) | 3.0 (1.0 - -5.0) | 1.0 (0 - 3.0) | 4.0 (1.0 - -6.0) |
|
|
|
|
|
|
病例数 | 41 | 137 | 55 |
|
中位数(差) | 5.0 (3.0 - -6.5) | 4.0 (3.0 - -6.0) | 5.0 (3.0 - -6.0) |
|
|
|
|
|
|
病例数 | 4 | 103 | 6 |
|
中位数(差) | 7.5 (5.5 - -10.3) | 7.0 (5.0 - -9.0) | 6.5 (4.8 - -8.8) |
|
|
|
|
|
|
病例数 | 3. | 83 | 3. |
|
中位数(差) | 6.0 (NE)e | 7.0 (5.0 - -9.0) | 6.0 (NE)e |
|
|
|
|
|
|
病例数 | 25 | 47 | 34 |
|
中位数(差) | 17.0 (10.5 - -22.5) | 21.0 (12.5 - -36.0) | 16.5 (9.5 - -22.0) |
一个除另有说明外,表中数据均为具有某一特征的患者人数、具有该特征数据的患者总数及所占百分比。
bARDS:呼吸窘迫综合征
cIQR:四分位间距
d这一数字来自国家卫生和计划生育委员会网站上的汇总数据。如果我们使用个人数据,只发现了33例死亡,病死率为23.9%。
eNE:不可估量
截至2014年2月10日,81例H7N9确诊病例提供了与其密切接触者的数据,共涉及1751人。其中,江苏859例、上海310例、浙江113例、安徽72例、河南45例、福建42例、江西54例、山东9例、北京37例、广东210例。在7天监测期间,这些人中只有11人出现呼吸道症状。这些分析不包括家庭集群。
截至2014年2月10日,从互联网上收集的病例数量是李研究报告的两倍多。同样使用2013年12月1日的截止日期,我们得到了138例病例,这只比李研究的病例数(139例)少了1例。
基于截至2014年2月10日和2013年12月1日的数据,我们的发现在大多数流行病学特征上与李的报告一致,包括年龄、性别比例、居住地区和最常用的H7N9病例确诊方法,尽管我们在患者接触史和临床特征方面的信息不太详细。尽管存在数据缺失的问题,但我们的结果在大多数临床特征上与Li的研究报告相似,如从发病到住院、ICU入院的中位时间和ARDS的发展。
根据截至2014年2月10日的最新数据,我们得到的病死率(71/327,21.7%)低于Li的研究报告的病死率(47/139,33.8%)。如果使用2013年12月1日相同截止日期的互联网个人数据,我们研究中的病死率为23.9%(33/138),仍低于Li研究报告的33.8%(47/139)。然而,国家卫生和计划生育委员会网站报道,截至2013年10月31日,共有45人死亡。根据这些公开的汇总数据,病死率与李的研究非常相似。我们从发病到第一次医疗的时间以及从发病到死亡的时间的结果与李所报道的两个截止日期的结果不同。我们无法收集已确定的家庭群集的详细资料(
基于截至2013年12月1日的互联网数据,疫情曲线如图所示
这种流行病在2014年再次出现。由于2014年报告的病例发病日期较少,我们无法显示2014年H7N9疫情的流行曲线。
2013年初至2014年2月10日中国确诊H7N9感染患者发病日期。
根据网络数据,2013年和2014年的平台期分别为2013年3月31日至4月28日和2014年1月10日至2月10日,分别报告118例和176例。在两个高原期,2014年的病例比2013年更年轻,更可能生活在农村地区。2014年的病死率低于2013年,两年性别比相似(
中国不同平台期H7N9确诊患者特征比较
特征 | H7N9确诊病例一个 |
|
||
|
第一个高原 |
第二个高原 |
|
|
病例总数 | 118 | 176 | 不b | |
|
|
|
|
|
|
病例数 | 118 | 175 | 不b |
|
中位年龄(IQRc) | 61.5 (48 - 74) | 57.0 (41 - 67) | . 01 |
|
%≥65岁 | 51 (43.2) | 49 (28.0) | . 01 |
|
% < 64年 | 67 (56.8) | 126 (72.0) | . 01 |
|
|
|
|
|
|
男性 | 83/118 (70.3) | 115/175 (65.7) | .41点 |
|
女 | 35/118 (29.7) | 60/175 (34.3) |
|
|
|
|
|
|
|
城市 | 82/104 (78.8) | 72/130 (55.4) | <措施 |
|
农村 | 22/104 (21.2) | 58/130 (44.6) |
|
家禽工人,n/ n (%) | 5/88 (5.7) | 2/95 (2.1) | 低位 | |
|
|
|
|
|
|
住院治疗 | 107/118 (90.7) | 93/93 (100.0) | 不b |
|
ICU住院 | 30/56 (53.6) | 2/4 (50.0) | 不b |
|
ARDSd | 12/14 (85.7) | 1/5 (20.0) | 不b |
|
死亡 | 27/118 (22.9) | 23/176 (13.1) | 03 |
一个除非另有说明,表中所提供的数据为具有某种特征的患者人数、具有该特征数据的患者总数以及相应的百分比。
bNE:不可估量
cIQR:四分位间距
dARDS:呼吸窘迫综合征
这项研究的结果表明,可以利用互联网上公开的信息来调查H7N9等疾病暴发的流行病学和临床特征。我们更新了2014年2月10日的疫情,共发现334例确诊病例,分布在中国15个地区。这可能是迄今为止关于这次疫情的最新报告。患者年龄在2.5岁至91岁之间,但大多数是老年人(中位年龄58岁)。男性占67.0%,66.9%居住在城市地区,93.7%的报告病例住院。总病死率为21.7%。我们没有发现人际传播感染的证据。
与常规流行病学研究相比[
我们的研究和李的报告结果的相似性[
可以理解的是,基于互联网的数据在某些特定的细节上可能不完整,这些细节是我们病例中的暴露史和临床特征。然而,数据的不完整性可能并不一定会对理解和控制疫情产生重大影响,因为它们可能仍然能够像许多其他基于样本的研究一样,对部分或所有这些因素给出难以准确的描述。例如,我们的研究在患者与动物接触史上显示了相同的结果。另一方面,在李的研究之后,到2014年2月10日,报告了196例新病例,我们的研究纳入的患者是李报告的两倍。基于这些数据,我们更新了报告,显示了2014年初感染的一次新发作。
截至2014年2月10日,互联网数据显示,h7n9病死率(21.7%)在中国(70%)和全球(59%)均显著低于h5n1病死率(21.7%)[
此外,亚组分析表明,首例H7N9病例报告前(即2013年3月31日)的病死率明显高于报告后的病死率。部分原因可能是在报告第一例病例之前,轻症或无症状患者的报告不完整。由于在疫情爆发之初缺乏认识和监测和检测过程的局限性,极有可能在疫情爆发初期低估了实际感染h7n9病例的数量[
本研究结果表明,互联网可用于调查H7N9等传染病暴发的流行病学和临床特征。与许多基于web的生物安全情报系统(如HealthMap、MedISys和BioCaster)不同,我们的调查旨在对疾病爆发提供全面和更详细的调查。大多数这些情报系统的建立仅仅是为了提醒健康威胁,在一段时间内只提供简要的病例数,而没有了解和控制传染病暴发所必需的重要详细信息。
与传统的疾病暴发流行病学调查相比,基于互联网的调查有一些重要的优势。首先,基于互联网的数据可以迅速分析和报告,初步结果有助于促进有效的应急规划,特别是在流行病的早期阶段。其次,数据的覆盖范围没有边界,可以是国内的或国际的,因此可以提供任何地方和区域数据无法提供的问题的总体情况。第三,由于公开的互联网数据对全世界任何有能力进行分析的潜在感兴趣的人都是开放的。这将大大有助于及时分析和更新疾病暴发情况,以便采取迅速和适当的行动加以控制。第四,早期的初步互联网数据及其分析可能极大地有助于提醒和迫使政府和当局促进及时向公众公布所有数据,最好是通过互联网,这可以防止出于其他原因而隐瞒数据的意图,例如出于政治平行性的动机或发表高影响因子期刊论文的好处,从而有助于及时采取行动抗击疫情。第五,互联网数据可以很容易地被其他从不同来源获得全部或部分原始数据的人补充、核对和更正。最后,如果流行病持续存在,特别是当它只涉及少数零星病例时,可以通过互联网收集新确诊病例的数据进行分析和更新。
网络调查的主要问题是数据不完整。例如,截至2013年12月1日,我们仅获得了33例死亡病例的个人数据,这导致病死率低于实地研究报告的病死率[
如果疫情持续很长一段时间或在事件逐渐消失并逐渐淡出公众关注的后期,数据不完整可能会变得特别严重。例如,在我们的案例中,即使是2013年12月1日至2014年2月10日(第二次疫情爆发的早期阶段)死亡人数的汇总数据,在互联网上也无法追踪。我们仅根据已确定的个别病例的有限数据估计了病死率。这一估计值低于李的研究报告[
不完整的数据更有可能出现在个别案件的细节上,而不是案件本身。我们发现个别病例往往缺乏临床特征。此外,我们的流行曲线在形状、时间段、高峰日期和总病例数上与李的研究报告的2013年12月1日之前相似。然而,在2013年12月1日至2014年2月10日期间,第二次暴发确认了196例病例,但只有30例患者的发病日期可用,这使我们无法可靠地描述第二次暴发的流行曲线。这表明,基于互联网的方法可能暂时更适合调查公众关注的突发和短期事件的早期阶段。
本研究利用互联网上可公开获取的数据,展示了中国H7N9感染的新爆发。该研究的结果在大多数流行病学和临床特征上与权威的常规流行病学研究的结果一致[
网上确认感染H7N9病例的个人资料。
急性呼吸窘迫综合征
疾病控制和预防中心
重症监护室
世界卫生组织
严重急性呼吸系统综合症
本研究由深圳市科创委设立深圳市健康风险分析重点实验室项目(批准号:SZRI-C.02.12.007)资助。
没有宣布。