JMIRgydF4y2Ba J医疗互联网服务gydF4y2Ba 医学互联网研究杂志gydF4y2Ba 1438 - 8871gydF4y2Ba 卡塔尔世界杯8强波胆分析 加拿大多伦多gydF4y2Ba v19i12e416gydF4y2Ba 29269339gydF4y2Ba 10.2196 / jmir.8184gydF4y2Ba 原始论文gydF4y2Ba 原始论文gydF4y2Ba 利用社交媒体内容评估英格兰一项新的儿童流感疫苗接种计划对人群的影响gydF4y2Ba 科利尔gydF4y2Ba 奈杰尔gydF4y2Ba 康威gydF4y2Ba 迈克gydF4y2Ba LimsopathamgydF4y2Ba 螺母gydF4y2Ba lampogydF4y2Ba VasileiosgydF4y2Ba CulottagydF4y2Ba 阿伦gydF4y2Ba 萨哈gydF4y2Ba KoustuvgydF4y2Ba LeigydF4y2Ba 简帛gydF4y2Ba BaschgydF4y2Ba 科里gydF4y2Ba 华克gydF4y2Ba 佩特拉gydF4y2Ba 瓦格纳gydF4y2Ba 莫里茨gydF4y2Ba MMathgydF4y2Ba 1gydF4y2Ba
英国公共卫生部gydF4y2Ba 科林代尔大街61号gydF4y2Ba 伦敦,NW9 5EQgydF4y2Ba 联合王国gydF4y2Ba 44 7539078912gydF4y2Ba moritz.wagner.16@ucl.ac.ukgydF4y2Ba
2gydF4y2Ba 3.gydF4y2Ba http://orcid.org/0000-0003-0204-3736gydF4y2Ba
lampogydF4y2Ba VasileiosgydF4y2Ba 硕士,博士gydF4y2Ba 4gydF4y2Ba http://orcid.org/0000-0001-8555-2063gydF4y2Ba Yom-TovgydF4y2Ba 兰德gydF4y2Ba 理学士、理学硕士、博士gydF4y2Ba 5gydF4y2Ba http://orcid.org/0000-0002-2380-4584gydF4y2Ba PebodygydF4y2Ba 理查德。gydF4y2Ba MBChB博士gydF4y2Ba 1gydF4y2Ba http://orcid.org/0000-0002-9069-2885gydF4y2Ba 考克斯gydF4y2Ba 英格马JgydF4y2Ba 二元同步通信博士gydF4y2Ba 4gydF4y2Ba 6gydF4y2Ba http://orcid.org/0000-0002-6662-417XgydF4y2Ba
1gydF4y2Ba 英国公共卫生部gydF4y2Ba 伦敦gydF4y2Ba 联合王国gydF4y2Ba 2gydF4y2Ba 伦敦大学学院gydF4y2Ba 伦敦gydF4y2Ba 联合王国gydF4y2Ba 3.gydF4y2Ba 伦敦卫生和热带医学学院gydF4y2Ba 伦敦gydF4y2Ba 联合王国gydF4y2Ba 4gydF4y2Ba 计算机科学系gydF4y2Ba 伦敦大学学院gydF4y2Ba 伦敦gydF4y2Ba 联合王国gydF4y2Ba 5gydF4y2Ba 微软研究院gydF4y2Ba 荷兹利亚gydF4y2Ba 以色列gydF4y2Ba 6gydF4y2Ba 计算机科学系gydF4y2Ba 哥本哈根大学gydF4y2Ba 哥本哈根gydF4y2Ba 丹麦gydF4y2Ba 通讯作者:莫里茨瓦格纳gydF4y2Ba moritz.wagner.16@ucl.ac.ukgydF4y2Ba 12gydF4y2Ba 2017gydF4y2Ba 21gydF4y2Ba 12gydF4y2Ba 2017gydF4y2Ba 19gydF4y2Ba 12gydF4y2Ba e416gydF4y2Ba 15gydF4y2Ba 6gydF4y2Ba 2017gydF4y2Ba 1gydF4y2Ba 9gydF4y2Ba 2017gydF4y2Ba 15gydF4y2Ba 9gydF4y2Ba 2017gydF4y2Ba 2gydF4y2Ba 10gydF4y2Ba 2017gydF4y2Ba ©Moritz Wagner, Vasileios Lampos, Elad Yom-Tov, Richard Pebody, Ingemar J Cox。最初发表于《医疗互联网研究杂志》(//www.mybigtv.com), 2017年12月21日。gydF4y2Ba 2017gydF4y2Ba

这是一篇开放获取的文章,根据创作共用署名许可(https://creativecommons.org/licenses/by/4.0/)的条款发布,允许在任何媒介上无限制地使用、分发和复制,前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。gydF4y2Ba

背景gydF4y2Ba

2013年,英格兰启动了一项新的儿童减毒活疫苗规划,其中包括一项针对所有2岁和3岁儿童的全国性运动,以及在流感季节向小学学龄儿童(4-11岁)提供疫苗的几个试点地点。2014/2015年流感季节,国家规划扩大到包括更多的试点地区,其中一些地区还向中学儿童(11-13岁)提供疫苗。gydF4y2Ba

客观的gydF4y2Ba

我们利用社交媒体内容,对2013/2014年和2014/2015年流感季节在英国启动的项目对人口的影响进行了补充评估。对试点地区接种疫苗的不同年龄组的整体社区范围内的传播影响进行了估计。gydF4y2Ba

方法gydF4y2Ba

应用了以前开发的统计框架,其中包括一个非线性回归模型,该模型经过训练,可以从来自试点(学龄接种疫苗)和对照(未接种疫苗)地区的Twitter帖子推断流感样疾病(ILI)率。然后,在没有进行干预的情况下,对照地区用于估计试点地区的ILI率。这些预测与相应的基于twitter的ILI估计进行了比较。gydF4y2Ba

结果gydF4y2Ba

结果表明,在2013/2014年和2014/2015年流感季节,仅在小学适龄疫苗试点地区,所有年龄段的ILI率分别降低了14%(1-25%)和17%(2-30%)。在两个年龄组的中学儿童接种疫苗的地区未观察到显著影响。gydF4y2Ba

结论gydF4y2Ba

这些发现证实了来自传统监测数据的独立评估,从而支持了该项目对小学适龄儿童的持续推广,并为社交媒体内容作为另一种综合征监测工具的价值提供了证据。gydF4y2Ba

健康干预gydF4y2Ba 流感gydF4y2Ba 疫苗接种gydF4y2Ba 社交媒体gydF4y2Ba 推特gydF4y2Ba
简介gydF4y2Ba 背景gydF4y2Ba

2012年,疫苗接种和免疫联合委员会建议将英国每年的流感疫苗接种活动扩大到包括所有2至16岁的健康儿童[gydF4y2Ba 1gydF4y2Ba].这一决定是根据使用证据综合方法建立的流感传播模型得出的,该模型表明,接种疫苗不仅可以保护儿童本身不受感染,而且还可以减少流感在一般人群中的传播。这一发现包括对高危人群的间接保护,如65岁以上人群或有潜在临床危险因素的人群[gydF4y2Ba 2gydF4y2Ba].2013/2014年流感季节期间开始分阶段推出减毒流感活疫苗(LAIV)规划。在第一季中,该项目为全英格兰所有2到3岁的儿童接种疫苗。一些地理位置不同的试点区域还为小学学龄儿童(4-11岁)提供疫苗接种,以确定为学龄儿童提供疫苗的最佳模式。在2014/2015年流感季节,该计划在全国范围内扩大,为所有2至4岁儿童提供疫苗接种。增加试点地点,为小学适龄儿童(1)接种疫苗(gydF4y2Ba 小学gydF4y2Ba;4-11岁),(2)中学前两年(gydF4y2Ba 中学gydF4y2Ba, 11-13岁),或(3)两者(gydF4y2Ba 小学及中学gydF4y2Ba;4-13年),以确定最佳的交付模式。gydF4y2Ba

动机gydF4y2Ba

英国公共卫生部(PHE)一直在使用各种监测系统来评估学龄期儿童流感运动对流感流行病学的总体人口影响,以验证为这一年龄组接种疫苗的直接和间接影响。2014/2015年的试点地点特别值得关注,因为目标群体的变化可能为全国推广的最佳战略提供进一步的见解。在2014/2015年运动期间,通过传统监测系统对目标年龄组和非目标年龄组进行的大多数流感指标显示,在为小学适龄儿童提供疫苗的试点地区,流感指数显著下降。然而,在试验地区,只有两个年龄组别的中学适龄儿童接种了疫苗,影响甚微[gydF4y2Ba 3.gydF4y2Ba].这些监测指标基于卫生系统,从全科医生的会诊率到超额死亡率。gydF4y2Ba

虽然这些结果对于估计干预措施对卫生保健服务的影响很重要,但在线用户生成的信息提供了补充数据源,可以进一步深入了解此类活动对更广泛社区的影响,包括那些不咨询卫生保健系统的人。我们的研究还强调了在缺乏常规评估系统的情况下,用户生成信息的潜在价值。基于互联网的监控系统被视为在物流和经济上都可行的新发展,具有作为传统监控系统延伸的巨大潜力[gydF4y2Ba 4gydF4y2Ba].最近的研究表明,结合gydF4y2Ba 机器学习gydF4y2Ba技术、社交媒体或搜索引擎的数据可用于准确估计疾病相关指标,如流感样疾病(ILI)率[gydF4y2Ba 5gydF4y2Ba-gydF4y2Ba 9gydF4y2Ba].这些技术为健康监测系统提供了额外的、公开的、可能更及时的综合征监测数据来源。此外,与传统的监测系统相比,用户生成的内容可以提供关于更广泛人群的见解,包括疾病人群金字塔的底层(即那些不寻求医疗照顾的人)[gydF4y2Ba 10gydF4y2Ba].gydF4y2Ba

对于2013/2014年的试验地区,为了进一步证明为儿童接种流感疫苗在社区范围内的效果,Lampos等人利用在线用户生成的内容结合统计自然语言处理技术来估计人群中的ILI率[gydF4y2Ba 9gydF4y2Ba].通过将未接种疫苗的控制区与试验区进行匹配,并使用来自这些地点的流感相关推特帖子或必应搜索查询,该运动在美国的影响gydF4y2Ba 小学gydF4y2Ba年龄试点地区的估计显示,与相应的对照地区相比,这些试点地区的普通人群流感传播显著下降(减少22%至33%)[gydF4y2Ba 9gydF4y2Ba].公共卫生部门的估计还显示,有证据表明,与非试点地区相比,试点地区的目标和非目标年龄组的流感传播有所减少,这是基于一个以甲型(H1N1)流感流行为主的季节中的各种流感指标。gydF4y2Ba 11gydF4y2Ba].gydF4y2Ba

目的gydF4y2Ba

本文的工作采用了与Lampos等人相同的统计框架[gydF4y2Ba 9gydF4y2Ba](略有改进的监督学习方法)对2014/2015年流感季节的Twitter数据进行了分析。我们的目标是评估学龄儿童流感疫苗试点试验对这些试点地区流感传播的影响。2014/2015流感季主要是甲型流感(h3N2)和乙型流感的流行。此外,我们研究了接种不同目标人群(特别是小学和/或中学适龄儿童)对普通人群流感发病率的影响。这项分析为减少全社区流感传播的最有效策略提供了进一步的见解。这项工作还旨在重新评估一种假设,即基于在线用户生成内容的统计框架可以形成更细粒度流感监测任务的有效来源,例如估计有针对性干预的影响。我们重复了先前Lampos等人研究的2013/2014年LAIV活动的分析[gydF4y2Ba 9gydF4y2Ba],但修订了试点和控制区域,以与我们2014/2015赛季的研究保持一致。gydF4y2Ba

方法gydF4y2Ba 数据源gydF4y2Ba

实验使用了两个数据来源:与ILI相关的推特地理定位帖子和皇家全科医师学院(RCGP)提供的官方ILI率[gydF4y2Ba 12gydF4y2Ba],后者定义gydF4y2Ba 地面实况gydF4y2Ba.此外,英国国家统计局(ONS)的边界数据和人口估计[gydF4y2Ba 13gydF4y2Ba,gydF4y2Ba 14gydF4y2Ba用于绘制疫苗试验区和控制区的地图。gydF4y2Ba

Twitter数据gydF4y2Ba

推特数据包括2011年8月29日至2015年8月30日英国所有精确定位的推特帖子,约占英国用户所有推文的1%。这个数字是根据英国约20%的人口使用Twitter得出的粗略估计,其中33%的活跃用户每天发布5条推文[gydF4y2Ba 15gydF4y2Ba].我们的数据集平均每天包含35万条地理定位的推文。如在Lampos et al [gydF4y2Ba 9gydF4y2Ba],相同的36个初始列表gydF4y2Ba ngydF4y2Ba-grams(短语与gydF4y2Ba ngydF4y2Ba与ILI相关的单词)是手动创建的。然后,根据Twitter时间序列数据中与该列表频繁共存的情况,得到一组217gydF4y2Ba ngydF4y2Ba-grams被提取(gydF4y2Ba ngydF4y2Ba< 5;看到gydF4y2Ba 多媒体附件1gydF4y2Ba).gydF4y2Ba

用于模型学习的RCGP ILI率仅以周为单位,因此这组的频率率为gydF4y2Ba ngydF4y2Ba计算任何给定日期前7天的-gram,并形成解释变量。为了估计对试点地区的影响,gydF4y2Ba ngydF4y2Ba在干预期间,使用了在选定的试点和控制地区定位的推文的-gram频率。gydF4y2Ba

官方健康报告gydF4y2Ba

RCGP提供每周ILI估计,RCGP是英国约100个诊所组成的哨点网络,覆盖约100万注册人口[gydF4y2Ba 12gydF4y2Ba].这些ILI估计数代表当周在合资格执业机构登记的每10万名患者的ILI病例/会诊每周发病率[gydF4y2Ba 12gydF4y2Ba].英国的数据涵盖了2011年8月29日至2015年8月30日。gydF4y2Ba

先导区及管制区gydF4y2Ba

作为试点项目的一部分,共有140个地方政府实施了疫苗接种。为了建立一个适用于影响评估的试点地区名单,这些地区在可能的情况下在县一级进行了合并。这个列表包括了大量的gydF4y2Ba 中学gydF4y2Ba试验区(37个),因此只考虑人口最多的地区,同时确保全国各地的均匀地理分布。这些地区的地理分布和人口规模分别是根据英国国家统计局的边界数据和英格兰的人口估计数来定义的。[gydF4y2Ba 13gydF4y2Ba,gydF4y2Ba 14gydF4y2Ba].七个人中的一个gydF4y2Ba 小学及中学gydF4y2Ba3个试点地区因面积小或被封闭在另一个试点地区而被取消。涉及特殊学校的试点地区被忽视,因为这些地区只包括少数学校,因此不太可能为整个社区带来任何重大利益。此预处理得到6gydF4y2Ba 小学gydF4y2Ba, 4gydF4y2Ba 小学及中学gydF4y2Ba,和7gydF4y2Ba 中学gydF4y2Ba试点地区。gydF4y2Ba

根据以下标准选择了一份合格的控制地点清单:与试点地区的适当距离、适度的人口规模和合理的地理分布。这些标准产生了一个包含16个控制区的列表。由其东北角和西南角表示的不重叠边界矩形在选定的试点和控制区域周围创建。试点和管制地区的地理分布情况见gydF4y2Ba 图1gydF4y2Ba.gydF4y2Ba 表1gydF4y2Ba列出本研究考虑的试点地区。有关控制和试验区域的完整列表,请参见gydF4y2Ba 多媒体附件2gydF4y2Ba.gydF4y2Ba

为研究所选的先导区及对照区的地理分布及相应的边界方框。红框控制区与任何试验区的距离至少为10公里。被排除在研究之外的“次要”和“主要及次要”试验区没有边界框,分别以较浅的蓝色和绿色显示。包含国家统计数据和操作系统数据,皇冠版权和数据库权利。gydF4y2Ba

本研究在2014/2015年LAIV计划期间考虑的试点地区及其人口规模[gydF4y2Ba 14gydF4y2Ba]和地理边界矩形角坐标。斜体突出显示了2013/2014年LAIV项目中使用过或部分重叠的试验区。gydF4y2Ba

位置gydF4y2Ba 飞行员gydF4y2Ba 人口gydF4y2Ba 东北角gydF4y2Ba一个gydF4y2Ba 西南角gydF4y2BabgydF4y2Ba
的年轻人gydF4y2Ba 小学gydF4y2Ba 163270年gydF4y2Ba 51.568, 0.551gydF4y2Ba 51.448, 0.334gydF4y2Ba
盖茨黑德gydF4y2Ba 小学gydF4y2Ba 200505年gydF4y2Ba 54.984, -1.510gydF4y2Ba 54.878, -1.853gydF4y2Ba
南泰恩赛德gydF4y2Ba 小学gydF4y2Ba 148740年gydF4y2Ba 55.011, -1.352gydF4y2Ba 54.928, -1.536gydF4y2Ba
桑德兰gydF4y2Ba 小学gydF4y2Ba 276889年gydF4y2Ba 54.944, -1.346gydF4y2Ba 54.799, -1.569gydF4y2Ba
坎布里亚郡gydF4y2Ba 小学gydF4y2Ba 497874年gydF4y2Ba 55.189, -2.159gydF4y2Ba 54.040, -3.641gydF4y2Ba
埃塞克斯gydF4y2Ba 小学gydF4y2Ba 1431953年gydF4y2Ba 52.093, 1.297gydF4y2Ba 51.632, -0.020gydF4y2Ba
兰开夏郡gydF4y2Ba 中学gydF4y2Ba 1184735年gydF4y2Ba 54.240, -2.045gydF4y2Ba 53.667, -3.085gydF4y2Ba
伯明翰gydF4y2Ba 中学gydF4y2Ba 1101360年gydF4y2Ba 52.609, -1.729gydF4y2Ba 52.381, -2.034gydF4y2Ba
诺福克gydF4y2Ba 中学gydF4y2Ba 877710年gydF4y2Ba 52.993, 1.745gydF4y2Ba 52.355, 0.154gydF4y2Ba
利兹gydF4y2Ba 中学gydF4y2Ba 766399年gydF4y2Ba 53.946, -1.290gydF4y2Ba 53.699, -1.800gydF4y2Ba
萨福克郡gydF4y2Ba 中学gydF4y2Ba 738512年gydF4y2Ba 52.550, 1.769gydF4y2Ba 51.932, 0.340gydF4y2Ba
林肯郡gydF4y2Ba 中学gydF4y2Ba 731516年gydF4y2Ba 53.616, 0.358gydF4y2Ba 52.640, -0.821gydF4y2Ba
萨罗普羊gydF4y2Ba 中学gydF4y2Ba 310121年gydF4y2Ba 52.998, -2.233gydF4y2Ba 52.306, -3.236gydF4y2Ba
埋葬gydF4y2Ba 小学及中学gydF4y2Ba 187474年gydF4y2Ba 53.667, -2.234gydF4y2Ba 53.512, -2.383gydF4y2Ba
索尔福德gydF4y2Ba 小学及中学gydF4y2Ba 242040年gydF4y2Ba 53.542, -2.245gydF4y2Ba 53.416, -2.490gydF4y2Ba
说废话gydF4y2Ba 小学及中学gydF4y2BacgydF4y2Ba 245974年gydF4y2Ba 51.632, 0.334gydF4y2Ba 51.484, 0.138gydF4y2Ba
莱斯特郡gydF4y2Ba 小学及中学gydF4y2Ba 667905年gydF4y2Ba 52.948, -0.664gydF4y2Ba 52.392, -1.598gydF4y2Ba

一个gydF4y2Ba边界框东北边的经度和纬度gydF4y2Ba

bgydF4y2Ba边界框西南边的经度和纬度gydF4y2Ba

cgydF4y2Ba哈弗林的中学课程只包括7年级的学生(11-12岁)。gydF4y2Ba

统计框架gydF4y2Ba

以下部分简要介绍了所实现的统计框架。除了稍微改进的监督学习方法外,该框架基于Lampos等人的工作[gydF4y2Ba 9gydF4y2Ba],其中对其进行了更详细的描述和验证。该方法包括首先学习一个非线性回归模型来估计ILI率gydF4y2Ba ngydF4y2Ba-grams基于用户生成的内容(在本例中是tweets)。随后,通过在匹配的试点和对照地区推断ILI率,应用线性建模方法评估干预在试点地区的潜在影响。gydF4y2Ba

用高斯过程估计发病率gydF4y2Ba

用于从用户生成的数据中获得传染病估计的大多数技术都涉及使用线性回归模型[gydF4y2Ba 16gydF4y2Ba-gydF4y2Ba 18gydF4y2Ba].Lampos等人表明,非线性方法可以提高模型性能,特别是当使用由变化组成的较小特征空间时gydF4y2Ba ngydF4y2Ba-克大小[gydF4y2Ba 8gydF4y2Ba].作者建议使用高斯过程(GPs)来模拟ILI率,并成功地将其应用于Twitter、谷歌和必应数据[gydF4y2Ba 8gydF4y2Ba,gydF4y2Ba 9gydF4y2Ba].下面是本研究中使用的GP模型的详细信息。gydF4y2Ba

让gydF4y2Ba XgydF4y2Ba∈ℝgydF4y2BaN×gydF4y2Ba米gydF4y2Ba为的观测矩阵gydF4y2Ba NgydF4y2Ba周,gydF4y2Ba 米gydF4y2Ba频率gydF4y2Ba ngydF4y2Ba她们的特性。然后给定输入gydF4y2Ba x, x 'gydF4y2Ba∈ℝgydF4y2Ba米gydF4y2Ba(代表gydF4y2Ba XgydF4y2Ba), GP可以定义为一个统计分布,其中任何有限的样本线性组合都是正态分布,其形式为:gydF4y2Ba

μ(gydF4y2Ba xgydF4y2Ba)和k(gydF4y2Ba x, x 'gydF4y2Ba)分别表示均值和协方差函数(或核),[gydF4y2Ba 19gydF4y2Ba].假设μ(gydF4y2Ba xgydF4y2Ba) = 0∀gydF4y2Ba 我gydF4y2Ba= 1,…,gydF4y2Ba NgydF4y2Ba时,分布完全由协方差函数决定。作为我们的核心内核,两个不同参数化的Matérn函数的和(kgydF4y2Ba米gydF4y2Ba) [gydF4y2Ba 20.gydF4y2Ba],具有自由度gydF4y2Ba vgydF4y2Ba=3/2最适合从Twitter数据中估计ILI率:gydF4y2Ba

在哪里gydF4y2Ba σgydF4y2Ba米gydF4y2Ba表示方差和的总体水平gydF4y2Ba lgydF4y2Ba米gydF4y2Ba一个特征长度尺度。假设不一样gydF4y2Ba ngydF4y2Ba-gram的大小可能在用法上有所不同,并且可能具有更简洁的语义解释gydF4y2Ba ngydF4y2Ba,我们用不同的内核来建模。协方差函数的和本身形成一个有效的协方差函数的事实允许这一点,我们有:gydF4y2Ba

在哪里gydF4y2Ba ggydF4y2Ba ngydF4y2Ba表示属于每一个的特性gydF4y2Ba ngydF4y2Ba-gram类别和gydF4y2Ba CgydF4y2Ba=3是的个数gydF4y2Ba ngydF4y2Ba-gram类别(在这个特定的模型中合并了3-grams和4-grams)。为了模拟噪声,我们使用指数平方和:gydF4y2Ba

和一个噪声函数:gydF4y2Ba

(δ为Kronecker函数),定义为[gydF4y2Ba 19gydF4y2Ba].gydF4y2Ba

GP回归涉及最小化负对数边际似然函数:gydF4y2Ba

在哪里gydF4y2Ba ygydF4y2Ba为ILI率时间序列,(gydF4y2Ba KgydF4y2Ba)gydF4y2Ba ijgydF4y2Ba = k (gydF4y2Ba xgydF4y2Ba我gydF4y2Ba,gydF4y2Ba xgydF4y2BajgydF4y2Ba),gydF4y2Ba μgydF4y2Ba=(μ(gydF4y2Ba xgydF4y2Ba1gydF4y2Ba),…,μ(gydF4y2Ba xgydF4y2Ba NgydF4y2Ba ))。一旦模型被学习,新观察到的特征频率gydF4y2Ba xgydF4y2Ba*gydF4y2Ba 导致新的ILI比率估计gydF4y2Ba ygydF4y2Ba*gydF4y2Ba 通过计算E[gydF4y2Ba ygydF4y2Ba*gydF4y2Ba |gydF4y2Ba ygydF4y2BaΩ,gydF4y2Ba xgydF4y2Ba*gydF4y2Ba ],为后验预测分布的均值。模型的性能使用训练集上的10倍交叉验证(随机时间分割)来测量,使用平均皮尔逊相关(gydF4y2Ba rgydF4y2Ba)和平均绝对误差(MAE)。gydF4y2Ba

评估LAIV计划的影响gydF4y2Ba

一旦GP模型得到训练,就可以使用Lampos等人,第3.3节中概述的方法来估计试点地区LAIV运动的影响[gydF4y2Ba 9gydF4y2Ba],我们在这里也简单描述一下。gydF4y2Ba

给定一组试验和控制区域,gydF4y2Ba ngydF4y2Ba在干预前后的一段时间内,在这些地区定位的Twitter帖子的频率被提取出来。然后,可以使用预训练的GP模型计算所有区域和区域的超集的ILI率估计值,我们用gydF4y2Ba 问gydF4y2BavgydF4y2Ba而且gydF4y2Ba 问gydF4y2BacgydF4y2Ba分别用于试验区和控制区。通过观察几周内的这些ILI估计,τ={gydF4y2Ba tgydF4y2Ba1gydF4y2Ba、……gydF4y2Ba tgydF4y2BaNgydF4y2Ba },在干预之前,流感活动相似的控制和试点地点可以基于强Pearson相关性进行匹配,gydF4y2Ba.假设流感活动相似的地点之间的ILI发病率存在线性关系,可以使用一个线性回归模型进行学习gydF4y2Ba而且gydF4y2Ba(即,在各种匹配区域对进行干预之前的ILI估计):gydF4y2Ba

在哪里gydF4y2Ba ω,β,εgydF4y2Ba我gydF4y2Ba 分别表示回归的权值和截距,以及独立的以零为中心的噪声。使用gydF4y2Ba 问gydF4y2BacgydF4y2Ba,干预期间控制地区的ILI估计值,如果没有进行干预,该线性模型可以预测干预期间试点地区的假设ILI率:gydF4y2Ba

在哪里gydF4y2Ba bgydF4y2Ba∈ℝgydF4y2BaNgydF4y2Ba(gydF4y2Ba bgydF4y2Ba)gydF4y2BakgydF4y2Ba=gydF4y2Ba β∀kgydF4y2Ba= 1,…,gydF4y2Ba NgydF4y2Ba.gydF4y2Ba

将这些假设的ILI率与干预期间GP模型估计的ILI率进行比较,可以估计运动的影响。采取了以下措施:gydF4y2Ba

在哪里gydF4y2Ba的平均值gydF4y2Ba 问gydF4y2Ba.因此,gydF4y2Ba δgydF4y2BavgydF4y2Ba 而且gydF4y2Ba θgydF4y2BavgydF4y2Ba 分别测量干预的绝对和相对平均影响。这些测量的置信区间是使用自举抽样产生的[gydF4y2Ba 21gydF4y2Ba].这种计算涉及到残差替换抽样gydF4y2Ba εgydF4y2Ba我gydF4y2Ba 的线性回归,将它们加到拟合值中,然后运行这些线性模型,从而产生估计gydF4y2Ba βgydF4y2Ba而且gydF4y2Ba ωgydF4y2Ba.然后将这些值应用于采样的(带有替换的)属性集gydF4y2Ba 问gydF4y2BavgydF4y2Ba而且gydF4y2Ba 问gydF4y2BacgydF4y2Ba.重复此过程100,000次将创建一组估计gydF4y2Ba δgydF4y2BavgydF4y2Ba 而且gydF4y2Ba θgydF4y2BavgydF4y2Ba 从中我们可以使用0.025和0.975分位数得出置信区间,前提是它们的分布是单峰对称的。如果绝对值高于自举估计的两个标准差,则结果被认为具有统计学意义[gydF4y2Ba 9gydF4y2Ba,gydF4y2Ba 22gydF4y2Ba].gydF4y2Ba

结果gydF4y2Ba

我们根据先前描述的方法,对2013/2014年和2014/2015年流感季节期间儿童LAIV运动的影响进行了评估。GP模型在英格兰和英国的RCGP ILI率上进行了训练gydF4y2Ba 图2gydF4y2Ba显示所使用的RCGP ILI率,其中突出显示干预前相关期和两个影响评估期。gydF4y2Ba

英国皇家全科医师学院(RCGP)提供的每周流感样疾病(ILI)发病率(每10万人),绿色为干预前相关期,红色为两个影响评估期(2013/14年和2014/15年流感季节)。gydF4y2Ba

估计ILI率的监督模型的性能gydF4y2Ba

GP回归模型使用2011年8月29日至2015年8月30日在英国地理定位的每周Twitter数据和相应的RCGP ILI率进行训练。基于10倍交叉验证,平均皮尔逊相关gydF4y2Ba rgydF4y2Ba=0.84,标准差为0.08,平均MAE为2.42(每10万人的周ILI率),标准差为0.52。这种方法与以往影响评估中使用的GP模型的性能一致[gydF4y2Ba 9gydF4y2Ba].gydF4y2Ba

LAIV计划的影响评估gydF4y2Ba

使用在国家层面(英格兰)培训的GP模型,估计了所选试点地点的ILI率。这是针对单个试验地点,所有试验地点的集合,以及同一队列接种疫苗的试验地点集合(即,gydF4y2Ba 小学gydF4y2Ba,gydF4y2Ba 中学gydF4y2Ba).对所有可能的控制区域组合进行了详尽的搜索。根据皮尔逊相关系数测量的相似流感活动,这些控制地点组合与LAIV运动开始前一段时期(2011年8月29日至2013年9月1日)的试点地点集相匹配。2013/2014年流感季节不包括在这一相关阶段,因为这涉及全国2岁和3岁儿童的疫苗接种以及一些小学适龄试点地区,这可能会改变某些控制点和试点地点之间的线性关系。对于每个试点地区和一组试点地区,然后使用相关性最高的控制区组合来估计LAIV运动对2014/2015流感季节的影响。与前一个流感季节的试点地区有一些重叠,因此对2013/2014年流感季节重新进行了相同的分析(在这种情况下,采用了不同的一组对照地区),因此可以将结果与以前的研究进行比较[gydF4y2Ba 9gydF4y2Ba,gydF4y2Ba 11gydF4y2Ba].gydF4y2Ba

表2gydF4y2Ba而且gydF4y2Ba 表3gydF4y2Ba显示单个试点地点的结果,以及2014/2015年和2013/2014年流感季节的结果。对于每个领域,表格中都包含了皮尔逊相关系数gydF4y2Ba rgydF4y2Ba,绝对和相对平均影响δ的10万次自举估计的平均值和95%置信区间gydF4y2BavgydF4y2Ba和θgydF4y2BavgydF4y2Ba在干预期间,选择的控制区数量gydF4y2Ba ngydF4y2Ba(gydF4y2Ba cgydF4y2Ba),以及试验计划的目标人口数目gydF4y2Ba 流行gydF4y2Ba(gydF4y2Ba vgydF4y2Ba)和匹配的控件集合gydF4y2Ba 流行gydF4y2Ba(gydF4y2Ba cgydF4y2Ba)地区。自举估计的分布以图形方式评估,似乎是单峰的。因此,统计上显著的结果是基于绝对值高于自举估计的两个标准差,并以斜体突出显示。此外,对于可靠的影响估计,必须有显著的干预前相关性,我们将其定义为皮尔森相关性>0.60,与之前的研究一样[gydF4y2Ba 9gydF4y2Ba].gydF4y2Ba

2014/2015年流感季节期间LAIV试点项目在个别试点地点及其超集的影响估计。对于每个考虑的区域,竞选前的皮尔逊相关gydF4y2Ba rgydF4y2Ba对于选定的控制区域,绝对平均值和相对平均值的平均值和95%置信区间影响δgydF4y2BavgydF4y2Ba和θgydF4y2BavgydF4y2Ba在干预期间,选择的控制区数量gydF4y2Ba n (c)gydF4y2Ba,以及所选疫苗接种的目标人群规模gydF4y2Ba 流行(v)gydF4y2Ba和控制gydF4y2Ba 流行(c)gydF4y2Ba展示了区域。具有统计意义的结果用斜体突出显示。gydF4y2Ba

试点地区gydF4y2Ba rgydF4y2Ba一个gydF4y2Ba δgydF4y2BavgydF4y2BabgydF4y2Ba θgydF4y2BavgydF4y2BacgydF4y2Ba ngydF4y2Ba(gydF4y2Ba cgydF4y2Ba)gydF4y2BadgydF4y2Ba 流行gydF4y2Ba(gydF4y2Ba vgydF4y2Ba)gydF4y2BaegydF4y2Ba 流行gydF4y2Ba(c)gydF4y2BafgydF4y2Ba
所有接种疫苗gydF4y2Ba 0.89gydF4y2Ba -0.50(-2.77到1.99)gydF4y2Ba -4.51(-25.72到22.61)gydF4y2Ba 10gydF4y2Ba 9772977年gydF4y2Ba 5066069年gydF4y2Ba
所有“小学”gydF4y2Ba 0.71gydF4y2Ba -1.15(-2.19到-0.15)gydF4y2Ba -16.97(-30.09到-2.42)gydF4y2Ba 8gydF4y2Ba 2719231年gydF4y2Ba 2371367年gydF4y2Ba
所有“小学及中学”gydF4y2Ba 0.84gydF4y2Ba -0.06(-1.50到1.43)gydF4y2Ba -0.30(-16.71到19.36)gydF4y2Ba 6gydF4y2Ba 1097419年gydF4y2Ba 2174854年gydF4y2Ba
所有“小学”及“中小学校”gydF4y2Ba 0.85gydF4y2Ba -1.35(-3.37到0.66)gydF4y2Ba -13.01(-30.54到7.31)gydF4y2Ba 9gydF4y2Ba 4062624年gydF4y2Ba 3601377年gydF4y2Ba
所有“中学”gydF4y2Ba 0.83gydF4y2Ba 0.06(-1.58至1.90)gydF4y2Ba 1.41(-19.40至28.40)gydF4y2Ba 7gydF4y2Ba 5710353年gydF4y2Ba 4038921年gydF4y2Ba
坎布里亚郡(“小学”)gydF4y2Ba 0.59gydF4y2Ba 0.04(-0.24至0.33)gydF4y2Ba 1.07(-5.75至8.17)gydF4y2Ba 7gydF4y2Ba 497874年gydF4y2Ba 3999608年gydF4y2Ba
埃塞克斯(小学)gydF4y2Ba 0.68gydF4y2Ba -0.32(-1.13到0.51)gydF4y2Ba -5.91(-20.56到10.58)gydF4y2Ba 8gydF4y2Ba 1431953年gydF4y2Ba 3199730年gydF4y2Ba
盖茨黑德(“小学”)gydF4y2Ba 0.59gydF4y2Ba -0.39(-0.74到-0.04)gydF4y2Ba -8.46(-15.56到-1.02)gydF4y2Ba 4gydF4y2Ba 200505年gydF4y2Ba 1551060年gydF4y2Ba
南泰恩赛德(“小学”)gydF4y2Ba 0.34gydF4y2Ba 0.25(0.03至0.52)gydF4y2Ba 6.82(0.81至14.07)gydF4y2Ba 3.gydF4y2Ba 148740年gydF4y2Ba 1697971年gydF4y2Ba
桑德兰(“小学”)gydF4y2Ba 0.54gydF4y2Ba 0.12(-0.05至0.32)gydF4y2Ba 3.20(-1.38至8.38)gydF4y2Ba 3.gydF4y2Ba 276889年gydF4y2Ba 1119136年gydF4y2Ba
瑟罗克(“小学”)gydF4y2Ba 0.32gydF4y2Ba 0.04(-0.14至0.23)gydF4y2Ba 1.01(-3.56到6.24)gydF4y2Ba 3.gydF4y2Ba 163270年gydF4y2Ba 753563年gydF4y2Ba
Bury(“小学及中学”)gydF4y2Ba 0.32gydF4y2Ba -0.11(-0.37到0.12)gydF4y2Ba -2.60(-8.94到3.13)gydF4y2Ba 2gydF4y2Ba 187474年gydF4y2Ba 893813年gydF4y2Ba
莱斯特郡(“小学和中学”)gydF4y2Ba 0.81gydF4y2Ba 0.32(-0.70至1.38)gydF4y2Ba 4.97(-10.01至21.22)gydF4y2Ba 6gydF4y2Ba 667905年gydF4y2Ba 2756865年gydF4y2Ba
索尔福德(小学和中学)gydF4y2Ba 0.67gydF4y2Ba 0.40(-0.20至1.01)gydF4y2Ba 8.45(-3.96至22.00)gydF4y2Ba 7gydF4y2Ba 242040年gydF4y2Ba 4183184年gydF4y2Ba
哈弗林(小学和中学七年级)gydF4y2Ba 0.48gydF4y2Ba -0.03(-0.35到0.31)gydF4y2Ba -0.55(-8.23到7.79)gydF4y2Ba 4gydF4y2Ba 245974年gydF4y2Ba 1742705年gydF4y2Ba
伯明翰(“中学”)gydF4y2Ba 0.79gydF4y2Ba 0.53(-0.27到1.34)gydF4y2Ba 10.36(-4.86至27.21)gydF4y2Ba 10gydF4y2Ba 1101360年gydF4y2Ba 5435742年gydF4y2Ba
兰开夏郡(“中学”)gydF4y2Ba 0.65gydF4y2Ba 0.18(-0.78到1.13)gydF4y2Ba 3.45(-13.41至21.40)gydF4y2Ba 8gydF4y2Ba 1184735年gydF4y2Ba 3463060年gydF4y2Ba
利兹(“中学”)gydF4y2Ba 0.63gydF4y2Ba 0.54(-0.40到1.51)gydF4y2Ba 10.81(-7.41到30.98)gydF4y2Ba 7gydF4y2Ba 766399年gydF4y2Ba 2731293年gydF4y2Ba
林肯郡(“中学”)gydF4y2Ba 0.66gydF4y2Ba -0.29(-0.78到0.19)gydF4y2Ba -6.09(-16.20到4.25)gydF4y2Ba 6gydF4y2Ba 731516年gydF4y2Ba 1737168年gydF4y2Ba
诺福克(“中学”)gydF4y2Ba 0.71gydF4y2Ba -0.12(-0.60到0.35)gydF4y2Ba -2.31(-11.55到7.25)gydF4y2Ba 6gydF4y2Ba 877710年gydF4y2Ba 2784394年gydF4y2Ba
什罗普郡(“中学”)gydF4y2Ba 0.35gydF4y2Ba 0.13(-0.13到0.39)gydF4y2Ba 3.30(-3.18至9.71)gydF4y2Ba 6gydF4y2Ba 310121年gydF4y2Ba 2833659年gydF4y2Ba
萨福克郡(“中学”)gydF4y2Ba 0.59gydF4y2Ba 0.10(-0.34至0.53)gydF4y2Ba 2.24(-7.54到12.35)gydF4y2Ba 5gydF4y2Ba 738512年gydF4y2Ba 2015339年gydF4y2Ba

一个gydF4y2Ba rgydF4y2Ba:运动前与所选控制区域集合的Pearson相关性gydF4y2Ba

bgydF4y2BaδgydF4y2BavgydF4y2Ba:干预期间平均ILI率的绝对差值gydF4y2Ba

cgydF4y2BaθgydF4y2BavgydF4y2Ba:干预期间平均ILI率的相对差异gydF4y2Ba

dgydF4y2Ba ngydF4y2Ba(gydF4y2Ba cgydF4y2Ba):所选的综合控制区域数目gydF4y2Ba

egydF4y2Ba 流行gydF4y2Ba(gydF4y2Ba vgydF4y2Ba):选定接种地区的目标人口数量gydF4y2Ba

fgydF4y2Ba 流行gydF4y2Ba(gydF4y2Ba cgydF4y2Ba):在选定的控制区内的目标人口数目gydF4y2Ba

2013/2014年流感季节,LAIV试点项目在各个试点地点和这些地点的超集的影响估计。对于每个考虑的区域,竞选前的皮尔逊相关gydF4y2Ba rgydF4y2Ba对于选定的控制区域,绝对平均值和相对平均值的平均值和95%置信区间影响δgydF4y2BavgydF4y2Ba和θgydF4y2BavgydF4y2Ba在干预期间,选择的控制区数量gydF4y2Ba n (c)gydF4y2Ba,以及所选疫苗接种的目标人群规模gydF4y2Ba 流行(v)gydF4y2Ba和控制gydF4y2Ba 流行(c)gydF4y2Ba展示了区域。具有统计意义的结果用斜体突出显示。gydF4y2Ba

试点地区gydF4y2Ba rgydF4y2Ba一个gydF4y2Ba δgydF4y2BavgydF4y2BabgydF4y2Ba θgydF4y2BavgydF4y2BacgydF4y2Ba ngydF4y2Ba(gydF4y2Ba cgydF4y2Ba)gydF4y2BadgydF4y2Ba 流行gydF4y2Ba(gydF4y2Ba vgydF4y2Ba)gydF4y2BaegydF4y2Ba 流行gydF4y2Ba(c)gydF4y2BafgydF4y2Ba
所有接种疫苗者(小学)gydF4y2Ba 0.82gydF4y2Ba -1.03(-2.00到-0.10)gydF4y2Ba -13.77(-25.01到-1.45)gydF4y2Ba 9gydF4y2Ba 3231685年gydF4y2Ba 3601377年gydF4y2Ba
莱斯特郡(小学)gydF4y2Ba 0.81gydF4y2Ba -0.28(-1.02到0.47)gydF4y2Ba -4.44(-15.93到7.95)gydF4y2Ba 6gydF4y2Ba 667905年gydF4y2Ba 2756865年gydF4y2Ba
埃塞克斯(小学)gydF4y2Ba 0.68gydF4y2Ba 0.34(-0.30至1.12)gydF4y2Ba 7.45(-6.41到24.32)gydF4y2Ba 8gydF4y2Ba 1431953年gydF4y2Ba 3199730年gydF4y2Ba
盖茨黑德(小学)gydF4y2Ba 0.59gydF4y2Ba 0.38(-0.06至0.85)gydF4y2Ba 9.11(-1.40→20.76)gydF4y2Ba 4gydF4y2Ba 200505年gydF4y2Ba 1551060年gydF4y2Ba
坎布里亚郡(小学)gydF4y2Ba 0.59gydF4y2Ba 0.36(-0.00到0.75)gydF4y2Ba 9.12(-0.07到19.11)gydF4y2Ba 7gydF4y2Ba 497874年gydF4y2Ba 3999608年gydF4y2Ba
哈弗林(小学)gydF4y2Ba 0.48gydF4y2Ba 0.15(-0.19至0.52)gydF4y2Ba 3.80(-4.99到13.43)gydF4y2Ba 4gydF4y2Ba 245974年gydF4y2Ba 1742705年gydF4y2Ba
伯里(小学)gydF4y2Ba 0.32gydF4y2Ba -0.09(-0.34到0.14)gydF4y2Ba -2.40(-8.44到3.64)gydF4y2Ba 2gydF4y2Ba 187474年gydF4y2Ba 893813年gydF4y2Ba

一个gydF4y2Ba rgydF4y2Ba:运动前与所选控制区域集合的Pearson相关性gydF4y2Ba

bgydF4y2BaδgydF4y2BavgydF4y2Ba:干预期间平均ILI率的绝对差值gydF4y2Ba

cgydF4y2BaθgydF4y2BavgydF4y2Ba:干预期间平均ILI率的相对差异gydF4y2Ba

dgydF4y2Ba ngydF4y2Ba(gydF4y2Ba cgydF4y2Ba):所选的综合控制区域数目gydF4y2Ba

egydF4y2Ba 流行gydF4y2Ba(gydF4y2Ba vgydF4y2Ba):选定接种地区的目标人口数量gydF4y2Ba

fgydF4y2Ba 流行gydF4y2Ba(gydF4y2Ba cgydF4y2Ba):在选定的控制区内的目标人口数目gydF4y2Ba

对于2014/2015流感季节,相关性在0.32至0.89之间,人口越多的试点地区往往有更多的控制区,控制区人口越多,Pearson相关性越高。唯一的显著影响是在gydF4y2Ba 小学gydF4y2Ba这些地区的结果表明,在2014/2015流感季节,平均ILI率降低了16.97% (95% CI 2.42-30.09)。就个别地区而言,盖茨黑德和南泰恩赛德确实显示出显著的结果,但它们在竞选前的相关性分别为0.59和0.34;两者都低于0.60的预定义阈值,这使得它们的影响估计可能不那么可靠。gydF4y2Ba

2013/2014年流感季节的相关性在0.32至0.82之间,虽然没有一个单独的地点显示出显著的结果,但所有试点共同估计该季节的平均ILI率在统计学上有显著影响,降低了13.77% (95% CI 1.45-25.01)。请注意,在2013/2014疫苗接种季节,小学适龄疫苗接种是所有试点地区实施的唯一项目。gydF4y2Ba

讨论gydF4y2Ba 主要结果gydF4y2Ba

通过使用社交媒体内容评估2013/2014年和2014/2015年英国儿童流感试点项目的影响,统计上显著的结果表明,平均ILI率降低了约17% (gydF4y2Ba 表2gydF4y2Ba,第2行,第4列)gydF4y2Ba 小学gydF4y2Ba年龄试点地区仅在2014/2015年流感季节,14% (gydF4y2Ba 表3gydF4y2Ba的聚合,第1行,第4列)gydF4y2Ba 小学gydF4y2Ba在2013/2014年流感季节接种疫苗的地区。gydF4y2Ba

与之前工作的比较gydF4y2Ba

这两项影响估计都与公共卫生部门使用传统监测系统进行的独立研究的结果一致[gydF4y2Ba 3.gydF4y2Ba,gydF4y2Ba 11gydF4y2Ba].然而,对于2014/2015赛季,影响结果普遍低于预期,只有少数统计上显著的结果。例如,人们期望gydF4y2Ba 小学及中学gydF4y2Ba或者组合的集合gydF4y2Ba 小学gydF4y2Ba而且gydF4y2Ba 小学及中学gydF4y2Ba试点地点将产生重大影响,因为它们包括一个类似的项目gydF4y2Ba 小学gydF4y2Ba试点地区。更详细地查看边界框(gydF4y2Ba 图1gydF4y2Ba)表示4gydF4y2Ba 小学及中学gydF4y2Ba试点地区,莱斯特郡和索尔福德都包括大量的非试点地区,这可能会导致他们的结果有偏差,低估了效应量。由于Twitter数据的稀缺性,在所有单独地点都缺乏统计上的显著结果。例如,个人gydF4y2Ba 小学gydF4y2Ba试点地区没有产生统计上显著的影响估计(除了盖茨黑德和南泰恩赛德,它们确实显示出显著的结果,但它们的干预前相关性低于0.60阈值),而所有试点地区的总和gydF4y2Ba 小学gydF4y2Ba区域。gydF4y2Ba

Lampos等人之前的研究采用了类似的方法,使用Twitter和Bing数据来评估LAIV试点在2013/2014年流感季节的影响[gydF4y2Ba 9gydF4y2Ba].这项研究根据Twitter数据估计,所有试点地点的影响总和约为33%,是本研究发现的两倍多。这些结果之间的差异很可能是由于两个因素造成的。首先,本研究中2013/2014季节使用的试验区比前一个季节略大,因为部分重复使用的试验区已经扩大。这个问题尤其适用于莱斯特郡和埃塞克斯的边界框,因为之前的研究只包括了这些地区的一部分。其次,除了一个控制区(利物浦),之前的大部分控制区都是2014/2015年试点项目的一部分,因此不能重复使用。因此选择了新的控制区域,这可能解释了影响估计的差异。尽管如此,鉴于两项研究都显示出了重大影响,即使使用不同的对照和试点地区,该方法也对同一流感季节产生了定性一致的结果。gydF4y2Ba

结论gydF4y2Ba

有强烈迹象表明,小学适龄疫苗接种计划有可能成为减少普通人群流感传播的有效战略。这一理念为正在开展的针对小学生的运动提供了支持。对于一项仅面向中学的疫苗接种计划,该计划仅向两岁的队列人群(而不是向所有中学年龄的儿童)提供疫苗,没有明确的证据表明该计划对整个人群有任何影响。这些结论与以往研究的结果一致,并补充了传统监测来源,显示了LAIV试点运动在全社区的影响[gydF4y2Ba 3.gydF4y2Ba,gydF4y2Ba 9gydF4y2Ba,gydF4y2Ba 11gydF4y2Ba,gydF4y2Ba 23gydF4y2Ba].gydF4y2Ba

目前大多数流感监测计划依赖于已建立的卫生系统。尽管这些计划提供了与卫生保健相关的疾病负担以及疫苗影响可能减少的重要信息,但其中一些计划对社区范围内的传播提供了不那么直接的了解。来自社交媒体的用户生成内容提供了对更大范围人群的快速访问,这有可能包括更广泛的社区(即,包括那些不寻求医疗服务的人),因此为公共卫生项目的监测和评估提供了一个有价值的补充来源。gydF4y2Ba

限制gydF4y2Ba

这项研究有几个潜在的局限性。仍然需要改进用于处理噪声、模型和数据偏差等问题的方法,以及从用户生成的内容中进行的估计并不是直接基于实际ILI案例的事实。更先进的自然语言处理技术可以提供更准确的结果[gydF4y2Ba 24gydF4y2Ba].控制区域的选择需要进一步细化;我们正在寻求均匀的地理分布,以及与试点地区保持足够的距离,以避免区域偏差,并分别隔离在试点地区观察到的潜在影响。此外,该方法高度依赖于可用的用户生成数据的数量和类型,因为这决定了ILI率估计数的准确性和解释。例如,大多数Twitter用户的年龄在15-44岁之间,居住在城市/郊区的比例更高[gydF4y2Ba 25gydF4y2Ba].这一因素可能会使某些人口群体的结果偏向疾病。当前框架通过对症状监测数据(来自RCGP)进行训练来进行ILI率建模,这样发现的偏差也会传递到模型中。此外,即使这些偏见可以避免,也存在一个问题,即没有明确的基本事实存在,可以进行适当的验证。gydF4y2Ba

未来的工作gydF4y2Ba

未来的工作可以朝着不依赖于传统监测来源进行培训的无监督模型发展。这些模型可以产生它们自己的、独立的ILI指标,这些指标仅基于用户生成的内容,并有可能挖掘到疾病人群金字塔的底部[gydF4y2Ba 10gydF4y2Ba].推断用户的人口统计数据,例如年龄[gydF4y2Ba 26gydF4y2Ba]、社会经济地位[gydF4y2Ba 27gydF4y2Ba,gydF4y2Ba 28gydF4y2Ba],或疾病的严重程度[gydF4y2Ba 29gydF4y2Ba可能是未来工作的另一个重点。Pebody等人表明,对于两个流感季节,随着流感感染终点变得更加严重,试点项目的影响会降低,这是当前建模框架无法考虑到的一个见解[gydF4y2Ba 3.gydF4y2Ba,gydF4y2Ba 11gydF4y2Ba].未来有了适当的数据访问,这个框架有可能评估干预方案的影响,而这些干预方案的吸收是可变的。这一框架不仅适用于流感,还适用于许多卫生干预措施,从而能够对收集传统监测数据进行及时和可能具有成本效益的补充。gydF4y2Ba

多媒体附件1gydF4y2Ba

217人的名单gydF4y2Ba ngydF4y2Ba-g被用作我们ILI率预测模型的特征。gydF4y2Ba

多媒体附件2gydF4y2Ba

根据各自的人口规模、到最近的试点地区的距离和地理边界矩形角坐标选择的试点和控制地区的表格。gydF4y2Ba

缩写gydF4y2Ba 全科医生gydF4y2Ba

高斯过程gydF4y2Ba

伊犁gydF4y2Ba

流感样疾病gydF4y2Ba

LAIVgydF4y2Ba

流感减毒活疫苗gydF4y2Ba

美gydF4y2Ba

平均绝对误差gydF4y2Ba

国家统计局gydF4y2Ba

英国国家统计局gydF4y2Ba

板式换热器gydF4y2Ba

英国公共卫生部gydF4y2Ba

RCGPgydF4y2Ba

皇家全科医师学院gydF4y2Ba

这项工作由EPSRC通过i-sense (gydF4y2Ba 传染病预警传感系统gydF4y2Ba;EP / K031953/1)。我们还要感谢RCGP提供匿名和汇总的综合征监测数据。gydF4y2Ba

VL、IJC、RP、EY-T、MW为本研究的总体构想;EY-T提供了Twitter的数据;VL设计模型;VL和MW进行实验;MW和VL撰写论文;所有合著者对手稿进行了审阅和评论,并批准了最终版本。gydF4y2Ba

疫苗接种和免疫联合委员会gydF4y2Ba 2011gydF4y2Ba 10gydF4y2Ba 5gydF4y2Ba 2017-06-15gydF4y2Ba 2011年10月5日(星期三)会议纪要gydF4y2Ba http://webarchive.nationalarchives.gov.uk/20120907090205/http://www.dh.gov.uk/prod_consum_dh/groups/dh_digitalassets/@dh/@ab/documents/digitalasset/dh_133598.pdfgydF4y2Ba BaguelingydF4y2Ba 米gydF4y2Ba FlaschegydF4y2Ba 年代gydF4y2Ba 卡马乔gydF4y2Ba 一个gydF4y2Ba DemirisgydF4y2Ba NgydF4y2Ba 米勒gydF4y2Ba EgydF4y2Ba 埃德蒙兹gydF4y2Ba WJgydF4y2Ba 评估流感疫苗接种规划的最佳目标人群:证据综合和建模研究gydF4y2Ba 科学硕士gydF4y2Ba 2013gydF4y2Ba 10gydF4y2Ba 10gydF4y2Ba 10gydF4y2Ba e1001527gydF4y2Ba 10.1371 / journal.pmed.1001527gydF4y2Ba 24115913gydF4y2Ba pmedicine - d - 13 - 00884gydF4y2Ba PMC3793005gydF4y2Ba PebodygydF4y2Ba RGgydF4y2Ba 绿色gydF4y2Ba 香港gydF4y2Ba 安德鲁斯gydF4y2Ba NgydF4y2Ba BoddingtongydF4y2Ba 问gydF4y2Ba 赵gydF4y2Ba HgydF4y2Ba YonovagydF4y2Ba 我gydF4y2Ba 埃利斯gydF4y2Ba JgydF4y2Ba 斯坦伯格gydF4y2Ba 年代gydF4y2Ba DonatigydF4y2Ba 米gydF4y2Ba 艾略特gydF4y2Ba AJgydF4y2Ba 休斯gydF4y2Ba 他gydF4y2Ba PathirannehelagegydF4y2Ba 年代gydF4y2Ba MullettgydF4y2Ba DgydF4y2Ba 史密斯gydF4y2Ba 通用电气gydF4y2Ba de LusignangydF4y2Ba 年代gydF4y2Ba ZambongydF4y2Ba 米gydF4y2Ba 在漂移流感a和B株流行的季节,学龄儿童接种流感疫苗的吸收和影响,英格兰,2014/15gydF4y2Ba 欧元SurveillgydF4y2Ba 2015gydF4y2Ba 20.gydF4y2Ba 39gydF4y2Ba 30029gydF4y2Ba 1560 - 7917. - 10.2807 / es.2015.20.39.30029gydF4y2Ba 26537222gydF4y2Ba 30029gydF4y2Ba MilinovichgydF4y2Ba GJgydF4y2Ba 威廉姆斯gydF4y2Ba 通用汽车gydF4y2Ba 克莱门茨gydF4y2Ba 交流gydF4y2Ba 胡gydF4y2Ba WgydF4y2Ba 基于互联网的监测系统,用于监测新出现的传染病gydF4y2Ba 柳叶刀感染病gydF4y2Ba 2014gydF4y2Ba 02gydF4y2Ba 14gydF4y2Ba 2gydF4y2Ba 160gydF4y2Ba 168gydF4y2Ba 10.1016 / s1473 - 3099 (13) 70244 - 5gydF4y2Ba 24290841gydF4y2Ba s1473 - 3099 (13) 70244 - 5gydF4y2Ba 金斯堡gydF4y2Ba JgydF4y2Ba MohebbigydF4y2Ba MHgydF4y2Ba 帕特尔gydF4y2Ba RSgydF4y2Ba 布拉姆gydF4y2Ba lgydF4y2Ba SmolinskigydF4y2Ba 女士gydF4y2Ba 才华横溢的gydF4y2Ba lgydF4y2Ba 使用搜索引擎查询数据检测流感流行gydF4y2Ba 自然gydF4y2Ba 2009gydF4y2Ba 02gydF4y2Ba 19gydF4y2Ba 457gydF4y2Ba 7232gydF4y2Ba 1012gydF4y2Ba 1014gydF4y2Ba 10.1038 / nature07634gydF4y2Ba 19020500gydF4y2Ba nature07634gydF4y2Ba lampogydF4y2Ba VgydF4y2Ba CristianinigydF4y2Ba NgydF4y2Ba 基于统计学习的社交网络即时预报事件gydF4y2Ba ACM Trans Intell系统技术gydF4y2Ba 2012gydF4y2Ba 09gydF4y2Ba 01gydF4y2Ba 3.gydF4y2Ba 4gydF4y2Ba 1gydF4y2Ba 22gydF4y2Ba 10.1145/2337542.2337557gydF4y2Ba 保罗gydF4y2Ba 乔丹gydF4y2Ba DredzegydF4y2Ba 米gydF4y2Ba BroniatowskigydF4y2Ba DgydF4y2Ba 推特提高流感预测gydF4y2Ba 公共科学图书馆咕咕叫gydF4y2Ba 2014gydF4y2Ba 6gydF4y2Ba 1gydF4y2Ba 10.1371 / currents.outbreaks.90b9ed0f59bae4ccaa683a39865d9117gydF4y2Ba 25642377gydF4y2Ba PMC4234396gydF4y2Ba lampogydF4y2Ba VgydF4y2Ba 米勒gydF4y2Ba 交流gydF4y2Ba CrossangydF4y2Ba 年代gydF4y2Ba StefansengydF4y2Ba CgydF4y2Ba 利用搜索查询日志预测流感样发病率的进展gydF4y2Ba Sci代表gydF4y2Ba 2015gydF4y2Ba 08gydF4y2Ba 03gydF4y2Ba 5gydF4y2Ba 12760gydF4y2Ba 10.1038 / srep12760gydF4y2Ba 26234783gydF4y2Ba srep12760gydF4y2Ba PMC4522652gydF4y2Ba lampogydF4y2Ba VgydF4y2Ba Yom-TovgydF4y2Ba EgydF4y2Ba PebodygydF4y2Ba RgydF4y2Ba 考克斯gydF4y2Ba IJgydF4y2Ba 通过用户生成的互联网内容评估健康干预措施的影响gydF4y2Ba 数据最小知道盘gydF4y2Ba 2015gydF4y2Ba 7gydF4y2Ba 2gydF4y2Ba 29gydF4y2Ba 5gydF4y2Ba 1434gydF4y2Ba 1457gydF4y2Ba 10.1007 / s10618 - 015 - 0427 - 9gydF4y2Ba 吉本斯gydF4y2Ba CLgydF4y2Ba margengydF4y2Ba 乔丹gydF4y2Ba 布特就gydF4y2Ba DgydF4y2Ba HavelaargydF4y2Ba 啊gydF4y2Ba 布鲁克gydF4y2Ba RJgydF4y2Ba KramarzgydF4y2Ba PgydF4y2Ba 彼得森gydF4y2Ba 吉隆坡gydF4y2Ba StuurmangydF4y2Ba 艾尔gydF4y2Ba 卡西尼号gydF4y2Ba 一个gydF4y2Ba 热夜gydF4y2Ba 新兴市场gydF4y2Ba KretzschmargydF4y2Ba 梅伊gydF4y2Ba 欧洲传染病负担(BCoDE)联盟gydF4y2Ba 测量传染病数据集的漏报和不确定:方法的比较gydF4y2Ba BMC公共卫生gydF4y2Ba 2014gydF4y2Ba 02gydF4y2Ba 11gydF4y2Ba 14gydF4y2Ba 147gydF4y2Ba 10.1186 / 1471-2458-14-147gydF4y2Ba 24517715gydF4y2Ba 1471-2458-14-147gydF4y2Ba PMC4015559gydF4y2Ba PebodygydF4y2Ba RgydF4y2Ba 绿色gydF4y2Ba HgydF4y2Ba 安德鲁斯gydF4y2Ba NgydF4y2Ba 赵gydF4y2Ba HgydF4y2Ba BoddingtongydF4y2Ba NgydF4y2Ba BawagydF4y2Ba ZgydF4y2Ba 英格兰一项新的减毒流感活疫苗方案的采用和影响:2013/14流感季节小学适龄儿童试点的早期结果gydF4y2Ba EurosurveillancegydF4y2Ba 2014gydF4y2Ba 19gydF4y2Ba 22gydF4y2Ba 20823gydF4y2Ba 1560 - 7917. - 10.2807 / es2014.19.22.20823gydF4y2Ba 科雷亚gydF4y2Ba 一个gydF4y2Ba 辛顿gydF4y2Ba WgydF4y2Ba 麦戈文gydF4y2Ba 一个gydF4y2Ba 范gydF4y2Ba VJgydF4y2Ba YonovagydF4y2Ba 我gydF4y2Ba 琼斯gydF4y2Ba 年代gydF4y2Ba 德gydF4y2Ba LSgydF4y2Ba 皇家全科医生学院研究和监测中心(RCGP RSC)哨点网络:队列概况gydF4y2Ba BMJ开放gydF4y2Ba 2016gydF4y2Ba 04gydF4y2Ba 20.gydF4y2Ba 6gydF4y2Ba 4gydF4y2Ba e011092gydF4y2Ba 10.1136 / bmjopen - 2016 - 011092gydF4y2Ba 27098827gydF4y2Ba bmjopen - 2016 - 011092gydF4y2Ba PMC4838708gydF4y2Ba 英国国家统计局gydF4y2Ba 英国数据服务gydF4y2Ba 2011gydF4y2Ba 2011年人口普查:边界数据(英格兰和威尔士)数据收集gydF4y2Ba http://census.ukdataservice.ac.uk/get-data/boundary-data.aspxgydF4y2Ba 英国国家统计局gydF4y2Ba 年度年中人口估计gydF4y2Ba 2015gydF4y2Ba 2017-06-15gydF4y2Ba http://www.ons.gov.uk/peoplepopulationandcommunity/populationandmigration/populationestimates/bulletins/annualmidyearpopulationestimates/2015-06-25gydF4y2Ba 玫瑰gydF4y2Ba KgydF4y2Ba Rosemcgrory.co.ukgydF4y2Ba 2016gydF4y2Ba 2017-06-15gydF4y2Ba 2016年英国社交媒体统计gydF4y2Ba http://www.rosemcgrory.co.uk/2016/01/04/social-media-statistics-2016/gydF4y2Ba lampogydF4y2Ba VgydF4y2Ba CristianinigydF4y2Ba NgydF4y2Ba 通过监控社交网络追踪流感大流行gydF4y2Ba 第二届认知信息处理国际研讨会gydF4y2Ba 2010gydF4y2Ba 第二届认知信息处理国际研讨会gydF4y2Ba 2010gydF4y2Ba 厄尔巴岛,意大利gydF4y2Ba 441gydF4y2Ba 416gydF4y2Ba 10.1109 / CIP.2010.5604088gydF4y2Ba lampogydF4y2Ba VgydF4y2Ba De BiegydF4y2Ba TgydF4y2Ba CristianinigydF4y2Ba NgydF4y2Ba 流感探测器——在Twitter上追踪流行病gydF4y2Ba 信号gydF4y2Ba 2010gydF4y2Ba 6323gydF4y2Ba 599gydF4y2Ba 602gydF4y2Ba 10.1007 / 978 - 3 - 642 - 15939 - 8 - _42gydF4y2Ba CulottagydF4y2Ba 一个gydF4y2Ba 从Twitter消息估计流感发病率和酒精销售量的轻量级方法gydF4y2Ba 朗资源与评估gydF4y2Ba 2012gydF4y2Ba 5gydF4y2Ba 13gydF4y2Ba 47gydF4y2Ba 1gydF4y2Ba 217gydF4y2Ba 238gydF4y2Ba 10.1007 / s10579 - 012 - 9185 - 0gydF4y2Ba 拉斯穆森gydF4y2Ba CgydF4y2Ba 威廉姆斯gydF4y2Ba CgydF4y2Ba 机器学习的高斯过程gydF4y2Ba 2006gydF4y2Ba 剑桥,麻gydF4y2Ba 麻省理工学院出版社gydF4y2Ba MaterngydF4y2Ba BgydF4y2Ba 空间变化gydF4y2Ba 1986gydF4y2Ba 柏林gydF4y2Ba 斯普林格出版社gydF4y2Ba 埃夫隆gydF4y2Ba BgydF4y2Ba TibshiranigydF4y2Ba RgydF4y2Ba 引导的介绍gydF4y2Ba 1993gydF4y2Ba 纽约gydF4y2Ba 查普曼和霍尔gydF4y2Ba 兰伯特gydF4y2Ba DgydF4y2Ba PregibongydF4y2Ba DgydF4y2Ba 线下广告的线上效果gydF4y2Ba 2008gydF4y2Ba 第二届广告数据挖掘和受众智能国际研讨会论文集- ADKDD '08gydF4y2Ba 2008gydF4y2Ba 美国内华达州拉斯维加斯gydF4y2Ba 10.1145/1517472.1517474gydF4y2Ba 英国公共卫生部gydF4y2Ba 2014gydF4y2Ba 2017-06-15gydF4y2Ba 英国流感和其他呼吸道病毒监测:2014年冬季至2015年冬季gydF4y2Ba https://www.gov.uk/government/uploads/system/uploads/attachment_data/file/429617/Annualreport_March2015_ver4.pdfgydF4y2Ba lampogydF4y2Ba VgydF4y2Ba 邹gydF4y2Ba BgydF4y2Ba 考克斯gydF4y2Ba 我gydF4y2Ba 使用词嵌入增强特征选择gydF4y2Ba 2017gydF4y2Ba 第26届万维网国际会议论文集gydF4y2Ba 2017gydF4y2Ba 澳大利亚珀斯gydF4y2Ba 695gydF4y2Ba 704gydF4y2Ba 10.1145/3038912.3052622gydF4y2Ba 达根gydF4y2Ba 米gydF4y2Ba 埃里森gydF4y2Ba NgydF4y2Ba 兰佩gydF4y2Ba CgydF4y2Ba 伦哈特gydF4y2Ba 一个gydF4y2Ba 马登gydF4y2Ba 米gydF4y2Ba 皮尤研究中心:互联网、科学与技术gydF4y2Ba 2015gydF4y2Ba 2017-09-11gydF4y2Ba 主要社交网络平台的人口统计数据gydF4y2Ba https://www.pewinternet.org/2015/01/09/demographics-of-key-social-networking-platforms-2/#twittergydF4y2Ba 饶gydF4y2Ba DgydF4y2Ba YarowskygydF4y2Ba DgydF4y2Ba ShreevatsgydF4y2Ba 一个gydF4y2Ba 古普塔gydF4y2Ba 米gydF4y2Ba 对Twitter中的潜在用户属性进行分类gydF4y2Ba 2010gydF4y2Ba 第二届搜索和挖掘用户生成内容国际研讨会论文集gydF4y2Ba 2010gydF4y2Ba 加拿大安大略省多伦多gydF4y2Ba 37gydF4y2Ba 44gydF4y2Ba 10.1145/1871985.1871993gydF4y2Ba Preoţiuc-PietrogydF4y2Ba DgydF4y2Ba lampogydF4y2Ba VgydF4y2Ba AletrasgydF4y2Ba NgydF4y2Ba 通过Twitter内容分析用户职业类别gydF4y2Ba 第53届计算语言学协会年会和第7届自然语言处理国际联合会议论文集gydF4y2Ba 2015gydF4y2Ba 计算语言学协会第53届年会论文集gydF4y2Ba 2015gydF4y2Ba 中国,北京gydF4y2Ba 1754gydF4y2Ba 1764gydF4y2Ba lampogydF4y2Ba VgydF4y2Ba AletrasgydF4y2Ba NgydF4y2Ba GeytigydF4y2Ba JgydF4y2Ba 邹gydF4y2Ba BgydF4y2Ba 考克斯gydF4y2Ba 我gydF4y2Ba 根据行为和语言推断社交媒体用户的社会经济地位gydF4y2Ba 2016gydF4y2Ba 第38届欧洲信息检索会议论文集gydF4y2Ba 2016gydF4y2Ba 意大利帕多瓦gydF4y2Ba 689gydF4y2Ba 695gydF4y2Ba 10.1007 / 978 - 3 - 319 - 30671 - 1 - _54gydF4y2Ba Yom-TovgydF4y2Ba EgydF4y2Ba Johansson-CoxgydF4y2Ba 我gydF4y2Ba lampogydF4y2Ba VgydF4y2Ba 海沃德gydF4y2Ba 交流gydF4y2Ba 利用社交媒体估计流感样疾病的二次发作率和连续间隔gydF4y2Ba 流感其他呼吸道病毒gydF4y2Ba 2015gydF4y2Ba 07gydF4y2Ba 9gydF4y2Ba 4gydF4y2Ba 191gydF4y2Ba 9gydF4y2Ba 10.1111 / irv.12321gydF4y2Ba 25962320gydF4y2Ba PMC4474495gydF4y2Ba
Baidu
map