这是一篇开放获取的文章,根据创作共用署名许可协议(https://creativecommons.org/licenses/by/4.0/)发布,该协议允许在任何媒体上不受限制地使用、分发和复制,前提是要正确引用最初发表在《医学互联网研究杂志》上的原始作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物链接,以及版权和许可信息。
到目前为止,台湾的感染率和病死率很低。取得这一重大成功的原因之一是,在有效追踪接触者以及管理和监视需要隔离的人方面更好地使用了大数据分析。
我们在此介绍一项独特的大数据分析应用,对象是与3000多名于2020年1月31日在台湾基隆港下船进行1日游的游客有过接触的台湾人,这是在2020年1月20日钻石公主号邮轮上发现一例指示病例后,于2020年2月5日在台湾基隆港下船的3千多名游客的5天前。
基于智能接触者追踪的移动传感器数据与其他大传感器监测数据交叉验证后,采用移动定位法和快速分析方法进行分析,共识别出627,386名潜在接触者。通过短信方式提供自我监测和自我隔离信息,并对有症状的接触者进行SARS-CoV-2检测。国家健康保险理赔大数据与因肺炎住院并被建议接受SARS-CoV-2筛查的患者中与COVID-19相关结果的随访有关。
截至2月29日,经逆转录聚合酶链式反应检测的67名接触者均为阴性,未发现确诊病例。截至2020年3月10日,接触人群随访发现的呼吸道综合征和肺炎病例比普通人群少。
带有智能接触者追踪的大数据分析、自动发送自我限制警报信息,以及使用医疗保险数据跟踪与COVID-19相关的结果,可以减少传统流行病学接触者追踪所需的资源。
台湾对COVID-19大流行的及时和快速反应,一直因其COVID-19确诊病例和病死率相对较低而受到赞誉[
在这里,我们提出了一个独特的例子,回顾性调查了大量与2020年1月31日停靠在台湾基隆的钻石公主号游轮上的乘客有过接触的人;利用COVID-19综合征自我隔离和自我监测的缓解计划;以及使用高效的大数据分析对这些接触者进行疾病监测,将这些接触者与国家健康保险索赔数据联系起来,以确定是否存在COVID-19和相关呼吸综合征。考虑到严重急性呼吸综合征冠状病毒2型(SARS-CoV-2)的潜伏期,鉴于乘客在台湾北部逗留的时间是2020年2月5日钻石公主号邮轮报告新冠病毒爆发的5天之前,中国经济与文化中心决定实施额外的预防措施,以进一步降低新冠病毒输入台湾的风险。
2020年1月21日,台湾首例从武汉返回台湾的患者被确诊为新冠肺炎。在此之后,台湾政府启动了防疫中心,以控制可能爆发的新冠肺炎[
尽管在第一次COVID-19流行期间(1月21日至2月9日)报告的病例不到20例,政府密切关注所有可能导致COVID-19传播的泄漏。实施策略包括边境管制、检疫和隔离。2020年1月28日,为应对新冠肺炎疫情,首次对来自中国等疫情流行地区的外国人实施入境限制。政府还密切关注2020年1月31日停靠在台湾基隆港的“钻石公主”号邮轮等进入台湾的邮轮。考虑到新冠病毒的潜伏期,当2020年2月5日在横滨停靠的钻石公主号游轮上报告新冠病毒爆发时,中国经济文化中心决定实施额外的预防措施,以进一步降低新冠病毒输入台湾的风险。这一意外事件造成了公众对社区传播的暂时恐慌[
2020年2月5日,在得知钻石公主号游轮爆发疫情后,中国文化文化中心于2020年2月6日立即成立了工作组,参与初步调查。建议对已经感染的乘客可能接触过的人进行接触者追踪。具体阐述了联系人调查与管理的设计与过程。
2020年1月31日,钻石公主号邮轮停靠基隆港,邮轮乘客进行了为期1天的旅行,团队设计了通过台湾行程追踪路线的可能解决方案。由于不可能对每一位乘客进行回顾性的个人访谈,为了克服确定联系人的位置和行程的障碍,主要采用了四种方法:穿梭巴士上的GPS、信用卡交易日志、闭路电视(CCTV)和移动位置数据。
在这四种方法中,移动地理定位方法是通过移动位置数据识别乘客路线的主流方法,能够提供更准确的接触地点和时间信息。该方法克服了从公交GPS、银行卡交易和闭路电视获取的信息不完整的缺点,这三种方法只能代表部分乘客。根据乘客的移动位置数据,使用这三种方法对被接触者的移动传感器估计的路线进行交叉验证。
2020年1月31日,3000多名乘客的移动位置数据来自5家当地移动电话公司。移动位置数据在距离真实移动位置150米的移动定位测量中收集,作为识别可能联系人的地理定位精度。移动定位方法可能不像GPS那样精确,但后者可能侵犯个人机密。根据多移动基站在早上5点至晚上8点之间暴露时间超过30分钟的漫游信号确定接触点位置,这些信号被识别为主要跟踪路线。根据国内五家电信运营商基站注册的移动信号,第一个挑战是识别基隆地区所有游客中的3000名乘客。根据记录,游轮从早上6点到下午6点停泊在港口。然后,我们检查了邮轮停靠基隆港前1小时至后2小时的数据。这证实了与邮轮同行的人的确切手机号码。
在收集了这些电话号码后,研究小组描绘了这些电话的大致位置。在当地政府的帮助下,我们发现大约34%的乘客乘坐穿梭巴士进行当地旅游,5.2%的乘客乘坐出租车,其余的乘客在港口或附近地区骑自行车或步行。超过24辆公共汽车和50辆出租车接受了采访和记录。旅行社提供的旅行路线进一步验证了估计的乘客路线。然后,该团队检查了每条路线的详细旅游信息,采访了港口地区的出租车司机,并整合所有信息,以更精确地确定乘客的居住位置。
这一阶段最重要的部分是确定乘客可能的位置。这也展示了如何利用混合不同数据源的大数据分析。
在第二阶段,我们利用上述乘客的手机位置信息,从可能的联系人中识别手机的传感器。携带手机,在距离标记地点500米范围内停留5分钟以上的市民,被归类为可能与2020年1月31日“钻石公主号”客轮乘客有过接触的人。
2020年2月7日,CECC通过公共预警系统以短信方式发出预警通知,提醒联系人启动缓解计划。建议潜在接触者在家隔离,以免参与公共集会,避免进一步接触。他们还被告知要自我监测与covid -19兼容的症状(发烧、咳嗽和呼吸短促),并在症状出现时求医。
2月9日,CECC向所有卫生保健提供者发送了一份通知,提到了这一事件和对潜在接触者的管理指导。建议卫生保健专业人员对有症状的接触者进行SARS-CoV-2检测。在检测后,有症状的接触者可能已按指示住院或回家进行自我隔离。还建议卫生保健专业人员主动与公共卫生当局联系,对接触者进行积极的后续行动。
为了捕获那些在接触人群中寻求医疗照顾但没有向公共卫生当局报告的人,我们使用国家健康保险索赔数据来跟踪所有潜在接触者的健康状况。确认了因肺炎住院的患者。对于那些仍在住院但未进行SARS-CoV-2检测的患者,告知医护人员患者的潜在接触史,并建议对其进行SARS-CoV-2筛查。
由于无症状感染者可能持续COVID-19发展很长时间,而且很难通过逆转录聚合酶链反应(RT-PCR)检测识别,比较台湾接触人群(n=627,386名居民)与普通人群(n=23,877,447名居民)的呼吸综合征和肺炎发病率的差异也是非常有趣的。在这些受试者中,呼吸综合征或肺炎病例的信息是通过与2020年1月31日至2020年3月10日全国健康保险索赔大数据库的链接确定的。在此期间,至少有一次门诊就诊采用ICD-10(国际疾病和相关健康问题统计分类,第10版)代码(“J00”至“J11”)的受试者被确定患有呼吸综合征。肺炎患者通过ICD-10编码(“J12-”到“J18”)进行识别。
根据2007年颁布的《台湾传染病控制法》,在SARS爆发四年后,在出现SARS- cov -2等新出现的传染病时,可以放弃授权或同意检索以政府为支持的与控制疾病爆发有关的个人信息。
为了评估向乘客途经的地区发送警报信息后,呼吸道综合征和肺炎的发病率是否显著增加,我们比较了接触人群和普通人群的这些发病率。计算两组之间的年龄标准化率。布雷斯洛和戴方法[
中心采取多种方式开展接触者追踪工作。其中包括由机构安排的行程、穿梭巴士的全球定位系统、信用卡交易记录、闭路电视、车牌识别系统和移动定位数据(
旅游行程:旅行社提出的旅游行程,提供行程安排和访问地点的信息。然而,这种方法只能追踪到部分乘客。此外,从行程中去一个地方的具体时间有时是不可靠的。
穿梭巴士GPS:考虑穿梭巴士GPS路线记录。然而,只有部分乘客使用穿梭巴士。其他人可以乘坐其他交通工具。
信用卡交易日志:使用信用卡交易日志的优点是个人、时间和空间的特殊性。困难在于这些数据的可获得性。即使可行,这个数据集也无法追踪到那些没有使用信用卡的人。
闭路电视和车辆牌照识别系统:为了追踪班车或私人交通工具的路线,闭路电视可以锁定特定的车辆或乘客。然而,CCTV的覆盖率并不是100%。此外,大量的乘客使闭路电视追踪和车牌识别不可能。
高速公路电子收费系统:所有通过国家高速公路的车辆都经过台湾电子收费系统的检查。它可以追踪一个特定的人或车辆,但当乘客数量很多时就不可行了。
移动定位数据:使用手机出行的乘客可以通过移动定位服务追踪到特定的时间和空间。此外,同样的信息可以应用于向可能与乘客有接触的公民发送警告信息。然而,这种方法可能会错过那些没有携带手机的人,但这是一个非常罕见的情况在台湾。
最后,考虑到其特殊性、可行性和最大的乘客覆盖范围,CECC最终决定使用移动定位数据进行接触者追踪和警报信息传递。应该注意的是,除了出于隐私考虑的信用卡交易之外,还使用了其他方法进行交叉验证。
为钻石公主号邮轮在台湾1日游期间的旅客提供潜在的接触追踪方法。
数字记录 | 调查 | 困难 |
旅行社提供旅游指南 | 追踪旅行路线 |
不能追踪那些乘坐出租车或独立机构的人 不能确定确切的访问时间 |
公共汽车GPS | 追踪巴士经过的地点 |
不能追踪那些乘坐出租车或独立机构的人 |
信用卡交易 | 通过购物记录追踪旅行路线 |
并非所有乘客都使用信用卡 |
中央电视台一个以及车牌识别系统 | 追踪旅行路线 |
大量乘客 取决于闭路电视的位置 时间消耗 |
全国高速公路上的电子收费系统 | 追踪巴士经过的地点 |
适用于有限路线 |
移动电话定位系统 | 追踪个人旅游路线 |
仅适用于使用手机漫游服务的用户 |
一个闭路电视。
2020年1月31日台湾一日游的旅客路线。
根据三个城市(基隆、新北市、台北)的乘客路线标记的位置进行警告信息的广播。标记地点:(1)基隆:基隆外母山、基隆中正公园、基隆文化馆、仙东、基隆、正滨渔港、基隆和平岛、基隆港、庙口夜市、白米炮台、基隆、基隆中正区钓鱼河街、基隆市。(2)新北市:石芬老街、九分、石芬瀑布、新北市、叶柳地质公园、南亚奇石、瑞坊区、新北市、龟吼区、万里区、碧沙渔港。(3)台北市:南门市集、国立革命烈士陵园、中山大礼堂、国立中正纪念堂、台北市、孔庙、自由广场、西门町、忠孝东路四段、台北市、大龙洞宝安寺、故宫博物院、帝化街、竹子湖、阳明山、台北大饭店、西昌街:龙山寺、台北市总站、太平洋崇光(复兴)、台北市。
根据移动位置信息,我们确定了627,386个相应的可能联系人。2020年2月7日,在确定接触者后,通过短信发送了症状监测和自我隔离信息。警报消息(
位置的规格可以显示在
演示(A)警报消息和(B)与谷歌地图集成的联系人位置。
截至2月14日,有20名有症状的接触者遵照警报信息的指导就医。所有人都接受了COVID-19检测,结果均为阴性。
截至2月29日,在接触人群中共确认有121例因肺炎住院。共报告了24名接触者疑似COVID-19病例,所有检测均为阴性。在41名仍在住院的接触者中,23人接受了COVID-19检测,所有结果均为阴性。
在2020年1月31日至3月10日的监测期间,接触人群的呼吸综合征年龄标准化发病率(16.87‰)低于一般人群(19.23‰;
暴露组和未暴露组的呼吸综合征/肺炎病例、发病率和相对比例。
疾病 |
暴露组(n=627,386) |
未暴露组(n=23,877,447) |
|
|
|||
|
病例数,n (%) | 105837 (16.87) | 4592694 (19.23) |
|
预期病例数,n (%) | 113920 (18.16) | N/A一个 |
|
粗相对比(95% CI) | 0.877 (0.872 - -0.882) | 1.00 |
|
年龄标准化相对比率(95% CI) | 0.929 (0.923 - -0.935) | 1.00 |
|
|||
|
病例数,n (%) | 1479 (0.236) | 91066 (0.381) |
|
预期病例数,n (%) | 1616 (0.26) | N/A |
|
粗相对比(95% CI) | 0.618 (0.587 - -0.651) | 1.00 |
|
年龄标准化相对比率(95% CI) | 0.915 (0.869 - -0.963) | 1.00 |
一个N/A:不适用。
尽管旨在降低人口接触率的公共卫生干预措施已证明其在控制大流行方面的效力[
为了快速追踪潜在的接触者,使用被动移动定位数据首先确定了邮轮乘客可能去过的许多地点。这些数据在移动服务提供商的网络单元中的转换存储了呼叫活动的位置。这些数据不仅可以监测旅游团的流动情况,还可以识别与旅游团有接触的人。这种移动地理定位方法也被用于一项移动健康研究,以衡量人类的流动性、疾病连通性和旅行者的健康风险[
根据我们的机动性和地理移动位置分析,总共有627,386名公民可能在钻石公主号游轮上与乘客接触。通过手机短信向这些人发送综合症监测和自我隔离信息,以减少可能的社区传播。尽管每个旅行者超过190个接触者可能不现实,但在这种紧急情况下,作为防止COVID-19传播的一个步骤,在不造成伤害的情况下增加目标接触人群是可以接受的。此外,应该注意到,在危机期间为决策提供准确、及时的信息至关重要。自从暴露受感染的宿主已经有好几天了。必须毫不拖延地迅速执行利用信息技术追踪和管理接触者的工作。这是利用大数据技术进行分析的优势之一。在抗击新冠肺炎疫情方面,类似的大数据技术应用于患者的空间跟踪,追踪病毒传播和潜在的时空暴露,支持快速分析的流行病学调查[
在评估带有警报信息的居家自我隔离政策的影响时,在这一接触人群中没有确定COVID-19确诊病例。此外,我们利用国家健康保险索赔数据库促进对严重呼吸道症状监测的另一个大数据分析。与未接触组相比,暴露组(接触人群)出现轻微或严重呼吸道症状的风险较低。除了预防SARS-CoV-2的传播外,这可能是因为警报信息增强了患者对自身健康状况的意识,增强了个人自给自足的生活方式。
本研究从大数据技术的角度出发,确定了通过大数据技术实现移动定位的方法是一种从附近人群的流动性出发,实现地理路线采集和绘制移动定位图,进行接触追踪的有效方法。通过创新技术体系,快速搭建疫情分析平台,支持疫情及时分析。
更重要的是,与使用传统的流行病学接触者调查方法相比,采用大传感器数据分析的智能接触者追踪应用于可能感染COVID-19的接触者调查也具有成本效益,因为成本和人力都将大幅减少。
我们的方法有一个主要的局限性。本研究中确定的潜在联系人往往包括更多的工作人口和学生,因为那些没有手机的人更可能是非常年轻或老年人,这些人很难被智能联系人追踪技术追踪。这一弱点可以通过提供一个积极的监测系统来解决,以便他们与当地卫生当局联系。
本研究通过大数据分析,证明了在钻石公主号邮轮潜在感染者的接触危机中,成功预防了新冠肺炎的社区传播。这是大数据技术如何应用于合同追踪和检疫,以支持新病毒感染的流行病学监测的一个例子。
闭路电视
中央疫情指挥中心
冠状病毒病
《疾病和有关健康问题国际统计分类》第十版
严重急性呼吸综合征冠状病毒
世界卫生组织
本研究由国立台湾大学公共卫生学院“人口健康与可持续环境创新与政策中心(人口健康研究中心,PHRC)”资助,隶属于台湾教育部高等教育萌芽计划的特色区域研究中心项目。
C-MC和C-CC为研究概念和设计做出了贡献。H-WJ、S-CC、P-CL、C-FL、Y-TY和M-YC有助于数据的获取。H-HJ和C-YH对统计分析有贡献。L-SC和H-HC有助于解释结果。C-MC起草了手稿。所有的作者都对手稿作了最后的认可。
没有宣布。