发表在gydF4y2Ba在gydF4y2Ba第22卷gydF4y2Ba,第9号gydF4y2Ba(2020)gydF4y2Ba: 9月gydF4y2Ba

本文的预印本(早期版本)可在gydF4y2Bahttps://preprints.www.mybigtv.com/preprint/19788gydF4y2Ba,首次出版gydF4y2Ba。gydF4y2Ba
了解韩国社区对COVID-19疫情的风险认知:信息流行病学研究gydF4y2Ba

了解韩国社区对COVID-19疫情的风险认知:信息流行病学研究gydF4y2Ba

了解韩国社区对COVID-19疫情的风险认知:信息流行病学研究gydF4y2Ba

原始论文gydF4y2Ba

1gydF4y2Ba台北医科大学医学科技学院生物医学资讯研究所,台湾台北gydF4y2Ba

2gydF4y2Ba印度尼西亚日惹Gadjah Mada大学医学、公共卫生和护理学院生物统计、流行病学和人口健康系gydF4y2Ba

3.gydF4y2Ba韩国崇实大学数学系,首尔gydF4y2Ba

4gydF4y2Ba台北医科大学医院临床大数据研究中心,台北,台湾gydF4y2Ba

5gydF4y2Ba台北医科大学医学人工智能研究中心,台北,台湾gydF4y2Ba

通讯作者:gydF4y2Ba

苏佳玉博士gydF4y2Ba

生物医学信息学研究所gydF4y2Ba

医学科学技术学院gydF4y2Ba

台北医科大学gydF4y2Ba

基隆路172-1号二段gydF4y2Ba

台北,106年gydF4y2Ba

台湾gydF4y2Ba

电话:886 2 66382736转1515gydF4y2Ba

电子邮件:gydF4y2Baemilysu@tmu.edu.twgydF4y2Ba


背景:gydF4y2Ba韩国是在应对冠状病毒大流行方面表现最好的国家之一,采取了大规模驾车通过检测、使用口罩和广泛的社交距离。然而,了解风险认知模式也可促进有效的风险沟通,以尽量减少危机期间疾病传播的影响。gydF4y2Ba

摘要目的:gydF4y2Ba我们试图利用互联网搜索数据探索韩国社区对COVID-19的健康风险认知模式。gydF4y2Ba

方法:gydF4y2Ba谷歌趋势(GT)和NAVER的相对搜索量(rsv)数据是用韩国语收集的,按照时间、性别、年龄、设备类型、位置等进行检索。将在线查询与2019年12月5日至2020年5月31日期间Kaggle开放获取数据集中报告的每日新增COVID-19病例和检测数量进行了比较。采用Spearman秩相关系数计算的时滞相关性来评估新发病例与网络搜索之间的相关性是否受到时间的影响。我们还利用COVID-19病例数、检测结果以及滞后期(1-3天)的GT和NAVER rsv构建了新发COVID-19病例的预测模型。采用反向消去和方差膨胀因子<5的单次和多次回归。gydF4y2Ba

结果:gydF4y2Ba在本地传播、批准冠状病毒检测试剂盒、实施冠状病毒免刷检测、口罩短缺、广泛开展社交距离运动等地方事件以及世界卫生组织宣布国际关注的突发公共卫生事件等国际事件期间,韩国与covid -19相关的查询数量有所增加。女性在网上的询问率也更高(gydF4y2BargydF4y2Ba= 0.763 - -0.823;gydF4y2BaPgydF4y2Ba<.001)及年龄组别≤29岁(gydF4y2BargydF4y2Ba= 0.726 - -0.821;gydF4y2BaPgydF4y2Ba<.001), 30-44岁(gydF4y2BargydF4y2Ba= 0.701 - -0.826;gydF4y2BaPgydF4y2Ba<.001),≥50岁(gydF4y2BargydF4y2Ba= 0.706 - -0.725;gydF4y2BaPgydF4y2Ba<措施)。在空间分布上,受灾地区的互联网搜索数据较高。此外,在移动搜索中发现更大的相关性(gydF4y2BargydF4y2Ba= 0.704 - -0.804;gydF4y2BaPgydF4y2Ba<.001)与桌面搜索(gydF4y2BargydF4y2Ba= 0.705 - -0.717;gydF4y2BaPgydF4y2Ba<.001),表明在疫情爆发期间搜索在线健康信息的行为发生了变化。这些与COVID-19相关的不同互联网搜索代表了社区对健康风险的看法。此外,作为冠状病毒检测数量众多的国家,结果显示,成年人认为冠状病毒检测相关信息比疾病相关知识更重要。与此同时,年轻人和老年人的看法不同。此外,NAVER rsv可能用于健康风险感知评估和疾病预测。与基于COVID-19病例的模型相比,添加NAVER提供的COVID-19相关搜索可以提高模型的性能,并有可能用于预测流行曲线。gydF4y2Ba

结论:gydF4y2Ba使用GT和NAVER rsv来探索社区健康风险认知模式可能有利于从几个角度(包括时间、人口特征和地点)进行风险沟通。gydF4y2Ba

医学与互联网学报,2020;22(9):e19788gydF4y2Ba

doi: 10.2196/19788gydF4y2Ba

关键字gydF4y2Ba



世界卫生组织于2020年3月11日宣布新冠肺炎疫情为大流行[gydF4y2Ba1gydF4y2Ba]。截至2020年5月31日,全球已有5934936人感染该疾病。gydF4y2Ba2gydF4y2Ba包括在韩国的11468人。2020年1月20日,韩国确诊了首例新冠肺炎病例[gydF4y2Ba3.gydF4y2Ba]。2020年2月19日之前报告了疾病传播缓慢上升;在大邱观察到的地方聚集导致新病例数每天都在增加[gydF4y2Ba4gydF4y2Ba]。采取了许多方法来预防疾病传播,包括冠状病毒驾车通过检测和保持社交距离[gydF4y2Ba5gydF4y2Ba,gydF4y2Ba6gydF4y2Ba]。冠状病毒免下车检测被认为是一种安全有效的筛查方法,每次检测大约需要10分钟,从而最大限度地减少了被检测人群之间的交叉感染[gydF4y2Ba6gydF4y2Ba]。迄今为止,与疫情高峰期(2020年2月19日至3月15日)相比,日均新增病例数减少了10倍以上[gydF4y2Ba3.gydF4y2Ba]。因此,韩国被认为是应对新冠疫情表现最好的国家之一。gydF4y2Ba

相反,充分的风险通报也可能有助于尽量减少疾病传播的影响[gydF4y2Ba7gydF4y2Ba]。因此,在大流行期间,世卫组织建议定期进行风险沟通,向公众和利益攸关方通报大流行状况的任何变化[gydF4y2Ba8gydF4y2Ba]。这一行动可能具有挑战性,因为适当的风险沟通需要对风险认知有充分的了解,这有助于确定公众需要哪些知识。[gydF4y2Ba7gydF4y2Ba]。然而,探索风险认知的研究通常采用调查方法或内容分析[gydF4y2Ba7gydF4y2Ba,gydF4y2Ba9gydF4y2Ba-gydF4y2Ba11gydF4y2Ba],这需要更多的资源和更长的时间。特别是,在调查一种新出现的疾病时,这些方法可能负担得起,因为卫生系统将因卫生保健使用激增而负担过重,从而导致评估社区卫生风险认知的更多障碍。gydF4y2Ba

因此,本研究旨在利用互联网搜索数据探索韩国社区对COVID-19的健康风险认知模式。这项研究是1996年首次引入的信息流行病学研究的一部分[gydF4y2Ba12gydF4y2Ba],并探讨互联网上的资讯分发情况[gydF4y2Ba13gydF4y2Ba为公共卫生和有关人口实际情况的政策提供建议。信息流行病学通常研究与疾病有关的主题以及疾病的爆发和流行[gydF4y2Ba14gydF4y2Ba]。这是可行的方法,因为互联网查询数据可以方便、迅速地提供,[gydF4y2Ba15gydF4y2Ba],并以符合成本效益的方式与调查方法比较[gydF4y2Ba16gydF4y2Ba],它可以近乎实时地捕获异常模式[gydF4y2Ba17gydF4y2Ba]。gydF4y2Ba

在本次分析中,我们使用了谷歌趋势(GT)和NAVER提供的与新冠肺炎相关的互联网搜索数据,代表了全球最大的搜索引擎和韩国本土搜索引擎的在线查询量,这些搜索引擎在韩国的市场份额高于谷歌[gydF4y2Ba18gydF4y2Ba]。本研究从流行病学研究中使用的时间、人口特征和地点等几个不同角度探讨了公众对正在发生的疫情的卫生风险认知模式。我们还利用COVID-19病例数、检测结果以及滞后期(1-3天)的GT和NAVER相对搜索量(rsv)构建了新发COVID-19病例的预测模型。未来的研究有必要确定在疾病爆发的早期阶段进行有效风险沟通的最佳滞后期。gydF4y2Ba


数据集gydF4y2Ba

从2020年1月20日至5月31日,每日新增COVID-19病例数和冠状病毒检测数来自Kim及其同事收集的Kaggle开放获取数据[gydF4y2Ba3.gydF4y2Ba]。我们使用Time.csv数据集检索每日新增COVID-19病例数和每日检测数,使用TimeProvince.csv数据集按地区收集累积冠状病毒病例数。这些数据集涵盖了韩国所有城市。此外,从GT检索了与COVID-19相关的互联网搜索数据[gydF4y2Ba19gydF4y2Ba]及NAVER网站[gydF4y2Ba20.gydF4y2Ba在相同的搭配中。搜索的信息是在2019年12月5日起的6周前收集的,目的是探索韩国出现首例COVID-19病例之前的模式。使用与covid -19相关的术语收集数据,包括冠状病毒()、冠状病毒测试()、中东呼吸综合征(MERS;在韩语中使用的数据包括:使用韩语时使用的数据有:使用韩语时使用的数据有:使用韩语时使用的数据有:使用韩语时的数据有:使用韩语时的数据有:使用韩语时的数据有:使用韩语时的数据;使用韩语时的数据有:使用韩语时的数据;这些关键词用于表示在线信息搜索,包括与covid -19相关的信息、个人防护措施和预防方法。使用中东呼吸综合征的特定关键词来评估在疫情爆发的早期,使用先前研究报告的与中东呼吸综合征相关的特定术语的信息搜索是否有所增加[gydF4y2Ba21gydF4y2Ba]。此外,“新天地”关键词也被用来收集新天地教堂集群后的在线信息搜索,并定义该集群是否引发了在线信息搜索的激增。对于多于一个单词的术语,如早期的GT研究框架所建议的那样,使用引号来提高GT和NAVER中数据的准确性[gydF4y2Ba22gydF4y2Ba]。还使用了GT查询的运行状况类别和web搜索选项。gydF4y2Ba

从GT和NAVER检索的在线搜索数据显示为一个相对数字,称为RSVs,范围从0到100。RSVs表示向这些搜索引擎发出的搜索请求。对于GT,根据相应的时间和位置对特定项的rsv进行归一化[gydF4y2Ba23gydF4y2Ba]。可在不同时间及地点下载GT rsv [gydF4y2Ba19gydF4y2Ba],而NAVER提供了不同时间、性别、年龄和设备类别类型的查询[gydF4y2Ba20.gydF4y2Ba]。gydF4y2Ba

统计分析gydF4y2Ba

使用2020年1月20日至3月22日的数据分析对COVID-19的健康风险认知。之所以选择这个时间范围,是因为本研究的目的是探索在疫情爆发的最初几周内代表健康风险认知的互联网搜索模式。以单一图形形式分析数据,以探索新发COVID-19病例的趋势、检测数量和每天的互联网搜索量。采用Spearman秩相关系数计算的时滞相关性来评估新发病例与GT和NAVER rsv的相关性是否受到滞后期或超前期3天内时间的影响。使用Stata 13 (StataCorp)进行统计分析,并将强相关性定义为相关系数gydF4y2BargydF4y2Ba> 0.7。此外,还生成了使用Tableau Public 2020 (Tableau Software, Inc .)创建的多层地图,以定义新发COVID-19病例和互联网搜索的分布。gydF4y2Ba

本研究还承担了预测新发病例的任务。使用几个预测指标,包括COVID-19病例数、检测结果以及滞后期(1-3天)的GT和NAVER rsv,来预测目标变量,即新发COVID-19病例数。在Stata 13中,使用单线性和多元线性回归计算预测值,采用反向消除和方差膨胀因子(VIF) <5。较低的VIF水平被认为可以最小化模型中多重共线性的存在,特别是在流行病学研究中[gydF4y2Ba24gydF4y2Ba]。使用健康风险感知分析中使用的发展数据集(2020年1月20日至3月22日)构建模型,并使用未来验证数据集(2020年3月23日至5月31日)进行验证。用均方根误差(RMSE)来评价模型的性能,用赤池信息准则(AIC)来选择正确的模型,用贝叶斯信息准则(BIC)来寻找未来预测的最佳模型[gydF4y2Ba25gydF4y2Ba]。gydF4y2Ba


由GT和NAVER rsv捕获的社区健康风险感知分为几个部分,包括时间、人口特征和地点的模式。gydF4y2Ba

每日新增COVID-19病例趋势、检测数量和互联网搜索量gydF4y2Ba

韩国于2020年1月20日报告了首例新冠肺炎病例(gydF4y2Ba图1gydF4y2Ba截至2020年5月31日,出现了四个疾病传播高峰。第一个高峰发生在2020年2月18日。自3月16日以来,平均每天新增病例增加到311例,减少到每天50例。第四次高峰出现在2020年5月8日,与2020年5月6日实施新常态相对应[gydF4y2Ba26gydF4y2Ba]。此外,截至2020年5月31日,韩国报告了11468例新冠肺炎病例。疫情爆发期间还进行了大量检测。从1月20日到5月31日,韩国平均每天进行6848次检测,总检测次数为91.0822万次,是世界上检测次数最多的国家之一。gydF4y2Ba

‎gydF4y2Ba
图1所示。韩国新发COVID-19病例的时间序列和检测数量。gydF4y2Ba
查看此图gydF4y2Ba

在疫情期间,GT和NAVER捕获的冠状病毒信息搜索趋势相似(gydF4y2Ba图2gydF4y2Ba).2020年1月的第二周和第五周以及2月的第四周出现了三个互联网搜索高峰。在2019年12月12日武汉报告首例COVID-19病例后的几天里,与冠状病毒相关的搜索量一直很高,与MERS相关的搜索量在最后两个高峰期间也有所上升。然而,随着1月20日韩国发现首例新冠肺炎病例,以及1月30日世界卫生组织宣布进入国际关注的突发公共卫生事件(PHEIC),大量的信息搜索出现了。与每日新增病例数据相比,GT和NAVER提供的信息搜索量在7-9天前达到峰值。冠状病毒搜索的第三个高峰可能与本地传播导致的新冠肺炎病例数量大幅增加相对应。即使在世界卫生组织于2020年3月11日宣布疫情为大流行之后,搜索量也逐渐减少[gydF4y2Ba1gydF4y2Ba]。gydF4y2Ba

‎gydF4y2Ba
图2。新冠肺炎病例的时间序列以及与韩国冠状病毒和中东呼吸综合征相关的谷歌趋势和NAVER相对搜索量。中东呼吸综合征;卫生组织:世界卫生组织。gydF4y2Ba
查看此图gydF4y2Ba

此外,在GT中没有捕获到与冠状病毒测试相关的()搜索;因此,gydF4y2Ba图3gydF4y2Ba仅说明与冠状病毒检测、口罩和社交距离相关的NAVER rsv。在报告COVID-19病例数周后,在2020年2月7日冠状病毒检测试剂盒获得批准之前,互联网搜索量有所增加[gydF4y2Ba27gydF4y2Ba]。第二波信息搜索出现在2020年2月的第三周,这可能是由于2020年2月23日新发COVID-19病例数量增加以及新冠病毒免刷检测的实施[gydF4y2Ba6gydF4y2Ba]。然而,与每日检测数量相比,与冠状病毒检测相关的搜索模式似乎更接近于新冠病毒病例的趋势。gydF4y2Ba

‎gydF4y2Ba
图3。韩国每日冠状病毒检测次数和NAVER与冠状病毒检测、口罩和保持社交距离相关的相对搜索量的时间序列。CDC:美国疾病控制与预防中心。gydF4y2Ba
查看此图gydF4y2Ba

关于口罩的冠状病毒测试的在线查询模式也类似。从个人防护措施来看,2月初人们开始搜索冠状病毒检测和口罩短缺的同一时期,与口罩相关的查询数量有所增加[gydF4y2Ba28gydF4y2Ba],并在2月下旬逐渐下降,因为联邦政府定期提供口罩供应[gydF4y2Ba29gydF4y2Ba]。此外,本地感染病例的大量增加也引发了与社交距离相关的互联网搜索(“保持社交距离”)作为预防措施之一。随着2020年3月第一周在韩国开展广泛的保持社交距离运动,这些搜索达到了顶峰[gydF4y2Ba5gydF4y2Ba]。相比之下,随着2020年2月18日新天地星团被发现,与新天地星团相关的搜索量增加了[gydF4y2Ba30.gydF4y2Ba],此后逐渐下降,甚至在2020年2月29日新发病例激增达到峰值之前(gydF4y2Ba图4gydF4y2Ba).gydF4y2Ba

‎gydF4y2Ba
图4。新冠肺炎病例时间序列、谷歌趋势、NAVER与韩国新天地群集相关的相对搜索量。gydF4y2Ba
查看此图gydF4y2Ba

新发COVID-19病例与不同性别和年龄组互联网搜索的时滞相关性gydF4y2Ba

结果是gydF4y2Ba表1gydF4y2Ba和gydF4y2Ba2gydF4y2Ba表现出适度的相关性(gydF4y2BargydF4y2Ba=0.628),新发病例与冠状病毒相关的GT rsv之间存在3天滞后。相反,两者之间有很强的相关性(gydF4y2BargydF4y2Ba=0.718),男性和女性的冠状病毒信息搜索计数滞后3天,NAVER rsv无差异。然而,这种相关性在不同的年龄组和滞后期有所不同。所有年龄段的人都有3天的滞后,相关性很强(gydF4y2BargydF4y2Ba=0.729)及年龄≤18岁(gydF4y2BargydF4y2Ba=0.821), 19 ~ 24岁(gydF4y2BargydF4y2Ba=0.784), 25-29岁(gydF4y2BargydF4y2Ba=0.726), 50-54岁(gydF4y2BargydF4y2Ba=0.706),≥50岁(gydF4y2BargydF4y2Ba= 0.725)。与此同时,35-39岁年龄组的相关性最弱。gydF4y2BargydF4y2Ba= 0.622)。NAVER rsv在≤18岁和19-24岁年龄组几乎所有滞后期和先导期都有很强的相关性。此外,在GT和NAVER rsv的新发COVID-19病例数增加的前置期或几天后,相关性的强度下降。与NAVER rsv相比,冠状病毒的GT rsv与新发病例的相关性较弱。gydF4y2Ba

表1。新冠肺炎确诊病例与谷歌趋势、NAVER相关搜索量之间的时差相关系数。gydF4y2Ba
一天gydF4y2Ba 谷歌趋势gydF4y2Ba NAVERgydF4y2Ba


性别gydF4y2Ba 年龄组别(岁)gydF4y2Ba


男人gydF4y2Ba 女性gydF4y2Ba 整体gydF4y2Ba ≤18gydF4y2Ba 19到24gydF4y2Ba 25 - 29gydF4y2Ba - 34gydF4y2Ba 35-39gydF4y2Ba 40-44gydF4y2Ba 45-49gydF4y2Ba 50 - 54gydF4y2Ba ≥55gydF4y2Ba
- - - - - -gydF4y2Ba3天gydF4y2Ba

rgydF4y2Ba 0.628gydF4y2Ba一个gydF4y2Ba 0.718gydF4y2Baa、bgydF4y2Ba 0.718gydF4y2Ba一个gydF4y2Ba 0.729gydF4y2Ba一个gydF4y2Ba 0.821gydF4y2Ba一个gydF4y2Ba 0.784gydF4y2Ba一个gydF4y2Ba 0.726gydF4y2Ba一个gydF4y2Ba 0.661gydF4y2Ba一个gydF4y2Ba 0.622gydF4y2Ba一个gydF4y2Ba 0.648gydF4y2Ba一个gydF4y2Ba 0.685gydF4y2Ba一个gydF4y2Ba 0.706gydF4y2Ba一个gydF4y2Ba 0.725gydF4y2Ba一个gydF4y2Ba

PgydF4y2Ba价值gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba
- - - - - -gydF4y2Ba2天gydF4y2Ba

rgydF4y2Ba 0.605gydF4y2Ba 0.684gydF4y2Ba 0.684gydF4y2Ba 0.694gydF4y2Ba 0.805gydF4y2Ba 0.759gydF4y2Ba 0.696gydF4y2Ba 0.621gydF4y2Ba 0.581gydF4y2Ba 0.607gydF4y2Ba 0.655gydF4y2Ba 0.680gydF4y2Ba 0.693gydF4y2Ba

PgydF4y2Ba价值gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba
- - - - - -gydF4y2Ba1天gydF4y2Ba

rgydF4y2Ba 0.590gydF4y2Ba 0.670gydF4y2Ba 0.670gydF4y2Ba 0.681gydF4y2Ba 0.812gydF4y2Ba 0.759gydF4y2Ba 0.678gydF4y2Ba 0.601gydF4y2Ba 0.561gydF4y2Ba 0.593gydF4y2Ba 0.638gydF4y2Ba 0.662gydF4y2Ba 0.682gydF4y2Ba

PgydF4y2Ba价值gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba
0天gydF4y2Ba

rgydF4y2Ba 0.576gydF4y2Ba 0.654gydF4y2Ba 0.654gydF4y2Ba 0.663gydF4y2Ba 0.803gydF4y2Ba 0.737gydF4y2Ba 0.659gydF4y2Ba 0.578gydF4y2Ba 0.538gydF4y2Ba 0.565gydF4y2Ba 0.606gydF4y2Ba 0.634gydF4y2Ba 0.655gydF4y2Ba

PgydF4y2Ba价值gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba
1天gydF4y2Ba

rgydF4y2Ba 0.554gydF4y2Ba 0.647gydF4y2Ba 0.647gydF4y2Ba 0.661gydF4y2Ba 0.794gydF4y2Ba 0.736gydF4y2Ba 0.660gydF4y2Ba 0.579gydF4y2Ba 0.536gydF4y2Ba 0.560gydF4y2Ba 0.606gydF4y2Ba 0.633gydF4y2Ba 0.658gydF4y2Ba

PgydF4y2Ba价值gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba
2天gydF4y2Ba

rgydF4y2Ba 0.505gydF4y2Ba 0.591gydF4y2Ba 0.591gydF4y2Ba 0.606gydF4y2Ba 0.759gydF4y2Ba 0.688gydF4y2Ba 0.600gydF4y2Ba 0.513gydF4y2Ba 0.477gydF4y2Ba 0.508gydF4y2Ba 0.554gydF4y2Ba 0.580gydF4y2Ba 0.606gydF4y2Ba

PgydF4y2Ba价值gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba
3天gydF4y2Ba

rgydF4y2Ba 0.491gydF4y2Ba 0.579gydF4y2Ba 0.579gydF4y2Ba 0.597gydF4y2Ba 0.749gydF4y2Ba 0.682gydF4y2Ba 0.587gydF4y2Ba 0.500gydF4y2Ba 0.468gydF4y2Ba 0.498gydF4y2Ba 0.537gydF4y2Ba 0.565gydF4y2Ba 0.592gydF4y2Ba

PgydF4y2Ba价值gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba

一个gydF4y2Ba每列的相关性最强。gydF4y2Ba

bgydF4y2Ba斜体表示与gydF4y2BargydF4y2Ba> 0.7。gydF4y2Ba

表2。新冠肺炎病例、谷歌趋势和NAVER与韩国冠状病毒检测相关的相对搜索量之间的滞后相关系数。gydF4y2Ba
一天gydF4y2Ba 谷歌趋势gydF4y2Ba NAVERgydF4y2Ba


性别gydF4y2Ba 年龄组别(岁)gydF4y2Ba


男人gydF4y2Ba 女性gydF4y2Ba 整体gydF4y2Ba ≤18gydF4y2Ba 19到24gydF4y2Ba 25 - 29gydF4y2Ba - 34gydF4y2Ba 35-39gydF4y2Ba 40-44gydF4y2Ba 45-49gydF4y2Ba 50 - 54gydF4y2Ba ≥55gydF4y2Ba
- - - - - -gydF4y2Ba3天gydF4y2Ba

rgydF4y2Ba N/AgydF4y2Ba一个gydF4y2Ba 0.739gydF4y2BabgydF4y2Ba 0.769gydF4y2Ba 0.770gydF4y2Ba 0.595gydF4y2BacgydF4y2Ba 0.681gydF4y2Ba 0.654gydF4y2Ba 0.701gydF4y2Ba 0.734gydF4y2Ba 0.696gydF4y2Ba 0.624gydF4y2Ba 0.612gydF4y2BacgydF4y2Ba 0.441gydF4y2Ba

PgydF4y2Ba价值gydF4y2Ba
<措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba
- - - - - -gydF4y2Ba2天gydF4y2Ba

rgydF4y2Ba N/AgydF4y2Ba 0.769gydF4y2Ba 0.790gydF4y2Ba 0.797gydF4y2Ba 0.505gydF4y2Ba 0.650gydF4y2Ba 0.687gydF4y2Ba 0.752gydF4y2Ba 0.786gydF4y2Ba 0.692gydF4y2Ba 0.673gydF4y2BacgydF4y2Ba 0.581gydF4y2Ba 0.445gydF4y2Ba

PgydF4y2Ba价值gydF4y2Ba
<措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba
- - - - - -gydF4y2Ba1天gydF4y2Ba

rgydF4y2Ba N/AgydF4y2Ba 0.795gydF4y2Bab, cgydF4y2Ba 0.799gydF4y2Ba 0.824gydF4y2Ba 0.500gydF4y2Ba 0.725gydF4y2BacgydF4y2Ba 0.645gydF4y2Ba 0.775gydF4y2Ba 0.826gydF4y2BacgydF4y2Ba 0.704gydF4y2Ba 0.630gydF4y2Ba 0.532gydF4y2Ba 0.434gydF4y2Ba

PgydF4y2Ba价值gydF4y2Ba
<措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba
0天gydF4y2Ba

rgydF4y2Ba N/AgydF4y2Ba 0.778gydF4y2Ba 0.799gydF4y2Ba 0.812gydF4y2Ba 0.542gydF4y2Ba 0.720gydF4y2Ba 0.653gydF4y2Ba 0.746gydF4y2Ba 0.783gydF4y2Ba 0.755gydF4y2BacgydF4y2Ba 0.559gydF4y2Ba 0.551gydF4y2Ba 0.358gydF4y2Ba

PgydF4y2Ba价值gydF4y2Ba
<措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba
1天gydF4y2Ba

rgydF4y2Ba N/AgydF4y2Ba 0.775gydF4y2Ba 0.823gydF4y2BacgydF4y2Ba 0.828gydF4y2BacgydF4y2Ba 0.508gydF4y2Ba 0.682gydF4y2Ba 0.688gydF4y2BacgydF4y2Ba 0.786gydF4y2BacgydF4y2Ba 0.814gydF4y2Ba 0.718gydF4y2Ba 0.586gydF4y2Ba 0.557gydF4y2Ba 0.450gydF4y2BacgydF4y2Ba

PgydF4y2Ba价值gydF4y2Ba
<措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba
2天gydF4y2Ba

rgydF4y2Ba N/AgydF4y2Ba 0.756gydF4y2Ba 0.802gydF4y2Ba 0.805gydF4y2Ba 0.549gydF4y2Ba 0.620gydF4y2Ba 0.623gydF4y2Ba 0.774gydF4y2Ba 0.762gydF4y2Ba 0.731gydF4y2Ba 0.586gydF4y2Ba 0.537gydF4y2Ba 0.433gydF4y2Ba

PgydF4y2Ba价值gydF4y2Ba
<措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba
3天gydF4y2Ba

rgydF4y2Ba N/AgydF4y2Ba 0.744gydF4y2Ba 0.763gydF4y2Ba 0.781gydF4y2Ba 0.465gydF4y2Ba 0.572gydF4y2Ba 0.606gydF4y2Ba 0.694gydF4y2Ba 0.756gydF4y2Ba 0.633gydF4y2Ba 0.633gydF4y2Ba 0.518gydF4y2Ba 0.424gydF4y2Ba

PgydF4y2Ba价值gydF4y2Ba
<措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba

一个gydF4y2Ba-不适用。gydF4y2Ba

bgydF4y2Ba斜体表示与r>0.7的强相关性。gydF4y2Ba

cgydF4y2Ba每列的相关性最强。gydF4y2Ba

在冠状病毒检测相关的搜索中发现了不同的模式。由于记录的查询数量不足,无法计算GT rsv的相关性。男性的睡眠滞后1天,两者之间存在很强的相关性(gydF4y2BargydF4y2Ba=0.795),女性领先1天(gydF4y2BargydF4y2BaNAVER RSVs =0.823),以及领先1天的所有年龄组(gydF4y2BargydF4y2Ba= 0.828)。此外,在不同年龄组中,有弱相关性到强相关性的报道。在19-24岁年龄组中有很强的相关性(gydF4y2BargydF4y2Ba=0.725),滞后1天,其次是30-34岁年龄组(gydF4y2BargydF4y2Ba=0.786,领先1天),35 ~ 39岁年龄组(gydF4y2BargydF4y2Ba=0.826,滞后1 d), 40 ~ 44岁年龄组(gydF4y2BargydF4y2Ba=0.755,延迟0天)。gydF4y2Ba

基于上网设备类型的上网信息查询趋势分析gydF4y2Ba

图5gydF4y2Ba和gydF4y2Ba6gydF4y2Ba展示使用移动设备和桌面设备在线搜索冠状病毒和冠状病毒检测信息的趋势。在所有信息搜索高峰中,冠状病毒的移动搜索查询量都更高。在所有高峰中,与冠状病毒测试相关的搜索,移动搜索似乎比桌面搜索更频繁、更稳定。gydF4y2Ba

‎gydF4y2Ba
图5。韩国新冠肺炎病例时间序列和NAVER相关搜索量。gydF4y2Ba
查看此图gydF4y2Ba
‎gydF4y2Ba
图6。新冠肺炎病例时间序列和与韩国冠状病毒检测相关的NAVER相对搜索量。gydF4y2Ba
查看此图gydF4y2Ba

Spearman秩相关系数为gydF4y2Ba表3gydF4y2Ba冠状病毒搜索的整体数据集(移动和桌面搜索)具有很强的相关性,滞后时间为3天(gydF4y2BargydF4y2Ba=0.729),以及流动电话搜寻(gydF4y2BargydF4y2Ba= 0.761)。有趣的是,与整体搜索相比,手机搜索在所有滞后期和前置期都有更强的相关系数。然而,弱至中度相关性(gydF4y2BargydF4y2Ba=0.417-0.546),通过桌面设备进行与冠状病毒相关的搜索。对于冠状病毒检测的在线搜索,强相关性(gydF4y2BargydF4y2Ba=0.77 -0.828),报告了所有滞后和领先日。尽管如此,移动搜索被观察到比桌面搜索有更强的相关系数。移动搜索的相关性最强,为0天的滞后(gydF4y2BargydF4y2Ba=0.804),桌面搜索滞后1天(gydF4y2BargydF4y2Ba= 0.717)。gydF4y2Ba

表3。韩国新冠肺炎病例与NAVER相关冠状病毒和冠状病毒检测相对搜索量的时滞相关系数gydF4y2Ba
一天gydF4y2Ba 冠状病毒搜索(设备类型)gydF4y2Ba 冠状病毒测试搜索(设备类型)gydF4y2Ba

整体gydF4y2Ba 移动gydF4y2Ba 桌面gydF4y2Ba 整体gydF4y2Ba 移动gydF4y2Ba 桌面gydF4y2Ba
- - - - - -gydF4y2Ba3天gydF4y2Ba

rgydF4y2Ba 0.729gydF4y2Baa、bgydF4y2Ba 0.761gydF4y2Ba一个gydF4y2Ba 0.546gydF4y2Ba一个gydF4y2Ba 0.770gydF4y2Ba 0.756gydF4y2Ba 0.677gydF4y2Ba

PgydF4y2Ba价值gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba
- - - - - -gydF4y2Ba2天gydF4y2Ba

rgydF4y2Ba 0.694gydF4y2Ba 0.726gydF4y2Ba 0.534gydF4y2Ba 0.797gydF4y2Ba 0.787gydF4y2Ba 0.657gydF4y2Ba

PgydF4y2Ba价值gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba
- - - - - -gydF4y2Ba1天gydF4y2Ba

rgydF4y2Ba 0.681gydF4y2Ba 0.720gydF4y2Ba 0.497gydF4y2Ba 0.824gydF4y2Ba 0.799gydF4y2Ba 0.717gydF4y2Ba一个gydF4y2Ba

PgydF4y2Ba价值gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba
0天gydF4y2Ba

rgydF4y2Ba 0.663gydF4y2Ba 0.704gydF4y2Ba 0.461gydF4y2Ba 0.812gydF4y2Ba 0.804gydF4y2Ba一个gydF4y2Ba 0.638gydF4y2Ba

PgydF4y2Ba价值gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba
1天gydF4y2Ba

rgydF4y2Ba 0.661gydF4y2Ba 0.692gydF4y2Ba 0.475gydF4y2Ba 0.828gydF4y2Ba一个gydF4y2Ba 0.804gydF4y2Ba 0.705gydF4y2Ba

PgydF4y2Ba价值gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba
2天gydF4y2Ba

rgydF4y2Ba 0.606gydF4y2Ba 0.650gydF4y2Ba 0.417gydF4y2Ba 0.805gydF4y2Ba 0.788gydF4y2Ba 0.654gydF4y2Ba

PgydF4y2Ba价值gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba
3天gydF4y2Ba

rgydF4y2Ba 0.597gydF4y2Ba 0.633gydF4y2Ba 0.423gydF4y2Ba 0.781gydF4y2Ba 0.761gydF4y2Ba 0.626gydF4y2Ba

PgydF4y2Ba价值gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba <措施gydF4y2Ba

一个gydF4y2Ba每列的相关性最强。gydF4y2Ba

bgydF4y2Ba斜体表示与gydF4y2BargydF4y2Ba> 0.7。gydF4y2Ba

COVID-19新病例分布和互联网搜索gydF4y2Ba

新发COVID-19病例和GT rsv的空间分布情况见gydF4y2Ba图7gydF4y2Ba。结果显示,在韩国出现确诊病例的9天前,京畿道、首尔、忠清南道、大邱、蔚山等地发现的与新型冠状病毒相关的GT rsv数量有所增加。此后,上述省份陆续报告新冠肺炎确诊病例。在疾病传播的最初几周(截至2020年2月15日),新冠病毒在首尔、仁川、光州、京畿道和全北(gydF4y2Ba图7gydF4y2Ba).对于GT rsv也捕获了类似的模式,在报告确诊病例的韩国西部地区,这一时期似乎有所上升。gydF4y2Ba

‎gydF4y2Ba
图7。韩国新冠肺炎病例分布和谷歌趋势rsvRSV:相对搜索量。gydF4y2Ba
查看此图gydF4y2Ba

此外,新发COVID-19病例从2020年2月19日开始激增。在此期间,包括当地传播中心大邱在内的韩国东部地区的GT rsv逐渐增加。截止到3月22日,每10万人口中有262.14名确诊患者,占全体确诊病例的71.79%。gydF4y2Ba31gydF4y2Ba],估计死亡率高于全国平均死亡率[gydF4y2Ba32gydF4y2Ba]。有趣的是,在大邱周边地区大规模扩散的前一周,网络搜索量反而有所增加。2020年2月25日至3月4日期间报告了大量本地感染病例,并在3月中旬迅速下降。随着新增病例数的减少,西部地区的互联网搜索量开始增加,这表明在研究期间的后期,新冠肺炎病例数有所增加。gydF4y2Ba

预测新发COVID-19病例gydF4y2Ba

本研究建立了三种不同的COVID-19新发病例预测模型(gydF4y2Ba表4gydF4y2Ba).延迟1天的新冠肺炎病例数、延迟2天和1天的COVID-19检测次数、延迟1天的GT冠状病毒搜索量和延迟3天的NAVER冠状病毒搜索量被选为模型的重要预测因子。模型1表现出较高的性能,这表明该模型代表了89%的新冠肺炎病例,而模型2仅代表了调整后的35%的病例gydF4y2BargydF4y2Ba2gydF4y2Ba值。通过结合这两个模型(基于案例的模型和基于互联网搜索数据的模型),模型的性能似乎略有提高,接近90%,导致RMSE最低,如模型3所示。gydF4y2Ba

表4。韩国新冠肺炎病例预测模型gydF4y2Ba
模型和预测器gydF4y2Ba 系数gydF4y2Ba一个gydF4y2Ba(95%置信区间)gydF4y2Ba PgydF4y2Ba值gydF4y2BaFgydF4y2Ba测试gydF4y2Ba 调整gydF4y2BargydF4y2Ba2gydF4y2Ba RMSEgydF4y2BabgydF4y2Ba 另类投资会议gydF4y2BacgydF4y2Ba BICgydF4y2BadgydF4y2Ba
模型1(预测因子包括新发COVID-19病例和COVID-19检测次数)gydF4y2Ba <措施gydF4y2Ba 0.891gydF4y2Ba 54.348gydF4y2Ba 1851.326gydF4y2Ba 1864.03gydF4y2Ba

新发COVID-19病例滞后1天gydF4y2Ba 0.942 (0.883 - 1.001)gydF4y2Ba





测试数延迟2天gydF4y2Ba -0.004 (-0.007 ~ -0.001)gydF4y2Ba





测试数延迟1天gydF4y2Ba 0.004 (0.001 ~ 0.007)gydF4y2Ba





缺点gydF4y2BaegydF4y2Ba 3.957 (-5.415 - 13.329)gydF4y2Ba




模型2(预测因子包括GT)gydF4y2BafgydF4y2Ba和NAVER回复gydF4y2BaggydF4y2Ba与冠状病毒有关)gydF4y2Ba <措施gydF4y2Ba 0.354gydF4y2Ba 133.802gydF4y2Ba 2153.293gydF4y2Ba 2162.805gydF4y2Ba

GT rsv滞后1天gydF4y2Ba -0.964 (-1.604 - -0.324)gydF4y2Ba





NAVER回复延迟3天gydF4y2Ba 3.583 (2.859 - 4.308)gydF4y2Ba





缺点gydF4y2Ba 28.920 (4.338 - 53.503)gydF4y2Ba




模型3(预测因子包括新发COVID-19病例、检测次数以及与冠状病毒相关的GT和NAVER rsv)gydF4y2Ba <措施gydF4y2Ba 0.895gydF4y2Ba 53.177gydF4y2Ba 1835.169gydF4y2Ba 1851.022gydF4y2Ba

新发COVID-19病例滞后1天gydF4y2Ba 0.880 (0.809 - 0.951)gydF4y2Ba





测试数延迟2天gydF4y2Ba -0.004 (-0.006 ~ -0.001)gydF4y2Ba





测试数延迟1天gydF4y2Ba 0.004 (0.002 ~ 0.007)gydF4y2Ba





NAVER回复延迟3天gydF4y2Ba 0.536 (0.177 - 0.894)gydF4y2Ba





缺点gydF4y2Ba -4.334 (-15.136 - 6.467)gydF4y2Ba




一个gydF4y2Ba系数:系数。gydF4y2Ba

bgydF4y2BaRMSE:均方根误差。gydF4y2Ba

cgydF4y2BaAIC:赤池信息准则。gydF4y2Ba

dgydF4y2BaBIC:贝叶斯信息准则。gydF4y2Ba

egydF4y2Ba缺点:常数。gydF4y2Ba

fgydF4y2Ba谷歌趋势。gydF4y2Ba

ggydF4y2BaRSV:相对搜索量。gydF4y2Ba

然后绘制模型gydF4y2Ba图8gydF4y2Ba对于开发集和验证集。通过调整后的值来评估,模型3在开发集中的表现优于其他两个模型gydF4y2BargydF4y2Ba2gydF4y2Ba以及RMSE、AIC和BIC。在验证集中,该模型也表现良好,RMSE下降到18.320。gydF4y2Ba

‎gydF4y2Ba
图8。韩国新冠肺炎病例预测。gydF4y2Ba
查看此图gydF4y2Ba

公众健康风险认知gydF4y2Ba

风险感知的定义是一个人对负面事件(包括疾病)发生可能性的主观判断[gydF4y2Ba33gydF4y2Ba]。就疾病暴发而言,在疾病暴发的早期阶段,特别是在新出现疾病的情况下,需要了解社区对健康风险的认识。这是因为在最初阶段,治疗方法有限,资源很少,积极干预措施也会延迟[gydF4y2Ba34gydF4y2Ba]。因此,探索对风险的认识是管理疫情风险的必要步骤。由于强有力的公众风险认知评估有助于预测有效的风险沟通,因此应立即采取这一步骤,以减少COVID-19疫情的影响。因此,使用互联网搜索数据进行社区健康风险认知评估更经济实惠,因为与调查方法相比,它可以更容易、更迅速和更具成本效益地提供[gydF4y2Ba16gydF4y2Ba]并可能实时捕获异常模式[gydF4y2Ba17gydF4y2Ba]。随着互联网和流动设备的广泛使用,互联网搜索数据可以更准确地代表社区对健康风险的认识[gydF4y2Ba35gydF4y2Ba],因为寻求信息的意图直接受到风险认知的影响[gydF4y2Ba9gydF4y2Ba]。gydF4y2Ba

主要结果gydF4y2Ba

在这项研究中,我们发现了GT和NAVER rsv、新发COVID-19病例和检测次数之间的各种相关性,从弱到强。先前的研究也报告了与监测数据相比,GT和NAVER rsv之间存在很强的相关性[gydF4y2Ba16gydF4y2Ba,gydF4y2Ba36gydF4y2Ba]。因此,在当地和国际活动期间,对covid -19相关信息的搜索量增加可能代表了社区对健康风险的看法。NAVER RSVs作为国内市场占有率最高的本地搜索引擎(截至2020年6月14日,所有搜索类别的占有率为57.31%)[gydF4y2Ba18gydF4y2Ba),似乎对冠状病毒检测等当地问题更为敏感gydF4y2Ba图3gydF4y2Ba。先前的一项研究也报道了类似的结果,该研究表明百度(在中国)在疾病预测方面比GT rsv具有更好的预测性能[gydF4y2Ba36gydF4y2Ba]。这些发现表明,NAVER rsv也可能补充在信息流行病学领域过度使用的GT rsv的使用。gydF4y2Ba

在本分析中,从信息搜索中检索到的社区风险感知模式通过检查不同方面来解释:时间、性别、年龄组、用于访问互联网的设备类型和空间分布。根据时间的变化趋势,在本地传播、新冠病毒检测试剂盒批准、新冠病毒免试、口罩短缺、保持社交距离、新村市疫情传播等地方事件期间,以及宣布国际关注的国际突发公共卫生事件期间,与新冠病毒相关的在线查询数量有所增加。然而,韩国也是受中东呼吸综合征影响的国家之一[gydF4y2Ba37gydF4y2Ba]。这种经历可能也导致了冠状病毒信息搜索量的增加,尽管在此之前尚未发现病例。此外,在研究期间,与mers相关的搜索量也很高。这些发现表明,在当地和国际危机之后,公众对卫生风险的认识都有所增加。因此,考虑到随着疫情的发展,健康风险观念可能会随着时间的推移而改变,应及时进行风险沟通。gydF4y2Ba

按时间划分的模式还显示,在流行曲线的中间位置,GT和NAVER rsv的数量减少,这可能是由于在此期间广泛获得在线新闻和卫生专家报告造成的[gydF4y2Ba38gydF4y2Ba]。这也可能是由于随着疫情的发展,人们对风险的认识有所降低[gydF4y2Ba7gydF4y2Ba]。因此,使用互联网查询数据来分析社区对风险的认知,在疫情爆发的早期阶段可能是有用的。gydF4y2Ba

此外,不同年龄组的分类模式显示,年龄较小(≤29岁)和年龄较大(≥50岁)的互联网搜索冠状病毒信息与新发COVID-19病例有很强的相关性。这一发现证明了这些年龄组的高危观念,甚至在当地新发COVID-19病例数增加前3天。较年轻年龄组的高危观念可能是由大量获取信息的互联网接入和韩国该年龄组确诊病例高(33.24%)引起的[gydF4y2Ba31gydF4y2Ba,gydF4y2Ba39gydF4y2Ba]。与此同时,感知到的脆弱性可能在年龄较大的群体中很常见,因为年龄较大是COVID-19死亡率的主要风险因素之一[gydF4y2Ba40gydF4y2Ba],其中98.08%的死亡病例发生在老年人中[gydF4y2Ba31gydF4y2Ba]。此外,先前的一项研究表明,年龄较大的人群对风险的认知更高[gydF4y2Ba7gydF4y2Ba]。gydF4y2Ba

相比之下,30-49岁年龄组甚至在事件发生前3天仅表现出弱至中度相关性。这可能是由于该年龄组确诊病例的百分比(23.94%)低于较年轻年龄组(≤29岁),这也可能影响健康风险观念。与此同时,关于冠状病毒检测的在线查询显示,35-44岁年龄组的人认为这是高风险人群。这些发现表明,成年人认为冠状病毒检测相关信息比疾病相关知识更重要。这也可能受到迄今为止进行的大量冠状病毒检测的影响。同时,年轻人(≤29岁)和老年人(≥50岁)对感染的认知不同,因此感染相关信息是必不可少的搜索。在性别方面,男性和女性都认为冠状病毒具有相似的风险水平,但女性对冠状病毒检测的风险认知更高。这一结果与之前的一项研究报告相似,该研究显示,女性组的风险感知更高[gydF4y2Ba7gydF4y2Ba]。因此,健康风险宣传应针对男性和女性以及弱势年龄组。gydF4y2Ba

在设备使用方面,模式表明,与桌面查询相比,移动设备搜索与covid -19相关搜索具有更强的相关性。在疫情爆发前3天,甚至观察到移动设备搜索之间存在很强的相关性。然而,桌面搜索与1天的滞后有很强的相关性,这比移动搜索晚了2天。这一发现表明,在疫情爆发期间,高风险观念刺激了大量的移动搜索。Shin和他的同事在之前的研究中也得出了相同的结果[gydF4y2Ba16gydF4y2Ba]。在数码时代,流动设备的广泛使用[gydF4y2Ba35gydF4y2Ba推动了从桌面设备用户到移动设备用户的行为变化。因此,政府应确保通过移动平台可以方便地获取风险信息,以便快速传播。研究结果还表明,在新发COVID-19病例的地区,互联网搜索的空间分布更高。这一发现与之前的研究相似,后者表明受影响地区的个体具有更高的风险感知[gydF4y2Ba7gydF4y2Ba,gydF4y2Ba11gydF4y2Ba]。gydF4y2Ba

在随后的分析中,我们还讨论了使用三种不同模型预测新冠肺炎病例的问题。结果表明,与基于COVID-19病例的模型相比,添加NAVER提供的COVID-19相关搜索可以提高模型的性能。这一结果与早先的一项研究相似[gydF4y2Ba17gydF4y2Ba],该研究还发现,使用本地搜索引擎的互联网搜索数据,模型的性能会有所提高。此外,在验证集中,该模型表现更好,这可能是由于查询NAVER数据的时间较长所致;因此,趋势可以更好地调整,并影响模型在验证集中的性能。因此,考虑到用于病例预测的NAVER rsv数据可能很重要,使用相同的数据集来更好地了解健康风险认知也很重要,特别是在疫情的早期阶段。gydF4y2Ba

简而言之,本研究描述了韩国社区对COVID-19的健康风险认知,在当地和国际活动期间,女性、某些年龄组和受影响地区的人们的健康风险认知往往更高。疫情期间,人们更有可能通过移动设备访问互联网,这是可以有效和密集传播健康风险信息的潜在渠道。此外,NAVER rsv可以潜在地用于健康风险感知评估和疾病预测。该方法证明了在大流行期间估计健康风险认知的一种简单和低成本的方法。由于需要在暴发的早期阶段提供快速的风险感知评估,因此结合GT和NAVER rsv可能有利于在时间、人群特征和地点方面针对风险进行沟通。单独的GT rsv只显示了时间和地点的模式[gydF4y2Ba41gydF4y2Ba]。然而,本研究仅探讨了对COVID-19的积极风险认知,而不是心理影响等消极风险认知。多项研究还报告,在流行病的初期阶段,焦虑、抑郁、愤怒、失眠、痛苦和自杀的发生率有所增加[gydF4y2Ba42gydF4y2Ba],探索对COVID-19大流行的负面风险认知对未来的工作很重要。gydF4y2Ba

限制gydF4y2Ba

由于在线搜索查询可能会随时间变化,因此确定进行风险沟通的最佳滞后时间是一项挑战。但是,使用GT或NAVER rsv可以灵活地定义数据查询的时间范围。因此,我们可以收集足够的回顾性数据集来确定最佳滞后时间。此外,这种分析可能仅限于特定的时间框架,只包括两个流行的搜索引擎和某些关键字,并且仅限于积极的风险感知。因此,需要进一步的研究来考虑这些方面,以提高风险感知分析的结果。gydF4y2Ba

结论gydF4y2Ba

从GT和NAVER rsv观察到的韩国社区对COVID-19疫情的健康风险认知在当地和国际活动期间增加,并且在女性,某些年龄组和受影响地区更高。尽管NAVER rsv在局部问题上更敏感,但整合GT和NAVER rsv可能在时间、人口特征和地点方面提供不同的搜索模式。此外,在线搜索还确定了在疫情爆发初期预测流行病曲线的重要变量。gydF4y2Ba

致谢gydF4y2Ba

本研究由台湾科技部(批准号:MOST108-2221-E-038-018和MOST109-2221-E-038-018)和台湾教育部高等教育萌芽计划(批准号:DP2-108-21121-01-A-01-04)资助。这项工作也得到了韩国国家研究基金会(NRF)的资助,由韩国政府(MSIT;no 2018R1C1B6001723)到ES。赞助方在论文的研究设计和发表内容中没有任何作用。此外,我们感谢Jihoo Kim及其同事在Kaggle上提供韩国covid -19相关信息的开放获取数据。gydF4y2Ba

作者的贡献gydF4y2Ba

AH设计了这项研究,进行了实验,分析了数据,并起草和修改了手稿。ES提供了分析建议并修改了原稿。AF对数据进行分析并修改稿件。ECYS构思了这项研究,设计了实验,并修改了手稿。所有作者都认可了最终版本。gydF4y2Ba

利益冲突gydF4y2Ba

没有宣布。gydF4y2Ba

  1. 世卫组织总干事在2020年3月11日COVID-19媒体吹风会上的开幕词。2020年3月11日。URL:gydF4y2Bahttps://www.who.int/dg/speeches/detail/who-director-general-s-opening-remarks-at-the-media-briefing-on-covid-19---11-march-2020gydF4y2Ba[2020-03-30]访问gydF4y2Ba
  2. 冠状病毒病(COVID-19):情况报告- 132。2020年5月31日。URL:gydF4y2Bahttps://www.who.int/docs/default-source/coronaviruse/situation-reports/20200531-covid-19-sitrep-132.pdf?sfvrsn=d9c2eaef_2gydF4y2Ba[2020-06-15]访问gydF4y2Ba
  3. 金建辉,李建军,金明辉,张世杰,柳世祥,林玉杰,等。COVID-19的数据科学(DS4C)。2020年1月20日。URL:gydF4y2Bahttps://www.kaggle.com/kimjihoo/coronavirusdataset?fbclid=IwAR2e4aTLe0x1OWp45eeyf0szA9pQpoFI6pM2KPHiXSNxHIAQDP_yz4D1qIM#Weather.csvgydF4y2Ba[2020-06-21]访问gydF4y2Ba
  4. Shim E, Tariq A, Choi W, Lee Y, Chowell G.新冠肺炎在韩国的传播潜力和严重程度。中华流行病学杂志[J]; 2009; 33 (3):339-344 [J]gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  5. 韩国试图“保持社交距离”以防止冠状病毒传播。美国之音,2020年3月6日。URL:gydF4y2Bahttps://learningenglish.voanews.com/a/south-korea-tries-social-distancing-to-prevent-coronavirus-spread/5316633.htmlgydF4y2Ba[2020-03-30]访问gydF4y2Ba
  6. Kwon KT, Ko JH, Shin H, Sung M, Kim JY.新型冠状病毒COVID-19免下车筛查中心:安全高效的社区大规模疫情筛查系统。韩国医学杂志2020年3月23日;35(11):e123 [J]gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  7. 张文明,金宇,张德华,郑海,赵山,尹世杰,等。在韩国中东呼吸综合征冠状病毒(MERS-CoV)爆发期间,信任对两种不同风险认知的影响:作为情感和认知维度:系列横断面调查英国医学杂志开放2020年3月04日;10(3):e033026。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  8. 什么是第六阶段?世界卫生组织,2009。URL:gydF4y2Bahttps://www.who.int/csr/disease/swineflu/frequently_asked_questions/levels_pandemic_alert/en/gydF4y2Ba[2020-04-06]访问gydF4y2Ba
  9. 传染病暴发期间风险信息的寻找和处理:寨卡病毒病例。风险管理学报;2010;30(6):1212-1225。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  10. Lohiniva A, Sane J, Sibenberg K, Puumalainen T, Salminen M.了解公众对冠状病毒病(COVID-19)的风险认知,加强风险沟通:应对疫情的实用方法,芬兰,2020年2月。欧洲监测2020年4月;25(13):2000317 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  11. 杨生理改变。谁的风险?为什么美国公众无视有关埃博拉疫情的信息?风险管理,2019;39(8):1708-1722。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  12. 信息流行病学:(错误)信息的流行病学。中华医学杂志2002;11(3):763-765。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  13. 信息流行病学和信息监控:一套新兴的公共卫生信息学方法框架,用于分析互联网上的搜索、交流和出版行为。[J]医学互联网研究2009年3月27日;11(1):e11 [J]gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  14. 马夫拉格尼。信息流行病学与信息监测:范围综述。[J]中国医学信息学报,2020,28;22(4):e16206 [J]gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  15. 杨建军。信息流行病学与信息监测:在线健康信息与网络行为。中华预防医学杂志,2011;40(5增刊2):S154-S158。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  16. 申顺,金涛,徐东,孙昌,金顺,柳思明,等。韩国国家流感监测数据与移动设备和台式机搜索查询之间的相关性。科学通报,2016;11(7):e0158539 [j]gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  17. 张勇,李亚平,胡伟。基于跨半球流感监测数据和本地互联网查询数据的季节性流感流行预测。科学通报2019;01;9(1):3262。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  18. 搜索引擎在韩国的市场份额。2020年6月15日。URL:gydF4y2Bahttp://www.internettrend.co.kr/trendForward.tspgydF4y2Ba[2020-06-15]访问gydF4y2Ba
  19. 谷歌趋势。:谷歌网址:gydF4y2Bahttps://trends.google.com/gydF4y2Ba[2020-06-15]访问gydF4y2Ba
  20. NAVER。URL:gydF4y2Bahttps://datalab.naver.com/gydF4y2Ba[2020-06-15]访问gydF4y2Ba
  21. Strzelecki A, Rizun M.基于谷歌趋势对中国武汉冠状病毒流行的信息流行病学研究。国际工程学报2020年4月08日;16(04):139。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  22. 马夫拉格尼,奥乔亚。信息流行病学和信息监控的谷歌趋势:方法论框架。公共卫生监测2019年5月29日;5(2):e13439 [j]gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  23. 关于谷歌趋势数据的常见问题解答。谷歌。URL:gydF4y2Bahttps://support.google.com/trends/answer/4365533?hl=en&ref_topic=6248052gydF4y2Ba
  24. 张晓明,李晓明,李晓明,等。流行病学研究的多元共线性回归分析。流行病学(Sunnyvale) 2016年4月;6(2):227 [j]gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  25. Chakrabarti A, Ghosh JK。AIC, BIC和模型选择的最新进展。In: Bandyopadhyay PS, Forster MR,编辑。统计学哲学。阿姆斯特丹:爱思唯尔;2011:583 - 605。gydF4y2Ba
  26. 随着新冠肺炎病例的减少,韩国进入了新常态。合众国际社,2020年5月6日。URL:gydF4y2Bahttps://www.upi.com/Top_News/World-News/2020/05/06/With-COVID-19-cases-in-decline-South-Korea-opens-up-to-a-new-normal/4181588747240/gydF4y2Ba[2020-06-15]访问gydF4y2Ba
  27. 韩国的冠状病毒病例急剧下降。它成功的秘诀是什么?科学。美国科学促进会;2020年3月17日。URL:gydF4y2Bahttps://www.sciencemag.org/news/2020/03/coronavirus-cases-have-dropped-sharply-south-korea-whats-secret-its-success#gydF4y2Ba[2020-03-30]访问gydF4y2Ba
  28. 还是没有足够的口罩供大家使用。《韩国先驱报》2020年2月29日。URL:gydF4y2Bahttp://www.koreaherald.com/view.php?ud=20200229000149gydF4y2Ba[2020-04-16]访问gydF4y2Ba
  29. 格林希尔·T,霍华德·j·面具?科学的答案是肯定的。fast.ai。2020年4月13日。URL:gydF4y2Bahttps://www.fast.ai/2020/04/13/masks-summary/gydF4y2Ba[2020-04-24]访问gydF4y2Ba
  30. 新型冠状病毒如何在韩国新天地宗教团体中传播。CNN。2020年2月28日。URL:gydF4y2Bahttps://edition.cnn.com/2020/02/26/asia/shincheonji-south-korea-hnk-intl/index.htmlgydF4y2Ba[2020-06-15]访问gydF4y2Ba
  31. 新闻稿:截至3月22日,韩国COVID-19最新情况。韩国疾病控制中心,2020年3月22日。URL:gydF4y2Bahttps://www.cdc.go.kr/board/board.es?mid=a30402000000&bid=0030gydF4y2Ba
  32. Shim E, Mizumoto K, Choi W, Chowell G. 2020年2月至5月韩国新冠肺炎疫情期间死亡风险评估。中华临床医学杂志[J]; 2009;9(6):1641 [J]gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  33. 潘洪军,李建军。风险认知与风险特征。收录:牛津传播研究百科全书。牛津:牛津大学出版社;2017.gydF4y2Ba
  34. 世界卫生组织疫情传播规划指南。世界卫生组织,2008。URL:gydF4y2Bahttps://www.who.int/ihr/elibrary/WHOOutbreakCommsPlanngGuide.pdf?ua=1gydF4y2Ba[2020-04-06]访问gydF4y2Ba
  35. Liang B, Scammon DL。在线健康信息搜索的发生率:公众健康风险感知的有用代理。医学互联网研究,2013,17;15(6):e114 [J]gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  36. 李超,陈丽娟,陈霞,张敏,庞鹏鹏,陈慧。基于网络搜索和社交媒体数据预测新冠肺炎疫情的可能性回顾性分析,中国,2020。欧洲监测2020年3月;25(10):2000199 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  37. 韩国从之前的冠状病毒爆发中学到了成功的COVID-19战略:中东呼吸综合征。《原子科学家公报》2020年3月20日。URL:gydF4y2Bahttps://thebulletin.org/2020/03/south-korea-learned-its-successful-covid-19-strategy-from-a-previous-coronavirus-outbreak-mers/gydF4y2Ba[2020-04-19]访问gydF4y2Ba
  38. Keller M, Blench M, Tolentino H, Freifeld CC, Mandl KD, Mawudeku A,等。使用基于事件的非结构化报告进行全球传染病监测。新兴传染病2009年5月;15(5):689-695。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  39. 2018韩国互联网白皮书。韩国互联网振兴院。URL:gydF4y2Bahttps://www.kisa.or.kr/eng/usefulreport/whitePaper_List.jspgydF4y2Ba[2020-06-15]访问gydF4y2Ba
  40. 周峰,于涛,杜锐,范刚,刘勇,刘忠,等。武汉成人COVID-19住院患者临床病程及死亡危险因素:一项回顾性队列研究柳叶刀2020年3月28日;395(10229):1054-1062 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  41. 胡赛因A,富德A,苏等。谷歌搜索趋势在传染病管理风险沟通中的应用——以台湾地区新冠肺炎疫情为例中华流行病学杂志[J]; 2010; 29 (5): 391 - 391 [J]gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  42. COVID-19、焦虑、睡眠障碍和自杀。睡眠医学[j]; [c]; 2009gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba


‎gydF4y2Ba
另类投资会议:gydF4y2Ba赤池信息准则gydF4y2Ba
BIC:gydF4y2Ba贝叶斯信息准则gydF4y2Ba
GT:gydF4y2Ba谷歌趋势gydF4y2Ba
即:gydF4y2Ba中东呼吸综合征gydF4y2Ba
说明:gydF4y2Ba教育部gydF4y2Ba
:gydF4y2Ba科学技术部gydF4y2Ba
联盟:gydF4y2Ba韩国研究财团gydF4y2Ba
国际关注的突发公共卫生事件:gydF4y2Ba国际关注的突发公共卫生事件gydF4y2Ba
RMSE:gydF4y2Ba均方根误差gydF4y2Ba
RSV:gydF4y2Ba相对搜索量gydF4y2Ba
VIF:gydF4y2Ba方差膨胀系数gydF4y2Ba
人:gydF4y2Ba世界卫生组织gydF4y2Ba


G·艾森巴赫编辑;提交02.05.20;由SY Shin, A Mavragani同行评审;对作者的评论12.06.20;收到修订版本01.07.20;接受14.09.20;发表29.09.20gydF4y2Ba

版权gydF4y2Ba

©Atina Husnayain, Eunha Shim, Anis Fuad, Emily Chia-Yu Su.原发表于《医学互联网研究杂志》(//www.mybigtv.com), 2020年9月29日。gydF4y2Ba

这是一篇在知识共享署名许可(https://creativecommons.org/licenses/by/4.0/)下发布的开放获取文章,该许可允许在任何媒介上不受限制地使用、分发和复制,前提是原始作品首次发表在《医学互联网研究杂志》上,并适当引用。必须包括完整的书目信息,到//www.mybigtv.com/上原始出版物的链接,以及版权和许可信息。gydF4y2Ba


Baidu
map