原始论文
摘要
背景:最近的冠状病毒病(COVID-19)大流行正在对世界卫生保健基础设施以及人类的社会、经济和心理健康造成影响。个人、组织和政府正在使用社交媒体就与COVID-19大流行有关的一些问题相互沟通。目前对社交媒体平台上与COVID-19有关的话题知之甚少。分析这些信息可以帮助决策者和卫生保健组织评估其利益相关者的需求,并适当地解决这些需求。
摘要目的:这项研究旨在确定推特用户发布的与COVID-19大流行相关的主要话题。
方法:利用一组工具(Twitter的搜索应用程序编程接口(API)、Tweepy Python库和PostgreSQL数据库),并使用一组预定义的搜索词(“corona”、“2019-nCov”和“COVID-19”),我们提取了2020年2月2日至2020年3月15日期间公共英语推文的文本和元数据(点喜欢和转发数量,以及包括粉丝数量在内的用户配置信息)。我们使用单个(unigrams)和双单词(bigrams)的词频来分析收集的推文。我们利用潜在的狄利克雷分配进行主题建模,以识别推文中讨论的主题。我们还进行了情绪分析,提取了每个话题的平均转发数、点赞数和粉丝数,并计算了每个话题的互动率。
结果:在纳入的约280万条推文中,来自160829名独立用户的167073条推文符合纳入标准。我们的分析确定了12个主题,分为四个主题:病毒的起源;其来源;它对人民、国家和经济的影响;以及降低感染风险的方法。10个话题的平均情绪是正面的,2个话题的平均情绪是负面的(COVID-19导致的死亡和种族主义加剧)。账号关注者推文主题的平均值从2722(种族主义加剧)到13413(经济损失)不等。这些推文的平均点赞数最高为15.4(经济损失),最低为3.94(旅行禁令和警告)。
结论:现场和网上的公共卫生危机应对活动正日益同时进行和相互交织。社交媒体为直接向公众传播卫生信息提供了机会。卫生系统应致力于通过监测社交媒体来建立国家和国际疾病检测和监测系统。还需要在社交媒体上更主动、更灵活地展示公共卫生,以打击假新闻的传播。
doi: 10.2196/19016
关键字
简介
自20世纪80年代以来,由于生态、环境和社会经济因素过多,人类疾病暴发变得越来越频繁和多样化[
].直到2003年和2012年,随着中国出现严重急性呼吸系统综合征,沙特阿拉伯又出现中东呼吸系统综合征,人们才认为冠状病毒家族具有高致病性[ , ].2019年12月,中国武汉出现一系列不明原因肺炎患者[ ].通过接触者追踪,这些患者与武汉一家海鲜及湿性动物批发市场有关[ ].为了进一步调查症状,中国当局进行了深度序列分析,提供了充分的证据,证明新型冠状病毒是该病的病原体[ ],现在被称为冠状病毒疾病(COVID-19)。此后,新冠肺炎疫情在中国和世界其他国家迅速蔓延。这种疾病的传染性很强,平均而言,每个病人可将感染传播给另外2至4个人[ ].截至2020年4月7日,全球212个国家共确诊新冠肺炎病例1,279,722例,死亡病例72,614例[ ].随着新冠肺炎疫情在全球范围内扩散,Facebook、Twitter、YouTube等社交媒体平台上的个人活跃度开始增加。多项研究表明,社交媒体不仅可以作为发现疫情的数据来源发挥重要作用,而且还可以在危机期间了解公众态度和行为,作为支持危机沟通和健康促进信息传递的一种方式[
- ].为了协助公共卫生专业人员做出更好的决定,并协助他们进行公共卫生监测,开发了先进的监测系统,以整理来自社交媒体的全球范围内有关公共卫生信息的大量实时数据[ ].世界各地用户在社交媒体平台上发布的可公开获取的数据可用于快速识别个人在COVID-19大流行方面的主要想法、态度、感受和话题。这些数据可以帮助政策制定者、卫生保健专业人员和公众确定关注的主要问题,并以更适当的方式解决这些问题。越来越多的文献集中在研究Twitter在公共卫生研究中的使用。一篇系统综述论文确定了Twitter在公共卫生方面的六个主要用途:分析共享内容、监测公共卫生主题或疾病、公众参与、招募研究参与者、基于Twitter的公共卫生干预措施以及Twitter用户的网络分析[
].其他研究分析了推特数据进行情感分析[ ]以及使用Twitter传播可信的疫苗相关网页[ ].在以往工作的基础上,本研究旨在确定推特用户发布的与COVID-19大流行相关的主要话题。分析这些信息可以帮助决策者和卫生保健组织评估其利益相关者的需求,并以适当和相关的方式解决这些需求。方法
数据收集
我们使用Twitter标准搜索应用程序编程接口(API)收集了2020年2月2日至2020年3月15日期间与冠状病毒相关的推文,API由一组预定义的搜索词(“corona”、“2019-nCov”和“COVID-19”)组成,这些词是与新型冠状病毒相关的最广泛使用的科学和新闻媒体术语。我们提取并存储了推文的文本和元数据,使用时间戳、点赞数和转发数,以及包括粉丝数在内的用户配置文件信息。我们将推文存储在一个数据库表中,该表的主键是推文ID。因此,副本没有存储在我们的数据库中。这项研究只收集了英语推文。由于推文的元数据(如点赞数和转发数)可能会随着时间而变化,我们在研究结束时使用已经收集的推文的推文id重新收集了更新的推文元数据。Twitter标准搜索API允许使用推文id访问旧推文。我们使用Tweepy Python (Python软件基金会)库访问Twitter API,使用PostgreSQL (PostgreSQL全球开发组)数据库存储收集的推文。
数据预处理
我们使用推文元数据中的语言字段识别非英语推文,并将其从分析中删除。我们从分析中识别并删除了转发。我们还去掉了标点符号、停顿词等一个而且的以及推文中的表情符号等不可打印字符。我们通过将“@Alaa”转换为“@username”来规范化Twitter用户提及。此外,通过使用自然语言工具包Python库的wordnetlemmmatizer模块将同一单词的各种形式(例如,travels, travelling和travel’s)转换为主单词(例如,travel),将其lemmatizer进行了lemm化。数据预处理描述在
.根据Twitter的条款和条件、使用条款和隐私政策,所有数据都是匿名的,不会逐字报告给任何第三方。数据分析
处理后的推文使用单个单词(unigram)和双单词(bigrams)组合的词频进行分析,并通过单词云进行可视化,以确定最常见的主题。此外,我们还使用了主题建模技术[
来确定推文中最常见的话题。主题建模是一种无监督的机器学习技术,可以在文档集合(在本例中是tweet)中找到集群。我们使用Python sklearn包中的潜狄利克雷分配(LDA)算法。LDA需要一组固定的主题,其中每个主题由一组单词表示。LDA的目标是将给定的文档映射到主题集,以便每个文档中的单词大部分都被这些主题捕获。LDA是一种应用广泛的主题建模算法。我们用它来寻找推文语言中的自然聚类。我们通过指定LDA所需的主题数量来应用主题建模,以将推文集分离到不同的集群中。根据我们之前的工作,我们选择了30个主题作为LDA的运行主题[ ].我们从LDA主题建模算法生成的30个主题中每个主题的最具代表性的单词(参见中LDA输出)
)和来自词云的常用词(参见词云中的 )并手动分析了两组单词。通过这种手工分析,作者对每个主题的12个主题和相关术语,unigram和bigram达成了共识(参见中每个主题的相关术语) ).这些术语被用来分类推文,使用基于规则的分类脚本,分为不同的主题,并计算每个主题的流行程度。接下来,我们开发了一个用Python编写的基于规则的分类脚本,以检查每条推文中是否存在任何预先识别的字母和字母。分类脚本使用一种简单的字符串匹配技术来查看给定的tweet是否包含所选主题的关键字。包含与某个主题相关的选定关键字的推文被归类为属于该主题。
我们还进行了其他分析,如情绪分析,提取每个话题的转发、点赞和关注者的平均数量,然后计算每个话题的互动率。情感分析是使用Python textblob库对推文文本进行的。情感得分在-1.0到1.0之间变化,最消极的文本为-1.0,最积极的文本为1.0。我们计算了每个话题的平均情绪和平均点赞数、转发数和粉丝数。我们还计算了每个主题的互动率,计算方法是将每个主题的转发和点赞总数除以每个主题的关注者总数。这些措施提供了对主题和在这些主题中发布内容的用户的进一步了解。
结果
搜索结果
如
在2020年2月2日至2020年3月15日期间,共获得了2,787,247条推文。在这些推文中,有1636422条(58.71%)非英语推文被删除。在剩余的1,150,825条英文推文中,735,182(63.88%)条转发被排除在外。此外,还删除了248,570条(21.60%)文本中没有冠状病毒相关术语的推文。这些推文被Twitter API捕获,因为用户的名称或个人资料描述与搜索条件匹配。因此,该研究分析了来自160829名独立用户的167073条独立推文。推文分析结果
推文中出现的话题
我们从分析的推文中确定了12个主题。这12个主题被分为四个主题:COVID-19的起源、新型冠状病毒的来源、COVID-19对人民和国家的影响以及减少COVID-19传播的方法。
总结确定的主题的流行程度。表对角线上的值表示主题中推文的数量和百分比,表非对角线上的值表示两个主题交集中的推文的数量和百分比。例如,一条假设的推文,如“虽然COVID-19的死亡人数继续上升,但各国为限制冠状病毒感染传播而实施的旅行禁令开始影响许多人的日常生活”,可以归类为旅行和死亡。表中这两个主题的交点处的值表示包含与这两个主题相关的关键字的推文的数量和百分比。关于这些主题的更多细节将在下面的小节中详细阐述。主题一:COVID-19的起源
本主题包括两个讨论COVID-19起源的主题。第一个主题是中国,这是所有确定的主题中最常见的主题。推特上的网友们都在谈论中国,因为中国是新型冠状病毒的发源地。第二个话题是疫情爆发。这个主题的推文讨论了爆发的细节,比如爆发的方式、时间和地点。
主题二:新型冠状病毒的来源
这一主题包括关于导致COVID-19传播给人类的原因的推文。推特用户确定了一种新型冠状病毒的两个来源,这在这项研究中形成了两个主题:吃肉和发展生物武器。前一个话题(吃肉)是在提到肉类在COVID-19传播中的作用的推文中发现的。这些推文大多将COVID-19的爆发归咎于非素食者,并要求他们停止吃肉以阻止冠状病毒的传播。后一个话题(生物武器)是由一些人在推特上讨论新冠病毒是否源自中国生物军事实验室而形成的。
主题3:2019冠状病毒病对人民和国家的影响
第三个主题来自关于COVID-19对个人、公司和国家影响的推文。这一主题的推文确定了COVID-19的六种影响,也形成了六个主题。第一个主题与COVID-19造成的死亡人数有关。属于这个话题的推文主要显示了不同城市和国家的冠状病毒造成的死亡统计数据和人数。
第二个话题是COVID-19带来的恐惧和压力。推特用户在这些推文中表达了他们对新冠病毒的恐惧和压力,因为新冠病毒传播迅速,而且缺乏治疗方法或疫苗。
第三个主题是COVID-19对中国和其他国家的旅行的影响。这些推文主要讨论了许多国家因冠状病毒大流行而实施的航班取消、推迟、旅行禁令和限制,以及旅行警告。
第四个议题是新冠疫情对经济的影响。这些推文大多显示了许多公司和国家的实际或预期经济损失,例如,由于COVID-19爆发,市场关闭、石油需求减少、生产延迟和重要活动取消。
恐慌性购买是第五个被确定的话题。这些推文谈到了许多国家的个人如何为应对COVID-19大流行的宵禁、封锁和居家令而成为恐慌性买家,以及超市和商店如何控制和防止恐慌性购买。
本主题确定的最后一个主题与种族主义有关。具体来说,大多数推文中的用户报告了针对东亚人的种族主义、偏见和仇外攻击(如粗鲁的评论或下流的眼神)的传播,因为COVID-19起源于东亚人的国家。
主题4:减少COVID-19传播的方法
最后一个主题汇集了讨论减少COVID-19传播方法的推文。从这些推文中,我们发现了两种方法,并形成了以下两个主题:戴口罩和隔离人群。前一个话题的大多数推文都谈到了口罩在减少冠状病毒爆发方面的重要性,或者几个国家的口罩短缺。后一个话题的大多数推文都是关于隔离感染或疑似感染冠状病毒的个人,以减少或防止疾病的传播。
如图中的非对角线值所示
,最常见的重叠话题是中国与COVID-19死亡人数,其次是中国与吃肉,中国与COVID-19爆发,COVID-19死亡人数与吃肉,中国与COVID-19恐惧和压力。主题和子主题 | 中国,n (%) | COVID-19疫情一个, n (%) | 吃肉,n (%) | 研制生化武器,n (%) | COVID-19造成的死亡,n (%) | 对COVID-19的恐惧和压力,n (%) | 旅行禁令和警告,n (%) | 经济损失,n (%) | 恐慌性购买,n (%) | 种族主义增加,n (%) | 戴口罩,n (%) | 隔离受试者,n (%) | |||||||||||||
COVID-19的起源 | |||||||||||||||||||||||||
中国 | 27128 (16.24) | - - - - - -b | - - - - - - | - - - - - - | - - - - - - | - - - - - - | - - - - - - | - - - - - - | - - - - - - | - - - - - - | - - - - - - | - - - - - - | |||||||||||||
COVID-19疫情 | 2776 (1.66) | 7468 (4.47) | - - - - - - | - - - - - - | - - - - - - | - - - - - - | - - - - - - | - - - - - - | - - - - - - | - - - - - - | - - - - - - | - - - - - - | |||||||||||||
新型冠状病毒来源 | |||||||||||||||||||||||||
吃肉 | 4200 (2.51) | 560 (0.34) | 12772 (7.65) | - - - - - - | - - - - - - | - - - - - - | - - - - - - | - - - - - - | - - - - - - | - - - - - - | - - - - - - | - - - - - - | |||||||||||||
发展生物武器 | 808 (0.48) | 151 (0.09) | 220 (0.13) | 2021 (1.21) | - - - - - - | - - - - - - | - - - - - - | - - - - - - | - - - - - - | - - - - - - | - - - - - - | - - - - - - | |||||||||||||
2019冠状病毒病对人民和国家的影响 | |||||||||||||||||||||||||
COVID-19死亡人数 | 4332 (2.59) | 905 (0.54) | 2621 (1.57) | 219 (0.13) | 17606 (10.54) | - - - - - - | - - - - - - | - - - - - - | - - - - - - | - - - - - - | - - - - - - | - - - - - - | |||||||||||||
对COVID-19的恐惧和压力 | 1820 (1.09) | 484 (0.29) | 841 (0.50) | 137 (0.08) | 1421 (0.85) | 8785 (5.26) | - - - - - - | - - - - - - | - - - - - - | - - - - - - | - - - - - - | - - - - - - | |||||||||||||
旅行禁令和警告 | 912 (0.55) | 424 (0.25) | 175 (0.10) | 25 (0.01) | 313 (0.19) | 339 (0.20) | 4358 (2.61) | - - - - - - | - - - - - - | - - - - - - | - - - - - - | - - - - - - | |||||||||||||
经济损失 | 1019 (0.61) | 273 (0.16) | 208 (0.12) | 65 (0.04) | 192 (0.11) | 198 (0.12) | 67 (0.04) | 2565 (1.54) | - - - - - - | - - - - - - | - - - - - - | - - - - - - | |||||||||||||
抢购 | 598 (0.36) | 175 (0.10) | 115 (0.07) | 39 (0.02) | 183 (0.11) | 161 (0.10) | 83 (0.05) | 826 (0.49) | 2161 (1.29) | - - - - - - | - - - - - - | - - - - - - | |||||||||||||
增加了种族歧视 | 614 (0.37) | 98 (0.06) | 134 (0.08) | 7 (0.01) | 191 (0.11) | 192 (0.11) | 32 (0.02) | 9 (0.01) | 22日(0.01) | 2136 (1.28) | - - - - - - | - - - - - - | |||||||||||||
减少COVID-19传播的方法 | |||||||||||||||||||||||||
戴着面具 | 560 (0.34) | 221 (0.13) | 166 (0.10) | 16 (0.01) | 293 (0.18) | 218 (0.13) | 113 (0.07) | 50 (0.03) | 178 (0.10) | 51 (0.03) | 3397 (2.03) | - - - - - - | |||||||||||||
隔离对象 | 524 (0.31) | 148 (0.09) | 90 (0.05) | 15 (0.01) | 251 (0.15) | 134 (0.08) | 322 (0.19) | 32 (0.02) | 20 (0.01) | 12 (0.01) | 39 (0.02) | 2014 (1.21) |
一个COVID-19:冠状病毒病
b—:不可用。
情绪与互动率分析结果
如
在美国,除了新冠肺炎导致的死亡和种族主义加剧这两个话题外,所有话题的情绪平均值都是积极的。“吃肉”话题获得的积极情绪平均最高,其次是“戴口罩”话题。负面情绪平均最高的是“COVID-19导致的死亡”话题。主题 | 情绪,刻薄(SD) | 追随者,均值(SD) | 喜欢,意思(SD) | 转发数,平均值(SD) | 互动率 | 用户提及次数,n (%) | 链接共享,n (%) |
中国 | 0.028 (0.254) | 5971.83 (182938 .26) | 5.48 (128.42) | 1.65 (51.08) | 0.00120 | 10323 (6.18) | 11041 (6.61) |
爆发 | 0.037 (0.229) | 272064 .16 20498 .22 () | 6.48 (88.02) | 2.69 (50.75) | 0.00045 | 2038 (1.23) | 3090 (1.85) |
吃肉 | 0.082 (0.282) | 7177.12 (176101) | 12.34 (295.47) | 7.09 (136.75) | 0.00271 | 3815 (2.28) | 7140 (4.27) |
发展生物武器 | 0.016 (0.241) | 3071.80(22697 .08点) | 6.66 (114.81) | 2.24 (37.53) | 0.00290 | 1036 (0.62) | 706 (0.42) |
COVID-19死亡人数一个 | -0.057 (0.287) | 9020.53(204289点) | 6.00 (86.42) | 2.44 (39.75) | 0.00094 | 6847 (4.10) | 5924 (3.55) |
对COVID-19的恐惧和压力 | 0.015 (0.247) | 11755点(310842点) | 7.11 (129.05) | 2.42 (48.22) | 0.00081 | 3851 (2.30) | 2693 (1.61) |
旅行禁令和警告 | 0.032 (0.248) | 9003.54 (154933 .20) | 3.93 (33.27) | 0.92 (8.07) | 0.00054 | 2122 (1.27) | 1210 (0.72) |
经济损失 | 0.035 (0.247) | 13361 .82(287310 .56点) | 15.33 (517.00) | 3.58 (109.51) | 0.00141 | 1225 (0.73) | 846 (0.51) |
抢购 | 0.031 (0.248) | 12121 .17 456517 .30 () | 4.07 (38.95) | 0.89 (8.51) | 0.00041 | 944 (0.56) | 609 (0.36) |
增加了种族歧视 | -0.033 (0.264) | 2878.38 (64604 .27) | 9.87 (80.57) | 1.66 (14.89) | 0.00400 | 685 (0.41) | 427 (0.26) |
戴着面具 | 0.035 (0.262) | 7557.34 (147010 .30) | 8.08 (105.39) | 1.88 (28.68) | 0.00132 | 1200 (0.72) | 1062 (0.64) |
隔离对象 | 0.012 (0.263) | 6800.47 (87835.42) | 5.64 (39.10) | 1.90 (17.12) | 0.00111 | 896 (0.54) | 630 (0.38) |
一个COVID-19:冠状病毒病
发布收集的推文的推特用户的平均粉丝数从2878(种族主义加剧)到13361(经济损失)不等。经济损失话题的点赞数最高。另一方面,旅行禁令和警告相关话题的平均点赞数最低。收集的推文的转发平均值在0.89(恐慌性购买)和7.11(吃肉)之间变化。互动率最低的是与抢购相关的推文,互动率最高的是与种族主义相关的推文,其次是与生物武器相关的推文和与吃肉相关的推文(
).在与中国相关的推文中,用户提到的次数最多,但在与种族主义相关的推文中,用户提到的次数最少(
).同样,链接分享在与中国相关的推文中最常见,而在与种族主义相关的推文中最不常见( ). 显示前面提到的所有度量的更多描述性统计数据(即中位数、方差、标准差、最大值和最小值)。讨论
主要研究结果
在2020年2月2日至2020年3月15日期间,推特上的用户讨论了与COVID-19有关的四个主题中的12个主要话题。在分析的推文中,用户提及和链接共享是最常见的。这些发现可能表明,推特用户有兴趣通知或警告他们的朋友和关注者有关COVID-19的情况。这些人际交流表明,人们在推特上围绕COVID-19的话题建立了联系。
推特上的用户还关注了冠状病毒对个人和国家的影响。具体来说,许多推特都发布了与冠状病毒有关的死亡人数。此外,许多推文都提到了冠状病毒对情感和心理的影响。推特用户可能会在推特上表达他们对COVID-19的恐惧和压力,以及缺乏预防COVID-19的疫苗治疗选择或特定的抗病毒治疗[
].然而,由于错误信息和阴谋论的疯狂传播,煽情的使用推特可能对公共卫生和疫情应对工作构成巨大挑战[ ].数字世界中“假新闻”和“扭曲证据”的传染性爆发,可造成大规模恐慌,并在现实世界中造成破坏性和毁灭性的后果,扭曲证据,阻碍卫生保健工作者和公共卫生系统的应对努力和活动[ ].此外,几条推文还讨论了COVID-19对企业和国家的经济影响。推特用户可能会谈论COVID-19对经济的影响,例如,由于主要快餐连锁店和零售商(如麦当劳、肯德基、苹果和阿迪达斯)临时关闭[
]、汽车销量下降、石油需求下降、iPhone等生产推迟、一级方程式世界锦标赛等体育赛事取消或推迟,或航班取消导致航空公司收入下降[ , ].据估计,2019冠状病毒病的蔓延可能给全球经济造成2.7万亿美元的损失。 ].推特用户讨论的新冠肺炎的最后一个影响是旅行。这个话题可能很常见,因为大多数国家都禁止从其境内确认存在COVID-19的国家出发或前往这些国家。推文还聚焦于冠状病毒的两个可能来源:吃肉和中国生物军事实验室。推特上提到了减少COVID-19传播的两种主要方法:口罩和隔离。第一种方法(口罩)在推特上被频繁讨论,主要是因为几个国家(如中国、英国和美国)报告了口罩短缺。隔离是推特上的一个常见话题,因为这是各国申请控制COVID-19爆发的第一步。
实践及研究意义
实际意义
研究表明,现实生活中的危机应对活动和网络上的危机应对活动正变得越来越“同步和交织”[
].社交媒体为直接向公众传播和传播公共卫生知识和信息提供了一个有利可图的机会[ ].然而,社交媒体也可以成为一种强大的武器,如果使用不当,可能会对公共卫生工作造成破坏,特别是在公共卫生危机期间。因此,需要作出更多努力,通过检查通过万维网(包括社交媒体)发布的在线内容,建立国家和国际疾病检测和监测系统。有必要在社交媒体上更强有力、更积极主动地宣传公共卫生。政府和卫生系统还应“倾听”或监测公众发布的与卫生有关的推文,特别是在危机时期,以帮助为与公共卫生(如社会距离和隔离)和供应链等有关的政策提供信息。
研究的意义
全球COVID-19疫情及其在各国的疯狂传播表明,需要在研究界的帮助下提高警惕和及时应对。这并不是本研究的重点,但未来的研究应该结合传染病爆发来调查“假新闻”的传播[
].此外,有必要在保护隐私的同时,向科学界和公共卫生界提供获取社交媒体帖子核心语料库的途径。在社交媒体平台上进行多语言情感分析还需要更多的工作,因为大多数研究工作都致力于英语数据[ ,包括这项研究。如果可行的话,除了同时分析不同社交媒体平台上的传染病爆发之外,未来的研究还可以考虑纵向的、多语言的情感分析。优势与局限
这项研究分析了与最近COVID-19疫情相关的推文,有几个优点和局限性。在这项研究中,考虑到疾病的全球传播,对分析的推文没有施加地理限制。然而,这项研究只分析了英语推文,这可能限制了关于这场全球爆发的研究结果的普遍性。此外,鉴于Twitter标准搜索API不允许研究人员获得超过1周前发布的推文[
],我们无法在2020年2月2日之前发布与covid -19相关的推文。因此,研究结果可能无法推广到那个时期。此外,这项研究无法收集标记为私人账户的推文。因此,调查结果可能不能代表用户在推特上讨论的与COVID-19有关的所有话题。本研究只分析了Twitter上的帖子,因此,我们的发现可能无法推广到其他社交媒体平台。此外,这项研究报告的发现仅限于那些能够访问和使用Twitter的人。因此,在假设结果的普遍性之前,建议谨慎,因为Twitter并不是每个人都在使用。结论
COVID-19大流行影响了许多卫生保健系统和国家,夺去了许多人的生命。作为一个充满活力的社交媒体平台,推特通过人们与COVID-19有关的互动和帖子预测了这一沉重的损失。很明显,在现实世界和网上协调公共卫生危机应对活动是至关重要的,应该成为所有卫生保健系统的首要任务。我们需要建立更多的国家和国际检测和监测系统,以发现传染病的传播,并打击通常伴随着这些疾病的假新闻。
致谢
本文的出版由卡塔尔国家图书馆资助。
利益冲突
没有宣布。
潜在狄利克雷分配输出。
PDF档案(adobepdf档案),241kb
词云。
PDF档案(adobepdf档案),255kb
每个主题的相关术语。
PDF档案(adobepdf档案),182 KB
用于情感和交互分析的描述性统计。
XLSX文件(Microsoft Excel文件),35kb参考文献
- 陈杰,陈晨,陈杰,等。全球人类传染病疫情上升。J R Soc Interface 2014 Dec 06;11(101):20140950 [免费全文] [CrossRef] [Medline]
- 崔健,李峰,史志。致病性冠状病毒的起源与进化。Nat Rev Microbiol 2019 Mar;17(3):181-192 [免费全文] [CrossRef] [Medline]
- Zumla A, Chan JFW, Azhar EI, Hui DSC, Yuen K.冠状病毒-药物发现和治疗方案。Nat Rev Drug discoverv 2016 May;15(5):327-347 [免费全文] [CrossRef] [Medline]
- 世界卫生组织,2020年1月21日。新型冠状病毒(2019-nCoV)疫情报告1https://www.who.int/docs/default-source/coronaviruse/situation-reports/20200121-sitrep-1-2019-ncov.pdf?sfvrsn=20a99c10_4
- Velavan TP, Meyer CG。COVID-19疫情。热带医学国际健康2020年3月25日(3):278-280。[CrossRef] [Medline]
- 世界卫生组织2020年4月7日。2019冠状病毒病(COVID-19)情况报告- 78网址:https://www.who.int/docs/default-source/coronaviruse/situation-reports/20200407-sitrep-78-covid-19.pdf?sfvrsn=bc43e1b_2
- 薛晓峰,冯毅,梁红,傅凯,谢忠。基于推特的公共卫生监测——从监测预测到公众反应。数据2018年12月29日;4(1):6。[CrossRef]
- Shah Z, Surian D, Dyda A, Coiera E, Mandl KD, Dunn AG。自动评估社交媒体上分享的疫苗相关网页的可信度:一项推特监测研究。J Med Internet Res 2019年11月04日;21(11):e14007。[CrossRef] [Medline]
- Sinnenberg L, Buttenheim AM, Padrez K, Mancheno C, Ungar L, Merchant RM。推特作为健康研究的工具:系统回顾。中华医学会公共卫生杂志2017年1月;107(1):e1-e8。[CrossRef] [Medline]
- Shah Z, Dunn AG。通过将流数据中的意外变化映射到时空格中来检测Twitter上的事件。IEEE大数据2019:1-1。[CrossRef]
- Steffens MS, Dunn AG, Wiley KE, Leask J.促进疫苗接种的组织如何应对社交媒体上的错误信息:定性调查。BMC公共卫生2019年10月23日;19(1):1348。[CrossRef] [Medline]
- Shah Z, Martin P, Coiera E, Mandl KD, Dunn AG。与推特情绪相关的时空因素建模:改进局部偏差识别的综合和建议。J Med Internet Res 2019 May 08;21(5):e12881。[CrossRef] [Medline]
- 布莱DM,拉弗蒂JD。主题模型。正确的方法:文本挖掘。英国伦敦:查普曼和霍尔/CRC;2009:101 - 124。
- Dyda A, Shah Z, Surian D, Martin P, Coiera E, Dey A,等。澳大利亚HPV疫苗覆盖率和澳大利亚推特用户中HPV疫苗信息暴露的相关性。中国疫苗免疫杂志2019;15(7-8):1488-1495 [免费全文] [CrossRef] [Medline]
- 疾病控制和预防中心,2020年。防治网址:https://www.cdc.gov/coronavirus/2019-ncov/about/prevention-treatment.html[2020-02-23]访问
- 《柳叶刀传染病》2019年冠状病毒病的挑战。Lancet infection Dis 2020 Mar;20(3):261 [免费全文] [CrossRef] [Medline]
- 病毒性错误信息威胁公共卫生。CMAJ 2017 12月18日;189(50):E1567。[CrossRef] [Medline]
- 《商业内幕》2020年2月07日。随着致命的冠状病毒继续传播,中国的主要快餐连锁店和零售商正在关门。下面是闭包列表:https://www.businessinsider.com/coronavirus-fears-mcdonalds-starbucks-close-2020-1[2020-02-23]访问
- 赫特·R.世界经济论坛2020年2月17日。2019冠状病毒病对全球经济的影响https://www.weforum.org/agenda/2020/02/coronavirus-economic-effects-global-economy-trade-travel/[2020-02-23]访问
- Orlik T, Rush J, Cousin M, Hong J. Bloomberg. 2020年3月6日。冠状病毒可能使全球经济损失2.7万亿美元。这是如何URL:https://www.bloomberg.com/graphics/2020-coronavirus-pandemic-global-economic-risk/
- 韦尔SR,布纳T,帕朗查MJ。工作中文献综述:将社交媒体纳入风险和危机沟通。突发事件与危机管理杂志2011年6月01日;19(2):110-122。[CrossRef]
- brireland JY, Quintiliani LM, Schneider KL, May CN, Pagoto S.社交媒体作为提高公共卫生研究影响力的工具。美国公共卫生杂志2017年12月;107(12):1890-1891。[CrossRef] [Medline]
- 周伟,吴A,克莱因WMP。解决社交媒体上有关健康的错误信息。JAMA 2018 12月18日;320(23):2417-2418。[CrossRef] [Medline]
- Dashtipour K, Poria S, Hussain A, Cambria E, Hawalah AYA, Gelbukh A,等。多语言情感分析:技术的现状和独立比较。Cognit Comput 2016;8:757-771 [免费全文] [CrossRef] [Medline]
- Twitter。搜索推文网址:https://developer.twitter.com/en/docs/tweets/search/overview[2020-04-06]访问
缩写
API:应用程序接口 |
COVID-19:冠状病毒病 |
LDA:潜在狄利克雷分配 |
G·艾森巴赫(G Eysenbach)编辑;提交31.03.20;同行评议:R Zowalla, E Da Silva;作者评论02.04.20;20年4月9日收到修订本;接受09.04.20;发表21.04.20
版权©Alaa Ali Abd-Alrazaq, Dari Alhuwail, Mowafa Househ, Mounir Hamdi, Zubair Shah。最初发表于《医疗互联网研究杂志》(//www.mybigtv.com), 2020年4月21日。
这是一篇开放获取的文章,根据创作共用署名许可(https://creativecommons.org/licenses/by/4.0/)的条款发布,允许在任何媒介上无限制地使用、分发和复制,前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。