这是一篇开放获取的文章,根据创作共用署名许可(https://creativecommons.org/licenses/by/4.0/)的条款发布,允许在任何媒介上无限制地使用、分发和复制,前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。
COVID-19大流行造成了一场全球卫生危机,正在影响世界各地的经济和社会。在充满不确定性和意外变化的时代,人们将社交媒体平台作为沟通工具和主要信息来源。Twitter和新浪微博等平台允许社区分享讨论和情感支持;它们在个人、政府和组织之间交换信息和表达意见方面也发挥着重要作用。然而,研究大流行期间社交媒体用户表达的主要担忧的研究有限。
这项研究的目的是调查中国最大的社交媒体平台新浪微博在新冠肺炎疫情期间提出和讨论的主要问题。
我们使用了一个网络爬虫工具和一组预定义的搜索词(
根据收集到的203191条符合条件的微博,我们确定了17个主题,并将其分为8个主题。主题包括疫情统计、国内疫情、世界其他国家疫情、新冠肺炎治疗、医疗资源、经济冲击、隔离调查、患者求救、复工复产、心理影响、联防联控、物资捐赠、周边疫情、疫苗研发、疫情防控加油致敬、疫情检测、复学。11个话题的平均情绪为正面,6个话题的平均情绪为负面。平均转发数最高的话题是国内疫情,平均点赞数最高的话题是检疫和调查。
社交媒体用户表达的担忧与全球大流行的演变高度相关。在新冠肺炎疫情期间,社交媒体为中国政府部门和组织提供了一个更好地了解公众关切和需求的平台。同样,社交媒体为传播防疫信息提供了渠道,影响了公众的态度和行为。政府部门,特别是卫生相关部门,可以通过监测社交媒体平台,及时制定适当的政策,在疫情期间引导公众舆论和行为。
2020年6月29日,世界卫生组织(世卫组织)纪念2019冠状病毒病爆发六个周年[
现有研究表明,及时了解公众的态度和要求对应对公共危机至关重要[
大量的文献研究了社交媒体在分析公共危机时期的公众行为、态度和反应方面的作用。研究人员主要关注平台功能、用户行为特征以及危机期间社交媒体的使用。由于大多数平台均可在公共领域免费获得[
新浪微博是中国领先的微博平台;它允许用户发送和接收字符限制的短帖子,并通过在定义的日期范围内搜索指定的关键字来检索文本内容。利用这一功能,我们收集了2019年12月1日至2020年7月31日期间与COVID-19相关的共享微博帖子。章鱼网络爬虫工具被用来搜索预定义的关键字,包括
在汉语中,单词之间没有明显的区分。因此,为了完成潜狄利克雷分配(latent Dirichlet allocation, LDA)处理任务,有必要在单词之间添加明显的分隔符。我们对数据预处理过程中采集到的文本内容进行中文分割。一种广泛使用的中文分词工具ictclas被用于将微博帖子按空格分隔成单词组。例如,“京东宣布向武汉市分批捐赠100万个医用口罩和6万件医疗用品”的微博被细分为“京东宣布/向武汉市/分批捐赠/ 100万个医用口罩/和/ 6万件/医疗用品/”。此外,我们删除了停顿词[
我们通过指定LDA所需的主题数量来应用主题建模,将微博帖子集分离为定义的集群[
LDA是一种广泛使用的主题建模算法[
为了确定恰当的LDA话题数量,我们使用一致性评分来进行判断;该方法对于选择合适数量的LDA主题非常有用[
随后,我们进行人工分析,从每个主题的前30个关键词中选取具有代表性和比例较高的关键词。接下来,就17个主题及相关关键词达成共识。最后,利用这些关键词对微博进行分类;我们还得到了每个话题下的微博数量,以及每个话题在所有相关微博中的比例。中提供了每个主题的微博帖子示例
微博的例子如下:
新型冠状肺炎的突然爆发对国家的经济运行造成了影响。国内生产总值负增长,国际国内环境日益复杂。但在逆周期调整政策的强力对冲下,复工复产快速推进,3月主要经济指标出现反弹,降幅明显收窄。
这条微博可以分为复工复产和经济冲击两个主题。
我们还对收集到的数据进行了其他分析,比如情绪分析。情感得分在-1.0到1.0之间变化,-1.0是最消极的文本,1.0是最积极的文本。此外,我们通过分析每个主题的平均转发数、点赞数和评论数来计算每个主题的用户互动率。最后,利用发布时间和地点,我们分析了基于时间段的用户关注的变化,以及基于中国地区的用户参与COVID-19相关讨论的差异。
使用网络爬虫工具和预定义的搜索词,我们从新浪微博平台获得了2019年12月1日至2020年7月31日期间分享的共计203191条微博帖子。
根据LDA的结果和每个主题所涉及的关键词,我们可以将主题分为8个主题:(1)患者入院;(二)治疗和研究;(3)治疗资源;(四)共同抗击疫情;(五)恢复秩序;(六)新型冠状病毒感染的防控措施;(七)国内外疫情情况;(8)新冠肺炎疫情影响。每个主题对应的术语显示在
微博所涉及的话题及对应的代表性词汇。
主题 | 主题 | 对应于每个主题的术语 |
病人入院 | 病人的呼救声 |
|
治疗和研究 | COVID-19治疗 |
|
|
疫苗开发 |
|
处理资源 | 医疗资源 |
|
共同抗击疫情 | 材料捐赠 |
|
|
为抗疫行动加油、致敬 |
|
恢复秩序 | 复工复产 |
|
|
研究恢复 |
|
新冠肺炎疫情防控措施 | 检疫与调查 |
|
|
联防联控 |
|
|
检测 |
|
国内外疫情形势 | 国内流行 |
|
|
邻国疫情 |
|
|
世界其他国家的流行病 |
|
|
流行病统计 |
|
COVID-19的影响 | 经济冲击 |
|
|
心理上的影响 |
|
本主题所包含的主题是患者的呼救,涉及已感染或可能感染新冠病毒的患者及其治疗情况。等待治疗的患者的呼救引起了广泛的关注,而这些患者随后的接收和治疗也引起了极大的关注。
本主题包含两个主题。第一个话题是COVID-19治疗。在本课题中,COVID-19患者的康复受到了广泛关注,如出院人数和康复人数。与此同时,治疗方法也引起了公众的广泛关注,例如使用中药治疗。本主题的第二个主题是疫苗开发。在这个话题中,疫苗及其临床试验的研究进展引起了很多评论。与此同时,关于疫苗是否能达到预防病毒的目标,人们一直存在广泛的争论。
本主题的主题是医疗资源。本课题主要关注医疗资源的核心方面;医务人员和病房,医疗资源的配置和整合,流动小屋医院等临时医院的建立,都是人们普遍关注的问题。
本主题包括两个主题。第一个话题是物资捐赠。在中国大陆抗击疫情初期,口罩等防疫物资极度匮乏。这一事件引起了广泛关注,各种防疫物资的捐赠成为一个活跃的话题。二是为抗疫行动加油、致敬。本课题包括两个方面;第一个方面是战胜疫情的信心和决心。关键词:
随着新冠肺炎疫情在中国大陆的传播逐渐得到控制,恢复生产和正常生活方式成为一个活跃的话题。本主题包括两个子主题。一是复工复产。复工复产的进展和安排引起广泛关注和讨论。这项旨在恢复正常生产经营秩序的工作得到了中国民众的广泛支持。第二个话题是复学,主要涉及两个方面:一是各年龄段学生返校的时间,二是高考的时间。
本主题包括三个主题。第一个主题是隔离调查,包括两个方面:咳嗽、发烧等症状调查和隔离时间。特别是,14天的隔离期已经成为标准。
二是联防联控。采取联防联控措施和设立指挥部是中国政府应对疫情的重要举措。这也是中国政府在短期内控制疫情的关键。相应地,它也得到了广泛的认可,并引起了公众的高度关注。
最后一个主题是检测。与本课题相关的主要内容是核酸检测,核酸检测是确定患者是否感染了COVID-10或SARS-CoV-2的重要方法。检测的话题引起了广泛的讨论。
本主题包括四个主题。第一个话题是国内疫情。一方面,由于湖北和武汉是中国抗击疫情的主战场,这些地区的疫情受到了相当多的关注。另一方面,新冠肺炎疫情在中国的蔓延也引起社会高度关注。邻国的流行病是第二个主题。这一话题的高峰出现在2020年2月中下旬,当时疫情开始从中国蔓延到日本、韩国、俄罗斯等邻国。这引起了新浪微博用户的热议。
第三个主题是世界其他国家的流行病。在本专题出现时,这一流行病已在全球蔓延;因此,主题涉及了许多国家和地区。美国作为疫情最严重的国家,引起了新浪微博博主的广泛关注。特别是,美国总统特朗普表示,如果美国新冠肺炎死亡人数能控制在10万人以下,“我们共同做得非常好”[
本主题有两个主题。首先是经济冲击。本专题主要涉及疫情对全球经济和市场的负面影响。第二个主题是心理影响。一方面,新冠肺炎疫情给社会公众带来了沉重的心理打击,担忧、恐惧等情绪在民众中蔓延。另一方面,民众也希望并相信,抗疫斗争将取得成功,并保持乐观情绪。
为了了解所确定的各种主题的具体关注程度,我们通过计算每个主题的微博帖子数来确定每个主题的数量和比例。例如,每个话题的比例是关于该话题的微博分享数除以微博总数(N=203,191)。我们的分析结果显示在
如
COVID-19治疗备受期待,长期受到公众关注,占比为11.1%(22725 / 203191)。医疗资源在抗击疫情中尤为重要,这一主题占岗位总数的10.9%(22246 / 203191)。新冠肺炎疫情对经济的重大影响,与人民群众利益密切相关;因此,经济冲击的话题也受到了很高的关注,以10.1%的帖子(20699 / 203191)排在第6位。检测隔离作为新冠肺炎疫情防控最重要的措施之一,在疫情发生以来的各个阶段都受到了广泛关注,占岗位总数(18541 / 203191)的9.12%。患者呼救话题也引起了广泛关注,占帖子总数的8.61%(17513 / 203191)。
新浪微博上与每个话题相关的微博数(N=203,191), N(%)。
排名 | 主题 | 微博文章 |
1 | 流行病统计 | 54513 (26.8) |
2 | 国内流行 | 36936 (18.1) |
3. | 世界其他国家的流行病 | 28329 (13.9) |
4 | COVID-19治疗 | 22725 (11.1) |
5 | 医疗资源 | 22246 (10.9) |
6 | 经济冲击 | 20699 (10.1) |
7 | 检疫与调查 | 18541 (9.12) |
8 | 病人的呼救声 | 17513 (8.61) |
9 | 复工复产 | 15914 (7.83) |
10 | 心理上的影响 | 14485 (7.12) |
11 | 联防联控 | 12457 (6.13) |
12 | 材料捐赠 | 12434 (6.11) |
13 | 邻国疫情 | 11995 (5.90) |
14 | 疫苗开发 | 9428 (4.64) |
15 | 为抗疫行动加油、致敬 | 9413 (4.63) |
16 | 检测 | 8939 (4.39) |
17 | 研究恢复 | 6889 (3.39) |
中国恢复经济秩序的重要举措是复工复产,这与人民生活息息相关。该话题的微博帖子占比7.83%(15914 / 203191)。疫情也极大地影响了公众的心理;因此,心理影响话题也受到了很大的关注,发帖比例为7.12%(14485 / 203191)。联防联控和物资捐赠受到一定关注。这两个话题分别排在第11位和第12位,占比分别为6.13%(12457 / 203191)和6.11%(12434 / 203191)。邻国的情况也引起了新浪微博用户的评论,尽管持续时间很短;因此,该话题排名第13位,占帖子总数的5.90%(11995 / 203191)。
疫苗的开发也得到了公众的讨论,相关微博帖子占4.64%(9428/ 203191)。抗击COVID-19是一场国家战争,公民们推动讨论如何战胜大流行。与此主题相关的帖子比例为4.63%(9413/ 203191)。检测作为识别新冠肺炎感染患者的重要手段,也得到了一定程度的重视,占4.39%(8939/ 203191)。在中国大陆疫情得到控制后,也提到了复学;但与其他话题相比,该领域的关注程度相对较低,仅占总帖子数(6889/ 203191)的3.39%。
基于收集到的微博元数据,包括转发数、评论数和点赞数,我们能够分析每个话题用户之间的互动水平。同时,我们对每个话题进行情感分析,得到每个话题的情感值。
值得注意的是,本文报道的数据包括意见领袖发布的微博。这些微博的转发、评论和点赞数量都很高。例如,“钟南山说莲花清温胶囊被证明对治疗新冠肺炎有效”的帖子,转发数、评论数和点赞数分别为13599、19022和344780。因此,本文的平均转发数、评论数和点赞数都很高。
从
每个主题的用户交互和情感分析结果。
排名 | 主题 | 转发(平均) | 评论(平均) | 喜欢(平均) | 人气值 |
1 | 复工复产 | 8 | 12 | 87 | 0.16 |
2 | 邻国疫情 | 29 | 22 | 199 | -0.006 |
3. | 冠状病毒的治疗 | 26 | 26 | 244 | -0.05 |
4 | 疫苗开发 | 24 | 16 | 199 | 0.08 |
5 | 流行病统计 | 15 | 12 | 178 | -0.11 |
6 | 经济冲击 | 18 | 10 | 97 | 0.051 |
7 | 材料捐赠 | 35 | 17 | 245 | 0.058 |
8 | 国内流行 | 71 | 20. | 184 | 0.024 |
9 | 医疗资源 | 34 | 35 | 241 | 0.031 |
10 | 检疫与调查 | 33 | 24 | 280 | -0.049 |
11 | 心理上的影响 | 29 | 29 | 217 | 0.041 |
12 | 联防联控 | 15 | 13 | 236 | 0.146 |
13 | 研究恢复 | 7 | 10 | 129 | 0.083 |
14 | 为抗疫行动加油、致敬 | 19 | 13 | 248 | 0.073 |
15 | 世界其他国家的流行病 | 11 | 10 | 118 | -0.117 |
16 | 病人的呼救声 | 22 | 18 | 224 | -0.017 |
17 | 检测 | 14 | 16 | 129 | 0.041 |
通过微博帖子的发布时间,我们可以分析不同时间段用户关注点的变化。同样,我们使用发布地点来分析中国不同地区用户参与COVID-19相关讨论的差异。
1月至5月主要话题的帖子比例变化。
中国各省微博发文数。
我们的研究于2019年12月1日至2020年7月31日进行,确定了8个主题和17个主题。在这些话题中,与新冠肺炎治疗相关的内容引起了极大的关注,特别是与患者的呼救和焦虑、恐慌等情绪相关的内容。由于新浪微博上普遍存在负面情绪,虚假信息和谣言更容易影响公众舆论,从而对抗疫行动产生负面影响。此外,新浪微博用户对新冠肺炎治疗和疫苗研发的进展也表现出了极大的兴趣。与此同时,医疗资源是否充足,能否满足患者的治疗需求,也引起了大量新浪微博用户的关注和讨论。
新浪微博用户也高度关注国内外疫情的实时情况。特别是,许多微博帖子包含了疫情发展的实时数据。此外,新浪微博用户不仅关注中国大陆的疫情,还大量讨论了周边国家和世界其他地区疫情的发展演变。此外,在新浪微博网友关注的17个话题中,还包括疫情防控措施、疫情后期秩序恢复措施、疫情影响等。
我们的研究结果表明,2019年12月和2020年1月是应对COVID-19大流行的关键时期,国内疫情和大流行统计数据在此期间受到了广泛关注。与此同时,疫情的突然爆发也影响了公众的心理。一方面,公众相信抗击疫情的斗争最终会取得胜利;另一方面,恐惧和担忧等情绪也在公众中蔓延。
2020年2月至3月是遏制疫情在中国大陆蔓延的关键时期[
2020年6月至7月,全球COVID-19感染和死亡人数持续上升。新浪微博用户的关注点从中国转移到世界其他地方,用户开始更多地关注其他国家的疫情和不断增长的疫情统计数据。
从微博帖子的空间分布信息来看,中国不同地区对新冠肺炎疫情的讨论存在差异。参与程度最高的六个地区是湖北省、河南省、广东省、安徽省、江苏省和湖南省。湖北省是中国新冠肺炎疫情的中心,而河南省、湖南省、安徽省都与湖北相邻,有很多人在湖北工作。江苏省作为经济发达地区,人员流动率较高。因此,这些省份的新浪微博用户更可能关注疫情。广东省在2003年经历了严重急性呼吸系统综合征(SARS)疫情,这是该地区更多用户参与新冠肺炎大流行讨论的重要原因。
最近的一项研究报告了推特用户关心的与COVID-19相关的主要话题[
第二,新浪微博用户关注疫情的实时状态。这不仅包括国内疫情,也包括国外疫情的发展。与此同时,在疫情中后期,复工复产、复学复学等恢复秩序的工作受到广泛关注。以下两个原因可能导致了上述独特问题的出现。一是中国公民是最早经历新冠肺炎疫情的国家,对疫情的发展变化比其他国家的民众更加敏感;二是中国作为全球疫情防控最有效的国家,已经具备了恢复秩序的条件[
情感分析结果表明,在17个主题中,具有积极情感值的主题为11个,具有消极情感值的主题为6个;对于大多数话题,用户没有明显的积极或消极情绪倾向。但是,需要注意的是,仍然有一些话题,其中某一方面的情感价值是显著的。例如,大流行统计数据等话题显示出消极的情绪倾向。负面情绪在新浪微博上的持续积累和传播,可能会引发市民的非理性行为,导致用户受到谣言或极端情绪的影响[
随着新冠肺炎疫情在全球范围内的爆发和传播,公民们纷纷转向新浪微博等社交媒体渠道,分享他们的观点,寻求澄清,并讨论与危机相关的话题。以往的研究表明,对公众行为和态度的分析和控制可以有效地帮助政府应对危机。
在本文中,我们收集了新浪微博的数据,并从数量、比例、情感和时空分布的角度进行分析。我们确定了用户对与COVID-19相关的各种话题的关注程度和情绪倾向,并确定了每个话题的时间分布以及用户参与话题讨论的空间差异。调查结果有助于深入了解公众对新冠肺炎疫情的看法和态度,是做好疫情防控工作的前提和基础。
本文在前人已有理论的基础上,结合新冠肺炎疫情这一时效性课题。通过对新浪微博微博的分析,从公众关注的与新冠肺炎相关的话题中得出实用的结论。同时,不可否认的是,本文也存在一定的局限性。首先,本研究收集的微博仅包括部分与新冠肺炎相关的微博,并非全部。因此,对新浪微博用户关注的主要问题的总结并不全面。其次,新浪微博用户多为年轻人;因此,我们的分析结果更能代表更年轻的公民。最后,虽然新浪微博的用户数量在中国是比较多的,但我们不能草率地得出结论,网上表达的意见就代表了普遍的民意。
COVID-19疫情对世界经济产生了严重影响,并给人们的生活和旅行方式带来了诸多挑战。与新冠肺炎相关的话题在新浪微博等社交媒体平台上引起了广泛关注和讨论。通过分析新冠肺炎话题的微博帖子,我们获得了公民对病毒相关话题的意见,从而找到解决社会和经济问题的解决方案[
每个主题的微博示例。
中文主题。
潜在狄利克雷分配
严重急性呼吸系统综合症
国家自然科学基金项目(Award # 61602198)和国家自然科学基金项目(Award # 72042016)的部分资助。
没有宣布。