发表在第22卷11号(2020): 11月

本文的预印本(早期版本)可在https://preprints.www.mybigtv.com/preprint/22152,首次出版
新冠肺炎疫情期间中国社交媒体用户表达的担忧:新浪微博数据的内容分析

新冠肺炎疫情期间中国社交媒体用户表达的担忧:新浪微博数据的内容分析

新冠肺炎疫情期间中国社交媒体用户表达的担忧:新浪微博数据的内容分析

原始论文

1华中科技大学公共管理学院,中国武汉

2华中科技大学非传统安全研究中心,中国武汉

3.华中科技大学医学与卫生管理学院,中国武汉

4英国伦敦布鲁内尔大学工程、设计与物理科学学院

5武汉大学政治与公共管理学院,中国武汉

通讯作者:

张伟博士

医学与卫生管理学院

华中科技大学

香港道13号

Qiaokou区

武汉,430074

中国

电话:86 13397110378

电子邮件:weizhanghust@hust.edu.cn


背景:2019冠状病毒病大流行造成了一场全球卫生危机,正在影响全世界的经济和社会。在不确定和意想不到的变化时期,人们转向社交媒体平台作为沟通工具和主要信息来源。Twitter和新浪微博等平台允许社区分享讨论和情感支持;它们在个人、政府和组织交流信息和表达意见方面也发挥着重要作用。然而,研究大流行期间社交媒体用户表达的主要担忧的研究有限。

摘要目的:本研究的目的是调查在COVID-19大流行期间,公民在中国最大的社交媒体平台新浪微博上提出和讨论的主要问题。

方法:我们使用了一个网络爬虫工具和一组预定义的搜索词(新型冠状病毒肺炎新型冠状病毒,新型冠状病毒肺炎)调查新浪微博用户提出的担忧。收集2019年12月1日至2020年7月32日期间发布的微博文本信息和元数据(点赞数、评论数、转发数、发布时间、发布地点)。在对收集到的文本的单词进行分割之后,我们使用主题建模技术——潜在狄利克雷分配(latent Dirichlet allocation, LDA)来识别用户发布的最常见主题。我们分析了话题的情感倾向,计算了话题的比例分布,利用点赞、评论和转发的数据对话题进行了用户行为分析,并研究了中国大陆不同地区公民用户关注的变化和参与的差异。

结果:根据收集到的203191条符合条件的微博,我们确定了17个话题,并将其分为8个主题。主题包括:疫情统计、国内疫情、世界各国疫情、新冠肺炎治疗、医疗资源、经济冲击、检疫调查、患者呼救、复工复产、心理影响、联防联控、物资捐赠、周边疫情、疫苗研制、加油致敬防疫行动、检测、复学。平均看法是正面的有11个,负面的有6个。转发均值最高的话题是国内疫情,点赞均值最高的话题是检疫和调查。

结论:社交媒体用户表达的担忧与全球大流行的演变高度相关。在新冠肺炎疫情期间,社交媒体为中国政府部门和组织更好地了解公众关切和需求提供了平台。同样,社交媒体提供了传播防疫信息的渠道,并影响了公众的态度和行为。政府部门,特别是与卫生有关的部门,可以通过监测社交媒体平台,及时制定适当的政策,在疫情期间引导公众舆论和行为。

医学与互联网学报,2020;22(11):e22152

doi: 10.2196/22152

关键字



2020年6月29日,世界卫生组织(世卫组织)纪念新冠肺炎疫情爆发6个月纪念日[1]。2019年12月31日,由SARS-CoV-2引起的未知肺炎株(现称为COVID-19)的第一例病例在湖北省武汉市报告,随后在全球产生了深远影响。2020年1月初,武汉报告了聚集性肺炎病例后,进行了实验室分析,导致该流行病被世卫组织确定为一种新的冠状病毒,正式命名为SARS-CoV-2。截至2020年7月3日,中国内地累计报告确诊病例83545例[2]。新冠肺炎疫情在中国爆发后,迅速在全球蔓延。截至2020年8月18日,全球共有214个国家和地区报告了新冠肺炎确诊病例,病例总数超过2100万例,死亡总人数超过76万例[3.]。COVID-19全球平均死亡率约为0.3%-1.5%;然而,在美国、巴西和墨西哥等国家,COVID-19的死亡率要高得多。随着新冠肺炎疫情在全球范围内蔓延,疫情逐渐在社交媒体平台上引起广泛关注和讨论。这一趋势在中国最大的社交媒体平台之一新浪微博上尤为明显。

现有的研究表明,及时了解公众的态度和需求在应对公共危机方面发挥着重要作用[45]。大多数社交媒体平台都具有面向媒体的功能,这些功能对于中介信息传播至关重要。公民可以在社交媒体上及时收到政府提供的经过事实核查的最新信息,而政府可以利用公民发布的公开信息更好地了解公众的态度、关注点和诉求[6-8]。截至2020年5月,新浪微博用户已超过5亿,它为公民互动提供了多种沟通机制,使中国公众能够分享信息和交换意见[9-11]。通过分析新浪微博上市民对新冠肺炎的担忧,政府可以更好地了解公众的态度和需求[1213]并澄清政府部门和组织在应对大流行时面临的现有挑战。这项研究为决策者提供了重要的见解和启示,特别是那些在公共卫生部门工作的决策者。研究结果对公众认知有了更深入的了解,也凸显了实践中存在的不足,以更好地满足公众需求。

大量文献研究了社交媒体在分析公共危机时期公众行为、态度和反应方面的作用。研究人员主要关注危机期间的平台功能、用户行为特征和社交媒体使用情况。由于大部分平台均可在公众领域免费使用[14],它们已成为公民在COVID-19大流行期间保持联系、讨论关切和意见、逃离单调封锁的广泛采用的方法[15]。研究人员一致认为,在大流行期间,社交媒体已成为信息传播的重要媒介[16]并在信息共享方面发挥着独特的作用[17]和医疗保健讨论[18]。有学者对社交媒体平台上的用户行为和连接网络进行了研究,认为人格特征会影响用户的行为[19],而网络包括积极和消极的联系[20.21]。社交媒体在应对公共危机中的独特地位和作用也引起了研究者的极大关注。他们一致认为,社交媒体平台在危机管理中发挥着重要作用,特别是在向公民提供及时信息方面[22并减少公民的焦虑和恐惧[23]。在现有研究的基础上,本文收集了中国领先的微博平台新浪微博的数据,分析了公民在COVID-19大流行期间表达的主要担忧。

方法

数据收集

新浪微博是中国领先的微博平台;它使用户能够发送和接收字符有限的短帖子,并通过在定义的日期范围内搜索指定的关键字来检索文本内容。利用该功能,我们收集了2019年12月1日至2020年7月31日期间与COVID-19相关的共享微博。使用Octopus网络爬虫工具搜索预定义的关键字,包括新型冠状病毒肺炎冠状病毒新型冠状病毒,新型冠状病毒肺炎。除了收集的文本内容外,我们还获取了每条微博的元数据,包括点赞数、评论数、转发数、发布时间和发布地点。元数据中的位置信息是指与微博相关的新浪微博账号的注册地址。为了获得这些数据,我们使用了新浪微博的高级搜索功能。

数据预处理

在汉语中,单词之间没有明显的分隔。因此,为了完成潜在狄利克雷分配(latent Dirichlet allocation, LDA)处理任务,有必要在词之间添加明显的分隔符。我们对数据预处理过程中收集到的文本内容进行了中文切分。使用广泛使用的中文分词工具ictclass将微博帖子分成以空格分隔的词组。例如,微博“京东宣布向武汉市分批捐赠100万只医用口罩和6万件医疗用品”被细分为“京东宣布向武汉市分批捐赠100万只医用口罩和6万件医疗用品”。此外,我们删除了停顿词[24],类似于在英语文本分析中删除“an”和“the”等停顿词。汉语停止词主要分为以下两类:常用词汇,如me, you, some, every day;语气助词,副词,介词,连词等本身没有意义的词,如in, yes, so, and then []25]。此外,标点符号和表情符号等字符也被删除。

数据分析

我们通过指定LDA所需的主题数来应用主题建模,将微博帖子集划分为定义的聚类[26]。LDA可以用来识别新浪微博上分享的微博帖子中最常见的话题。主题建模是一种无监督的机器学习技术,可以识别文档集合中的集群(在我们的例子中是微博帖子)。在本研究中,我们使用了LDA4j包中的LDA算法。LDA4j是用Java语言实现的LDA算法,项目可以从GitHub免费下载[27]。

LDA是一种应用广泛的主题建模算法[28]。根据LDA模型,文档(即微博帖子的文本)是词汇表的集合,可能包含多个主题。LDA模型的目标是推测基于给定文档的主题分布[29]。使用LDA建模,我们可以将给定的文档映射到一组固定的主题,并捕获每个主题的代表性单词。然后,在微博帖子数据集中建立自然聚类。

为了确定适当的LDA主题数量,我们使用连贯评分来进行判断;该方法已被提出用于选择合适数量的LDA主题[30.]。通过对话题数的不断调整,我们发现当话题数为17时,一致性得分达到了最优值[31]。因此,我们设置LDA模型将微博帖子集划分为17个聚类;提供了文本集多媒体附录1

随后,我们进行了人工分析,从每个主题的前30个关键词中选择了具有代表性和高占比的关键词。接下来,就17个议题及相关关键词达成共识。最后,利用这些关键词对微博进行分类;我们还得到了每个话题下的微博帖子数以及每个话题在所有相关微博中所占的比例。中提供了每个主题的微博帖子示例多媒体附录2

以微博为例:

突如其来的新型冠状肺炎疫情对国家经济运行产生了影响。它带来了国内生产总值的负增长和日益复杂的国际国内环境。但在逆周期调整政策的强力对冲下,复工复产快速推进,3月主要经济指标呈现反弹,降幅明显收窄。

这条微博可以分为两个不同的主题:复工复产和经济冲击。

我们还对收集到的数据进行了其他分析,比如情绪分析。情绪得分在-1.0和1.0之间变化,-1.0是最消极的文本,1.0是最积极的文本。此外,我们通过分析每个话题的平均转发数、点赞数和评论数来计算每个话题的用户交互率。最后,利用发布时间和地点,我们分析了用户关注的时间段变化以及用户参与COVID-19相关讨论的中国地区差异。


使用网络爬虫工具和预定义的搜索词,我们从新浪微博平台上获得了2019年12月1日至2020年7月31日期间共享的203191条微博。

微博分析

主题

根据LDA得到的结果和每个主题所涉及的关键词,我们可以将主题分为8个主题:(1)患者入院;(2)治疗和研究;(3)治疗资源;(四)共同抗击疫情;(五)恢复秩序;(六)新型冠状病毒肺炎防控措施;(七)国内外疫情情况;(8)疫情影响。每个主题对应的术语见表1;这些关键词也被用作主题分类的标准。

表1。微博所涉及的话题以及每个话题对应的代表性术语。
主题 主题 与每个主题对应的术语
病人入院 病人的呼救声 帮助注意扩散接收
治疗和研究 COVID-19治疗 出院治愈治疗康复中药

疫苗开发 疫苗预防药物临床试验
处理资源 医疗资源 医疗医生医疗保健护士移动舱病房
共同抗击疫情 材料捐赠 面具材料捐款

助燃和致敬抗疫行动 齐心协力耶和华见证人团结就是力量责任坚持下去战斗
努力恢复秩序 复工复产 恢复工作恢复生产就业操作

研究恢复 返回学校学生学校高中高考
新冠肺炎防控措施 检疫及调查 检疫联系发热14天调查

联防联控 总部工作领导小组联合防御联合控制

检测 核酸积极的
国内外疫情形势 国内流行 武汉湖北监狱浙江山东

邻国的流行病 日本韩国东京俄罗斯

全球其他国家的流行病 美国特朗普英国意大利印度巴西法国

流行病统计 例确诊病例新发病例累积的情况下疑似病例
COVID-19的影响 经济冲击 经济影响市场冲击

心理上的影响 希望担心恐惧可怕的
主题1:病人入院

本主题的主题是患者的呼救,涉及已感染或可能感染COVID-19的患者及其治疗情况。等待治疗的患者的呼救声引起了广泛的关注,而这些患者的后续接待和治疗也引起了极大的关注。

主题2:治疗与研究

这个主题包含两个主题。第一个主题是COVID-19治疗。在本专题中,COVID-19患者的康复情况受到了广泛关注,例如出院人数和康复人数。与此同时,治疗方法也引起了公众的广泛关注,比如使用中药治疗。本主题的第二个主题是疫苗开发。在本专题中,有关疫苗及其临床试验的研究进展引起了许多评论。与此同时,关于疫苗是否能达到预防病毒的目的一直存在广泛的争论。

主题3:治疗资源

本主题的主题是医疗资源。本课题关注医疗资源的核心方面;医护人员和医院病房,医疗资源的配置和整合,以及建立移动舱医院等临时医院,都是人们普遍关注的问题。

主题4:共同抗击疫情

这个主题包括两个主题。第一个话题是物资捐赠。在中国大陆抗击疫情初期,口罩等防疫物资极为匮乏。这一问题引起了广泛关注,各类防疫物资的捐赠成为一个活跃的话题。第二个主题是推动和致敬抗疫行动。本课题包括两个方面内容;第一个方面是战胜大流行病的信心和决心。关键词:战斗失败代表了新浪微博用户对抗击新冠肺炎的总体态度。第二个方面,即合作防治大流行病,经常被讨论;关键短语如齐心协力团结就是力量经常被提及。

主题5:努力恢复秩序

随着新冠肺炎疫情在中国大陆的蔓延逐步得到控制,恢复生产、恢复正常生活成为一个活跃的话题。这个主题包括两个子主题。第一个分议题涉及复工复产问题。复工复产的进展和安排引起广泛关注和讨论。这项工作旨在恢复正常的生产经营秩序,得到了中国人民的广泛支持。第二个话题是复学,主要涉及两个方面:一是各年龄段学生返校的时间,二是高考的时间。

主题6:COVID-19防控措施

这个主题包括三个主题。第一个主题是检疫和调查,包括两个方面:症状调查,如咳嗽和发烧,和隔离时间。特别是,14天的隔离期已成为标准。

二是联防联控。采取联防联控措施,设立疫情指挥部,是中国政府为应对疫情采取的重要举措。这也是中国政府短期内控制疫情的关键。相应地,它也得到了广泛的认可和公众的高度关注。

最后一个主题是检测。与本课题相关的主要内容是核酸检测,这是确定哪些患者感染了COVID-10或是否感染了SARS-CoV-2的重要途径。检测的话题引起了广泛的讨论。

主题七:国内外疫情形势

本主题包括四个主题。第一个话题是国内疫情。一方面,由于湖北和武汉是中国抗击疫情的主战场,这两个地区的疫情受到高度关注。另一方面,疫情在中国的蔓延也引起了公众的高度关注。邻国的流行病是第二个主题。这一话题的高峰出现在2020年2月中下旬,当时疫情开始从中国蔓延到日本、韩国和俄罗斯等邻国。这引起了新浪微博用户的热烈讨论。

第三个主题是世界其他国家的流行病。当这个话题出现时,疫情已经在全球蔓延;因此,这个话题包括了许多国家和地区。美国作为受疫情影响最严重的国家,引起了新浪微博博主的广泛关注。特别是美国总统特朗普表示,如果美国的新冠肺炎死亡人数能够控制在10万人以下,“我们大家一起就做得很好”。32一直是人们热议的话题。与此同时,其他病例数量严重的国家,如意大利、印度、巴西和法国,也引起了广泛的争论。第四个主题是流行病统计。COVID-19的流行数据,如确诊病例数、新发病例数、疑似病例数等,受到广泛关注和讨论;公众对流行病数据的关注和讨论一直贯穿于该流行病演变的各个阶段。疫情统计可分为国内疫情数据和国际疫情数据两部分。国内疫情数据指国家卫生健康委员会公布的病例数据。例如,截至2020年7月31日,全国累计治愈78989例,累计报告确诊病例84337例。国际流行病数据由世界各国政府公布[33]。例如,截至2020年7月31日,全球每日确诊病例数超过28.9万例,总计1740万例[34]。仅美国一天就增加了7万多例确诊病例[35]。

主题8:COVID-19的影响

这个主题有两个主题。首先是经济冲击。这个话题主要是指疫情对全球经济和市场的负面影响。第二个主题是心理影响。一方面,疫情的爆发给公众带来了巨大的心理打击,焦虑、恐惧等情绪在市民中蔓延。另一方面,公众也希望并相信抗击疫情能够取得成功,保持乐观情绪。

主要题目比例分析结果

为了了解所识别的各个话题的具体关注程度,我们通过统计每个话题的微博帖子数来确定每个话题的数量和比例。例如,每个话题的比例是该话题的微博分享数除以微博总数(N=203,191)。我们的分析结果显示在表2

如图所示表2在美国,与大流行病有关的统计数据可被视为一种衡量标准,以确定公民在流行病期间对当前形势的了解程度。自首次爆发以来,大流行统计主题受到了极大关注,排名第一,占26.8%(54,513/203,191)。国内疫情一直是公众关注的焦点,特别是在中国大陆疫情尚未完全控制的情况下。微博中关于该话题的帖子数占比18.1%(54513条/ 203191条),排名第二。随着新冠肺炎疫情在全球蔓延,其他国家有关新冠肺炎疫情的微博数量持续增长;这个话题以13.9%(28329 / 203191)的比例排名第三。

新型冠状病毒肺炎的治疗长期受到公众的高度期待和关注,占11.1%(22,725/203,191)。医疗资源在防治这一流行病方面尤为重要,这一主题占员额总数的10.9%(22 246/203 191)。新冠肺炎疫情对经济的巨大影响与公众利益密切相关;因此,“经济冲击”话题也受到了高度关注,以10.1%(20,699/203,191)位居第6位。作为控制和预防新冠肺炎疫情传播的最重要措施之一,在疫情发生以来的各个阶段,检测隔离话题都受到了相当大的关注,占总帖子数的9.12%(18,541/203,191)。患者呼救话题也引起了广泛关注,占总帖子数的8.61%(17,513/203,191)。

表2。每个话题在新浪微博上的相关微博数(N=203,191), N(%)。
排名 主题 微博文章
1 流行病统计 54513 (26.8)
2 国内流行 36936 (18.1)
3. 全球其他国家的流行病 28329 (13.9)
4 COVID-19治疗 22725 (11.1)
5 医疗资源 22246 (10.9)
6 经济冲击 20699 (10.1)
7 检疫及调查 18541 (9.12)
8 病人的呼救声 17513 (8.61)
9 复工复产 15914 (7.83)
10 心理上的影响 14485 (7.12)
11 联防联控 12457 (6.13)
12 材料捐赠 12434 (6.11)
13 邻国的流行病 11995 (5.90)
14 疫苗开发 9428 (4.64)
15 助燃和致敬抗疫行动 9413 (4.63)
16 检测 8939 (4.39)
17 研究恢复 6889 (3.39)

中国恢复经济秩序的一项重要举措是复工复产,这与公民的生活息息相关。微博中关于该话题的帖子占比为7.83%(15,914/203,191)。疫情也极大地影响了公众的心理;因此,心理影响的话题也受到了关注,帖子比例为7.12%(14,485/203,191)。联防联控和物资捐赠受到一定重视。这两个话题分别排在第11位和第12位,占比分别为6.13%(12,457/203,191)和6.11%(12,434/203,191)。邻国的情况也引起了新浪微博用户的评论,尽管持续时间很短;因此,该话题占5.90%(11995 / 203191),排名第13位。

公众也在讨论疫苗的发展,相关微博帖子占所有微博的4.64%(9428/ 203191)。抗击新冠肺炎是一场全民之战,在这场战斗中,市民们就如何战胜疫情展开了激烈的讨论。与此主题相关的帖子百分比为4.63%(9413/203,191)。作为识别COVID-19感染患者的重要手段,检测也得到了一定程度的重视,占4.39%(8939/ 203191)。中国大陆疫情得到控制后,也提到复学;然而,与其他话题相比,这一领域的关注程度相对较低,仅占帖子总数的3.39%(6889/ 203191)。

用户交互结果与情感分析

基于收集到的微博元数据,包括转发、评论和喜欢的数量,我们能够分析每个主题的用户之间的交互水平。同时,我们进行情感分析,得到每个主题的情感值。表3显示每个主题的平均转发、评论和点赞数,以及它们的情感值。确定情绪值的计算公式为(a - b)/(a - b),其中a为表达积极情绪的推文数,b为表达消极情绪的推文数[36]。

需要说明的是,本文报道的数据包括了意见领袖发布的微博。这些微博的转发、评论和点赞数量都很高。例如,对于“钟南山说莲花清瘟胶囊被证明有效治疗COVID-19”的帖子,转发、评论和点赞的数量分别为13599、19022和344780。因此,本文的平均转发数、评论数和点赞数都很高。

表3,可以看出,国内疫情、物资捐赠、医疗资源是转发量排名前三的话题,说明新浪微博用户有强烈的分享意愿。分析点赞数的结果发现,防疫调查、防疫加油致敬、物资捐赠、新冠肺炎治疗等话题的平均点赞数较高。根据每个话题的情绪值,正面情绪值和负面情绪值的话题数分别为11个和6个。此外,大多数话题的情绪值都很低,这表明积极情绪的微博帖子数量与消极情绪的微博帖子数量几乎相同。然而,除了与大流行统计数据有关的情绪外,负面情绪是明显的。

表3。每个话题的用户交互和情感分析结果。
排名 主题 转发(平均) 评论(平均) 喜欢(平均) 人气值
1 复工复产 8 12 87 0.16
2 邻国的流行病 29 22 199 -0.006
3. 冠状病毒的治疗 26 26 244 -0.05
4 疫苗开发 24 16 199 0.08
5 流行病统计 15 12 178 -0.11
6 经济冲击 18 10 97 0.051
7 材料捐赠 35 17 245 0.058
8 国内流行 71 20. 184 0.024
9 医疗资源 34 35 241 0.031
10 检疫及调查 33 24 280 -0.049
11 心理上的影响 29 29 217 0.041
12 联防联控 15 13 236 0.146
13 研究恢复 7 10 129 0.083
14 助燃和致敬抗疫行动 19 13 248 0.073
15 全球其他国家的流行病 11 10 118 -0.117
16 病人的呼救声 22 18 224 -0.017
17 检测 14 16 129 0.041

微博帖子时空分析结果

通过微博的发布时间,我们可以分析不同时间段用户关注点的变化。同样,我们使用发布地点来分析中国不同地区与COVID-19相关的讨论中用户参与度的差异。图1说明了主题的比例在一段时间内如何变化。该数字包括2019年12月至2020年7月关注度最高的前四个话题的名称和比例。考虑到月份的不同,排名前四的话题也在不断变化。2019年12月至2020年7月,疫情统计、国内疫情、全球其他国家疫情、新冠肺炎治疗、医疗资源、经济冲击、复工复产、心理影响、物资捐赠等9个主题分列前4名。2019年12月和2020年1月,国内疫情、疫情统计、心理影响、物资捐赠四个话题受到高度关注。2020年2月和3月,国内疫情和大流行统计话题受到更多关注;这些话题的微博数量分别排名第一和第二。与此同时,医疗资源和新冠肺炎治疗话题关注度上升,进入前四名。2020年4月和5月,复工复产和经济冲击成为人们讨论的活跃话题。与此同时,流行病统计和世界其他国家的流行病专题仍然受到高度关注。 In June and July 2020, the most popular topics changed little compared with previous months. Topics such as pandemic statistics, epidemics in other countries worldwide, and economic shock also retained a high degree of attention during this period.

图2给出微博发布数量的地理排名。这些位置信息是从发布微博的微博账号的注册地址中获取的。在收集到的203191条微博中,127009条(62.5%)包含发布地点。通过对微博发布地点的分析,我们确定了微博发布数量最多的六个地区。这可以从图2来自湖北的帖子比其他任何省份都要多。河南省和广东省分别排名第二和第三,其他省份排名低于这两个省份。

图1所示。从1月到5月主要话题的帖子比例的变化。
查看此图
图2。中国各省微博发布数量。
查看此图

主要发现

新浪微博用户主要关注新冠肺炎治疗的最新消息以及国内外疫情状况

我们的研究于2019年12月1日至2020年7月31日进行,确定了8个主题和17个主题。其中,与COVID-19治疗相关的内容引起了极大的关注,特别是与患者呼救和焦虑、恐慌等情绪相关的内容。由于新浪微博上普遍存在负面情绪,错误信息和谣言更容易影响公众舆论,从而对防疫行动产生负面影响。此外,新浪微博用户对COVID-19治疗和疫苗开发的进展表现出了浓厚的兴趣。与此同时,医疗资源是否充足,能否满足患者的治疗需求,在大量新浪微博用户中引起了相当大的关注和讨论。

新浪微博用户也非常关注国内外疫情的实时情况。特别是,许多微博帖子包含疫情发展的实时数据。此外,新浪微博用户不仅关注中国大陆的疫情,还对周边国家和世界其他地区的疫情发展演变进行了大量讨论。此外,在新浪微博用户关注的17个话题中,还包括疫情防控措施、疫情后期恢复秩序措施、疫情影响等。

不同时期各类话题微博发微博数量的变化反映了新冠肺炎疫情在中国发生、发展和消亡的过程

研究结果显示,2019年12月和2020年1月是应对新冠肺炎疫情的关键时期,国内疫情和大流行统计数据在此期间备受关注。同时,突如其来的疫情也影响了公众的心理。一方面,公众相信抗击疫情的斗争最终会取得胜利;另一方面,恐惧和担忧等情绪也在公众中蔓延。

2020年2月和3月是遏制疫情在中国大陆蔓延的关键时期[37]。在此期间,流行病统计数据和国内流行病仍然引起高度关注。与此同时,患者数量的激增引起了公众对COVID-19治疗和医疗资源的关注。2020年4月至5月,中国内地疫情基本得到控制;然而,新冠肺炎疫情已开始向其他国家和地区蔓延。此时,经济冲击和复工复产成为新浪微博上讨论最多的话题。同样,用户非常关注疫情在全球的蔓延,并查看了实时数据。

2020年6月至7月,全球COVID-19感染和死亡人数继续上升。新浪微博用户的关注焦点从中国转移到世界其他地方,用户开始更加关注其他国家的疫情和不断增长的流行病统计数据。

新浪微博用户的地理位置和是否经历过类似事件与他们对公共危机的关注程度密切相关

从微博上收集到的空间分布信息来看,与COVID-19相关的讨论在中国不同地区存在差异。参与程度最高的6个地区分别是湖北省、河南省、广东省、安徽省、江苏省和湖南省。湖北省是中国新冠肺炎疫情的重灾区,而河南省、湖南省、安徽省与湖北省相邻,在湖北省工作的市民较多。江苏省作为经济发达地区,人员流动率较高。因此,这些省份的新浪微博用户更有可能关注疫情。广东省在2003年经历了严重急性呼吸系统综合症(SARS)疫情,这是该地区更多用户参与COVID-19大流行讨论的重要原因。

新浪微博和推特微博平台用户关注的问题有异同

最近的一项研究报告了Twitter用户关心的与COVID-19相关的主要话题[36]。作者分析了2020年2月2日至3月15日推特用户关注的与新冠肺炎相关的4个主题和12个话题。他们发现,推特用户主要关心的是COVID-19对人民和国家的影响。例如,许多推特都提到了与COVID-19相关的死亡人数以及对公民情绪和心理的影响。此外,疫情对经济的影响也得到了广泛讨论。推特用户特别提到了减少新冠病毒传播的两种主要方法:口罩和隔离。与这些发现相比,新浪微博上的帖子有一些相似之处。包括经济影响和心理影响在内的话题在新浪微博和Twitter上都受到了高度关注[36]。然而,与此同时,新浪微博用户的主要关注点也表现出了独特的特点。首先,推特用户关注的是疫情的起因和影响,而新浪微博用户更关注的是预防、控制和治疗。各种疫情防控措施,如隔离、检测、联防联控等,引起了新浪微博用户的广泛关注。同样,新浪微博用户也非常关注与COVID-19治疗相关的内容,比如患者的求助、医疗资源和治疗方法。此外,市民对SARS-CoV-2疫苗的研制继续给予高度关注。这可能是因为中国政府采取了一系列应对措施,让民众意识到疫情的严重性和危害性;因此,新浪微博用户更关心与健康相关的话题,如病毒的预防、控制和治疗。

第二,新浪微博用户关注疫情的实时状态。这不仅包括国内疫情情况,也包括国外疫情发展情况。与此同时,在疫情的中后期,复工复产、复学复学等恢复秩序的工作受到广泛关注。以下两个原因可能导致了上述独特问题的出现。首先,中国公民是第一个经历新冠肺炎大流行的国家,对疫情的发展变化比其他国家的人民更加敏感;其次,中国作为疫情防控最有效的国家,已经具备了恢复秩序的条件。38]。

及时引导新浪微博上的负面情绪是至关重要的

我们的情绪分析结果表明,在17个话题中,情绪值为积极的话题数为11个,情绪值为消极的话题数为6个;对于大多数话题,用户没有明显的积极或消极的情绪倾向。然而,需要注意的是,仍然有一些话题中某一方面的情感价值是显著的。例如,流行病统计等主题表现出消极的情绪倾向。负面情绪在新浪微博上的持续积累和传播可能引发公民的非理性行为,导致用户受到谣言或极端情绪的影响[19],例如群体恐慌和拒绝政府支持;因此,及时指导处理负面情绪是至关重要的。

研究的意义

随着新冠肺炎疫情在全球范围内的爆发和传播,公民们纷纷转向新浪微博等社交媒体渠道,分享他们的观点,寻求澄清,并讨论与危机相关的话题。先前的研究表明,分析和控制公众的行为和态度可以有效地帮助政府应对危机[39]。随着许多国家开始经历第二波COVID-19疫情,社交媒体平台可以收集大量反映公众行为和态度的信息。通过分析这些数据,可以确定公民的需求和行为特征[40]。

本文收集了新浪微博上的数据,从数量、比例、情感、时空分布等角度进行分析。我们确定了用户对与COVID-19相关的各种话题的关注程度和情感倾向,并确定了每个话题的时间分布和用户参与话题讨论的空间差异。研究结果有助于深入了解公众对COVID-19的看法和态度,这是预防和控制这种新型疾病的前提和依据。

优势与局限

本文在前人已有理论的基础上,结合COVID-19这一时代性话题。通过对新浪微博微博的分析,从公众关注的与COVID-19相关的话题中得出实用的结论。同时,不可否认的是,本文也存在一定的局限性。首先,本研究收集的微博只包括部分与COVID-19相关的微博,而不是全部。因此,对新浪微博用户关注的主要问题的总结并不全面。其次,新浪微博的大部分用户都是年轻人;因此,我们的分析结果更能代表年轻公民。最后,虽然新浪微博的用户数量在中国相对较大,但我们不能匆忙下结论说网络上表达的意见就代表了一般的民意。

结论

新冠肺炎疫情对世界经济造成严重影响,给人们的生活和出行方式带来诸多挑战。与新冠肺炎相关的话题在新浪微博等社交媒体平台上引起了广泛关注和讨论。通过分析关于COVID-19话题的微博帖子,我们获得了公民对与病毒相关的话题的意见,从而找到解决社会和经济问题的方法[41]。通过对新浪微博和Twitter主要话题的对比分析,新浪微博用户发布的帖子话题呈现出更多的地域性特征。从微博的分布来看,各话题所占的比例差异明显。根据情绪分析结果,市民表现出积极的情绪态度。然而,公众中仍存在一些负面情绪,这需要中国政府及时引导。通过分析微博帖子的时间分布可以发现,不同时期的话题占比变化明显,用户关注的主要问题随着疫情的发展而变化。同样,通过分析微博帖子的发布位置,我们发现用户对COVID-19相关话题的讨论参与度存在明显的地区差异。

致谢

国家自然科学基金项目(no . 61602198)和国家自然科学基金项目(no . 72042016)资助。

利益冲突

没有宣布。

多媒体附录1

每个主题的微博示例。

DOCX文件,16 KB

多媒体附录2

中文主题。

DOCX文件,47kb

  1. 世卫组织总干事在2020年6月29日COVID-19媒体吹风会上的开幕词。2020年6月29日。URL:https://www.who.int/director-general/speeches/detail/who-director-general-s-opening-remarks-at-the-media-briefing-on-covid-19---29-june-2020[2020-11-23]访问
  2. 截至7月3日,有关COVID-19的最新消息。中国国家卫生健康委员会公共卫生办公室。2020年07月03日。URL:http://www.nhc.gov.cn/xcs/yqtb/list_gzbd_13.shtml[2020-11-20]访问
  3. 2020年8月21日COVID-19每周业务更新。2020年8月21日。URL:https://www.who.int/docs/default-source/coronaviruse/weekly-updates/wou-21082020.pdf?sfvrsn=e34ba8f3_2&download=true[2020-11-23]访问
  4. 庄士强KA, Taylor M, Ryan B.应急管理沟通:应急准备公共沟通中的积极悖论。公共关系学报,2010;46(2):1093。(CrossRef
  5. 黄颖,张晓明。社交媒体对健康危机的影响:基于社交媒体的信息响应。公关Rev 2020 Sep;46(3):101909。(CrossRef
  6. Roy KC, Hasan S, Sadri AM, Cebrian M.飓风桑迪中基于社交媒体的危机传播效率研究。[J]信息管理,2020年6月;52:10 - 2060。(CrossRef
  7. 陈强,闵超,张伟,王刚,马鑫,埃文斯瑞。打开黑匣子:如何在新冠肺炎危机期间通过政府社交媒体促进公民参与。计算机与人类行为[j]; [c]; 2010免费全文] [CrossRef] [Medline
  8. 陈朱C,徐X,张W, J,埃文斯r .如何通过环境从而使健康传播的区别:一个内容分析下来托托账户由中国省级卫生委员会。国际环境与公共卫生杂志2019年12月27日;17(1):192 [J]免费全文] [CrossRef] [Medline
  9. 闫强,吴磊,郑磊。基于社交网络的微博用户行为分析。中国生物医学工程学报,2013,31(7):1712-1723。(CrossRef
  10. 张伟,邓铮,Evans R,向峰,叶青,曾睿。中国三级转诊医院社交媒体景观:观察性描述性研究。医学互联网研究,2018年8月09日;20(8):e249 [J]免费全文] [CrossRef] [Medline
  11. 朱超,曾锐,张伟,Evans R,何锐。社交媒体时代孕妇孕期相关信息寻求与分享的定性研究。[J]医学互联网研究,2019年12月04日;21(12):e13694 [J]免费全文] [CrossRef] [Medline
  12. Bizid I, Nayef N, Boursier P, Doucet A.危机事件阶段微博知名用户检测。[j] .国际信息学报,2018;38(11):1783 - 1788。(CrossRef
  13. 张伟,徐翔,张宏,陈强。网络参与混乱:以中国政府发起的电子政务广场为例。Int J Public Sect Adm 2016 Jun 07;39(14):1195-1202。(CrossRef
  14. 李柏生,苏振宇,李峰,梁玲,陈敏。社会媒体与政治党派关系——一个次等公共领域在民主中的角色。遥感通报,2018,35(7):1949-1957。(CrossRef
  15. 谢艳,乔锐,邵刚,陈华。突发公共事件中中国社交媒体用户传播行为研究。遥感通报,2017,34(3):740-754。(CrossRef
  16. 韦士曼D, Spence PR, Van Der Heide B.社交媒体作为信息来源:信息更新的近时性和可信度。计算机通讯学报,2013,11(2):171-183。(CrossRef
  17. 周世伟,Hunt YM, Beckjord EB, Moser RP, Hesse BW。美国社会媒体的使用:对健康传播的影响。医学互联网研究,2009年11月27日;11(4):e48 [J]免费全文] [CrossRef] [Medline
  18. B.社交媒体网站上的信息分享。计算机学报,2013,29(6):2622-2631。(CrossRef
  19. Correa T, Hinsley AW, de Zúñiga HG.谁在网络上进行交互?:用户个性与社交媒体使用的交集。计算机学报,2010;26(2):247-253。(CrossRef
  20. 李建军,张建军,张建军。社交媒体的网络特征分析。2010年第四届SIGCHI计算系统中人因会议论文集;2010年4月10日至15日;亚特兰大,GA . 1361-1370页。(CrossRef
  21. 张伟,邓志,洪志,Evans R,马军,张华。不快乐的病人不一样——中国好医生网站差评内容分析。医学信息学报,2018;20(1):35 - 35 [J]免费全文] [CrossRef] [Medline
  22. 尹杰,刘建军,刘建军,刘建军。基于社交媒体的应急意识研究。IEEE intel system 2012;27(6):52-59。(CrossRef
  23. 王晓明,王晓明,王晓明,等。社交媒体在紧急情况下的应用。国际医学杂志,2015;35(5):609-619。(CrossRef
  24. 李建军,李建军。微博过滤的主题建模方法研究。计算机学报,2017;12(2):761-770。(CrossRef
  25. 李建军,李建军。基于中文停词表的文本挖掘模型的性能评价。J .沙特国王大学,计算机与信息科学。(CrossRef
  26. 李建军,李建军,李建军,等。[J]中国生物医学工程学报,2003;3:993- 922 [J]免费全文
  27. LDA4j。GitHub。URL:https://github.com/hankcs/LDA4j[2020-11-20]访问
  28. 李建军,李建军,李建军,等。具有可证明保证的主题建模实用算法。出来了。预印本发布于2012年12月19日。
  29. Pavlinek M, Podgorelec V.基于自训练和LDA主题模型的文本分类方法。专家系统应用2017 Sep;80:83-93。(CrossRef
  30. 李建军,李建军,李建军,等。基于多模型和多主题的主题连贯研究。参见:2012年自然语言处理和计算自然语言学习的经验方法联合会议论文集。:计算语言学协会;2012年7月出席:2012年自然语言处理与计算自然语言学习经验方法联合会议;2020年7月12日至14日;济州岛,韩国p. 952-961https://www.aclweb.org/anthology/D12-1087.pdf
  31. 王志强,郭志强,郭志强,郭志强,等。一种基于局部相干性的lda模型。在:计算语言学协会第55届年会论文集(卷1:长论文)。:计算语言学协会;2017年7月出席:计算语言学协会第55届年会上;2017年7月20日至8月4日;不列颠哥伦比亚省温哥华(1799-1809年)(CrossRef
  32. 特朗普承认,美国冠状病毒死亡人数可能达到10万或更多。CNN。2020年3月30日。URL:https://www.cnn.com/2020/03/29/politics/trump-deaths-coronavirus/index.html[2020-11-23]访问
  33. 中国大陆新增45例新冠肺炎确诊病例。CGTN。2020年8月1日。URL:https://news.cgtn.com/news/2020-08-01/Chinese-mainland-reports-45-new-COVID-19-cases-SAOFIVVkL6/index.html[2020-11-23]访问
  34. 冠状病毒病(COVID-19)情况报告- 1993。2020年7月31日。URL:https://www.who.int/docs/default-source/coronaviruse/situation-reports/20200731-covid-19-sitrep-193.pdf?sfvrsn=42a0221d_4[2020-11-23]访问
  35. 美国舒梅克州打破了冠状病毒记录,一天内确诊病例超过7.7万例。2020年7月16日。URL:https://www.reuters.com/article/us-health-coronavirus-usa-records-idUSKCN24I014[2020-11-23]访问
  36. Abd-Alrazaq A, Alhuwail D, Househ M, Hamdi M, Shah Z.推特用户在COVID-19大流行期间最关注的问题:信息监测研究。医学互联网研究,2020年4月21日;22(4):e19016 [J]免费全文] [CrossRef] [Medline
  37. 白皮书《抗击新冠肺炎:中国在行动》。《中国日报》,2020年6月https://covid-19.chinadaily.com.cn/a/202006/08/WS5edd8bd6a3108348172515ec.html[2020-11-20]访问
  38. C少勇,赵焕明,李敏,李双环。新浪微博与Twitter微博服务的比较。参见:2011年计算机科学与网络技术国际会议论文集。: IEEE;2011年计算机科学与网络技术国际会议;哈尔滨,中国;December 24-26, 2011 p. 2259-2263。(CrossRef
  39. 张晓梅,杨静,张建培,洪宇。基于弱依赖连接的微博情感分析。基于知识的系统2018年2月;142:170-180。(CrossRef
  40. 李建军,刘建军。基于情感网络的社交网络情感分析。万维网2016年10月11日;20(4):831-854。(CrossRef
  41. 社会媒体在危机管理中的应用:一项调查。[J] .防灾减灾学报,2020,(8):1093 - 1094。(CrossRef


LDA:潜在狄利克雷分配
“非典”:严重急性呼吸系统综合症


G·艾森巴赫编辑;提交05.07.20;A Saroj, S Doan的同行评审;对作者的评论01.08.20;收到订正本21.08.20;接受28.10.20;发表26.11.20

版权

©王俊泽,周颖,张伟,理查德·埃文斯,朱成岩。原载于医学互联网研究杂志(//www.mybigtv.com), 2020年11月26日。

这是一篇在知识共享署名许可(https://creativecommons.org/licenses/by/4.0/)下发布的开放获取文章,该许可允许在任何媒介上不受限制地使用、分发和复制,前提是原始作品首次发表在《医学互联网研究杂志》上,并适当引用。必须包括完整的书目信息,到//www.mybigtv.com/上原始出版物的链接,以及版权和许可信息。


Baidu
map