JMIR J医疗互联网服务 医学互联网研究杂志 1438 - 8871 卡塔尔世界杯8强波胆分析 加拿大多伦多 v22i11e22152 33151894 10.2196/22152 原始论文 原始论文 新冠肺炎疫情期间中国社交媒体用户表达的担忧:新浪微博微博数据的内容分析 Eysenbach 冈瑟 Saroj 安妮塔 Doan 儿子 Junze 博士学位 1 2 https://orcid.org/0000-0002-2112-5465 英航 1 2 https://orcid.org/0000-0002-5900-4757 博士学位 3.
医学与健康管理学院“, 华中科技大学 航空路13号 Qiaokou区 武汉,430074 中国 86 13397110378 weizhanghust@hust.edu.cn
https://orcid.org/0000-0003-0178-0750
埃文斯 理查德。 博士学位 4 https://orcid.org/0000-0001-6367-0560 Chengyan 博士学位 5 https://orcid.org/0000-0002-3879-9124
公共管理学院 华中科技大学 武汉 中国 非传统安全中心 华中科技大学 武汉 中国 医学与健康管理学院“, 华中科技大学 武汉 中国 工程、设计和物理科学学院“, 布鲁内尔大学 伦敦 联合王国 政治学与公共管理学院“, 武汉大学 武汉 中国 通讯作者:张伟 weizhanghust@hust.edu.cn 11 2020 26 11 2020 22 11 e22152 5 7 2020 1 8 2020 21 8 2020 28 10 2020 ©王俊泽,周莹,张伟,理查德·埃文斯,朱成燕。最初发表于《医疗互联网研究杂志》(//www.mybigtv.com), 2020年11月26日。 2020

这是一篇开放获取的文章,根据创作共用署名许可(https://creativecommons.org/licenses/by/4.0/)的条款发布,允许在任何媒介上无限制地使用、分发和复制,前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。

背景

COVID-19大流行造成了一场全球卫生危机,正在影响世界各地的经济和社会。在充满不确定性和意外变化的时代,人们将社交媒体平台作为沟通工具和主要信息来源。Twitter和新浪微博等平台允许社区分享讨论和情感支持;它们在个人、政府和组织之间交换信息和表达意见方面也发挥着重要作用。然而,研究大流行期间社交媒体用户表达的主要担忧的研究有限。

客观的

这项研究的目的是调查中国最大的社交媒体平台新浪微博在新冠肺炎疫情期间提出和讨论的主要问题。

方法

我们使用了一个网络爬虫工具和一组预定义的搜索词( 新型冠状病毒肺炎 新型冠状病毒, 新型冠状病毒肺炎)调查新浪微博用户提出的担忧。收集2019年12月1日至2020年7月32日期间发布的微博的文本信息和元数据(点赞数、评论数、转发数、发布时间和发布地点)。在对收集到的文本进行单词分割后,我们使用主题建模技术潜狄利克雷分配(LDA)来识别用户发布的最常见的主题。我们分析了话题的情感倾向,计算了话题的比例分布,利用从点赞数、评论数和转发数收集的数据对话题进行了用户行为分析,并研究了中国大陆不同地区公民的用户关注点变化和参与差异。

结果

根据收集到的203191条符合条件的微博,我们确定了17个主题,并将其分为8个主题。主题包括疫情统计、国内疫情、世界其他国家疫情、新冠肺炎治疗、医疗资源、经济冲击、隔离调查、患者求救、复工复产、心理影响、联防联控、物资捐赠、周边疫情、疫苗研发、疫情防控加油致敬、疫情检测、复学。11个话题的平均情绪为正面,6个话题的平均情绪为负面。平均转发数最高的话题是国内疫情,平均点赞数最高的话题是检疫和调查。

结论

社交媒体用户表达的担忧与全球大流行的演变高度相关。在新冠肺炎疫情期间,社交媒体为中国政府部门和组织提供了一个更好地了解公众关切和需求的平台。同样,社交媒体为传播防疫信息提供了渠道,影响了公众的态度和行为。政府部门,特别是卫生相关部门,可以通过监测社交媒体平台,及时制定适当的政策,在疫情期间引导公众舆论和行为。

冠状病毒 新型冠状病毒肺炎 社交媒体 公共卫生 新浪微博 公众舆论 公民的担忧
简介

2020年6月29日,世界卫生组织(世卫组织)纪念2019冠状病毒病爆发六个周年[ 1].2019年12月31日,由新型冠状病毒肺炎(SARS-CoV-2)引起的首例不明肺炎(现称COVID-19)在湖北省武汉市确诊,并在全球范围内产生了深远影响。2020年1月初,武汉报告了聚集性肺炎病例,随后进行了实验室分析,将疫情确定为一种新型冠状病毒,世卫组织正式将其命名为SARS-CoV-2。截至2020年7月3日,中国内地报告确诊病例83545例[ 2].新冠肺炎疫情在中国爆发后,迅速在全球蔓延。截至2020年8月18日,全球共有214个国家和地区报告新冠肺炎确诊病例,总病例数超过2100万例,死亡总人数超过76万例[ 3.].COVID-19的全球平均死亡率约为0.3%-1.5%;然而,美国、巴西和墨西哥等国家的COVID-19死亡率要高得多。随着新冠肺炎疫情在全球范围内的传播,疫情逐渐在社交媒体平台上引起广泛关注和讨论。这一趋势在中国最大的社交媒体平台之一新浪微博上表现得尤为明显。

现有研究表明,及时了解公众的态度和要求对应对公共危机至关重要[ 4 5].大多数社交媒体平台都具有面向媒体的特征,这些特征对于中介信息传播至关重要。公民可以在社交媒体上及时收到政府提供的最新事实核查信息,而政府可以利用公民公开发布的信息,更好地了解公众的态度、关切和要求[ 6- 8].截至2020年5月,新浪微博用户已超过5亿,为公民互动提供了多种沟通机制,允许中国公众分享信息和交换意见。 9- 11].通过分析新浪微博中民众对新冠肺炎疫情的关注,政府可以更好地了解民众的态度和诉求[ 12 13],并阐明政府部门和组织在应对大流行时面临的挑战。这项研究为政策制定者提供了重要的见解和启示,特别是那些在公共卫生部门工作的人。研究结果加深了对公众认知的了解,并指出了实践中的不足,以更好地满足公众需求。

大量的文献研究了社交媒体在分析公共危机时期的公众行为、态度和反应方面的作用。研究人员主要关注平台功能、用户行为特征以及危机期间社交媒体的使用。由于大多数平台均可在公共领域免费获得[ 14],它们已成为公民在COVID-19大流行期间保持联系、讨论关切和意见、逃离单调封锁的广泛采用的方法[ 15].研究人员一致认为,在疫情期间,社交媒体已成为信息传播的重要媒介[ 16]并在信息共享方面发挥着独特的作用[ 17]和医疗保健讨论[ 18].有学者对社交媒体平台上的用户行为和连接网络进行了探索,认为人格特征影响用户行为[ 19],而网络包括正连接和负连接[ 20. 21].社交媒体在应对公共危机中的独特地位和作用也引起了研究者的广泛关注。双方一致认为,社交媒体平台在危机管理中发挥着重要作用,特别是在向公民及时提供信息方面[ 22减少市民的焦虑和恐惧[ 23].本文在现有研究的基础上,收集了国内领先的微博平台新浪微博的数据,分析了COVID-19大流行期间公民表达的主要关注点。

方法 数据收集

新浪微博是中国领先的微博平台;它允许用户发送和接收字符限制的短帖子,并通过在定义的日期范围内搜索指定的关键字来检索文本内容。利用这一功能,我们收集了2019年12月1日至2020年7月31日期间与COVID-19相关的共享微博帖子。章鱼网络爬虫工具被用来搜索预定义的关键字,包括 新型冠状病毒肺炎 冠状病毒 新型冠状病毒, 新型冠状病毒肺炎.除了收集到的文本内容外,我们还获取了每个微博帖子的元数据,包括点赞数、评论数、转发数、发布时间和发布地点。元数据中的位置信息是指与微博相关的新浪微博账户的注册地址。为了获得这些数据,我们使用了新浪微博的高级搜索功能。

数据预处理

在汉语中,单词之间没有明显的区分。因此,为了完成潜狄利克雷分配(latent Dirichlet allocation, LDA)处理任务,有必要在单词之间添加明显的分隔符。我们对数据预处理过程中采集到的文本内容进行中文分割。一种广泛使用的中文分词工具ictclas被用于将微博帖子按空格分隔成单词组。例如,“京东宣布向武汉市分批捐赠100万个医用口罩和6万件医疗用品”的微博被细分为“京东宣布/向武汉市/分批捐赠/ 100万个医用口罩/和/ 6万件/医疗用品/”。此外,我们删除了停顿词[ 24],类似于在英语文本分析中去除“an”和“the”等停顿词。汉语停顿词主要分为以下两类:一类是广泛使用的词汇,如我、你、一些、每天;另一类是语气助词、副词、介词、连词以及其他本身没有意义的词,如in、yes、so、then [ 25].此外,标点符号和表情符号等字符也被删除了。

数据分析

我们通过指定LDA所需的主题数量来应用主题建模,将微博帖子集分离为定义的集群[ 26].LDA可以用来识别新浪微博帖子中最常见的话题。主题建模是一种无监督的机器学习技术,可以识别文档集合中的集群(在我们的例子中是微博帖子)。在这项研究中,我们使用了LDA4j包中的LDA算法。LDA4j是用LDA算法的Java语言实现的,项目可以从GitHub免费下载[ 27].

LDA是一种广泛使用的主题建模算法[ 28].根据LDA模型,文档(即微博帖子的文本)是词汇表的集合,可能包括多个主题。LDA模型的目标是基于给定的文档推测主题的分布[ 29].使用LDA建模,我们可以将给定的文档映射到固定的主题集,并捕获每个主题的代表性单词。然后,在微博帖子数据集中建立自然聚类。

为了确定恰当的LDA话题数量,我们使用一致性评分来进行判断;该方法对于选择合适数量的LDA主题非常有用[ 30.].通过对话题数的不断调整,我们发现当话题数为17时,一致性得分达到最优值[ 31].因此,我们设置LDA模型,将微博帖子集划分为17个聚类;中提供的文本集 多媒体附件1

随后,我们进行人工分析,从每个主题的前30个关键词中选取具有代表性和比例较高的关键词。接下来,就17个主题及相关关键词达成共识。最后,利用这些关键词对微博进行分类;我们还得到了每个话题下的微博数量,以及每个话题在所有相关微博中的比例。中提供了每个主题的微博帖子示例 多媒体附件2

微博的例子如下:

新型冠状肺炎的突然爆发对国家的经济运行造成了影响。国内生产总值负增长,国际国内环境日益复杂。但在逆周期调整政策的强力对冲下,复工复产快速推进,3月主要经济指标出现反弹,降幅明显收窄。

这条微博可以分为复工复产和经济冲击两个主题。

我们还对收集到的数据进行了其他分析,比如情绪分析。情感得分在-1.0到1.0之间变化,-1.0是最消极的文本,1.0是最积极的文本。此外,我们通过分析每个主题的平均转发数、点赞数和评论数来计算每个主题的用户互动率。最后,利用发布时间和地点,我们分析了基于时间段的用户关注的变化,以及基于中国地区的用户参与COVID-19相关讨论的差异。

结果

使用网络爬虫工具和预定义的搜索词,我们从新浪微博平台获得了2019年12月1日至2020年7月31日期间分享的共计203191条微博帖子。

微博分析 主题

根据LDA的结果和每个主题所涉及的关键词,我们可以将主题分为8个主题:(1)患者入院;(二)治疗和研究;(3)治疗资源;(四)共同抗击疫情;(五)恢复秩序;(六)新型冠状病毒感染的防控措施;(七)国内外疫情情况;(8)新冠肺炎疫情影响。每个主题对应的术语显示在 表1;这些关键词也被用作主题分类的标准。

微博所涉及的话题及对应的代表性词汇。

主题 主题 对应于每个主题的术语
病人入院 病人的呼救声 帮助 注意 扩散 接收
治疗和研究 COVID-19治疗 出院 治愈 治疗 康复 中药
疫苗开发 疫苗 预防 药物 临床试验
处理资源 医疗资源 医疗 医生 医疗保健 护士 移动舱 病房
共同抗击疫情 材料捐赠 面具 材料 捐款
为抗疫行动加油、致敬 同心协力 耶和华见证人 团结就是力量 责任 坚持下去 战斗
恢复秩序 复工复产 复工 恢复生产 就业 操作
研究恢复 返回学校 学生 学校 高中 高考
新冠肺炎疫情防控措施 检疫与调查 检疫 联系 发热 14天 调查
联防联控 总部 工作领导小组 联合防御 联合控制
检测 核酸 积极的
国内外疫情形势 国内流行 武汉 湖北 监狱 浙江 山东
邻国疫情 日本 韩国 东京 俄罗斯
世界其他国家的流行病 美国 特朗普 英国 意大利 印度 巴西 法国
流行病统计 例确诊病例 新发病例 累积的情况下 疑似病例
COVID-19的影响 经济冲击 经济 影响 市场 冲击
心理上的影响 希望 担心 恐惧 可怕的
主题1:患者入院

本主题所包含的主题是患者的呼救,涉及已感染或可能感染新冠病毒的患者及其治疗情况。等待治疗的患者的呼救引起了广泛的关注,而这些患者随后的接收和治疗也引起了极大的关注。

主题2:治疗与研究

本主题包含两个主题。第一个话题是COVID-19治疗。在本课题中,COVID-19患者的康复受到了广泛关注,如出院人数和康复人数。与此同时,治疗方法也引起了公众的广泛关注,例如使用中药治疗。本主题的第二个主题是疫苗开发。在这个话题中,疫苗及其临床试验的研究进展引起了很多评论。与此同时,关于疫苗是否能达到预防病毒的目标,人们一直存在广泛的争论。

主题3:治疗资源

本主题的主题是医疗资源。本课题主要关注医疗资源的核心方面;医务人员和病房,医疗资源的配置和整合,流动小屋医院等临时医院的建立,都是人们普遍关注的问题。

主题四:共同抗击疫情

本主题包括两个主题。第一个话题是物资捐赠。在中国大陆抗击疫情初期,口罩等防疫物资极度匮乏。这一事件引起了广泛关注,各种防疫物资的捐赠成为一个活跃的话题。二是为抗疫行动加油、致敬。本课题包括两个方面;第一个方面是战胜疫情的信心和决心。关键词: 战斗而且 失败代表新浪微博用户对抗击新冠肺炎疫情的总体态度。人们经常讨论第二个方面,即在防治艾滋病方面的合作;关键短语包括 同心协力而且 团结就是力量经常被提及。

主题5:努力恢复秩序

随着新冠肺炎疫情在中国大陆的传播逐渐得到控制,恢复生产和正常生活方式成为一个活跃的话题。本主题包括两个子主题。一是复工复产。复工复产的进展和安排引起广泛关注和讨论。这项旨在恢复正常生产经营秩序的工作得到了中国民众的广泛支持。第二个话题是复学,主要涉及两个方面:一是各年龄段学生返校的时间,二是高考的时间。

主题六:新冠肺炎防控措施

本主题包括三个主题。第一个主题是隔离调查,包括两个方面:咳嗽、发烧等症状调查和隔离时间。特别是,14天的隔离期已经成为标准。

二是联防联控。采取联防联控措施和设立指挥部是中国政府应对疫情的重要举措。这也是中国政府在短期内控制疫情的关键。相应地,它也得到了广泛的认可,并引起了公众的高度关注。

最后一个主题是检测。与本课题相关的主要内容是核酸检测,核酸检测是确定患者是否感染了COVID-10或SARS-CoV-2的重要方法。检测的话题引起了广泛的讨论。

主题七:国内外疫情形势

本主题包括四个主题。第一个话题是国内疫情。一方面,由于湖北和武汉是中国抗击疫情的主战场,这些地区的疫情受到了相当多的关注。另一方面,新冠肺炎疫情在中国的蔓延也引起社会高度关注。邻国的流行病是第二个主题。这一话题的高峰出现在2020年2月中下旬,当时疫情开始从中国蔓延到日本、韩国、俄罗斯等邻国。这引起了新浪微博用户的热议。

第三个主题是世界其他国家的流行病。在本专题出现时,这一流行病已在全球蔓延;因此,主题涉及了许多国家和地区。美国作为疫情最严重的国家,引起了新浪微博博主的广泛关注。特别是,美国总统特朗普表示,如果美国新冠肺炎死亡人数能控制在10万人以下,“我们共同做得非常好”[ 32一直是一个热烈讨论的话题。与此同时,意大利、印度、巴西、法国等其他病例严重的国家也引起了广泛的争论。第四个主题是流行病统计。COVID-19的确诊病例数、新增病例数、疑似病例数等疫情数据受到了广泛关注和讨论;公众对流行病数据的关注和讨论贯穿了这一流行病演变的所有阶段。疫情统计可分为国内疫情数据和国际疫情数据两部分。国内疫情数据是指国家卫健委公布的病例数据。例如,截至2020年7月31日,全国累计治愈病例78989例,报告确诊病例84337例。国际流行病数据由世界各国政府公布[ 33].例如,截至2020年7月31日,全球每日确诊病例超过28.9万例,共计1740万例[ 34].仅美国一天新增确诊病例就超过7万例[ 35].

主题8:2019冠状病毒病的影响

本主题有两个主题。首先是经济冲击。本专题主要涉及疫情对全球经济和市场的负面影响。第二个主题是心理影响。一方面,新冠肺炎疫情给社会公众带来了沉重的心理打击,担忧、恐惧等情绪在民众中蔓延。另一方面,民众也希望并相信,抗疫斗争将取得成功,并保持乐观情绪。

主要题目比例分析结果

为了了解所确定的各种主题的具体关注程度,我们通过计算每个主题的微博帖子数来确定每个主题的数量和比例。例如,每个话题的比例是关于该话题的微博分享数除以微博总数(N=203,191)。我们的分析结果显示在 表2

表2,有关大流行的统计数字可被视为衡量标准,以确定公民在大流行期间对当前情况的了解。大流行统计问题自首次疫情爆发以来得到了极大关注,排名第一,有26.8%的帖子(54,513/203,191)。国内疫情一直是公众关注的焦点,特别是在中国大陆疫情尚未完全控制的情况下。该话题的微博数量占微博总数的18.1%(54513条/ 203191条),排名第二。随着新冠肺炎疫情在全球范围内蔓延,其他国家提及疫情的微博数量持续增长;该主题以13.9%的比例(28329 / 203191)排名第三。

COVID-19治疗备受期待,长期受到公众关注,占比为11.1%(22725 / 203191)。医疗资源在抗击疫情中尤为重要,这一主题占岗位总数的10.9%(22246 / 203191)。新冠肺炎疫情对经济的重大影响,与人民群众利益密切相关;因此,经济冲击的话题也受到了很高的关注,以10.1%的帖子(20699 / 203191)排在第6位。检测隔离作为新冠肺炎疫情防控最重要的措施之一,在疫情发生以来的各个阶段都受到了广泛关注,占岗位总数(18541 / 203191)的9.12%。患者呼救话题也引起了广泛关注,占帖子总数的8.61%(17513 / 203191)。

新浪微博上与每个话题相关的微博数(N=203,191), N(%)。

排名 主题 微博文章
1 流行病统计 54513 (26.8)
2 国内流行 36936 (18.1)
3. 世界其他国家的流行病 28329 (13.9)
4 COVID-19治疗 22725 (11.1)
5 医疗资源 22246 (10.9)
6 经济冲击 20699 (10.1)
7 检疫与调查 18541 (9.12)
8 病人的呼救声 17513 (8.61)
9 复工复产 15914 (7.83)
10 心理上的影响 14485 (7.12)
11 联防联控 12457 (6.13)
12 材料捐赠 12434 (6.11)
13 邻国疫情 11995 (5.90)
14 疫苗开发 9428 (4.64)
15 为抗疫行动加油、致敬 9413 (4.63)
16 检测 8939 (4.39)
17 研究恢复 6889 (3.39)

中国恢复经济秩序的重要举措是复工复产,这与人民生活息息相关。该话题的微博帖子占比7.83%(15914 / 203191)。疫情也极大地影响了公众的心理;因此,心理影响话题也受到了很大的关注,发帖比例为7.12%(14485 / 203191)。联防联控和物资捐赠受到一定关注。这两个话题分别排在第11位和第12位,占比分别为6.13%(12457 / 203191)和6.11%(12434 / 203191)。邻国的情况也引起了新浪微博用户的评论,尽管持续时间很短;因此,该话题排名第13位,占帖子总数的5.90%(11995 / 203191)。

疫苗的开发也得到了公众的讨论,相关微博帖子占4.64%(9428/ 203191)。抗击COVID-19是一场国家战争,公民们推动讨论如何战胜大流行。与此主题相关的帖子比例为4.63%(9413/ 203191)。检测作为识别新冠肺炎感染患者的重要手段,也得到了一定程度的重视,占4.39%(8939/ 203191)。在中国大陆疫情得到控制后,也提到了复学;但与其他话题相比,该领域的关注程度相对较低,仅占总帖子数(6889/ 203191)的3.39%。

用户交互与情感分析结果

基于收集到的微博元数据,包括转发数、评论数和点赞数,我们能够分析每个话题用户之间的互动水平。同时,我们对每个话题进行情感分析,得到每个话题的情感值。 表3显示每个话题的平均转发数、评论数和点赞数,以及他们的情绪值。确定情绪值的计算公式为(a - b)/(a - b),其中a为表达积极情绪的推文数,b为表达消极情绪的推文数[ 36].

值得注意的是,本文报道的数据包括意见领袖发布的微博。这些微博的转发、评论和点赞数量都很高。例如,“钟南山说莲花清温胶囊被证明对治疗新冠肺炎有效”的帖子,转发数、评论数和点赞数分别为13599、19022和344780。因此,本文的平均转发数、评论数和点赞数都很高。

表3,可以看出,国内疫情、物资捐赠、医疗资源是转发量排名前三的话题,说明新浪微博用户有强烈的分享意愿。通过分析点赞数,我们发现检疫与调查、为抗疫行动加油致敬、物资捐赠、新冠肺炎治疗等话题的点赞数平均值较高。根据每个话题的情感值,正面情感值和负面情感值的话题数分别为11个和6个。此外,大多数话题的情绪值较低,这表明积极情绪微博的数量与消极情绪微博的数量几乎相同。但是,除了与大流行相关的统计数据外,负面情绪很明显。

每个主题的用户交互和情感分析结果。

排名 主题 转发(平均) 评论(平均) 喜欢(平均) 人气值
1 复工复产 8 12 87 0.16
2 邻国疫情 29 22 199 -0.006
3. 冠状病毒的治疗 26 26 244 -0.05
4 疫苗开发 24 16 199 0.08
5 流行病统计 15 12 178 -0.11
6 经济冲击 18 10 97 0.051
7 材料捐赠 35 17 245 0.058
8 国内流行 71 20. 184 0.024
9 医疗资源 34 35 241 0.031
10 检疫与调查 33 24 280 -0.049
11 心理上的影响 29 29 217 0.041
12 联防联控 15 13 236 0.146
13 研究恢复 7 10 129 0.083
14 为抗疫行动加油、致敬 19 13 248 0.073
15 世界其他国家的流行病 11 10 118 -0.117
16 病人的呼救声 22 18 224 -0.017
17 检测 14 16 129 0.041
微博帖子的时空分析结果

通过微博帖子的发布时间,我们可以分析不同时间段用户关注点的变化。同样,我们使用发布地点来分析中国不同地区用户参与COVID-19相关讨论的差异。 图1说明主题的比例如何在一段时间内变化。该数字包括2019年12月至2020年7月期间关注度最高的四个话题的名称和比例。考虑到不同月份,排名前四位的话题不断变化。2019年12月至2020年7月,疫情统计、国内疫情、全球其他国家疫情、新冠肺炎治疗、医疗资源、经济冲击、复工复产、心理影响、物资捐赠等9个话题进入前4名。2019年12月至2020年1月,国内疫情、疫情统计数据、心理影响、物资捐赠4个话题受到高度关注。2020年2月和3月,国内疫情和大流行统计专题比以往受到更多关注;这些话题的微博数量分别位居第一和第二。与此同时,医疗资源和新冠肺炎治疗话题的关注度有所上升,进入前4位。2020年4月至5月,复工复产和经济震荡成为热点话题。与此同时,世界其他国家的大流行病统计和流行病问题仍然受到高度重视。 In June and July 2020, the most popular topics changed little compared with previous months. Topics such as pandemic statistics, epidemics in other countries worldwide, and economic shock also retained a high degree of attention during this period.

图2给出了微博帖子数量的地理排名。位置信息是从发布微博的微博账号的注册地址中获取的。在收集到的203191条微博中,有127009条(62.5%)包含了发布地点。通过分析微博发布地点,我们确定了微博发布数量最多的六个地区。它可以从 图2来自湖北省的职位数量远远高于其他任何省份。河南省和广东省分列第二和第三位,其他省份排在这之后。

1月至5月主要话题的帖子比例变化。

中国各省微博发文数。

讨论 主要发现 新浪微博用户主要关注新冠肺炎治疗的最新消息以及国内外疫情现状

我们的研究于2019年12月1日至2020年7月31日进行,确定了8个主题和17个主题。在这些话题中,与新冠肺炎治疗相关的内容引起了极大的关注,特别是与患者的呼救和焦虑、恐慌等情绪相关的内容。由于新浪微博上普遍存在负面情绪,虚假信息和谣言更容易影响公众舆论,从而对抗疫行动产生负面影响。此外,新浪微博用户对新冠肺炎治疗和疫苗研发的进展也表现出了极大的兴趣。与此同时,医疗资源是否充足,能否满足患者的治疗需求,也引起了大量新浪微博用户的关注和讨论。

新浪微博用户也高度关注国内外疫情的实时情况。特别是,许多微博帖子包含了疫情发展的实时数据。此外,新浪微博用户不仅关注中国大陆的疫情,还大量讨论了周边国家和世界其他地区疫情的发展演变。此外,在新浪微博网友关注的17个话题中,还包括疫情防控措施、疫情后期秩序恢复措施、疫情影响等。

不同时间段各类话题微博发文数的变化反映了中国新冠肺炎疫情发生、发展和消亡的过程

我们的研究结果表明,2019年12月和2020年1月是应对COVID-19大流行的关键时期,国内疫情和大流行统计数据在此期间受到了广泛关注。与此同时,疫情的突然爆发也影响了公众的心理。一方面,公众相信抗击疫情的斗争最终会取得胜利;另一方面,恐惧和担忧等情绪也在公众中蔓延。

2020年2月至3月是遏制疫情在中国大陆蔓延的关键时期[ 37].在此期间,大流行统计数字和国内疫情仍然引起高度关注。与此同时,患者数量的激增引起了公众对新冠肺炎治疗和医疗资源的关注。2020年4月至5月,中国内地疫情基本得到控制;但新冠肺炎疫情已开始向其他国家和地区蔓延。此时,经济冲击和复工复产成为新浪微博上最热门的话题。同样,用户也非常关注疫情的全球传播,并查看实时数据。

2020年6月至7月,全球COVID-19感染和死亡人数持续上升。新浪微博用户的关注点从中国转移到世界其他地方,用户开始更多地关注其他国家的疫情和不断增长的疫情统计数据。

新浪微博用户所处的位置、是否经历过类似事件,与他们对公共危机的关注程度密切相关

从微博帖子的空间分布信息来看,中国不同地区对新冠肺炎疫情的讨论存在差异。参与程度最高的六个地区是湖北省、河南省、广东省、安徽省、江苏省和湖南省。湖北省是中国新冠肺炎疫情的中心,而河南省、湖南省、安徽省都与湖北相邻,有很多人在湖北工作。江苏省作为经济发达地区,人员流动率较高。因此,这些省份的新浪微博用户更可能关注疫情。广东省在2003年经历了严重急性呼吸系统综合征(SARS)疫情,这是该地区更多用户参与新冠肺炎大流行讨论的重要原因。

新浪微博和Twitter微博平台用户关注的问题既有相似之处,也有不同之处

最近的一项研究报告了推特用户关心的与COVID-19相关的主要话题[ 36].作者分析了推特用户在2020年2月2日至3月15日期间关注的与COVID-19相关的4个主题和12个话题。他们发现,推特用户主要关心COVID-19对个人和国家的影响。例如,许多推文中提到了与COVID-19相关的死亡人数以及对公民情绪和心理的影响。此外,会议还广泛讨论了COVID-19的经济影响。推特用户特别提到了减少COVID-19传播的两种主要方法:口罩和隔离。与这些发现相比,新浪微博帖子有一些相似之处。在新浪微博和推特上,包括经济影响和心理影响在内的话题都受到了高度关注。 36].然而,与此同时,新浪微博用户的主要关注点也呈现出独特的特点。首先,推特用户关注疫情的前因后果,而新浪微博用户更关注防控和治疗。隔离、检测、联防联控等各种疫情防控措施引起了新浪微博用户的广泛关注。同样,新浪微博用户高度关注与新冠肺炎治疗相关的内容,如患者的呼救、医疗资源和治疗方法。此外,市民继续高度关注SARS-CoV-2疫苗的开发。这可能是因为中国政府采取了一系列应对措施,让民众认识到疫情的严重性和危害性;因此,新浪微博用户更关注与健康相关的话题,如病毒的预防、控制和治疗。

第二,新浪微博用户关注疫情的实时状态。这不仅包括国内疫情,也包括国外疫情的发展。与此同时,在疫情中后期,复工复产、复学复学等恢复秩序的工作受到广泛关注。以下两个原因可能导致了上述独特问题的出现。一是中国公民是最早经历新冠肺炎疫情的国家,对疫情的发展变化比其他国家的民众更加敏感;二是中国作为全球疫情防控最有效的国家,已经具备了恢复秩序的条件[ 38].

及时引导新浪微博负面情绪至关重要

情感分析结果表明,在17个主题中,具有积极情感值的主题为11个,具有消极情感值的主题为6个;对于大多数话题,用户没有明显的积极或消极情绪倾向。但是,需要注意的是,仍然有一些话题,其中某一方面的情感价值是显著的。例如,大流行统计数据等话题显示出消极的情绪倾向。负面情绪在新浪微博上的持续积累和传播,可能会引发市民的非理性行为,导致用户受到谣言或极端情绪的影响[ 19],如群体恐慌和拒绝政府支持;因此,及时的引导来解决负面情绪是至关重要的。

研究的意义

随着新冠肺炎疫情在全球范围内的爆发和传播,公民们纷纷转向新浪微博等社交媒体渠道,分享他们的观点,寻求澄清,并讨论与危机相关的话题。以往的研究表明,对公众行为和态度的分析和控制可以有效地帮助政府应对危机。 39].随着许多国家开始经历第二波COVID-19疫情,社交媒体平台可以收集大量反映公众行为和态度的信息。通过分析这些数据,有可能确定公民的需求和行为特征[ 40].

在本文中,我们收集了新浪微博的数据,并从数量、比例、情感和时空分布的角度进行分析。我们确定了用户对与COVID-19相关的各种话题的关注程度和情绪倾向,并确定了每个话题的时间分布以及用户参与话题讨论的空间差异。调查结果有助于深入了解公众对新冠肺炎疫情的看法和态度,是做好疫情防控工作的前提和基础。

优势与局限

本文在前人已有理论的基础上,结合新冠肺炎疫情这一时效性课题。通过对新浪微博微博的分析,从公众关注的与新冠肺炎相关的话题中得出实用的结论。同时,不可否认的是,本文也存在一定的局限性。首先,本研究收集的微博仅包括部分与新冠肺炎相关的微博,并非全部。因此,对新浪微博用户关注的主要问题的总结并不全面。其次,新浪微博用户多为年轻人;因此,我们的分析结果更能代表更年轻的公民。最后,虽然新浪微博的用户数量在中国是比较多的,但我们不能草率地得出结论,网上表达的意见就代表了普遍的民意。

结论

COVID-19疫情对世界经济产生了严重影响,并给人们的生活和旅行方式带来了诸多挑战。与新冠肺炎相关的话题在新浪微博等社交媒体平台上引起了广泛关注和讨论。通过分析新冠肺炎话题的微博帖子,我们获得了公民对病毒相关话题的意见,从而找到解决社会和经济问题的解决方案[ 41].对比分析新浪微博和Twitter的主要话题,新浪微博用户发布的话题更具有地域特征。从微博帖子的分布来看,各话题所占比例差异明显。情绪分析结果显示,市民表现出积极的情绪态度。然而,公众中仍然存在一些负面情绪,这需要中国政府及时引导。通过分析微博帖子的时间分布,可以发现不同时期的话题占比变化明显,而用户关注的主要话题则随着疫情的发展而变化。同样,通过分析微博帖子的发布地点,我们发现用户参与COVID-19相关话题的讨论存在明显的地区差异。

每个主题的微博示例。

中文主题。

缩写 乔治。

潜在狄利克雷分配

“非典”

严重急性呼吸系统综合症

国家自然科学基金项目(Award # 61602198)和国家自然科学基金项目(Award # 72042016)的部分资助。

没有宣布。

世卫组织总干事2020年6月29日在COVID-19疫情媒体吹风会上的开幕词 世界卫生组织 2020 06 29 2020-11-23 https://www.who.int/director-general/speeches/detail/who-director-general-s-opening-remarks-at-the-media-briefing-on-covid-19---29-june-2020 截至7月3日关于COVID-19的最新消息 中国国家卫生健康委员会卫生办公室 2020 07 03 2020-11-20 http://www.nhc.gov.cn/xcs/yqtb/list_gzbd_13.shtml 2019冠状病毒病每周行动更新2020年8月21日 世界卫生组织 2020 08 21 2020-11-23 https://www.who.int/docs/default-source/coronaviruse/weekly-updates/wou-21082020.pdf?sfvrsn=e34ba8f3_2&download=true 约翰斯顿 泰勒 瑞安 B 应急管理沟通:公共沟通对应急准备的正面悖论 公共关系检讨 2020 06 46 2 101903 10.1016 / j.pubrev.2020.101903 Y DiStaso 在Facebook上响应健康危机:响应时间和消息吸引力的影响 公共关系 2020 09 46 3. 101909 10.1016 / j.pubrev.2020.101909 罗伊 KC 哈桑 年代 距首都普里什蒂纳 Cebrian 了解桑迪飓风期间基于社交媒体的危机沟通的效率 Int J Inf管理 2020 06 52 102060 10.1016 / j.ijinfomgt.2019.102060 最小值 C W G X 埃文斯 R 打开黑匣子:如何在COVID-19危机期间通过政府社交媒体促进公民参与 计算人类行为 2020 09 110 106380 10.1016 / j.chb.2020.106380 32292239 s0747 - 5632 (20) 30133 - 3 PMC7151317 C X W J 埃文斯 R 通过抖音进行健康传播如何发挥作用:中国省级卫生健康委员会运营的抖音账号的内容分析 国际环境与公共卫生 2019 12 27 17 1 192 10.3390 / ijerph17010192 31892122 ijerph17010192 PMC6981526 l l 基于社交网络的微博用户行为分析 自然史一 2013 04 392 7 1712 1723 10.1016 / j.physa.2012.12.008 W Z 埃文斯 R F R 中国三级转诊医院的社交媒体格局:观察性描述性研究 J医疗互联网服务 2018 08 09 20. 8 e249 10.2196 / jmir.9607 30093370 v20i8e249 PMC6107732 C R W 埃文斯 R R 社交媒体时代准妈妈妊娠相关信息的寻求与分享:定性研究 J医疗互联网服务 2019 12 04 21 12 e13694 10.2196/13694 31799939 v21i12e13694 PMC6920903 Bizid 纳耶夫 NgydF4y2Ba Boursier P 下去 一个 在危机事件阶段检测知名微博用户 正系统 2018 11 78 173 188 10.1016 / j.is.2017.12.004 W X H 网上参与混乱:以中国政府发起的电子政务广场为例 公共部门行政 2016 06 07 39 14 1195 1202 10.1080 / 01900692.2015.1072218 PS 所以 CY F l 社交媒体和政治党派——次等公共领域在民主中的作用 Telemat通知 2018 10 35 7 1949 1957 10.1016 / j.tele.2018.06.007 Y R G H 中国社交媒体用户在突发公共事件中的传播行为研究 Telemat通知 2017 06 34 3. 740 754 10.1016 / j.tele.2016.05.023 威斯曼 D 斯宾塞 公关 范德海德 B 社交媒体作为信息源:更新的近代性和信息的可信度 J计算介质通信 2013 11 08 19 2 171 183 10.1111 / jcc4.12041 WS 亨特 YM Beckjord 海尔哥哥 莫泽 RP 海塞 BW 社交媒体在美国的使用:对健康传播的影响 J医疗互联网服务 2009 11 27 11 4 e48 10.2196 / jmir.1249 19945947 v11i4e48 PMC2802563 Osatuyi B 在社交媒体网站上分享信息 计算Hum Behav 2013 11 29 6 2622 2631 10.1016 / j.chb.2013.07.001 科雷亚 T Hinsley 亚历山大-伍尔兹 德·祖尼加 HG 谁在网络上进行交互?:用户个性与社交媒体使用的交集 计算Hum Behav 2010 3. 26 2 247 253 10.1016 / j.chb.2009.09.003 Leskovec J Huttenlocher D jonkleinberg J 社交媒体中的签名网络 计算机系统中的人为因素SIGCHI会议论文集 2010 04 CHI 2010:计算机系统中的人为因素SIGCHI会议 2010年4月10日至15日 亚特兰大,乔治亚州 1361 1370 10.1145/1753326.1753532 W Z 在香港 Z 埃文斯 R J H 不快乐的病人不一样:中国好医生网负面评论的内容分析 J医疗互联网服务 2018 01 25 20. 1 e35 10.2196 / jmir.8223 29371176 v20i1e35 PMC5806007 应ydF4y2Ba J 兰伯特 一个 卡梅隆 罗宾逊 B 权力 R 利用社交媒体提高对紧急情况的认识 IEEE智能系统 2012 11 27 6 52 59 10.1109 / mis.2012.6 西蒙 T 戈德堡 一个 Adini B 紧急情况下的社交——在紧急情况下使用社交媒体的回顾 Int J Inf管理 2015 10 35 5 609 619 10.1016 / j.ijinfomgt.2015.07.001 Hajjem Latiri C 结合IR和LDA主题建模的微博过滤 程序计算科学 2017 112 761 770 10.1016 / j.procs.2017.08.166 王妃 R Lobiyal D 基于印地语停止词列表的文本挖掘模型性能评估 沙特国王大学,计算机与信息科学 10.1016 / j.jksuci.2020.03.003 布莱 D Ng 一个 约旦 潜狄利克雷分配 J Mach Learn Res 2003 3. 993 1022 LDA4j GitHub 2020-11-20 https://github.com/hankcs/LDA4j Arora 年代 通用电气 R Halpern Y Mimno D Moitra 一个 桑塔格 D Y 可证明保证主题建模的一种实用算法 出来了。 预印本于2012年12月19日在线发布 Pavlinek Podgorelec V 基于自训练和LDA主题模型的文本分类方法 专家系统应用 2017 09 80 83 93 10.1016 / j.eswa.2017.03.020 史蒂文斯 K Kegelmeyer P Andrzejewski D 男管家 D 探讨多模型多主题的主题连贯性 2012年自然语言处理和计算自然语言学习的经验方法联合会议论文集 2012 07 2012年自然语言处理和计算自然语言学习的经验方法联合会议 2020年7月12日至14日 济州岛,韩国 计算语言学协会 952 961 Amoualian H W Gaussier E Balikas G Amini Clausel 基于lda模型的局部相干性诱导分割 第55届计算语言学协会年会论文集(第一卷:长论文) 2017 07 第55届计算语言学协会年会 2017年7月20日至8月4日 温哥华公元前 计算语言学协会 1799 1809 10.18653 / v1 / p17 - 1165 Bohn K 特朗普承认,美国的冠状病毒死亡人数可能会达到10万人或更多 美国有线电视新闻网 2020 03 30. 2020-11-23 https://www.cnn.com/2020/03/29/politics/trump-deaths-coronavirus/index.html 中国大陆报告45例新冠肺炎确诊病例 CGTN 2020 08 01 2020-11-23 https://news.cgtn.com/news/2020-08-01/Chinese-mainland-reports-45-new-COVID-19-cases-SAOFIVVkL6/index.html 2019冠状病毒病(COVID-19)疫情报告 世界卫生组织 2020 07 31 2020-11-23 https://www.who.int/docs/default-source/coronaviruse/situation-reports/20200731-covid-19-sitrep-193.pdf?sfvrsn=42a0221d_4 舒马克 l 美国以一天超过7.7万例的病例打破了冠状病毒记录 路透 2020 07 16 2020-11-23 https://www.reuters.com/article/us-health-coronavirus-usa-records-idUSKCN24I014 Abd-Alrazaq 一个 Alhuwail D Househ 哈姆迪 沙阿 Z COVID-19大流行期间推特用户最关心的问题:信息监视研究 J医疗互联网服务 2020 04 21 22 4 e19016 10.2196/19016 32287039 v22i4e19016 PMC7175788 白皮书《抗击新冠肺炎:中国在行动》 《中国日报》 2020 06 2020-11-20 https://covid-19.chinadaily.com.cn/a/202006/08/WS5edd8bd6a3108348172515ec.html Shaoyong C Huanming Z 最小值 l 双环小 l 新浪微博与Twitter微博服务比较 2011年计算机科学与网络技术国际会议论文集 2011 2011年计算机科学与网络技术国际会议 哈尔滨,中国 2011年12月24-26日 IEEE 2259 2263 10.1109 / iccsnt.2011.6182424 小梅 Z Y Jianpei Z 弘宇 H 基于弱依赖连接的微博情感分析 Knowl-Based系统 2018 02 142 170 180 10.1016 / j.knosys.2017.11.035 Fersini E 波齐 足总 墨西拿 E 认可网络:一种社交网络情感分析的新方法 万维网 2016 10 11 20. 4 831 854 10.1007 / s11280 - 016 - 0419 - 8 Saroj 一个 朋友 年代 社会媒体在危机管理中的使用:一项调查 减少灾害风险 2020 09 48 101584 10.1016 / j.ijdrr.2020.101584
Baidu
map