发表在第24卷第6期(2022年):6月

本文的预印本(早期版本)可在https://preprints.www.mybigtv.com/preprint/37623,首次出版
了解COVID-19错误信息如何以及由谁在社交媒体上传播:编码和网络分析

了解COVID-19错误信息如何以及由谁在社交媒体上传播:编码和网络分析

了解COVID-19错误信息如何以及由谁在社交媒体上传播:编码和网络分析

原始论文

1南京大学信息管理学院,南京

2南京大学江苏省数据工程与知识服务重点实验室,南京

通讯作者:

邓三红博士

信息管理学院

南京大学

仙林路163号

栖霞区

南京,210023年

中国

电话:86 2589685996

电子邮件:sanhong@nju.edu.cn


背景:在COVID-19大流行等全球卫生危机期间,社交媒体上出现了错误信息的迅速传播。与COVID-19相关的错误信息已经进行了分析,但很少有人关注开发一个全面的分析框架来研究其在社交媒体上的传播。

摘要目的:我们提出了一个基于详细似然模型的理论模型来理解社交媒体上与covid -19相关的错误信息的说服过程。

方法:所提出的模型结合了中心路线特征(内容特征)和外围特征(包括创作者权威、社会认同和情感)。中央层面的新冠肺炎虚假信息特征包括五个主题:医疗信息、社会问题和民生问题、政府应对、疫情传播和国际问题。首先,我们根据事实核查来源创建了一个与COVID-19大流行相关的错误信息数据集,并在现实世界的社交媒体上创建了包含这种错误信息的帖子数据集。根据收集到的帖子,我们分析了传播模式。

结果:我们的数据集包括11,450个错误信息帖子,其中医疗错误信息是最大的类别(n=5359, 46.80%)。此外,研究结果表明,活跃用户中最不活跃的(4660/11,301,41.24%)和最活跃的(2320/11,301,20.53%)都倾向于分享错误信息。此外,与国际话题相关的帖子最有可能在社交媒体上产生深远而持久的影响,它们的分布深度(最大深度=14)和宽度(最大宽度=2355)最高。97.00%(2364/2437)的传播以辐射传播为特征。

结论:我们提出的模型和发现可以通过检测可疑用户和识别传播特征来帮助打击错误信息的传播。

中国医学杂志,2018;24(6):e37623

doi: 10.2196/37623

关键字



背景

早在2020年2月15日,世界卫生组织总干事在慕尼黑安全会议上就指出:“我们不仅在抗击一场流行病;同时也是一场信息大流行。”1].由于在大流行期间实行隔离限制,信息的获取仅限于互联网和社交媒体,这助长了错误信息的传播。根据一项调查,87%的互联网用户接触到与大流行相关的错误信息[2].

错误信息在社交媒体上的传播可能会被信息孤岛和个性化内容的回音室放大。Kouzy等[3.报告称,在他们检查的673条推文中,有153条(24.8%)包含COVID-19大流行的错误信息,673条推文中有107条(17.4%)包含无法证实的信息。来自社交媒体账户的关于病毒起源的错误信息吸引了超过2000万的点击量。4].

理论背景

在社交媒体上,虚假信息可以被定义为旨在说服其他用户的信息。说服理论指出,传播者、信息内容和接收者都对沟通产生影响。除了研究帖子本身,也有必要检查在社交媒体上传播虚假信息的用户。为了揭示虚假信息传播者的特征,我们依赖于说服理论,这有助于理解虚假信息是如何在社交媒体上传播的。根据一种广泛使用的说服模型——阐述可能性模型(ELM),用户通过中心路径或外围路径形成对一条信息的态度[5].在中心路径中,用户评估信息的质量和强度,而在外围路径中,他们更关注表面因素,如来源的声誉、视觉吸引力和呈现方式[6].因此,网络健康虚假信息的特征可分为中心和外围两个层面[7].在不同国家的背景下,已经记录了在线冠状病毒错误信息的中心级特征[89错误信息在世界范围内迅速传播。然而,人们对与covid -19相关的错误信息的外围特征知之甚少。因此,本研究的第一个研究问题是:与COVID-19相关的传播错误信息的中心和外围层面特征是什么?为了回答这个问题,我们提出了一个基于ELM的社交媒体上与covid -19相关的错误信息的说服过程的理论模型。如图1,强调中心路线特征(内容类型)和外围特征(包括创作者的权威、社会认同和情感)。

传播误导性信息导致公众的不确定性增加,不信任可靠的消息来源,从而导致病毒传播加剧和遏制无效[4].迄今为止,研究主要集中在与冠状病毒疾病相关的错误信息的程度上[3.].相比之下,人们缺乏对covid -19相关错误信息的病毒性的全面了解,特别是在社交媒体的背景下。因此,指导本研究的第二个研究问题如下:与covid -19相关的错误信息如何在社交媒体上传播?为了回答这个问题,我们从多个角度衡量了社交媒体上与covid -19相关的错误信息的病毒性,包括转发数量、转发深度、转发宽度和转发速度。

图1。与covid -19相关的虚假信息在社交媒体上传播的理论模型
查看此图

相关工作

说服理论与错误信息

说服可以定义为“旨在通过改变他人的信仰、价值观或态度来影响他人的人际交往”[10].ELM认为说服主要是一种认知事件,这意味着说服性信息的接收者使用动机和推理(或缺乏推理)的心理过程来接受或拒绝信息[5].

在外围路线中,信息依赖于接收者的情感介入,通过更肤浅的手段来说服接收者。Cialdini [1112找出了使用外围信息的七种常见线索:权威、承诺、对比、喜欢、互惠、稀缺和社会认同。作为一种外围线索,权威可以用来说服观众接受所呈现的信念或行为。先前的心理学研究表明,参与者倾向于相信他们认为可信的人提供的信息。13].从社交媒体的角度来看,用户的关注者和关注者(朋友)的数量可以代表用户的社会资本[14],这可能表明他们的权威。拥有众多粉丝的用户(如意见领袖)发布的帖子被认为是值得信赖的[15].此外,Suh等人[16]的研究发现,社交媒体用户的关注数/关注量对其帖子的转发概率有正向影响。

社会证明的外围证据是基于古老的同辈压力的概念。1112].经验证据表明,社交媒体平台提供的参与度指标,如点赞和帖子的数量,也会增加人们对社交媒体内容的信任度,尤其是在虚假信息的情况下。17].最后,外围路径依赖于与积极属性的联系,如积极情绪,而不是关注事实。18].

在社交媒体上传播错误信息

博德和弗拉加[19他将错误信息定义为“没有证据支持的事实不正确的信息”。周等[20.的研究表明,带有情感和比较词汇的错误信息比正确信息更容易传播。

此外,研究人员研究了基于用户的特征,以进一步了解在社交媒体上发布或传播虚假信息的个人类型[21].验证状态,通常分配给官方账号和公众人物,告知人们账号的真实性,常被用来衡量社交媒体内容的可信度[22].由于危机被定义为情绪状况,情绪在与公共卫生突发事件相关的错误信息研究中的作用需要进一步调查[23].

现有的关于错误信息传播特征的研究主要集中在时间因素上[2425]而不是传播结构[26].为了捕捉虚假信息在社交媒体上传播的高阶传播模式,Ma等人[26他在Twitter上构建了一个虚假信息的传播网络,并发现虚假信息通常首先由一个低调的用户发布,然后由一些受欢迎的用户进一步传播,而真正的信息首先由一个著名的用户发布,然后直接由许多普通用户分享。

covid -19相关虚假信息的特征

表1总结了之前关于社交媒体上与covid -19相关的错误信息的研究。宋等[9]通过分析事实核查帖子,研究了韩国COVID-19大流行期间传播的错误信息类型。Ceron等[8]收集了巴西事实核查项目的两个推特账户的数据,并在疫情期间发布了被反驳的主题。陈与唐[27]报告称,突发公共卫生事件中的虚假信息传播具有明显的本地化和高再现性特征。

除了基于内容的特征外,研究还表明,与经过验证的账户相比,来自未经验证账户的推文包含更多的错误信息(未经验证的账户占31%,经过验证的账户占12.6%;P<措施)(3.].拥有更多粉丝的推特账户发布的虚假信息更少(20.1%,P<措施)。Cinelli等[28]发现,虽然可疑来源的帖子数量占可信来源的帖子数量的70%,但前者的回复量是后者的三倍。

总之,我们在本研究中解决了现有文献中的两个潜在空白。之前的研究从几个角度考察了关于COVID-19大流行的错误信息的特征[3.892729].心理学研究已经证明了新闻来源可信度对说服力的影响[13],特别是在错误信息的情况下[30.].然而,关于这方面的实证研究还很有限与COVID-19大流行相关的虚假信息(即发布虚假信息的用户)以及虚假信息在社交媒体平台上的传播模式。此外,基于ELM,我们提出假消息传播的外围层面特征包括创作者的权威性、情感和社会认同,并在此基础上研究了新冠肺炎相关假消息在社交媒体上的传播特征。据我们所知,没有一项研究考虑了上述与covid -19相关的错误信息的所有特征。

表1。此前对社交媒体上与covid -19相关的错误信息的研究。
研究 标题 方法 数据
宋等[9 韩国政府应对COVID-19错误信息的对策:韩国疾病控制与预防中心网站“事实和问题检查”分析 内容分析 90个帖子 韩国疾病控制与预防中心(KCDC)网站
Kouzy等[3. 冠状病毒病毒式传播:量化推特上covid - 19错误信息的流行 统计分析 673条 推特
Ceron等[8 新冠肺炎时代的假新闻议程:通过事实核查内容确定趋势 主题分析 5115条 推特
秦(29 突发公共卫生事件中健康谣言的特征分析——以新冠肺炎期间的“双黄连”事件为例 案例分析 134年的标题 丁香园公布的新冠肺炎相关谣言列表
陈与唐[27 突发公共事件中微博谣言传播特征分析——以新冠肺炎疫情为例 编码和可视化分析 968个帖子 微博辟谣

过程

首先,我们根据事实核查来源创建了一个与COVID-19大流行相关的虚假信息数据集,然后创建了另一个包含来自现实世界社交媒体平台的虚假信息的传播帖子数据集。基于收集到的帖子,我们进一步分析了新冠病毒虚假信息在社交媒体上传播的传播模式,并提出了其外围层面的特征。详细的数据收集和分析程序描述在图2

图2。数据收集和数据分析过程。
查看此图

数据收集

虚假信息的定义

对公众来说,准确识别未知的错误信息是很困难的,因为这需要多学科的专业知识。通过处理权威的否定信息,可以实现对错误信息的可靠访问。例如,从反驳信息“吸烟可以预防冠状病毒感染。”这是错误的,“我们可以提取错误信息”吸烟可以预防冠状病毒感染。

获取与COVID-19大流行相关的错误信息

作为权威不实信息来源,我们选取了三家权威网络平台:中国互联网联合辟谣平台[31](中央网络安全和信息化委员会办公室负责运营)、腾讯事实核查平台[32](大型互联网综合服务商运营)、微博报表处理大厅[33(由大型公共社交媒体平台运营)。我们开发了一个网络爬虫,自动收集2019年12月1日至2020年12月1日在各平台上以“新型冠状病毒(新冠病毒)/COVID/Epidemic(疫情)”为关键词发布的辟谣信息。在人工清理不相关和重复信息后,我们获得了1065个与COVID-19大流行相关的错误信息帖子。

收集含有COVID-19大流行错误信息的帖子

为了收集含有新冠肺炎疫情相关错误信息的传播帖子,我们从收集到的所有错误信息中提取关键词,然后创建相应的查询,在微博上进行高级搜索。考虑到虚假信息可能被延迟和长期传播,查询搜索仅限于2019年12月1日至2021年2月2日期间的原始帖子。

为确保收集帖的准确性,第一轮收集采用半自动收集工具,以人工查询方式进行。如果有超过50个有效的检索帖子,则使用自动网络爬虫执行第二轮收集,然后进行数据清理。经过两轮收集,将含有错误信息的微博帖子与相应的错误信息进行匹配,最终识别出11450条微博。

编码过程

以往研究综述[34-36]有关社交媒体上与大流行相关的错误信息分类的资料,可参阅多媒体附件1.受之前研究的启发,为了描述COVID-19错误信息的内容,我们根据Richards和Hemphill提出的六个步骤手动编码了1065个错误信息帖子[37:(1)初步组织和规划,(2)开放和轴向编码,(3)初步代码本的开发,(4)代码本的试点测试,(5)最终编码过程,以及(6)代码本的评审和主题的确定。

本研究开发的编码方案见表2.与新冠肺炎相关的虚假信息分为5种内容类型:政府应对(与中国有关)、疫情传播(与中国有关)、医疗信息(与中国有关)、社会问题和民生问题(与中国有关)和国际问题。遵循Krippendorff的[38]方法,招募了四名编码员进行两轮人工标记。在第一轮中,对300个错误信息项目进行了试点标记。经过进一步讨论,剩下的765个错误信息条目在第二轮中由四名编码员独立标记,α值为。78。这意味着四位编码员在主题分配上达成了实质性的一致[39].在编码过程中,对于涉及两个或多个主题的错误信息项,四位编码员都进行了讨论,并将这些项划分为最相关的类别。随后,根据对应错误信息的标记,对11450个帖子进行了标记。

表2。与COVID-19大流行相关的错误信息主题。
主题 插图 例子
政府回应(与中文有关) 交通管制、复工复学、停工复学、疫情防控等相关信息 据悉,今天在武汉喷洒完消毒液粉后,发烧患者将被送往指定医院。
疫情传播情况(与中国有关) 与大流行病传播有关的信息 广汉家的女婿从武汉回来几天。这家人隐瞒了他们的工作地址,每天都去打牌。他今天生病了。邻居们很生气,去砸了他的房子。
医疗信息(中文相关) 有关病毒本身、感染、预防、治疗、消毒和其他医疗信息 一位医生朋友寄来的。针对这种新型冠状病毒,可以使用维生素C(对抗病毒)和紫锥菊(增强免疫力)的含量来预防。
社会议题及民生(与中国有关) 名人、捐助、社会、民生等方面的信息 国家层面的响应!所有出租的房屋、公寓、商店和工厂将在2月份免租一个月,在3月和4月免租半个月!希望所有“房东”都能积极回应!一起克服困难
国际问题 有关其他国家应对的信息,网上的政治谣言 日本派出了1000人的医疗队,没有戴口罩,也没有喊口号。

职位特征提取

通过微博ID weibo.cn/repost/网站,我们获得了每个帖子的具体转发、点赞、评论信息。然后根据转发关系,我们创建了收集到的帖子的转发网络。继Avram等人之后[17],我们使用粘性指标,包括每个帖子的点赞数、评论数和转发数,来表示包含错误信息的帖子的社会证明特征表3).

表3。包含与covid -19相关的错误信息的帖子及其发布用户的功能。
类别 描述 数据类型
社会认同功能

转发 转发频率 整数

评论 评论频率 整数

喜欢 喜欢的频率 整数
概要文件特性

验证状态 验证与否 验证/不验证

验证类型 验证类型 类别

Mrank 微博会员级别 整数(鹿)

Urank 用户级 整数(0-48)
互动功能

Posts_count 职位数量 整数

Followers_count 关注人数 整数

Following_count 关注人数 整数

用户特征提取

除了因被屏蔽而无法捕获的用户外,共收集了11301名在微博上发布了含有COVID-19错误信息的用户。

微博的用户认证机制为不同类型的用户提供了一个证明自己身份的渠道。验证类型包括被验证的个人用户、政府用户、媒体用户和企业用户。用户级别作为微博用户的基本特征,在很大程度上可以代表账号的活跃程度。用户级别越高,用户越活跃。会员级别反映了用户使用微博的习惯。会员级别高的用户可以被认为是忠实用户。

除了个人资料功能外,互动特征(即关注者、关注者和帖子的数量)也可以表征用户在社交媒体上的权威。帖子的数量反映了用户在社交媒体平台上的参与度。拥有相当数量粉丝的用户可以与一大群人分享他们的观点[16],而拥有众多追随者的用户则拥有广泛的信息来源[14].因此,配置文件功能和交互功能都表征了发布了包含错误信息的帖子的用户的权威性。这些特性的详细描述可以在表3

情绪分析

情绪特征被认为是区分网络谣言和虚假评论的有效特征[40].在这项研究中,我们通过将预训练的卷积神经网络模型应用于百度Senta系统上收集的数据集来进行情感分析[41].Senta将情感知识整合到预训练的模型中,并在大多数测试数据集上产生新的最先进的结果[42].Senta作为一个开放的情感分析平台,可以接触到来自多个环境的大量语料库,这大大提高了其分析的有效性[4243].Senta采用无监督方法自动挖掘情感知识,在14个典型的中文情感分析任务中全面超越其他方法[41].输入Senta的每个帖子都会返回一个介于0到1之间的积极情绪可能性的结果,这可以用作该帖子的情绪特征。

传播网络建设

为了描述与冠状病毒相关的虚假信息在社交媒体上的流行程度,除了每个帖子的转发数量外,我们还从研究的前一步创建的数据集中抓取了每个帖子的详细转发信息,并收集了原始虚假信息帖子的转发列表。每个帖子的转发信息包括转发原帖子的用户、转发内容、转发后收到的转发数和点赞数。微博平台使用“//”符号将转发的内容划分为不同的转发级别。因此,可以根据转发的内容提取出每个帖子的转发级别。此外,基于相应的转发关系,可以使用一系列转发构建每个帖子的传播网络。因此,除了因为被屏蔽或删除等原因而无法捕获的帖子外,我们为包含COVID-19信息的2437个帖子构建了一个传播网络。在这些网络中,每个节点表示一个单独的帖子,而有向链接表示从源节点到转发节点的转发关系。例如,如果帖子A转发原始帖子B,那么从节点B到A绘制一条边。

传播尺度、深度、宽度和速度的提取

在构建的传播网络中,每个节点代表一个参与COVID-19相关错误信息传播的单个帖子。基于每个原始帖子的网络,传播规模是指网络中的节点数量,对应于原始帖子的转发数量。传播深度表示原帖子在网络中转发的最高级别,而传播宽度等于网络中节点数最多的级别的节点数。

图3显示了一个帖子的传播网络的例子。节点A表示包含与covid -19相关的错误信息的原始帖子。帖子B1、B2、B3转发原帖子。随后,帖子B1由帖子C1、C2、C3转发,帖子B3由帖子C4转发;帖子C3也被D1转发。本例中,原帖子A被转发8次,传播规模为8。第二级转发涉及大部分帖子,即原帖子A的传播宽度等于4。转发级别最高表示传播深度为3。

图3。样本帖子的传播规模、深度、宽度和速度的说明。每个节点代表一个参与传播与COVID-19有关的错误信息的帖子。
查看此图

道德的考虑

由于本研究基于公开数据,不涉及个人身份数据,因此不需要伦理批准。


邮政中心路线特征

为了回答第一个研究问题,我们进行了编码分析,以确定包含与covid -19相关的错误信息的帖子的内容类型/主题。这类帖子共11,450个,分为五个主题:政府应对(n=1021)、疫情传播(n=639)、医疗信息(n=5359)、社会问题和民生问题(n=4132)、国际问题(n=299)。最常见的主题是医疗错误信息(5359/ 11450,46.80%),包括关于病毒、感染、预防、治疗和消毒的错误信息。第二大热门话题是社会问题和民生问题(4132/11,450,36.09%),尤其与名人的虚假言论有关。这一类别还包括提到捐款被驳斥的帖子。

为了区分不同主题的帖子,帖子的数量和对应的日期被标在图4,其中较暖的颜色代表在特定时期内更受欢迎的错误信息话题。社会和民生方面的错误信息在3月中旬出现得最为突出,当时出现了几个广泛传播的错误信息话题,包括有关马来西亚萨满可以施法治愈冠状病毒的说法。2月至5月,虚假医疗信息的帖子出现频率最高,这段时间正是中国疫情最严重的时期。

图4。随着时间的推移,包含错误信息的帖子数量的变化。
查看此图

哨所外围路由特征

概述

为了回答第一个研究问题,我们还研究了收集的帖子的社会证明特征、帖子的情感特征以及发布这些帖子的用户的权威特征。

帖子的社会证明功能

收集到的与covid -19相关的错误信息帖子平均收到11次转发,13次评论和189次点赞。的饼图图5表示不同主题上包含错误信息的帖子的数量,柱状和直线表示每个主题上的帖子收到的点赞、评论和转发的标准差(左y轴)和平均值(右y轴)。关于错误信息的主题,点赞最多(平均713个)、评论最多(平均67个)和转发最多(平均82个)的帖子包含关于国际问题的错误信息,而医疗信息的帖子获得的关注最少,平均有40个点赞、7条评论和5条转发(见《每日邮报》)图5).在这五个主题中,关于国际问题的不实信息帖子仅占所有帖子的2.61%(299/ 11450),但获得了更高的关注度。这可能表明,涉及国际问题的错误信息虽然不那么频繁,但在所有三种类型的社会认同特征中都具有更强的病毒性,这表明这种错误信息可能造成严重的后果。

图5。与各种错误信息主题相关的帖子的社会证明功能。
查看此图
帖子的情感特征

考虑到错误信息的话题,图6描述了与covid -19相关的错误信息帖子产生的情绪强度值的平均值的方差。颜色越暖,情绪越积极,反之,颜色越冷,情绪越消极。随着时间的推移,帖子的平均情绪值保持中性到积极。一些含有关于未经证实的预防措施和治疗的错误信息的帖子似乎相对积极。例如,“在家里洗热水澡是保护易感人群最简单、最有效、最便宜的方法!”表达了极其乐观的情绪。与大流行期间公众普遍存在的消极情绪相反[44,含有错误信息的帖子往往表达积极的情绪,以吸引公众的关注。

与其他主题相比,传播与疫情传播有关的错误信息的帖子往往始终是负面的。特别是,有关解除封锁和交通限制的错误信息表达了非常负面的情绪,例如“哈尔滨关闭了!”城市紧急关闭。没有任何旅行的机会。”

图6。与各种错误信息主题相关的帖子的情绪特征。
查看此图
用户权限特征

在发布与新冠肺炎相关的虚假信息的用户中,认证用户占46.60%(5266/ 11301)。其中,经核实的个人用户来源最为突出(2475/5266,47.00%),其次是媒体用户(1159/5266,22.01%)和政府账号(1013/5266,19.24%)。未验证用户数量仅比验证用户多6.8%,占消息总数的53.40%(6035/11,301)。这表明,在检测错误信息时,它是否由经过验证的帐户发布不能作为确定信息权威的标准。

我们发现,在不同主题上发布包含错误信息的消息的用户的权威特征之间存在明显差异。对于国际问题,医疗信息的认证用户(160/292,54.8%)超过未认证用户(132/292,45.2%),认证用户(3160/5310,59.51%)也超过未认证用户。相比之下,非认证用户发布有关社会问题和民生问题的虚假信息(2586/4093,63.18%)比认证用户(1507/4093,36.82%)更多,关于疫情传播的虚假信息也更容易被非认证用户发布(409/630,64.9%)。

的上半部分显示了在各种主题上发布错误信息的用户级和会员级分布图7.从用户级别和会员级别来看,最低级别(用户级别为0-13,会员级别为0)的用户发布虚假信息的责任最大,分别占41.24%(4660/11,301)和46.77%(5285/11,301)。令人惊讶的是,第二大最负责任的用户群体是那些用户最多的群体(在42-48;2320/11,301, 20.53%)和会员数(6-7;2680/11,301, 23.71%)水平。这可能表明,虚假信息是由最不活跃的用户和最活跃的用户发布的。在国际假消息和医疗假消息中,用户级别最高(42-48)的用户所占比例最高(1516/5602,27.06%),而其他三个主题的假消息往往由用户级别较低的用户发布(0-13;2758/5699, 48.39%)。

下半部分图7显示了在不同主题上发布包含错误信息的消息的用户的平均交互特征。虚假信息发布者的平均粉丝数量超过10万,显示出他们在社交媒体上拥有巨大的社会资本。

相比之下,发布国际问题和医疗信息的虚假信息的用户往往比发布政府应对、社会问题和民生、疫情传播等虚假信息的用户具有更高的权威。发布与政府回应相关的错误信息的用户的帖子数、粉丝数和关注数在五个主题中最低,代表用户的权限较低。

图7。用户级和会员级分布以及用户发布关于各种主题的错误信息的平均交互特征。
查看此图

职位的传播模式

基于2437条含有新冠肺炎相关错误信息的帖子构建的传播网络,提取了每个帖子的传播规模、深度、最大宽度、平均宽度和速度。在本研究中,最大宽度测量了最宽级别涉及的节点数量,平均宽度测量了所有级别的平均数量。表4总结所有员额传播方式的描述性统计数字。在我们的数据集中,传播最广泛的帖子由传播网络中的7604名用户组成。传播最深的帖子被14个级别的用户转发,而传播最广的帖子在一定传播级别上被2355个用户转发。平均而言,所有帖子的传播规模为19.7,平均深度为1.5,平均最大宽度为20.5。

表4。传播模式的描述性统计。
传播的措施 意思是(SD) 最大
规模 19.7 (236.03) 7604
深度 1.5 (0.99) 14
最大宽度 20.5 (87.82) 2355
平均宽度 15.9 (23.74) 688
速度 2.4 (8.20) 96.9

图8显示了与每个主题相关的帖子的传播规模、深度、最大宽度、平均宽度和速度的方法的95% CI图。含有与社会问题和人民生活有关的错误信息的帖子显然比关于其他主题的帖子吸引了更多的用户参与传播网络。与其他话题相比,与政府响应相关的虚假信息(平均传播规模28.2)和社会问题与民生相关的虚假信息(平均传播规模27.4)吸引了更多的用户参与讨论和传播。从传播深度、最大宽度和平均宽度来看,国际问题帖子在各个传播层次上的受众都更多,传播也更深入。与其他话题不同的是,大多数国际假消息帖子吸引了一定程度的公众关注(转发率为168/299,56.2%),这表明这种类型的假消息更有可能受到广泛、大规模和激烈的主流讨论。

在此基础上,我们将虚假信息帖子的传播网络划分为三种主要类型:(1)辐射传播网络,其中第一级传播比其他各级传播更广泛;(2)扇区传播网络,传播网络中其他级别的宽度都比第一级宽,转发量最高的节点转发量比点赞量多;(3)病毒式传播网络,传播网络中其他层次的宽度均大于第一级,点赞量最高的节点获得的点赞量大于转发量。图9展示了这三种网络的代表性例子。

对帖子进行检查,97.00%(2364/2437)是通过辐射传播网络传播的,只有0.98%(24/2437)属于部门传播网络,2.01%(49/2437)属于病毒传播网络。如图9A,原节点辐射出的一级转发宽度远大于后续各层,表现为根节点周围的节点密度远大于其他层上的节点密度。在这种类型的传播网络中,创建原创帖子的用户通常拥有更高的权威(例如,拥有大量的粉丝);这些用户包括公共组织和新闻媒体。此外,帖子的内容很可能是政治性的。节点密度随着级别的增加呈下降趋势,说明这些帖子的潜在影响在一级转发后下降。所示的传播网络图9B和c,虽然第一层的宽度比较大,但其他层的节点呈扇形,节点从多个子层节点向外辐射。在属于行业和病毒式传播网络的帖子传播中,存在多个具有高度传播能力的节点。与辐射传播网络中存在的帖子相比,一些拥有大量粉丝、未被认证为权威机构或公共组织的意见领袖,也在该帖子在行业和病毒式传播网络中的传播中发挥了作用。

图8。传播模式的置信区间图。
查看此图
图9。每种传播网络类型的示例。(a)辐射传播网。(b)部门传播网。(c)病毒传播网络。
查看此图

虚假信息传播者的聚类分析

为了进一步表征在社交媒体上发布关于冠状病毒的错误信息的用户,我们利用k-means聚类算法根据用户权限特征(包括用户级别、会员级别、帖子数量、关注数和关注数)对用户进行分类。为保证聚类质量,使用R中的Nbclust函数检验k的不同值,根据肘关节法选择5作为最优聚类数。图10使用GGally R包中的ggpairs函数以散点图矩阵的形式显示用户[45].每个点都由使用k-means聚类算法识别的聚类着色。

根据k-means聚类算法,将发布错误信息的用户分为普通用户、平台用户、不活跃用户、有影响力用户和混合用户五类。共有2342名用户被归类为普通用户,他们参与社交媒体,但不太愿意为会员付费。他们的会员水平往往较低,但用户水平较高,在帖子数量和关注者方面的表现相对正常。平台用户(2980名)的行为模式与普通用户相似,只是会员级别不同。他们往往拥有更高的会员水平,这表明他们既积极参与社会互动,又购买会员以享受特权。最大的群体是不活跃用户,包括5652名用户,他们在所有五个功能上出现的频率都较低。相比之下,有影响力的用户,即最小的用户群体(由101名用户组成),比其他人更频繁地发布消息,也获得了大量的追随者。在用户和成员级别方面,这个组的用户倾向于保持在最高位置。最后,社交组的用户比其他组的用户拥有更多的粉丝,但他们发布的帖子更少。226名混合者组的特征与Kozinets鉴定的特征一致[46他们在社交媒体上保持着强大的社交关系,但对活动兴趣不大。

不同类型的用户在不同主题上发布错误信息的分布情况如图所示图11.不活跃用户更倾向于发布关于社会问题和人民生活的虚假信息,这与其他四种用户类型有显著差异。有影响力的用户对医疗虚假信息传播的贡献最大,但不太可能发布与社会问题和民生相关的虚假信息。

图10。用户权限特征的散点图和相关矩阵。a:相关性在0.001的显著性水平上显著(双侧);b:相关性在0.01的显著性水平上显著(双侧);c:相关性在.05(双侧)的显著性水平上是显著的。
查看此图
图11。各种类型的用户发布与各种主题相关的错误信息。
查看此图

拓扑属性和用户权限特征之间的相关性

我们还进行了相关分析,以测试传播网络特征是否与创建帖子的用户的权威特征显著相关。使用Spearman等级相关系数来衡量创作者的权威特征与最终传播网络特征之间的相关性。表5结果表明,在双面检验条件下,追随者数量和成员水平与传播网络的五个特征(即传播规模、深度、平均宽度、最大宽度和速度)均显著相关(P< . 01)。

从网络的角度来看,拥有众多粉丝的用户发布的消息往往在社交媒体上获得更多的关注。会员级别高的用户更有可能参与社交媒体互动。类似于灾难相关信息的上下文[14]时,关注者数量对帖子的传播规模、深度和速度有显著的正向影响。这表明,来自高权限级别用户的错误信息在广泛广播中具有很高的强度,因此可能会产生严重的后果。

表5所示。斯皮尔曼相关(ρ)拓扑属性与用户权限特征之间的分析。
传播变量 文章数 粉丝数 后数 会员级别 用户级
规模

ρ 0.114 0.344 0.009 0.171 0.107

P价值 <措施 <措施 .77点 <措施 措施
最大宽度

ρ 0.103 0.349 0.008 0.17 0.1

P价值 .002 <措施 .80 <措施 .002
平均宽度

ρ 0.081 0.345 -0.007 .171 0.096

P价值 . 01 <措施 <措施 .003
深度

ρ 0.174 0.197 0.106 0.08 0.118

P价值 <措施 <措施 措施 02 <措施
速度

ρ 0.023 0.174 -0.003 0.105 0.047

P价值 的相关性 <措施 公布 措施 16

主要研究结果

理解人们为什么会相信错误信息的潜在心理是制定有效干预措施的关键。30.].这项对包含与covid -19有关的错误信息的帖子的研究揭示了其在社交媒体上传播的重要见解。为分析中心水平特征,将新冠肺炎相关误报内容分为5种类型:医疗信息(5359/ 11450,46.80%)、人民社会和民生(4132/ 11450,36.09%)、政府应对(1021/ 11450,8.92%)、疫情传播(639/ 11450,5.58%)、国际问题(299/ 11450,2.61%)。内容分类与以往对近期流行病的研究一致[34].与之前关于COVID-19的研究一致,其中大多数错误信息与医疗有关[13.],我们发现错误信息的主要主题与医疗信息有关,以及与社会和民生问题有关。特别是,带有医疗错误信息的帖子在大流行最严重的阶段出现得最频繁。

引起关注的错误信息可以引发激烈的讨论,从而促进信息的传播。除了中心层面的特征外,带有covid -19相关错误信息的帖子的社会证明显示,此类错误信息得到了积极的回应(平均转发11条,评论13条,点赞189条)。有趣的是,与国际问题相关的假消息占所有帖子的2.61%(299/ 11450),但获得了惊人的更高关注(平均转发82条,评论67条,点赞713条),这表明涉及国际问题的假消息往往会在社交媒体上疯传,从而可能产生严重后果。这与推特上的实证研究结果一致,与covid -19相关的阴谋性错误信息最有可能在推特上传播。47].

与大流行期间公众出现的负面情绪相反[48],在大流行期间出现的错误信息帖子中,情绪从积极转向中性。特别是,一些关于未经检验的预防措施和治疗的错误信息似乎非常积极,引起了公众的注意。我们的结果支持这样一种观点,即在大流行期间设计错误信息干预措施时应考虑错误信息主题[47].

对用户档案特征的分析显示,拥有最低和最高级别用户和会员级别的用户对发布虚假信息负有最大责任。我们的研究结果表明,最不活跃和最活跃的用户都倾向于分享错误信息。与Kouzy等人的经验结果相反[3.在该地区,未经认证的推特账户发布的虚假信息明显多于已认证的账户,在所有包含与covid -19相关的虚假信息的消息中,已认证的微博用户占了近一半(5266/11,301,46.60%)。这说明用户验证状态不适用于微博新冠病毒相关虚假信息检测。

虚假信息发布者的平均粉丝数量极高(>10万),这表明他们在社交媒体上拥有的可信度和社会影响力。一些以营销为导向的账号改变了真实新闻的主要部分来吸引用户。至于医疗虚假信息,一些企业账户编造虚假信息(如“纳豆可以灭活病毒”)来宣传他们的产品。

虚假信息帖子平均传播规模为19.7条,平均深度为1.5条,平均最大宽度为20.5条。李等[14]报告灾害相关帖子的平均传播规模和深度分别为68.64和1.113。这表明,与新冠疫情相关的虚假信息帖子比与灾害相关的帖子传播得更深,但传播规模低于与灾害相关的帖子。此外,关于国际问题的帖子最有可能在社交媒体上产生深远而持久的影响,在传播深度、最大宽度和平均宽度方面都是最高的。这凸显了应对与covid -19有关的错误信息,特别是与国际问题有关的错误信息的重要性。

在获取传播网络的拓扑属性时,可以在错误信息帖子的传播中区分三种主要类型的网络:辐射型、扇形和病毒型。与推特上的谣言传播不同,在推特上,新闻通常是由一个低影响力的用户发布,然后由一些受欢迎的用户分享。26],微博上的新冠肺炎虚假信息主要以辐射传播网络为代表,即先由知名用户发布,然后由众多普通用户直接分享。此外,原始用户往往拥有更高的权威(公共机构和新闻媒体),这表明有影响力的用户在COVID-19虚假信息的传播中发挥了至关重要的作用;这与Wang等人的结果一致[47,他们发现唐纳德·特朗普的推文可能会影响人们的信息分享行为。

限制

这项研究有几个局限性。首先,我们只调查了微博上关于新冠肺炎的虚假信息。此外,我们还选择了“Novel Coronavirus(新冠病毒)/COVID/Epidemic(疫情)”作为COVID-19相关关键词。然而,由于疾病术语在早期可能存在不一致,用户可能使用了本次研究未收集到的其他关键词,如武汉肺炎(武汉肺炎)和不明原因肺炎(不明原因肺炎)来描述与covid -19相关的对话或话题。因此,我们研究中确定的特征可能并不代表所有与covid -19相关的错误信息。未来的研究应考虑其他社交媒体平台上的错误信息,以确定这些发现的稳定性。其次,我们关注的是中文错误信息。以其他语言传播关于大流行的错误信息可能导致不同的结果,这也应在今后的工作中加以探讨。

结论

在COVID-19大流行期间,我们目睹了假新闻和阴谋论的大规模传播,尤其是在社交媒体上。这项研究对社交媒体平台上传播的COVID-19错误信息进行了全面检查。

本研究的理论贡献主要体现在两个方面。虽然已经努力分析社交媒体平台上与COVID-19相关的错误信息,但目前还没有以心理学理论为指导的综合分析框架来研究此类错误信息,特别是与COVID-19相关的错误信息。基于ELM,这项工作为理解covid -19相关错误信息的潜在说服过程迈出了第一步。通过建立说服过程的理论模型,本研究包括一组全面的特征,以了解与covid -19相关的虚假信息在社交媒体上的传播。此外,尽管以往的研究通常将大流行错误信息的检测视为一个二元分类问题,但我们的研究结果表明,关于不同主题的错误信息似乎在情感、社会参与指标和出版者权威特征方面具有不同的特征。因此,本研究建议错误信息检测算法和预防机制的开发应考虑错误信息的具体主题。针对不同主题的误报特点,有必要制定针对性的策略。

这项研究的实际贡献是双重的。首先,尽管与covid -19相关的错误信息已被广泛研究,但据我们所知,没有研究试图揭示在社交媒体上发布关于新型冠状病毒的错误信息的用户的综合特征。因此,本研究同时考察了虚假信息作者的档案特征和互动特征。通过揭示错误信息发布者的特征,我们的研究结果不仅扩展了分析与covid -19相关的错误信息的研究,而且为检测可能倾向于发布错误信息的可疑用户提供了可能的解决方案。此外,用户的权威特征与传播网络拓扑属性之间存在显著的正相关关系,表明权威特征可能对虚假信息的传播产生影响。为了打击错误信息,我们的研究结果表明,有影响力的用户、公共组织和新闻媒体必须意识到他们有责任提供经过验证的信息,特别是在公共卫生危机期间。

致谢

本研究得到国家自然科学基金项目(72004091,72174083)和教育部人文社会科学基金项目(20YJC870014)的部分资助。

利益冲突

没有宣布。

多媒体附件1

表S1。关于社交媒体上与冠状病毒相关的错误信息分类的研究综述。

DOCX文件,17kb

  1. Cuan-Baltazar JY, Muñoz-Perez MJ, Robledo-Vega C, Pérez-Zepeda MF, Soto-Vega E. COVID-19在互联网上的错误信息:信息流行病学研究。JMIR公共卫生监测2020年4月09日;6(2):e18444 [免费全文] [CrossRef] [Medline
  2. 蒋舒。新冠肺炎谣言传播与应对的信息病学研究。研究科普2020;15(1):70-78。[CrossRef
  3. 郭志刚,张志刚,张志刚,张志刚,等。冠状病毒病毒式传播:量化推特上COVID-19错误信息的流行。Cureus 2020 3月13日;12(3):e7255。[CrossRef] [Medline
  4. Mian A, Khan S.冠状病毒:错误信息的传播。BMC Med 2020 Mar 18;18(1):89 [免费全文] [CrossRef] [Medline
  5. 陈晓明,陈晓明。说服力的阐述似然模型。心理学1986;19:123-205。[CrossRef
  6. Ebnali M, Kian C.推动用户做出更健康的决定:在健康论坛中遇到错误信息的设计方法。2019出席:AHFE 2019设计传播中的应用人为因素国际会议;2019年7月24日至28日;华盛顿特区。[CrossRef
  7. 赵颖,大娟,闫娟。基于行为特征的在线健康社区错误信息检测方法。Inf Process Manage 2021 Jan;58(1):102390。[CrossRef
  8. Ceron W, de-Lima-Santos M, Quiles MG。新冠肺炎时代的假新闻议程:通过事实核查内容确定趋势在线Soc网络媒体2021年1月;21:100116。[CrossRef
  9. 宋勇,高林,张夏.韩国政府应对COVID-19错误信息的回应:韩国疾病控制与预防中心网站“事实和问题检查”分析。亚太公共卫生杂志2021 july 06;33(5):620-622。[CrossRef] [Medline
  10. 说服:理解、实践和分析。澳大利亚墨尔本:Addison-Wesley出版公司;1976.
  11. 人际影响。进:Shavitt S, Brock TC,编辑。说服:心理学见解和观点。马萨诸塞州尼达姆高地:Allyn & Bacon出版社;1994:195 - 217。
  12. Cialdini RB。影响:说服心理。纽约州纽约:哈珀商业;2006.
  13. 来源可信度的说服力:对五十年证据的批判性回顾。应用社会心理学报2004年2月,34(2):243-281。[CrossRef
  14. 李玲,田娟,张强,周娟。内容特征和创作者特征对灾难相关信息在社交媒体上分享的影响。Inf Manage 2021 7月;58(5):103489。[CrossRef
  15. 特科特J,约克C,欧文J,肖尔RM,平瑞RJ。社交媒体意见领袖的新闻推荐:对媒体信任和信息寻求的影响。计算机与媒介通信2015年6月1日;20(5):520-535。[CrossRef
  16. Suh B, Hong L, Pirolli P, Chi e想被转发?大规模分析影响推特网络转发的因素。2010年发表于:SOCIALCOM '10: 2010 IEEE第二届社会计算国际会议;2010年8月20-22日;华盛顿特区。[CrossRef
  17. Avram M, Micallef N, Patil S, Menczer F.暴露于社交参与指标会增加错误信息的脆弱性。HKS错误信息评论2020年7月25日;1(5):1-11。[CrossRef
  18. 《沟通理论在职业生活中的应用:实践导论》。加州千橡市:SAGE出版公司;2010.
  19. Bode L, Vraga EK。在相关新闻中,这是错误的:通过社交媒体上的相关故事功能来纠正错误信息。中华医学杂志2015年6月23日;65(4):619-638。[CrossRef
  20. 周超,李凯,陆勇。社交媒体中错误信息的语言特征与传播:信息丰富度的调节作用。Inf进程管理2021 11月;58(6):102679。[CrossRef
  21. 陈胜,肖林,毛杰。社交媒体含错误信息帖子的劝导策略。Inf Process Manage 2021 Sep;58(5):102665。[CrossRef
  22. Castillo C, Mendoza M, Poblete B. Twitter的信息可信度。2011发表于:第20届国际万维网会议;2011年3月28日至4月1日;海得拉巴,印度。[CrossRef
  23. van der Meer TGLA, Jin Y.寻求公共卫生危机中错误信息处理的公式:纠正性信息类型和来源的影响。卫生公共2020年5月14日;35(5):560-575。[CrossRef] [Medline
  24. 权山,车明,郑坤。基于不同时间窗口的谣言检测。PLoS One 2017;12(1):e0168344 [免费全文] [CrossRef] [Medline
  25. 权S,车敏,郑k,陈伟,王艳。网络社交媒体谣言传播的突出特征2013年发表于:2013 IEEE第13届数据挖掘国际会议;2013年12月7日至10日;德克萨斯州达拉斯[CrossRef
  26. 马俊,高伟,王坤。基于核学习的传播结构微博谣言检测。2017年发表于:第55届计算语言学协会年会上;2017年7月;温哥华BC。[CrossRef
  27. 陈冬,唐山。突发公共卫生事件中微博谣言传播特征分析——以新冠肺炎疫情为例。科学普及研究;2021;16(01):98。[CrossRef
  28. Cinelli M, Quattrociocchi W, Galeazzi A, Valensise CM, Brugnoli E, Schmidt AL,等。COVID-19社交媒体信息大流行。科学通报2020年10月06日;10(1):16598。[CrossRef] [Medline
  29. 突发公共卫生事件中健康谣言的特征分析——以新冠肺炎疫情期间双黄连事件为例J News Res 2020;11(20):104-115。
  30. 彭妮库克G,兰德DG。假新闻的心理。中国科学进展(英文版);21 (5):388-402 [免费全文] [CrossRef] [Medline
  31. 中国互联网联合辟谣平台。URL:https://www.piyao.org.cn/2020yqpy/[2020-12-01]访问
  32. 腾讯事实核查平台。URL:https://vp.fact.qq.com/home[2020-12-01]访问
  33. 微博报表处理大厅。URL:https://service.account.weibo.com/[2020-12-01]访问
  34. 胡伟,陈宏,王强。新冠肺炎疫情中谣言的心理动因及对策。大理大学学报2021;6(1):111-116。[CrossRef
  35. 王凯。新型冠状病毒疫情相关谣言内容分析及治理思考——基于Nvivo 11的368份样本分析。东北农业大学学报(社会科学版)2020;18(05):27-35。
  36. 姚安,马军,林勇,刘强,张震。重大突发公共卫生事件的谣言演变与治理策略。科学通报2020;38(07):22-29。[CrossRef
  37. Richards KAR, Hemphill MA。协同定性数据分析的实用指南。中华物理教育杂志,2018年4月,37(2):225-231。[CrossRef
  38. 内容分析:其方法论介绍。加州纽伯里公园:SAGE出版公司;2012.
  39. Zapf A, Castell S, Morawietz L, Karch A.测量标称数据的评级者之间的可靠性-哪些系数和置信区间是合适的?BMC Med Res methodo2016 Aug 05;16(1):93 [免费全文] [CrossRef] [Medline
  40. Rout JK, Singh S, Jena SK, Bakshi S.使用标记和未标记数据的欺骗性审查检测。Multimed Tools应用2016年8月19日;76(3):3187-3211。[CrossRef
  41. 田红,高超,肖旭,刘红,何波,吴红,等。怀疑知识增强了情绪分析的预训练。arXivcs。URL:http://arxiv.org/abs/2005.05635[2022-05-09]访问
  42. 朱颖,曹磊,谢娟,于颖,陈安,黄峰。利用社交媒体数据评估COVID-19对中国心理健康的影响。精神医学2021年4月20:1-8。[CrossRef] [Medline
  43. 陈燕,王婷,朱松,连平,如果我要走了,你会想念我吗?出乎市场意料的挪威乐的退出和客户的满意。旅游管理2020年2月;76:103951。[CrossRef
  44. 徐强,沈震,Shah N, Cuomo R,蔡敏,Brown M,等。COVID-19大流行早期阶段来自中国武汉的微博社交媒体帖子特征:定性内容分析JMIR公共卫生监测2020年12月07日;6(4):e24125 [免费全文] [CrossRef] [Medline
  45. Barter RL, Yu B. Superheat:一个R包,用于创建漂亮和可扩展的热图,以可视化复杂的数据。中国计算机工程学报,2018;27(4):910-922。[CrossRef] [Medline
  46. Kozinets房车。E-tribalized营销?:虚拟消费社区的战略意义。《金融研究》1999年6月;17(3):252-264。[CrossRef
  47. 王旭,张敏,范伟,赵凯。理解COVID-19错误信息在社交媒体上的传播:话题和政治领导人推动的影响。应用科学学报2021年9月27日;27(5):726-737。[CrossRef] [Medline
  48. Usher K, Durkin J, Martin S, Vanderslott S, Vindrola-Padros C, Usher L,等。澳大利亚COVID-19大流行期间关于家庭暴力的公众情绪和话语:对社交媒体帖子的分析。J Med Internet Res 2021 10月01日;23(10):e29025 [免费全文] [CrossRef] [Medline


榆树:精化可能性模型


编辑:M吉松迪,M戈特利布;提交28.02.22;作者:徐q, W Ceron, N Chalghaf, Lin T;对作者19.04.22的评论;修订版本收到10.05.22;接受07.06.22;发表20.06.22

版权

©赵月华,朱思成,万强,李天义,邹春,王浩,邓三红。最初发表于《医疗互联网研究杂志》(//www.mybigtv.com), 20.06.2022。

这是一篇开放获取的文章,根据创作共用署名许可(https://creativecommons.org/licenses/by/4.0/)的条款发布,允许在任何媒介上无限制地使用、分发和复制,前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。


Baidu
map