JMIR J医疗互联网服务 医学互联网研究杂志 1438 - 8871 卡塔尔世界杯8强波胆分析 加拿大多伦多 v24i8e38776 35943771 10.2196/38776 原始论文 原始论文 COVID-19封锁期间在线攻击增加:深度文本挖掘和差异中的差异分析的两阶段研究 Mavragani 孤挺花 克莱因 阿里 戈尔 罗斯 杰罗姆Tze-Hou 1 2 https://orcid.org/0000-0003-1312-0186 理查德Tzong-Han 博士学位 1
地理信息科学中心 人文社会科学研究中心“, 台湾中央研究院 学术路二段128号 出门 台北,11529年 台湾 886 2 27894160 886 2 27898150 rthtsai@gate.sinica.edu.tw
3. https://orcid.org/0000-0003-0513-107X
地理信息科学中心 人文社会科学研究中心“, 台湾中央研究院 台北 台湾 台北市建国中学 台北 台湾 计算机科学与信息工程系“, 中央大学 桃园 台湾 通讯作者:Richard Tzong-Han Tsai rthtsai@gate.sinica.edu.tw 8 2022 9 8 2022 24 8 e38776 17 4 2022 6 5 2022 19 6 2022 23 6 2022 ©Jerome Tze-Hou Hsu, Richard Tzong-Han Tsai。最初发表于《医疗互联网研究杂志》(//www.mybigtv.com), 2022年8月9日。 2022

这是一篇开放获取的文章,根据创作共用署名许可(https://creativecommons.org/licenses/by/4.0/)的条款发布,允许在任何媒介上无限制地使用、分发和复制,前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。

背景

COVID-19大流行在全球范围内引发了严重的公共卫生危机,政策制定者正在利用封锁来控制病毒。然而,威胁社会稳定的攻击性社会行为明显增加。封锁措施可能会对心理健康产生负面影响,导致攻击性情绪增加。发现封锁和攻击性增加之间的关系对于制定适当的政策以解决这些不利的社会影响至关重要。我们将自然语言处理(NLP)技术应用于互联网数据,以调查封锁对社会和情感的影响。

客观的

本研究旨在了解封锁与攻击性增加之间的关系,利用NLP技术分析了美国推文时空范围内的以下3种攻击性情绪:愤怒、攻击性语言和仇恨言论。

方法

我们对11455名推特用户进行了纵向互联网研究,分析了他们在2019年至2020年发布的1281362条推文中的攻击性情绪。我们选择了互联网上3种常见的攻击性情绪(愤怒、攻击性语言和仇恨言论)作为分析的主题。为了检测推文中的情绪,我们训练了一个来自变形金刚的双向编码器表示(BERT)模型来分析每个州和每周攻击性推文的百分比。然后,我们使用差异中的差异估计来衡量锁定状态对不断增加的攻击性推文的影响。由于大多数其他可能影响结果的独立因素,如季节和区域因素,已被时间和状态固定效应排除,这种差异中的差异分析的重要结果不仅可以表明具体的正相关,而且还可以指出因果关系。

结果

在2020年封锁的前6个月里,所有用户的攻击水平与2019年同期相比有所上升。值得注意的是,被封锁的用户比未被封锁的用户表现出更强的攻击性。我们的“差异中的差异”估计发现,在封锁和攻击性增加(愤怒: P=。002,offensive language: P<措施,hate speech: P= .005)。从这样的结果可以推断出存在因果关系。

结论

了解封锁和攻击之间的关系可以帮助政策制定者解决封锁对个人和社会的影响。应用自然语言处理技术和在社交媒体上使用大数据可以为这项工作提供关键和及时的信息。

自然语言处理 封锁 网络攻击 infoveillance 因果关系 社交媒体 神经网络 电脑 流感大流行 新型冠状病毒肺炎 情绪 互联网 情绪分析 推特 内容分析 infodemiology
简介 背景

2020年3月13日,美国宣布进入紧急状态,以应对COVID-19大流行。许多州都采取了封锁措施,以减缓病毒的传播。然而,封锁政策影响到人类生活的许多方面。人们在长时间的监禁中所经历的沮丧和孤独可能会产生负面的心理影响。 1- 3.].此外,挫折感可以通过不断增强的攻击性表现出来。 4].在一个人们与亲密的家庭成员紧密生活在一起的时代,情绪问题,如自杀念头和攻击性,可能导致破坏性行为,并对社会产生直接影响[ 5 6].科学调查是否证实了这些观察结果,可能对公共或私人治理产生重大的政策影响。不出所料,禁闭和不良心理影响之间的关系越来越受到多个学科研究人员的关注。然而,对于封锁和攻击性情绪之间的因果关系,很少有可靠的测试。这项研究使用机器学习来产生可靠的数据。然后,我们使用统计差异中的差异分析来估计封锁和在线攻击增加之间的因果关系。机器学习技术在社会科学研究中的应用可以在更广阔的范围内以更快的速度提供新的信息。

相关的工作 封锁的负面影响

在个人层面上,研究表明,封锁与自杀意念、焦虑障碍、噩梦、抑郁、孤独和心理健康状况不佳有关[ 7- 12].在社会层面,封锁的不利影响表现为离婚、性暴力[ 13],以及家庭暴力[ 14].所有这些影响对个人和社会的稳定和福祉构成相当大的威胁。因此,了解COVID-19封锁下的这些有害行为是一项紧迫的任务。

心理学的其他研究集中在封锁前和封锁后心理健康的恶化[ 7].作者通过比较封锁前和封锁后的调查数据,观察到封锁后1个月某些健康行为的增加。然而,作者并没有分析禁闭和这些行为之间的因果关系。

情感是人类行为的主要驱动力之一。更有攻击性的心态会导致家庭暴力和性暴力等攻击性行为,这是合理的。有影响的挫折-攻击理论[ 15的研究表明,攻击性行为是由于个人目标受挫引起的挫败感造成的。在大流行的最初几个月,封锁导致许多计划被取消,目标未能实现。因此,封锁和攻击性增加之间的因果关系是合理的。

值得注意的是,一项研究调查了封锁和攻击性增加之间的相关性[ 2].Killgore等人进行了问卷调查[ 2].在美国大流行的最初几个月里,他们使用巴斯·佩里攻击问卷来测量处于封锁状态和未处于封锁状态的患者的攻击水平。他们发现,在封锁组和非封锁组之间,以下4种攻击在统计上显著增加:身体攻击、言语攻击、愤怒和敌意。然而,由于传统问卷调查方法的局限性,例如在大流行前缺乏数据,这项研究无法评估封锁和攻击性增加之间的因果关系。此外,由于调查管理的实际限制,作者不得不在每次抽样中调查不同的参与者,这提供了额外的不确定性来源。

COVID-19推特情绪分析

使用自然语言处理(NLP)对推文进行在线分析,为健康相关研究提供了有价值的信息。对封锁期间人们的情绪进行了一般情绪分析[ 16 17].

有些与特定主题有关,例如疫苗接种[ 18- 20.],而另一些则与特定地区或国家有关[ 21].然而,据我们所知,大多数研究都没有分析封锁和情绪之间的关系。苏等[ 22分析了两个进入封锁状态的城市的心理语言学特征。虽然这可以捕捉到推文词汇的特定上升趋势,但词汇频率分析方法并不能捕捉到每个单词的上下文。因此,它无法像神经网络模型那样准确地预测情绪[ 23].

我们的研究

本文针对目前心理学和自然语言处理研究的不足之处。大多数最近的心理学文献都没有提供有意义的证据来证明封锁和攻击性情绪之间的因果关系。另一方面,目前在情感分析方面的NLP研究主要集中在优化方法,使机器能够在大量的数字化人类话语中捕捉情感。然而,目前公共卫生领域的NLP文献很少探讨社会现象的因果关系。

我们使用新的NLP技术对在线Twitter用户及其推文进行了虚拟纵向研究,以调查封锁对以下3种攻击行为的影响:愤怒、攻击性语言(offensive)和仇恨言论(hate)。我们的信息监测方法使我们能够发现攻击水平的趋势,为决策者和卫生专业人员提供重要信息。此外,封锁前后的数据使我们能够使用差异中的差异分析来估计封锁与攻击性增加之间的潜在因果关系,这是一种既定的计量经济学方法,用于理解非实验时间序列数据中的因果关系[ 24].这种跨学科方法在理解封锁和攻击性增加之间的关系方面产生了可靠的结果,并为应用NLP和互联网技术支持医学研究开辟了新的潜力。

方法 概述

首先,我们选取了一组美国各地的推特用户作为分析对象。然后,我们使用Twitter的应用程序编程接口获取抽样用户在2019年1月1日至2020年10月1日之间发布的所有推文。我们的目标是使用神经网络模型来检测这些推文中不同时期不同程度的攻击性情绪。我们选择了来自变形金刚(BERT)模型的双向编码器表示,这是一种最先进的语言模型,可以通过上下文和细微差别更好地理解情感的含义,而不是以前基于词典的模型[ 23 25].为了训练BERT模型进行情绪检测,我们基于已建立的数据集收集了训练数据[ 26- 28].之后,我们使用经过训练的BERT模型对推文情绪进行分类。我们进行了一项观察性分析,以比较和对比不同地理位置、封锁状态和时间之间的攻击水平。在观察到封锁后攻击性增加后,我们使用泊松回归作为差异中的差异估计来测量封锁状态和攻击性水平之间的关系。

Twitter数据抽样

在美国,各州保留实施封锁政策的权力。因此,本研究使用状态锁定状态来确定个人用户是否在特定时间处于锁定状态。我们随机抽取了美国各州的推特用户作为我们纵向互联网研究的参与者。在对用户进行采样后,我们对他们在2019年和特朗普总统于2020年3月宣布全国进入紧急状态后的前6个月发布的每条推文进行了采样。我们的抽样产生了一个时空数据集,其中包括从2019年1月1日到2020年10月1日由11455名推特用户发布的1281362条推文。抽样用户来自美国各地,包括来自所有50个州的用户。在这项研究中,我们使用这些推文来调查封锁和社交媒体攻击性之间的关系。所有推文都遵循数据预处理协议[ 29],然后由BERT模型进行情绪检测分析。

培训数据收集

为了检测推文中的攻击性情绪,我们对三种攻击性情绪分别训练了BERT神经网络二元分类模型。对于每个模型,我们收集了不同的训练数据集。我们对每种情绪的定义与训练数据集的定义相同。 表1包含3种攻击性情绪的定义,与 表2为每个提供示例文本。

每种情绪的定义。

积极的情感 定义
愤怒 强烈的不满或敌意[ 26
攻击性的语言 含有不可接受的语言(亵渎),并可能对弱势群体造成伤害的言论[ 27
仇恨言论 对目标群体表达仇恨并带有贬损、侮辱和羞辱性的语言[ 27 28

包含每种攻击性情绪的示例文本。

积极的情感 手机文字输入的软件
愤怒 我希望这一切能尽快结束。这是地狱
攻击性的语言 人们真的这么蠢吗?
仇恨言论 @user腐烂从顶部开始......特朗普的混蛋都是种族主义者......去他妈的!
愤怒

我们选择GoEmotions数据集来训练愤怒分类模型[ 26].它是最大的手动注释数据集之一,有58,000个英文Reddit评论。在数据集中,每个句子都被标注,以识别28种相对常见的情绪的存在。为了训练BERT模型进行二元分类,我们选择了6000个包含愤怒的句子和6000个不包含愤怒的句子的随机样本。我们选择了1000个其他注释注释进行测试。基于GoEmotions,愤怒被定义为“一种强烈的不满或对抗的感觉。”

攻击性的语言

攻击性语言是指包含不可接受的语言(亵渎),对弱势群体有潜在伤害的言论。我们选择了“自动侦测仇恨言论及冒犯性语言问题”[ 27]数据集作为我们的训练数据集,其中包含24,802条人工标记的推文。我们随机抽取了7750个句子进行训练,613个句子进行测试。这项研究将具有真正有害意图的仇恨言论与一般攻击性词汇区分开来。例如,许多青少年经常随意地使用“f*ck”和“b*tch”这样的词,并没有恶意。AHSD为攻击性语言和更有害的仇恨言论提供注释数据。

仇恨言论

与一般的攻击性语言不同,仇恨言论是一种更具体的语言,会造成故意伤害。为了训练我们的仇恨模型,如前所述,我们将AHSD数据集与大规模人群Sourcing [ 28数据集提供了额外的2067条被人类标记为可恶的推文。我们随机抽取了6450个句子用于训练,639个用于测试。这两个数据集都将仇恨言论确定为对目标群体表达仇恨的语言,目的是贬损、侮辱和羞辱。这个定义在之前的研究中被广泛使用[ 30.- 32].

模型训练

我们使用BERT模型[ 29来识别推文中的情绪。这种预训练的神经网络模型是情感理解中最强大的模型之一。由于模型有来自整个英语维基百科的丰富的预训练数据,在我们进行最后的微调之前,模型已经对英语语言有了基本的了解。该模型的上下文嵌入使其能够根据上下文理解单词,使其语言理解能力超越传统的词汇分析。我们的模型架构是在python模块pytorch 1.8.1和transformer 4.11.0下构建的。使用训练数据,我们为所有3种目标情绪获得了良好的表现模型(具体统计数据如下所示)。

模型评价

我们首先在测试集上测试我们的模型预测(火车-测试分割)。结果显示在 表3,连同混淆矩阵在 图1.然后,我们在抽样的Twitter数据集上测试我们的模型,用于进一步分析。为了评估自采样推特数据上的模型性能,我们选择了1080条推文,540条来自被封锁的人,540条来自未被封锁的人,每周随机选择5-6条推文。然后,两名以英语为母语的人根据上述每种情绪的定义对推文进行了注释。注释器和模型性能之间的Cohen kappa值报告在 表4而且 5,分别。通过这一点,我们可以在进一步下游分析中使用的Twitter数据上验证我们的模型能力。

在测试集上建模性能。

模型 精度 回忆 F1
愤怒 0.869 0.826 0.847
攻击性的语言 0.953 0.988 0.970
仇恨言论 0.956 0.920 0.933

我们的模型的困惑矩阵:愤怒(A),攻击性(B)和仇恨(C)。右下和左上象限是模型正确预测的地方,分别代表真消极和真积极。象限颜色越深,预测能力越强。

科恩kappa评级者之间的协议。

情感 卡巴
愤怒 0.928
攻击性的语言 0.937
仇恨言论 0.890

在抽样的Twitter数据集上建模性能。

模型 精度 回忆 F1
愤怒 0.795 0.888 0.839
攻击性的语言 0.843 0.922 0.880
仇恨言论 0.810 0.872 0.839
数据分析方法 概述

为了理解推文中的攻击性水平,我们测量了所有随机采样的推文中包含攻击性的推文的比例。首先,我们为每种攻击性情绪(即愤怒、攻击性和仇恨)使用单独的BERT模型来分析我们采样的Twitter数据。分析结果是3个数据集,每个数据集代表一种攻击性情绪。在每个数据集中,对于50个州中的每个州,我们计算了从2019年1月到2020年10月的92周内包含攻击性情绪的推文的百分比。该分析得到3个数据集,每个数据集有4600个数据点。

虽然我们的数据由不同时空设置下的攻击性推文数量组成,但我们分析了攻击性推文在总推文中的比例,而不是攻击性推文的数量,以调查推特上的攻击性水平。这是因为攻击性推文数量的增加可能是由于推文总量的增加,这并不一定意味着攻击性水平更高。测量攻击性推文的比例可以更准确地描述推特上的攻击性水平。

经过3个阶段的观察和分析,我们从不同的角度看待数据。在第一部分中,我们比较了大流行前6个月不同封锁状态组之间的攻击水平。在那之后,我们把注意力集中在那些经历了封锁的州,我们观察了他们封锁前后的攻击水平。最后,我们使用差异中的差异分析来估计封锁对攻击性增加的影响。

观察被封锁组与未被封锁组之间攻击水平的差异

为了了解封锁对攻击性情绪的影响,我们调查了每个特定时间和地点的攻击性推文比例,并比较了处于封锁状态下和未处于封锁状态下的人的比例。为此,我们设计了第一个目标。在2019年1月1日至2020年10月1日的92周内,我们将封锁州和非封锁州分为两组。然后,我们分别汇总了攻击性推文的数量和推文总数。基于综合数据,我们计算了这两个组每周的攻击性推文百分比,持续了92周。请注意,每个州的用户代表处于封锁状态的患者,而不是基于该州当前的封锁状态而处于封锁状态的患者。

观察封锁前后几周实行封锁的州的侵略趋势

在前一节中,我们观察并比较了被封锁和未被封锁的组之间的攻击性情绪。在本节中,我们重点了解了封锁州的趋势。更具体地说,我们通过比较封锁前后的数据,研究了封锁后攻击性的增加。我们根据封锁的第一周按时间顺序排列了每个封锁州的数据。更具体地说,对于每个经历过封锁的州,封锁开始的那一周被记为第0周。其他的周也相应地编号(例如,第0周之后的第一周是第1周,第0周之前的第一周是第- 1周,依此类推)。使用这种方法,我们可视化了封锁后攻击性的增加。请注意,这仅仅是对封锁前后侵略趋势的观察。它没有衡量封锁状态对侵略程度的净影响。为了具体衡量影响并调查因果关系,我们在下一节中应用了差异中的差异估计,以统计方式量化封锁组和非封锁组之间的攻击水平差异。

用泊松回归分析差异中的差异

研究因果关系的传统方法是在随机分配的受试者中进行实验,参与者随机分为两组。一组接受治疗,另一组不接受。然而,在许多情况下,包括我们的实验,由于实际或伦理原因,实验是不可行的。例如,我们不能随机分配人员,并将他们长期封锁。一些社会科学研究人员使用多元回归来解决这个问题,当感兴趣的自变量, X等相关变量, Z1 、…… Zk ,共同行动决定结果, Y.虽然这种方法可以控制选定的效果 Z变量,其他一些潜在的相关变量可能缺乏数据或难以识别,导致重要变量可能没有被考虑。为了解决这个问题,科学家们使用了“差中差法”。

正如Callaway和Sant 'Anna指出的那样,“差异中的差异(DID)已成为用于评估政策干预中的因果效应的最流行的研究设计之一”[ 33].差异中的差异是指治疗组和对照组在特定时间(T1)与另一个时间(T2)的差异,其中2倍被特定干预隔开。该方法比较T1 ( DT1), T2处的差值( DT2),并测量两者之间的差异 DT1而且 DT2(差异中的差异)与干预有因果关系。简而言之,差异中的差异衡量的是干预是否会对差异产生因果影响 DT1而且 DT2 34].在这项研究中,治疗组指的是那些被封锁的Twitter用户,对照组指的是那些没有被封锁的用户。干预措施是封锁我们的目的是比较这两组之间的攻击水平的差异( DT2)与封锁前两组之间的差异( DT1),并测量两者之间的差异 DT1而且 DT2与禁闭有因果关系

为了实现时间序列数据中的差分估计,我们使用固定效应模型。固定效应模型通过控制每个地理和时间数据组(简称数据组)中的平均值来处理不可见变量。每个数据组的平均值由许多因素构成,包括那些我们可能知道或不知道的Z变量。换句话说,我们需要控制的Z变量的影响是在每个数据组的平均值中捕获的。通过从每个数据组的结果中减去平均值,固定效应模型控制了杂Z变量的影响,并测量了X变量对Y变量的贡献的净增加。以“国家的固定效应”为例,不同政治倾向和种族构成导致的侵略水平差异体现在各州的平均侵略水平中。在减去平均值之后,我们现在测量了相对于每个州的标准,攻击性水平是如何增加的。本研究中使用的固定效应模型“比普通回归分析更接近于实现无偏倚的因果效应估计”[ 35].

为了实现上面的固定效应模型,我们需要将固定效应添加到最适合我们数据的回归模型中。因为我们最初的观察是在特定时空设置中发布的攻击性推文的数量,所以我们的数据代表了一种计数数据。因此,对于固定效应的计数数据,我们选择了经典的泊松模型[ 36].最初使用的公式如下:

ln ( 攻击性推文计数s t ) = α 0+ α 1 在封锁+ μ状态 + σ时间 + ε (1)

在这种情况下, 攻击性推文计数s t 是在特定时间(t)下,特定状态(s)下的攻击性推文的数量。 α0是标准回归模型中的常数。变量 α1表示治疗效果 在封锁关于咄咄逼人的推文。 在封锁是一个二进制变量(本实验中的解释变量),其值为0表示未被锁定,值为1表示被锁定。模型还包括状态固定效应和时间固定效应,如下所示: μ状态 而且 σ时间 .这两个变量没有特定的范围,而是代表它们对应的数据组的平均值(例如,某个州或特定周的数据)。 ε误差项是否包含在所有统计回归中。

然而,正如前面提到的,攻击性推文数量的增加可能是由于发布的推文总数的增加,这并不一定表明攻击性水平更高。测量攻击性推文的比例可以更准确地描述推特上的攻击性水平。因此,为了使用这种基于计数的模型来测量攻击性推文的比例,我们通过添加术语ln( 总计),将系数固定为1,得到方程。此操作是为类似我们的情况而设计的,并得到了 暴露()stata17软件中的选项[ 37].更具体地说,我们现在的方程如下:

ln ( 攻击性推文计数s t ) = α 0+ α 1 在封锁+ μ状态 + σ时间 + ε+ ln ( 总计s t (2)

为了理解ln( 总计s t )允许我们估计比例而不是计数,我们可以这样看这个方程:当我们减去ln( 总计s t ),则该估计相当于对攻击性推文的比例进行建模。方程如下:

ln ( 攻击性推文计数s t / 总计s t ) = α 0+ α 1 在封锁+ μ状态 + σ时间 + ε (3)

我们的模型更接近于捕捉观察数据中感兴趣的自变量对因变量的无偏因果效应[ 35].由于大多数其他可能影响结果的独立因素,如季节和区域因素,已经被时间和状态固定效应所吸收,这种差异中的差异分析的显著结果不仅可以表明具体的正相关,而且可以强烈地表明因果关系。所有分析均使用Stata BE Edition 17.0 (StataCorp)进行。

结果 观察被封锁组与未被封锁组之间攻击水平的差异

该分析比较了处于封锁状态和未处于封锁状态的各州之间的侵略水平。2020年3月13日,美国宣布进入紧急状态。在曾实施封锁的42个州中,有40个州在2020年3月20日至4月4日的两周内实施了封锁。 图2显示了2020年4月至10月的数据,当时美国的大流行越来越严重,一些州开始封锁。它说明了被封锁和未被封锁的群体之间每周攻击水平的差异。 图3将时间范围缩小到包括2019年的数据,将大流行下的数据纳入更广泛的视角。

自2020年4月1日以来,所有3种攻击性情绪(愤怒(A)、攻击性(B)和仇恨(C))的每周攻击性推文百分比。表示封锁州(洋红色)和未封锁州(青色)。

自2019年1月1日以来,所有3种攻击性情绪(愤怒(A)、攻击性(B)和仇恨(C))的每周攻击性推文百分比。显示的是被封锁的州(洋红色)、未被封锁的州(蓝绿色)和任何封锁开始前的数据(黄色)。

愤怒

就强烈的不满或对抗感而言,2020年5月推文数量突然增加,在封锁期间尤其明显。自4月以来的前9周,被封锁的一组的平均愤怒水平比另一组高出2%-3%。 图3显示2019年愤怒推文的比例在20%左右波动。到2020年5月,这一比例升至34%。在2020年夏天,愤怒水平下降,两组人的愤怒推文比例相似。

攻击性的语言

对于可能伤害弱势群体的不可接受的语言,自2020年4月以来的7周内,推文的比例急剧上升( 图2).2019年,攻击性水平在6%左右波动( 图3).在第7周,未被封锁组和未被封锁组的攻击性推文比例分别飙升至12.2%和9.8%。之后,数量开始逐渐减少。虽然在未被封锁的组和未被封锁的组中都看到了类似的趋势,但被封锁的推文百分比始终比另一组高2%-3%。

仇恨言论

对于旨在向目标群体表达仇恨的贬损、羞辱和侮辱性言论,推文比例在2020年4月1日起的第8周达到峰值( 图2).仇恨言论的比例从大流行开始时的3%左右飙升至封锁期间和未被封锁期间的8%和6%。比例在2020年夏季有所下降,随后几个月逐渐稳定下来。与攻击性语言的趋势类似,仇恨推文的百分比在下降后大大高于2019年的数值( 图3).在最初的激增之后,封锁下的仇恨言论比例比另一组高出1%-2%。

三种攻击性情绪的攻击性水平都大幅上升,在2020年4月1日起的6-8周左右达到峰值( 图2).在整个过程中,被封锁的人比不被封锁的人表现出更激进的倾向。没有被封锁的人经历了与被封锁的人相似的趋势,但程度不那么严重。在攻击性增加的初始峰值之后,所有三种情绪推文的比例都下降到一个相对稳定的平台。这种稳定可能表明人们正在逐渐适应这种情况,与封锁初期的突然不满相比,情绪相对缓和。尽管攻击性推文的比例暂时下降,但仍远高于2019年的水平( 图3).

观察封锁前后几周的攻击趋势

我们选择了实施封锁的州,并比较了封锁前后的侵略水平。我们看到了封锁后不断增加的攻击趋势。 图4显示包含目标情绪的推文的每周变化。在这三种攻击性情绪中,在封锁后的10周内,推文的比例明显飙升。下表显示了每周平均推文百分比(封锁前60周和封锁后22周)。在所有三种情绪中,封锁后的比例都有所上升(愤怒,18.51%至23.77%;进攻性,5.80% - 8.79%;仇恨,2.97% - 4.85%)。这些描述性数据使我们基本了解了封锁和攻击性增加之间的潜在联系。请注意,这一部分并没有得出完全由封锁引起的结论,而是显示了封锁前后可能由多种因素引起的侵略行为的总体趋势。在接下来的部分中,我们进行了差异中的差异分析,以精确估计封锁对侵略行为增加的净影响。

在封锁前后,愤怒(A)、攻击性(B)和仇恨(C)的攻击性推文百分比。第0周的垂直红线表示开始封锁。请注意,由于各州可能在不同的时间开始封锁,因此第0周在不同的州可能不同。尽管如此,各州通常在2020年3月20日至4月4日之间开始封锁。

用泊松回归分析差异中的差异

在本节中,我们使用泊松回归模型进行了差异中的差异分析。封锁与所有三种攻击性情绪的攻击性推文比例的增加有关。在对数线性模型中,原始系数, α1, X和Y之间表示X每增加一个单位ln(Y)的增加,由于对数的存在,很难解释。发病率比(IRR)是利益自变量e的指数系数 α 1,即x每增加一个单位,Y就增加一个单位。对于所有3种攻击性情绪,攻击性推文比例与锁定状态之间的IRR都大于1(愤怒,1.049;攻势,1.168;仇恨,1.114),这表明在最初的封锁之后,愤怒、攻击性和仇恨的情绪推文平均分别增加了4.9%、16.8%和11.4%。所有3个结果都显示出较高的统计学意义(愤怒: P=。002,offensive: P<措施,hate: P= .005)。差异中的差异结果显示在 表6.在状态和时间固定效应的控制下,大多数可能导致误读的因素被排除。因此,我们可以衡量封锁状态对侵略水平的净影响。我们的估计强烈表明,在所有3种攻击性情绪中,封锁和攻击性增加之间存在因果关系。

情绪推文比例和锁定状态的泊松回归结果。

锁定状态 发病率比 标准错误 z P价值 95%可信区间
被封锁(愤怒) 1.049745 0.0163949 3.11 .002 1.018099 - -1.082375
封锁(进攻) 1.168261 0.0319202 5.69 <措施一个 1.107345 - -1.232529
被封锁(恨) 1.114432 0.0432653 2.79 .005 1.032780 - -1.202541

一个STATA回归得到 P=组织。

讨论 主要研究结果 封锁状态下攻击性情绪的信息监视研究

了解攻击性情绪的趋势是理解大流行期间与攻击性行为相关的各种社会问题的第一步。受Killgore等人的问卷研究启发[ 2],我们使用NLP作为信息监视方法,观察大流行最初几个月的在线攻击趋势。我们希望该方法能够支持传统的心理调查,利用计算机技术提供一种更有效的理解人群情绪的方法。

通过使用全州封锁状态来分析推文,我们可以在很长一段时间内捕捉攻击水平的峰值和低谷。我们还可以确定具有不同锁定状态的组之间的攻击水平差异。在观察的时间段内,有几个特别明显的攻击性水平峰值。这些偏差或许可以解释各种社会事件对公众情绪的影响。从2020年4月初大多数州实施封锁到同年5月下半月,攻击水平上升的幅度是2019年所没有的,被封锁的人比其他人表现出更严重的上升。全国新冠肺炎死亡者从3月末的每天100人以下激增到4月中旬的2000多人,情绪和生活方式受到了前所未有的冲击。通过封锁,死亡人数在接下来的几个月里稳步下降,并在6月达到较低的平衡。所有三种攻击性情绪都在全国大流行最严重的月份达到顶峰,当时各州正在经历高死亡人数和内乱。

经过大约2个月的封锁后,侵略程度有所下降。这种下降可能是由于流行疲劳,使人们感到压力更小,表现出更少的攻击性[ 38].根据世界卫生组织的一份报告,“在危机开始时,大多数人能够利用他们的激增能力——一种人类在剧烈压力情况下为短期生存而利用的心理和身体适应系统的集合。然而,当糟糕的情况一拖再拖时,他们不得不采取不同的应对方式,结果可能是疲劳和丧失动力。 39].尽管人数有所下降,但被封锁的人仍然比未被封锁的人表现出更高的攻击性水平。

尽管这三种攻击性情绪的攻击趋势大致遵循相同的模式,但每种情绪都有一些略有不同的特征,这揭示了每种情绪的独特性。愤怒是三种情绪中最常见的情绪。在最初的高峰之后,不同封锁状态组之间的攻击线在接下来的几个月里交织在一起。攻击性和仇恨比愤怒更常见。然而,在大流行的前6个月里,被封锁者的攻击性和仇恨水平一直高于未被封锁者的水平。

我们的信息监测研究捕捉了人们在特定时间段内情绪的波动,为政策制定者和公共卫生专业人员提供了重要信息。

发现封锁和攻击性增加之间的因果关系

我们的估计表明,封锁和攻击性增加之间存在因果关系。用于计数数据的泊松回归分析适用于估计在一段时间内发布的攻击性推文的数量。时间和状态固定影响能够解决除锁定状态以外的因素对结果的不希望看到的影响。使用这个严格的统计模型,我们可以展示封锁状态对攻击性推文增加的净影响。在所有三种攻击性情绪(愤怒: P=。002,offensive: P<措施,hate: P=.005)与我们信息监视研究中的观察相匹配,即处于封锁状态的人具有更高的攻击水平。封锁期间的攻击性情绪会导致家庭暴力和离婚等社会问题。我们的发现为理解大流行期间攻击性情绪的原因提供了重要信息。

潜在政策影响

统计数据和科学证据在大流行期间的理性决策中发挥着至关重要的作用[ 40].利用大数据来检测封锁和攻击行为之间的潜在因果关系,可以指导政府在封锁期间实施心理健康支持政策。过去,心理健康支援有各种不同形式,包括但不限于家庭暴力保护[ 41]、学校辅导[ 42]、心理咨询[ 43].我们希望我们对侵略趋势的时空检测可以促进更有效地将公共资源分配到最需要的地区。此外,我们希望激励未来的研究人员使用机器学习来检测社会趋势,从而引发适当的政策反应。此外,我们希望我们的因果分析可以提高社会和政治对大流行期间精神卫生政策重要性的认识。

与之前工作的比较

基尔戈尔等[ 2发现封锁后的攻击性水平有所上升,这在被封锁的人群中尤其明显。我们的研究使用具有固定效应的泊松回归模型来精确测量封锁和攻击的净影响。这一被广泛采用的计量经济学方法指出了封锁与攻击性增加之间的因果关系[ 33].传统的问卷调查一次只能收集一个主题的数据,相比之下,我们从Twitter上获得的数据更加全面。通过调整分析方法,可用于其他学科的研究。

之前的NLP情感分析研究主要集中在使用机器来理解大量文本中的情感[ 16 17].然而,很少有人应用这一技术来调查公共卫生领域社会现象的因果关系。受传统心理学问卷调查研究的启发,我们将NLP技术应用于情感的纵向互联网研究。这种跨学科的努力为了解导致攻击性增加的因素提供了至关重要的信息。它为NLP技术提供了新的机会,使心理学和公共卫生研究更加高效和及时。

局限性和未来工作

我们的研究有一些局限性,也有在未来工作中改进的潜力。首先,Twitter的数据过度反映了更年轻的用户,这些用户更容易使用移动应用程序,并且生活在一个促进社交媒体的文化中。这些用户可能无法准确反映整个人口,因为某些具有不同人口和社会经济地位的群体可能代表性不足[ 44 45].然而,这种限制并非本研究独有,而是存在于所有涉及Twitter数据的研究中。其次,由于时间和计算的限制,考虑到可用推文的总数,我们采样的推文数量并不是很大。在未来,我们可以使用这种研究程序,增加推文样本的数量,以更细粒度的尺度检测空间和时间上的攻击水平。尽管如此,目前抽样的推文数量足以让这项研究显示全州范围内的攻击性波动,并得出具有统计学意义的主张。第三,为了确定每个用户的锁定状态,本研究只能使用带有地理标记的美国状态的用户的锁定状态。由于我们无法在个人层面上询问用户的锁定状态,这可能导致在确定用户的锁定状态时出现一些错误。这种局限性是互联网上社会事件研究所固有的。因此,我们的研究是在用户遵守所在州的封锁政策的假设下进行的。此外,为应对迅速变化的大流行情况,出现了不同类型和严格的封锁政策。 This research only measured the initial lockdown where people were restricted to staying at home. Future research is open to measuring the effect of lockdown policies at different levels and nuances on aggressive emotions and behaviors. Another source of uncertainty comes from the Twitter user location labels, since the location is per user rather than per tweet (“a user who moves from one city to another [and updates his location] will have all of his tweets considered as being from the latter location” [ 46])。此外,Gore等人和Frank等人的研究表明,一条推文的情绪与它所在的地理区域(即城市)高度相关[ 47 48].最后,我们的研究方法并不局限于测量攻击性情绪。未来的研究可以很容易地将我们的方法应用于其他情感和研究课题。利用NLP技术帮助心理学和公共卫生研究在未来具有巨大的潜力。

结论

信息监视研究在现代世界中非常有用。随着NLP的最新进展,模型可以被训练成准确理解文本中的情绪。NLP技术可以应用于分析大量社交媒体数据中的情绪。这种大规模的公众情绪时空数据可以进一步分析,以研究情绪趋势与某些政策(如封锁)之间的相关性和因果关系。计算机技术在社会科学研究中的应用前景广阔。

缩写 AHSD

自动仇恨言论检测和攻击性语言问题

伯特

来自变压器的双向编码器表示

IRR

发病率比

NLP

自然语言处理

作者感谢张允坚博士、何汉伟博士、林长青博士、陈伯伟博士、杨殿汉博士、廷昊轩博士、吕信恩博士、周立芬博士、潘伟力博士、蔡佩琴博士、林钦博士、梁志轩博士和张志礼博士对本文的帮助。这项研究得到了美国国家科学技术委员会的部分资助,资助金额为109-2221-E-008-062-MY3和109-2221-E-008-058-MY3。

数据可用性

本研究的源代码可在GitHub [ 49].

没有宣布。

沙阿 SGS 格拉 D 范Woerden HC Kiparoglou V COVID-19大流行:封闭孤独和数字技术的作用的大流行 J医疗互联网服务 2020 11 05 22 11 e22287 10.2196/22287 33108313 v22i11e22287 PMC7647474 Killgore WD 科卢楠 SA 泰勒 电子商务 Anlap Dailey NS 在COVID-19封锁期间,攻击行为不断增加 J影响失调代表 2021 07 5 100163 10.1016 / j.jadr.2021.100163 34075370 s2666 - 9153 (21) 00090 - 1 PMC8161773 Munoz-Fernandez N Rodriguez-Meirinhos 一个 西班牙COVID-19隔离期间青少年的担忧、惯例、同伴活动、挫折和乐观 临床医学 2021 02 16 10 4 798 10.3390 / jcm10040798 33669433 jcm10040798 PMC7920480 布鲁尔 J Elson 特米 P Frustration-Aggression理论 威利暴力与侵略手册 2017 新泽西州霍博肯, 威利 谢尔 l COVID-19大流行对自杀率的影响 QJM 2020 10 01 113 10 707 712 10.1093 / qjmed / hcaa202 32539153 5857612 PMC7313777 Moreira DN 平托·达·科斯塔 Covid-19大流行对亲密伴侣暴力沉淀的影响 国际法律精神病学杂志 2020 07 71 101606 10.1016 / j.ijlp.2020.101606 32768122 s0160 - 2527 (20) 30065 - 0 PMC7318988 Niedzwiedz CL 绿色 乔丹 Benzeval 坎贝尔 D 克雷格 P Demou E Leyland 一个 皮尔斯 一个 汤姆森 R 惠特利 E Katikireddi SV COVID-19封锁最初阶段之前和期间的心理健康和健康行为:对英国家庭纵向研究的纵向分析 流行病学,社区卫生 2021 03 25 75 3. 224 231 10.1136 / jech - 2020 - 215060 32978210 jech - 2020 - 215060 PMC7892383 Marroquin B 葡萄树 V 摩根 R COVID-19大流行期间的心理健康:居家政策、社会距离行为和社会资源的影响 精神病学Res 2020 11 293 113419 10.1016 / j.psychres.2020.113419 32861098 s0165 - 1781 (20) 31541 - 9 PMC7439968 X 对冲基金 年代 儿子 C 凯勒 B 史密斯 一个 Sasangohar F 调查COVID-19大流行期间美国大学生的心理健康:横断面调查研究 J医疗互联网服务 2020 09 17 22 9 e22817 10.2196/22817 32897868 v22i9e22817 PMC7505693 Pesonen 一个 Lipsanen J 哈洛宁 R Elovainio 睡魔 N 麦克拉 JM 唧筒座 Bechard D 奥利拉 Kuula l 大流行梦:COVID-19封锁期间梦内容的网络分析 前面Psychol 2020 10 1 11 573961 10.3389 / fpsyg.2020.573961 33117240 PMC7560506 Groarke JM 浆果 E Graham-Wisener l McKenna-Plumley 体育 McGlinchey E C COVID-19大流行期间英国的孤独感:来自COVID-19心理健康研究的横断面结果 《公共科学图书馆•综合》 2020 9 24 15 9 e0239698 10.1371 / journal.pone.0239698 32970764 玉米饼- d - 20 - 21817 PMC7513993 Majumdar P Biswas 一个 Sahu 年代 COVID-19大流行和封锁:导致印度上班族和学生睡眠中断、抑郁、躯体疼痛和屏幕暴露增加的原因 Chronobiol Int 2020 08 13 37 8 1191 1200 10.1080 / 07420528.2020.1786107 32660352 美国网球 J Murr H El-Jarrah R COVID-19封锁和针对妇女的暴力行为增加:了解大流行期间的家庭暴力 暴力与性别 2021 09 01 8 3. 133 139 10.1089 / vio.2020.0069 桑格牛 年代 McCrary J 冠状病毒封锁对家庭暴力的影响 SSRN杂志 2020 1 27 10.2139 / ssrn.3612491 干了 l 挫折-攻击假说:检验与重构 Psychol牛 1989 07 106 1 59 73 10.1037 / 0033 - 2909.106.1.59 2667009 Kruspe 一个 Haberle 库恩 XX COVID-19大流行期间欧洲推特信息的跨语言情感分析 arXiv 2020 2022-07-13 https://arxiv.org/abs/2008.12172 X J 一个 F J 在线社交媒体上的COVID-19分析:趋势、情绪和情绪 arXiv 2020 2022-07-13 https://arxiv.org/abs/2005.14464 Mehedi Shamrat FMJ Chakraborty 年代 伊姆兰 毫米 穆纳 比拉王储 毫米 达斯 P 拉赫曼 基于NLP和监督KNN分类算法的新型冠状病毒疫苗推文情感分析 IJEECS 2021 07 01 23 1 463 10.11591 / ijeecs.v23.i1.pp463 - 470 张成泽 H Rempel E 罗伊 Adu P Carenini G 新西兰 追踪加拿大推特上公众对COVID-19疫苗接种的态度:使用基于方面的情绪分析 J医疗互联网服务 2022 03 29 24 3. e35016 10.2196/35016 35275835 v24i3e35016 PMC8966890 T 年代 W X Y R Ly K Kacker V B Z 利用美国Twitter数据揭示对COVID-19疫苗的公众舆论:时空视角 J医疗互联网服务 2021 09 10 23 9 e30854 10.2196/30854 34346888 v23i9e30854 PMC8437406 穆罕默德Ridhwan K 哈格里夫斯 CA 利用推特数据了解新加坡公众对COVID - 19疫情的情绪 国际信息管理数据洞察杂志 2021 11 1 2 100021 10.1016 / j.jjimei.2021.100021 Y J X P J C T W T 武汉和伦巴第的新冠肺炎封锁影响研究:微博和推特上的心理语言学分析 国际环境与公共卫生 2020 06 24 17 12 4552 10.3390 / ijerph17124552 32599811 ijerph17124552 PMC7344534 Kotelnikova 一个 深度学习与基于规则的情感分析方法的比较 2020 2020国际工业工程与现代技术研讨会(FarEastCon) 2020年10月6日至9日 俄罗斯符拉迪沃斯托克 10.1109 / FarEastCon50210.2020.9271333 赫尔南 知更鸟 JM 因果推论:如果 2020 佛罗里达州博卡拉顿 CRC的新闻 Catelli R 佩洛西 年代 埃斯波西托 基于lexicon的与基于bert的情感分析:意大利语的比较研究 电子产品 2022 01 26 11 3. 374 10.3390 / electronics11030374 Demszky D Movshovitz-Attias D Ko J 考恩 一个 Nemade G 拉维 年代 GoEmotions:一个细粒度情绪数据集 arXiv 2020 2022-07-13 https://arxiv.org/abs/2005.00547 戴维森 T Warmsley D 梅西 韦伯 自动仇恨言论检测和攻击性语言问题 arXiv 2017 2022-07-13 https://arxiv.org/abs/1703.04009 Founta Djouvas C Chatzakou D Leontiadis 布莱克本 J Stringhini G Vakali 一个 Sirivianos Kourtellis N 大规模的众包和描述推特辱骂行为 2018 第十二届国际AAAI网络和社交媒体会议 2018年6月25日至28日 加利福尼亚州斯坦福大学 Devlin J 兆瓦 K Toutanova K BERT:深度双向转换器的预训练,用于语言理解 arXiv 2018 2022-07-13 https://arxiv.org/abs/1810.04805 Badjatiya P 古普塔 年代 古普塔 Varma V 基于深度学习的推特仇恨言论检测 WWW '17伴侣:第26届万维网伴侣国际会议论文集 2017 第26届国际万维网伙伴会议 2017年4月3日至7日 澳大利亚珀斯 10.1145/3041021.3054223 华纳 W Hirschberg J 在万维网上检测仇恨言论 LSM '12:第二届社会媒体语言研讨会论文集 2012 第二届社交媒体语言工作坊 2012年6月7日 加拿大蒙特利尔 施密特 一个 Wiegand 基于自然语言处理的仇恨言论检测研究 第五届社会媒体自然语言处理国际研讨会论文集 2017 第五届社会媒体自然语言处理国际研讨会 2017年4月3日 瓦伦西亚,西班牙 10.18653 / v1 / w17 - 1101 卡拉威 B 圣安娜 PH值 多个时间段的差异中存在差异 计量经济学杂志 2021 12 225 2 200 230 10.1016 / j.jeconom.2020.12.001 ·安格瑞斯特 JD Pischke JS 几乎无害的计量经济学:经验主义者的伴侣 2009 普林斯顿,纽约 普林斯顿大学出版社 Kempf-Leonard K 社会测量百科全书 2004 荷兰阿姆斯特丹 爱思唯尔 Hilbe JM 建模计数数据 2014 英国剑桥 剑桥大学出版社 Stata 17基础参考手册 2021 大学城,德克萨斯州 占据新闻 Bodenmann G Meuwly N 布拉德伯里 TN Gmelch 年代 Ledermann T 亲密关系中的压力、愤怒和言语攻击:个体和二元应对的调节作用 社会与个人关系杂志 2010 04 22 27 3. 408 424 10.1177 / 0265407510361616 大流行疲劳:重振公众以预防COVID-19:世卫组织欧洲区域会员国的政策考虑 世界卫生组织 2022-07-15 https://apps.who.int/iris/handle/10665/335820 达特 R 戈德堡 Y Goldshtein 于佩尔 一个 Kenett RS 庄园 O Pfeffermann D 因为他 E di Serio C 斯坦伯格 DM 统计学家在以色列应对COVID-19中的作用:整体观点 Isr J卫生政策决议 2022 04 20. 11 1 22 10.1186 / s13584 - 022 - 00531 - y 35443682 10.1186 / s13584 - 022 - 00531 - y PMC9019798 的孩子叫 JS 泰勒 J Bradbury-Jones C Nirantharakumar K 凯恩 E Bandyopadhyay 年代 COVID-19:需要采取公共卫生方法来管理家庭暴力 《柳叶刀公共卫生》 2020 06 5 6 e309 10.1016 / s2468 - 2667 (20) 30112 - 2 平卡斯 R Hannor-Walker T 莱特 l 正义 J COVID-19对学生的影响:学校辅导员如何挺身而出 NASSP公告 2020 12 11 104 4 241 256 10.1177 / 0192636520975866 Kavoor 基于“增大化现实”技术 Chakravarthy K 约翰 T COVID-19大流行时期的远程咨询:澳大利亚地区公共急性精神卫生保健机构的初步经验 亚洲J精神病学 2020 06 51 102074 10.1016 / j.ajp.2020.102074 32294583 s1876 - 2018 (20) 30185 - 4 PMC7195079 威尔逊 K 阿特金森 K Deeks 年代 利用新技术提高疫苗信心的机会 专家Rev疫苗 2014 08 14 13 8 969 77 10.1586 / 14760584.2014.928208 24931799 Karami 一个 Kadari RR Panati l Nooli SP Bheemreddy H Bozorgi P 地理标记行为分析:地理标记用户是否代表Twitter人口? IJGI 2021 06 02 10 6 373 10.3390 / ijgi10060373 梅丝洛夫 一个 莱曼 年代 YY Onnela 摩根大通 Rosenquist J 了解Twitter用户的人口统计数据 网络和社交媒体国际AAAI会议论文集 2011 第五届国际AAAI博客和社交媒体会议 2011年7月17日至21日 西班牙巴塞罗那 戈尔 RJ 迪亚洛 年代 帕迪拉 J 你发什么推,你就是什么:将美国肥胖率的地理差异与推特内容联系起来 《公共科学图书馆•综合》 2015 9 2 10 9 e0133505 10.1371 / journal.pone.0133505 26332588 玉米饼- d - 15 - 02269 PMC4557976 弗兰克 先生 米切尔 l 多兹 PS 丹弗斯 厘米 幸福和生活模式:地理定位推文的研究 Sci代表 2013 9 12 3. 1 2625 10.1038 / srep02625 24026340 srep02625 PMC6505625 COVID-19封锁期间在线攻击增加:深度文本挖掘和差异中的差异分析的两阶段研究 GitHub 2022-08-02 https://github.com/JeromeTH/Increased-Online-Aggression-During-COVID-19-Lockdowns
Baidu
map