发表在6卷,4号(2020): Oct-Dec

本文的预印本(早期版本)可在https://preprints.www.mybigtv.com/preprint/19833,首次出版
COVID-19大流行期间网络种族主义的复苏及其后果:推文中的情绪和情绪分析

COVID-19大流行期间网络种族主义的复苏及其后果:推文中的情绪和情绪分析

COVID-19大流行期间网络种族主义的复苏及其后果:推文中的情绪和情绪分析

本文作者:

Akash Dutt Dubey1 作者Orcid图片

原始论文

斋浦尔管理学院,印度斋浦尔

通讯作者:

Akash Dutt Dubey博士

斋浦里管理学院

Pratap Nagar, Sanganer

斋浦尔,302017

印度

电话:+91 7510099112

电子邮件:drakashddubey@gmail.com


背景:随着全球新冠肺炎患者数量的增加,一些人指责中国和世界卫生组织应为这种疾病的传播负责。因此,世界各地都有关于种族主义和仇恨行为的报道。当美国总统唐纳德·特朗普使用“中国病毒”一词时,这一问题愈演愈烈,亚洲人现在成为了攻击目标。网上的情况与此类似,充满仇恨的评论和帖子都在增加。

摘要目的:本文的目的是通过评估与推特上的推文相关的情绪和情绪,分析COVID-19大流行期间越来越多的网络种族主义实例。

方法:研究人员共分析了2020年4月11日至16日的16,000条推文,以确定其相关的情绪和情绪。使用R. Twitter API进行统计分析,使用sentimentr包分别收集推文并评估其情绪。这项研究分析了与“中国病毒”、“武汉病毒”和“中国冠状病毒”等术语相关的情绪和情绪。

结果:结果表明,大多数被分析的推文都是负面情绪,带有恐惧、悲伤、愤怒和厌恶的情绪。侮辱性词语和亵渎性词语的使用率很高。此外,“中国撒谎的人死了”、“武汉卫生组织”、“流感”、“中国必须付出代价”、“中共是恐怖分子”等词汇也经常出现在这些推文中。

结论:这项研究让我们深入了解了推特上网络种族主义的崛起。根据调查结果,可以得出结论,相当多的用户在推特上对亚裔、中国和世界卫生组织持负面情绪。

JMIR公共卫生监测2020;6(4):e19833

doi: 10.2196/19833

关键字



自成立以来,社交媒体网络一直是世界各地人们表达观点和意见的平台。1993年,《纽约客》[1发表了一幅名为《在互联网上,没人知道你是一条狗》的漫画,这表明当你在互联网上时,种姓、种族、民族、宗教和外表并不重要。相比之下,中村[2否认了这种乌托邦模式的存在,并指出互联网是“种族主义媒介的一个突出例子”。布朗(3.得出的结论是,互联网经常是种族主义以各种方式传播的地方,包括通过某些网站。这些网站使用攻击性的刻板印象来建立白人对非洲少数民族的至上主义。2011年,Clark等人[4]使用改进的共识定性研究分析了网络日志,以研究针对美洲原住民的不同类型的种族微侵略。有足够的研究已经证实了互联网上存在对不同种族、民族和宗教的种族侵略和仇恨。

当前,世界正面临新冠肺炎疫情的冲击。2019年12月首次报告了COVID-19感染,当时在湖北省武汉市的几名患者中观察到严重呼吸道感染病例。这些病人在鱼类及海鲜批发市场(俗称菜市场)工作[5].2020年1月,市场关闭,并使用消毒剂进行消毒。2020年1月7日,研究人员分离出一种新型冠状病毒,现在称为SARS-CoV-2。2020年1月11日,世界卫生组织(WHO)最初否认了SARS-CoV-2人际传播的可能性。然而,确诊病例继续飙升,并于2020年1月30日,世界卫生组织宣布COVID-19为国际关注的突发公共卫生事件(PHEIC)和流行病。最终,在2020年3月11日,世卫组织宣布COVID-19为大流行。由于缺乏任何特定的治疗方法,世界卫生组织建议自我隔离和封锁,以减少COVID-19的传播。

2020年3月17日,美国总统唐纳德·特朗普在推特上写道:“美国将大力支持航空公司等受中国病毒影响特别大的行业。我们将比以往任何时候都更强大!“(6].“中国病毒”一词引发了一系列争议;#中国病毒和#武汉病毒等标签开始在唐纳德·特朗普的支持者中流行。7-9在各种在线社交网络平台上,推特是其中最著名的。从那时起,针对亚洲社区的种族歧视和亵渎言论就在推特上随处可见。1011].在意大利,已经有多起反华种族主义和歧视的报道。人们还认为,意大利仇外情绪的上升是与种族主义有关的信息传播的结果[12].根据Budhwani和Sun [13,“中国病毒”和“中国病毒”等词语的使用率增加了10倍。

开展这项研究时考虑到,在COVID-19大流行期间,网络种族主义和网上仇恨行为有所增加。这项研究的主要目的是分析与提到“中国病毒”或“武汉病毒”的推文相关的情绪和情绪。这项研究还分析了这些推文中最常用的单词。


Twitter是世界上最受欢迎的微博服务提供商之一,成立于2006年。据估计,全球推特用户数量为3.3亿。最初,推文限制在140个字符,但后来增加到280个字符。推特经常被用作人们传播信息、分享观点和情感的平台。这种观点的快速分享使研究人员能够确定与几乎所有事物相关的情绪(例如,对产品、电影、政治、数字技术和自然灾害的情绪)[14-18].

对推文的情感分析也被用于确定普通人群对不同疾病的看法。对Twitter帖子进行情绪分析,以研究关于埃博拉病毒的话题报道和情绪[19].这项研究分别分析了两种媒体来源(即Twitter和新闻来源)。类似地,一项研究调查了影响推特上关于寨卡病毒负面情绪的关键话题[20.].情绪分析还用于分析克罗恩病患者的推文,以了解他们对特定药物治疗的看法[21].

虽然没有一个公认的关于人类基本情绪的心理学理论,但大多数研究都认为,简单的正负二分法不能用于将人类情绪作为一个整体进行分类。同样,人们相信自动情感分析也必须实现微调算法来详细描述人类情感。Sentimentr (CRAN)就是这样一个包,它试图评估与文本相关的情感和情绪[22].sentimentr软件包已成功用于分析关于偏头痛活动的推文情绪[23].它还被用于分析唐纳德·特朗普的推文,以研究推文情绪和转发数量之间的关系[24].在对四种不同的情感计算包的回顾中,Naldi [25他的结论是,否定者的关键问题在多愁善感的包装中得到了准确的处理。换句话说,sentimentr准确地计算出了“有用”、“没用”(否定)、“真的有用”(放大)和“几乎没用”(去放大)这些词之间的差异。基于否定、放大和反放大的作用,这个包计算情绪的潜力是本研究中使用这个包分析推文情绪的原因。

图1说明了本研究对推文进行情绪分析的流程图。使用R (The R Foundation)中的rtweet包收集推文。为了收集推文,search_tweets使用rtweet函数。在收集过程中,使用以下关键字获取推文:#中国病毒,#中国病毒冠状病毒和#武汉病毒。搜索日期范围定为2020年4月11日至16日。搜索过程中没有收集转发和回复,这样可以避免数据的重复。

收集完推文后,使用r中的Text Mining包执行数据清理过程。该包用于删除空白、标点符号、停止词,并将推文转换为小写。数据清理后,应用sentimentr包对推文进行分析。一旦根据情绪和情绪对推文进行打分,与积极和消极情绪、亵渎和情绪相关的词汇也会被计算出来,以便进一步分析。

图1。推文情感分析流程图。API:应用程序编程接口。
查看此图

使用推文收集过程,总共收集了16,000条推文进行分析。收集的推文使用R中的sentimentr包进行分析,并根据积极情绪和消极情绪进行评分。“情感包”对情绪进行打分,0为中性,负数表示存在负面情绪,正数表示存在积极情绪。每条推文的情绪得分分别计算,然后生成所有推文的完整情绪报告。

在分析中得到的最小值为-1.930,这是负面情绪最严重的推文的得分。在分析过程中获得的最高得分是5.371(即最积极的推文)。情绪的中位数和平均值分别为-0.016和-0.063。这表明,推文中观察到的情绪具有负向倾斜,也就是说,消极情绪的推文数量比积极情绪的推文数量更普遍。

表1显示收集的推文的情感分析。虽然对推文的情绪分析提供了人们如何发推文的概述,但情绪分析提供了为什么会发生这种情况的洞察。可以看出,表达恐惧的推文与表达信任的推文在流行程度上几乎相同。当四种负面情绪(恐惧、悲伤、愤怒和厌恶)被集中分析时,它们占样本的52.18% (n=8450)。虽然这一结果证实了抽样推文中主要存在负面情绪,但它也揭示了推文中负面情绪的组成部分。表达不同情绪的示例推文显示在表2

表1。推文的情感分析。
情感 推文,n (%)
信任 2926 (18.29)
恐惧 2857 (17.86)
悲伤 2123 (13.27)
期待 2005 (12.53)
愤怒 1972 (12.32)
厌恶 1498 (9.36)
快乐 1422 (8.89)
惊喜 1198 (7.49)
表2。以不同情绪的推文为例。
情感 推特
信任
  • “中央政府在处理武汉病毒问题上做得很好。”
  • “美国政府向武汉病毒学实验室提供了100万美元资金用于病毒研究#冠状病毒更新#冠状病毒#COVID #COVID #武汉病毒#突发新闻”
  • “太好了,拜登现在需要解释一下,他说中国旅行禁令是排外的,永远不会再发生了,他犯了一个巨大的错误,因为如果他是总统,这种态度会杀死我们所有人。”
愤怒
  • “这对特朗普来说很好,武汉病毒是什么?不知道为什么它会这么严重地触动你,但你总是要每天找点东西来揍特朗普。它会变老的,你看起来很幼稚#武汉病毒#武汉流感”
  • “中国的粗心和欺骗已经摧毁了全球经济,让各国付出了数万亿美元的代价。他们从其他国家欠下的每一分钱都应该被免除。冠状病毒#武汉病毒#中国死了人”
  • “我猜推特应该封杀所有中国人,因为它在中国被封杀了#中国人死了#中国病毒”
悲伤
  • “先生,我们曾对你抱有很大的希望,但这一切都碎了。你在这个困难时期站在邪恶的中共一边,已经成为了共产主义中国的喉舌,资助它将是反人类罪#中国病毒。”
  • “看看武汉病毒给美国人民造成的经济破坏就知道了。”
  • “#中国新冠肺炎疫情中我们失去了家庭朋友的一名成员,我们已经住院治疗,昨天世界听到了一个被冠状病毒感染的婴儿的消息,我向我的朋友们恳求,冠状病毒是一场严重的现实#保持社会距离#居家生活。”
期待
  • “考虑到全球大部分疫苗来自印度,印度可能在发现针对中国病毒的疫苗方面发挥至关重要的作用。”
  • “我们的生活将发生巨大变化,做好准备#中国病毒”
  • “我知道,我认为所有国家都应该向中国宣战,#中国害死人#武汉#中国病毒#中国必须付出代价#中国对抗世界”
恐惧
  • “在这场对抗#中国病毒的斗争中,我们恐怕会走很长一段路,因为这迎合了一个本不应该出现在印度的社区。”
  • “我们害怕#中国病毒,所以我们现在正在撤退”
  • “对不起,我害怕#中国病毒#”
厌恶
  • “你会这么无耻的后买中国手机# ChinaVirus # ChineseVirusCorona # coronavirusindia #冠状病毒# COVID # covidindia重创中国,将他们最痛苦PS品牌手机获取中国公司的利润超过销售组件”
  • “真为你感到羞耻#中国新冠病毒”
  • “可耻的是,造成#武汉病毒大流行的人现在正在歧视无辜的非洲人。”
快乐

  • “泰国新年快乐,朋友,让我们一起战斗吧#奶茶联盟#为自由而战#支持香港#hkisnotchina #台湾是国家#中国病毒#中国必须支付# chinaledandpeople dies”
  • “不仅康复了,还筹集了大笔资金,可爱的D冠状病毒#中国病毒#武汉病毒”
  • “我有足够的钱舒适地生活,这个#中国病毒刚刚耗尽了我的积蓄,我对我的投资很满意。”
惊喜
  • “很惊讶,我们还没吸取教训就相信中国了#中国病毒”
  • “令人震惊,你知道你的税都花在这上面了吗?所以美国国立卫生研究院对#武汉病毒负有部分责任吗?”
  • “世界仍处于极度震惊之中。从一开始,专家们就建议总统不要把‘新冠病毒’贴上‘中国病毒’的标签,但无济于事。看来无论特朗普对中国怀有什么恶意,最终都开始出现危及生命的事态发展。”

在分析推文的同时,还分析了传达不同情绪的15个最常见的单词。分析结果示于表3.在提到“中国病毒”、“武汉病毒”和“中国冠状病毒”等词汇时,人们最常使用的词是死亡、好事、金钱、薪酬、大流行、特朗普和组织。死亡、薪酬、大流行、邪恶和疾病等词语在与负面情绪和情绪相关的推文中被反复使用。这些结果,结合表3之前的统计数据反映了网上传播的负面情绪和情绪。

表3。分析的推文中使用最多的术语的频率。
术语 推文,n (%)
死亡 1656 (13.51)
1352 (11.03)
1305 (10.65)
支付 1284 (10.48)
流感大流行 1254 (10.23)
特朗普 824 (6.72)
组织 668 (5.45)
希望 588 (4.80)
536 (4.37)
时间 513 (4.19)
邪恶的 472 (3.85)
472 (3.85)
战斗 470 (3.83)
医疗 447 (3.65)
疾病 416 (3.39)

主要研究结果

根据分析得到的结果,与收集的推文相关的负面情绪和情绪是明显的。包括“中国病毒”一词在内的大量推文表达了仇恨、厌恶、恐惧和愤怒。除了与不同情绪相关的单词外,还有一些用户创造的俚语或结构没有被sentimentr软件包检测到。其中最突出的是“中国pisterrorist”,“中国人民死亡”,“中国病毒”,“中国病毒冠状病毒”,“中国人民死亡”,“中国必须解释”,“中国必须付出”,“中国生物恐怖主义”,“中国流感”,“让中国付出”,“奶茶联盟”,“所有人死亡”,“武汉卫生组织”。其中一些术语还表达了对世卫组织的愤怒,称其为“武汉卫生组织”。这种趋势表明,中国和世界卫生组织都对新冠肺炎的传播负有责任。

像病毒、特朗普、大流行、政府、爆发、工资、共产主义、宣传、指责、被杀、羞耻、杀戮、狗屎、地狱、愚蠢、谎言、谎言、死亡等突出的词,在推特中被用来反映负面情绪,而像正确、喜欢、好、钱、负责任、人性、负责任、工作、组织、伟大、更好、好、全球、请、谢谢等词,在推特中被用来表示积极情绪。在分析过程中,还分析了被归类为脏话的词语,并发现在推特中使用脏话的频率很高。这个名单包括操,屎,地狱,他妈的,屁股,屎,该死,混蛋,混蛋,混蛋,混蛋,纳粹,混蛋,纳粹。这些词反映了推特中与厌恶相关的情绪。

总的来说,根据本文的研究结果,可以清楚地指出,人们在推特上对所谓的“中国病毒”的看法大多是负面的。负面词汇的使用,加上大量亵渎的术语,反映了推特上的情绪,主要集中在恐惧、悲伤、愤怒和厌恶上。研究结果还表明,在2019冠状病毒病时代存在歧视和种族主义的迹象,此前Coates [26].本研究获得的结果进一步证明,由于COVID-19,网络种族主义大幅增加。

结论及未来工作

本文分析了推文,以评估在COVID-19大流行期间遇到的网络种族主义程度。为此,我们收集了提到“中国病毒”、“武汉病毒”或“中国冠状病毒”的推文。这项工作表明,大多数推文的情绪都是负面的。对推文相关情绪的进一步分析也显示,推特用户中存在恐惧、愤怒和厌恶的情绪。此外,还有一些表达对中国、武汉和世界卫生组织负面情绪的俚语。推特上使用的大多数词汇都是负面的,包括死亡、工资、共产主义、共产党、种族主义等。该研究还显示,大量使用不敬的词语,这支持了网络种族主义在COVID-19大流行期间有所增加的结论。未来的研究可以通过分析未来几天的网络种族主义趋势来建立在这项研究的基础上。

利益冲突

没有宣布。

  1. 在互联网上,没有人知道你是一只狗。《纽约客》1993;69(20):61-61。
  2. 数字化的种族:互联网的视觉文化。Choice Reviews Online 2008年8月1日;45(12):45-6837。[CrossRef
  3. 布朗C. www.hate.com:互联网上的白人至上主义话语与白人意识形态的建构。霍华德传播杂志2009年5月05日;20(2):189-208。[CrossRef
  4. Clark DA,西班牙人LB, Reed TD, Soble JR, Cabana S.记录针对美国印第安人的种族微侵略的博客表达。高等教育多样性研究,2011;4(1):39-50。[CrossRef
  5. 黄超,王勇,李霞,任玲,赵娟,胡勇,等。武汉地区新型冠状病毒感染患者临床特征分析柳叶刀2020年2月;395(10223):497-506。[CrossRef
  6. 美国将大力支持这些行业……我们将比以往任何时候都更强大!Twitter。2020。URL:https://twitter.com/realDonaldTrump/status/1239685852093169664[2020-05-03]访问
  7. Tavernise S, Oppel Jr. RA。唾弃、怒吼、攻击:华裔美国人担心自己的安全。《纽约时报》2020年3月23日。URL:https://www.nytimes.com/2020/03/23/us/chinese-coronavirus-racist-attacks.html[2020-05-03]访问
  8. Aratani L。“亚洲人咳嗽”:生活在恐惧中,种族主义助长了对冠状病毒的恐慌。《卫报》2020年3月24日。URL:https://www.theguardian.com/world/2020/mar/24/coronavirus-us-asian-americans-racism[2020-03-05]访问
  9. 斯科特·d·特朗普(Scott D. Trump)对冠状病毒使用种族主义名字的新执着是危险的。Vox 2020年3月18日。URL:https://www.vox.com/2020/3/18/21185478/coronavirus-usa-trump-chinese-virus[2020-05-03]访问
  10. 郑勇,高娥,温杰。关于COVID-19的误导性媒体报道对中国游客心理健康的影响:一篇视角文章。安纳托利亚2020年3月28日;31(2):337-340。[CrossRef
  11. 在社交媒体上用跨语言咒骂对抗与covid -19有关的反华种族主义。先于印刷。多语言2020年8月24日;39(5):607-616 [免费全文] [CrossRef
  12. 罗维塔A,巴伽瓦修拉A。意大利与covid -19相关的网络搜索行为和信息流行态度:信息流行病学研究。JMIR公共卫生监测2020年5月05日;6(2):e19374 [免费全文] [CrossRef] [Medline
  13. Budhwani H, Sun R.通过在推特上将新型冠状病毒称为“中国病毒”来制造COVID-19污名:社交媒体数据的定量分析。J Med Internet Res 2020 May 06;22(5):e19301 [免费全文] [CrossRef] [Medline
  14. Shirsat V, Jagdale R, Shende K, Deshmukh SN, Kawale S.使用机器学习技术对新闻文章和博客进行句子级情感分析。ijcse 2019 5月31日;7(5):1-6。[CrossRef
  15. Uma Ramya V, Thirupathi Rao K.使用机器学习技术的电影评论情感分析。IJET 2018 3月18日;7(2.7):676。[CrossRef
  16. M A, Ravikumar P.调查:使用意见挖掘的推特数据分析。IJCA 2015 10月15日;128(5):34-36。[CrossRef
  17. Maindola P, Singhal N, Dubey A.数字钱包和UPI系统在印度废钞后使用IBM Watson的情绪分析。钦奈:IEEE;2018年发表于:2018年计算机通信与信息学国际会议(ICCCI);2018年1月4日至6日;印度哥印拜陀p. 1-6网址:https://ieeexplore.ieee.org/document/8441441CrossRef
  18. 王毅,泰勒JE。自然灾害中的情感和人类流动性耦合:2014年南纳帕地震的一项基于推特的研究。Nat Hazards 2018年3月15日;92(2):907-925。[CrossRef
  19. Kim EH, Jeong YK, Kim Y, Kang KY, Song M.基于话题的埃博拉病毒在Twitter和新闻中的内容和情绪分析。信息科学学报2016年7月11日;42(6):763-781。[CrossRef
  20. Mamidi R, Miller M, Banerjee T, Romine W, Sheth A.确定推特上负面情绪的关键话题:关于2015-2016年寨卡病毒流行的见解。JMIR公共卫生监测2019年6月04日;5(2):e11036 [免费全文] [CrossRef] [Medline
  21. Roccetti M, Marfia G, Salomoni P, Prandi C, Zagari RM, Gningaye Kengni FL,等。克罗恩病患者的态度:Facebook和Twitter帖子的信息流行病学案例研究和情感分析。JMIR公共卫生监测2017年8月09日;3(3):e51 [免费全文] [CrossRef] [Medline
  22. Rinker T.计算文本极性情感[R包sentimentr版本2.7.1]。Cran.r-project.org。2019.URL:https://cran.r-project.org/package=sentimentr[2020-05-03]访问
  23. 邓华,王强,Turner D, Sexton K, Burns S, Eikermann M,等。用于人口研究的现实世界偏头痛推文的情感分析。头痛报告2020年1月15日;3(3):1-9。[CrossRef
  24. 欧阳阳,王伟文。特朗普推文:文本情感分析。正确的观点:特朗普、推特和美国民主。英国:Palgrave Macmillan, Cham;2020:89 - 129。
  25. 基于R包的情感计算方法综述。预印本。arXiv 2019 1月24日:e [免费全文
  26. 科茨·m·Covid-19和种族主义的兴起。BMJ 2020年4月06日;369:m1384。[CrossRef] [Medline


国际关注的突发公共卫生事件:国际关注的突发公共卫生事件
人:世界卫生组织


G·艾森巴赫(G Eysenbach)编辑;提交03.05.20;H Budhwani, E Bellei, M Alam同行评审;对作者15.05.20的评论;订正版本收到27.05.20;接受14.09.20;发表15.10.20

版权

©Akash Dutt Dubey。原载于JMIR公共卫生与监测(http://publichealth.www.mybigtv.com), 15.10.2020。

这是一篇根据创作共用署名许可协议(https://creativecommons.org/licenses/by/4.0/)发布的开放获取文章,允许在任何媒介上不受限制地使用、分发和复制,前提是正确引用了首次发表在JMIR公共卫生和监测上的原创作品。必须包括完整的书目信息,http://publichealth.www.mybigtv.com上的原始出版物的链接,以及此版权和许可信息。


Baidu
map