JPH 公共卫生监测 公共卫生和监测 2369 - 2960 卡塔尔世界杯8强波胆分析 加拿大多伦多 v6i3e17103 32298232 10.2196/17103 原始论文 原始论文 从推特数据评估的州级种族态度与不良出生结局之间的关系:观察性研究 桑切斯 特拉维斯 Myeong光宇 卡瓦略 Darlinton 星期四T 谈到MSPH 1
家庭和社区医学系 加州大学旧金山分校 波特雷罗大街1001号 83区80号楼 旧金山,加州,94110 美国 1 6179639595 thu.nguyen@ucsf.edu
https://orcid.org/0000-0003-1185-045X
亚当斯 尼基 博士学位 2 https://orcid.org/0000-0003-3562-4211 蒂娜 英里每小时,博士 3. https://orcid.org/0000-0001-8165-8231 针对 M玛丽亚 谈到女士 4 https://orcid.org/0000-0001-9644-3081 艾伦 阿玛尼米 英里每小时,博士 5 https://orcid.org/0000-0002-5882-1026 琼C MSPH博士 3. https://orcid.org/0000-0003-4745-6681
家庭和社区医学系 加州大学旧金山分校 旧金山,加州 美国 情报与安全应用研究实验室 马里兰大学 马里兰大学帕克 美国 流行病学和生物统计学系 马里兰大学公共卫生学院 马里兰大学帕克 美国 流行病学和生物统计学系 加州大学旧金山分校 旧金山,加州 美国 社区卫生科学和流行病学司 加州大学伯克利分校 伯克利分校, 美国 通讯作者:Thu T Nguyen thu.nguyen@ucsf.edu Jul-Sep 2020 6 7 2020 6 3. e17103 18 11 2019 13 3. 2020 2 4 2020 16 4 2020 ©Thu T Nguyen, Nikki Adams, Dina Huang, M Maria Glymour, Amani M Allen, Quynh C Nguyen。原发表于JMIR公共卫生与监测(http://publichealth.www.mybigtv.com), 2020年7月6日。 2020

这是一篇根据知识共享署名许可(https://creativecommons.org/licenses/by/4.0/)的条款发布的开放获取文章,该许可允许在任何媒介上不受限制地使用、分发和复制,前提是原始作品首次发表在JMIR公共卫生与监测上,并适当引用。必须包括完整的书目信息,到http://publichealth.www.mybigtv.com上原始出版物的链接,以及版权和许可信息。

背景

在美国,出生结果的种族差异持续存在,而且还在扩大。人际种族主义和结构性种族主义是对出生结果中持续存在的种族差异的主要解释,但确认种族主义的作用和评估种族主义对健康结果影响趋势的研究受到衡量种族主义的挑战的阻碍。大多数关于歧视的研究都依赖于自我报告的歧视经历,很少有研究调查美国国家层面的种族态度和偏见。

客观的

本研究旨在调查与种族或少数民族相关的国家级twitter衍生情绪与出生结果之间的关系。

方法

我们利用Twitter的流媒体应用程序编程接口收集了从2015年6月到2017年12月的26,027,740条推文,其中至少包含一个与种族相关的术语。情感分析使用支持向量机(一种监督机器学习模型)进行。我们构建了对少数民族和特定种族群体的情绪的总体指标。每年,国家级推特衍生的情绪数据与当年的出生数据合并。该研究的参与者是2015年至2017年期间没有先天性异常的单胎分娩的妇女,她们的胎龄(n=9,988,030)或出生体重(n=9,985,402)的数据可用。主要结局为低出生体重(出生体重≤2499 g)和早产(胎龄<37周)。我们使用对数二项回归模型估计了控制个体水平产妇特征(社会人口统计学、产前护理和健康行为)和州一级人口统计学的发病率。

结果

将机器学习模型与手动标记的推文进行比较,识别负面情绪的准确率为91%。与生活在最低分位数州的母亲相比,生活在推特中引用种族或少数民族的负面情绪最高的州的母亲低出生体重(高出8%,95%可信区间为4%-13%)和早产(高出8%,95%可信区间为0%-14%)的发生率更高。在总人口中,涉及少数民族的负面推文越多,出生结果就越不利,包括非西班牙裔白人和种族或少数民族。在分层亚组分析中,涉及特定种族或少数民族群体(黑人、中东人和穆斯林)的负面推文越多,黑人和少数民族的出生结果就越差。

结论

与种族相关的负面社会环境与种族或少数民族以及非西班牙裔白人的不良生育结果有关。

社交媒体 种族偏见 生的结果 种族或少数民族
介绍

早产和低出生体重是婴儿死亡和儿童残疾的主要原因[ 1, 2].在美国,出生结果的种族差异仍然存在[ 3., 4并一直在扩大[ 5].2017年,非西班牙裔白人母亲的早产率为9.05%,而黑人母亲的早产率为13.93%。从2006年到2016年,黑人婴儿的低体重率一直是非西班牙裔白人婴儿的两倍多[ 6].产妇保健行为、产前护理的充分性和社会人口特征不能完全解释观察到的差异[ 3.].越来越多的证据表明,种族偏见可能在一定程度上造成了这些持续存在的差异[ 3., 7, 8].

传统上,歧视的经历是在个人层面上通过自我报告来评估的[ 9, 10].自我报告的种族态度和信仰受到一些限制,包括社会可取性偏见和自我审查[ 11, 12],风险无效暴露评估[ 13, 14].种族歧视的自我报告可受到多种因素的影响,包括应对(例如,否认)、基于人格特征或状态的方面(例如,耻辱意识和基于种族的拒绝敏感性)和种族认同方面(例如,内化的种族主义)[ 13].虽然个人自我报告的歧视经历可以提供重要信息,但一个地方的社会气候代表了种族偏见和歧视的一个有益方面,它可能对健康产生自己的影响,独立于个人层面的经历。因此,只依赖个人自我报告的数据可能会低估种族主义对健康的影响。

歧视可能通过几种机制影响不良的生育结果。例如,歧视的经历可能会激活应激反应,如果长期经历,可能会导致不良的生育结果。产妇应激可能通过以下三个主要途径影响分娩结局:(1)神经内分泌功能改变,导致母体-胎盘-胎儿内分泌系统激活,促进分娩[ 15, 16];(2)免疫功能改变,导致对感染和炎症反应的易感性增加[ 17];(3)不适应的应对行为,如吸烟和饮酒[ 18].还假设歧视通过获得教育、就业、保健和住房等资源来影响生育结果[ 3.,但这是一个长期的过程。

一项创新研究强调了与种族或民族有关的事件的潜在影响,这些事件会在背景层面上改变社会气候。作者调查了2008年爱荷华州波斯特维尔联邦移民突击搜查后的出生结果,这是当时美国历史上最大的一次单点突击搜查。 19].将爱荷华州袭击后37周内出生的婴儿的出生体重与一年前相同的37周期间进行比较,拉丁裔母亲,包括在美国出生的拉丁裔母亲,在袭击后生下低体重婴儿的风险增加了24%。在非拉丁裔白人母亲中未观察到LBW的变化。调查人员进行了州一级的分析,发现不仅在波斯特维尔,而且在爱荷华州也有估计的影响。另一项研究发现,2001年9月11日恐怖袭击发生后的6个月与一年前的6个月相比,阿拉伯名字的妇女患低体重儿或早产的风险有所增加。 20.].这些研究为社会环境对受影响社区健康的潜在影响提供了证据。

社交媒体是公共卫生研究中未得到充分利用的数据来源。每天有数百万条推文被发送,90%的Twitter用户公开了他们的个人资料[ 21].在网络空间中,人们表达各种各样的观点和信仰,包括那些与种族有关的观点和信仰。此外,研究表明,网络空间提供的匿名感鼓励人们表达他们在面对面互动中可能不会表达的观点[ 22].这些方面使社交媒体成为捕捉敏感话题(如与种族有关的讨论)的有吸引力的来源。

以前的研究使用Twitter数据来检查主题,如疫苗接种[ 23在营养、锻炼和幸福方面的国家模式[ 24],并进行健康监察[ 25].然而,很少有研究调查敏感话题,如社交媒体上的种族和种族主义,之前使用社交媒体数据研究种族主义的研究主要集中在仇恨言论上[ 26]和种族歧视[ 27].

为了提供一种与种族或民族相关的社会气候测量方法,并解决先前自我报告的个人层面测量方法的局限性,我们开发了一种新的区域层面的种族情绪测量方法,并研究了其与低体重和早产的关系。我们采取了广泛的方法,收集了涉及种族或民族群体的推文,而不仅仅是仇恨言论或使用种族歧视的推文。然而,传统上被认为是种族歧视的术语可以以非贬义的方式使用,这种挪用在Twitter上很常见。例如,在流行文化中,“黑鬼”一词经常被用作没有价值的群体内用语[ 27].此外,传达种族情绪的讨论可以在不使用种族歧视的情况下进行。对使用种族相关术语的推文进行更全面的检查可能包括对使用种族诽谤以及中性种族术语(如“黑人”、“非裔美国人”或“亚洲人”)的推文进行情绪分析。在之前的一篇论文中,我们研究了2015年Twitter数据得出的种族情绪与不良出生结果之间的关系[ 28].在本文中,我们改进了机器学习模型的准确性来标记推文的情绪,将推文的样本量增加了20倍,并使用推特和出生结果数据多年而不是一年来检查关系。

方法 Twitter数据

从2015年6月到2017年12月,使用Twitter的流媒体应用程序编程接口,随机收集了1%的公开推文样本。该分析包括来自美国的带有经纬度坐标或其他“地点”属性的英语推文,这些属性允许识别推文所在的州。样本中包含的所有推文也使用了518个与种族相关的关键词中的一个或多个( 多媒体附录1)。这些术语是根据美国人口普查中使用的种族和民族分类汇编而成的,之前的研究调查了与种族有关的在线对话。 27, 29],以及一个种族歧视的在线数据库[ 30.].根据使用的关键词,推文被分为以下五个主要的种族或民族类别:黑人、西班牙裔、亚洲人、白人和中东人。中东类别包括反伊斯兰或与穆斯林有关的推文。

为了进行分析,对Twitter数据进行了清理和处理。我们根据“tweet_id”删除重复的推文。我们确定了排除术语,这些术语倾向于检索不相关的推文,如“黑烟”和“印度路”。为了防止少数非常频繁的用户的不当影响,我们排除了数据集中每年发推超过1000次的用户的推文,这占所有推文的3%到4%。我们总共从2,498,717名Twitter用户中收集了26,027,740条tweet。这项研究被加州大学旧金山分校的机构审查委员会确定为豁免。

情绪分析

我们使用支持向量机(SVM),一种有监督的机器学习模型,来标记推文。我们从人工标记的Sentiment140 (n=498)中获得训练数据[ 31], Kaggle (n=7086) [ 32], Sanders (n=5113) [ 33]和我们的研究小组标记的6481条推文。Sentiment140、Kaggle和Sanders数据集是公开可用的训练数据集,专门用于情感分析。对于我们的主要分析,我们将负面推文(赋值为1)与所有其他推文(赋值为0)进行比较,这些推文是积极或中立的推文(赋值为0)。我们使用五倍交叉验证来评估模型性能,并在负面分类方面达到了高水平的准确性(91%)和高F1分数(84%)。推文也被标记为积极或不积极。我们同样使用了五重交叉验证,获得了89%的准确率和81%的F1分数。州级情绪变量是通过对引用不同种族或民族群体的推文的二分情绪进行平均而创建的。

个人层面的健康数据

我们使用了2015-2017年限制美国出生文件的数据,其中包含地理标识符作为个人层面的出生结果数据。这些文件是在向国家卫生统计中心提交研究提案并获得数据访问许可后获得的[ 34].该分析仅限于没有先天性异常的单胎出生。先天性畸形[ 35双胞胎、三胞胎和其他高顺序多胞胎增加了低体重儿和早产的风险[ 36].主要结局为低体重(定义为出生体重≤2499 g)和早产(定义为胎龄<37周)。早产模型包括9,988,030例出生的数据,LBW模型包括9,985,402例出生的数据。

协变量

我们调整了种族情绪和出生结果之间关联的潜在混杂因素。个体水平的母亲特征包括出生年份、母亲年龄(19岁、25岁、29岁、33岁和38岁的线状样条结)、种族(白人、非西班牙裔;黑色,非西班牙裔;美洲印第安人/阿拉斯加原住民,非西班牙裔;亚洲、非西班牙裔;夏威夷原住民/太平洋岛民,非西班牙裔;多种族,非西班牙裔),西班牙裔,婚姻状况(已婚/未婚),教育程度(低于高中,高中或普通教育发展[GED],一些大学,学士学位,硕士学位或博士学位),体重指数(kg/m)2),怀孕期间吸烟(妊娠早期、中期或晚期),第一次分娩(是/否),以及妊娠早期开始产前护理(是/否)。我们还调整了州一级的特征,包括非西班牙裔黑人和西班牙裔个人的比例、人口密度(每平方英里)、南部州指标(是/否)和经济劣势(标准化因素得分[ 37, 38总结了以下变量[%]:失业;一些大学教育、高中文凭、贫困儿童、单亲家庭和家庭收入中位数)来解释各州人口和经济特征的构成差异。因子评分的使用方法已于先前公布[ 24].州级协变量是通过美国社区调查的5年估计从2013年到2017年得出的[ 39].

统计分析

每年,对种族或少数民族的州级情绪与当年的出生数据相结合。我们使用对数二项回归模型估计发病率(IRs),控制了个体水平的产妇特征和国家水平的人口统计学特征。在我们的主要分析中,我们使用与种族相关的术语对推文的负面情绪进行建模,但在敏感性分析中,我们对负面情绪与积极情绪的比例进行建模,以检验结果是否对于不同极性的情绪建模具有鲁棒性。我们在 P< . 05。使用Stata MP 15 (StataCorp LP, College Station, Texas, USA)进行统计分析,使用R软件(R Foundation for statistical Computing, Vienna, Austria)进行绘图[ 40].

结果

从2015年到2017年,我们收集了26,027,740条推文,其中至少包含一个与种族或民族群体相关的关键词。在被评估的518个术语中,有20个术语出现在75%的推文中,涉及种族或少数民族群体。最热门的推特词汇是“黑鬼/黑鬼”(13,561,626/ 26,027,740,52.10%)、“种族主义者”(1,070,770/ 26,027,740,4.11%)、“墨西哥人”(620,957/ 26,027,740,2.39%)、“白人”(514,111/ 26,027,740,1.98%)和“中国人”(498,775/ 26,027,740,1.92%)。 表1)。此外,关于黑人的推文有15683909条,关于亚洲人的推文有1801780条,关于白人的推文有15577568条,关于西班牙裔的推文有1512566条,关于中东人的推文有1274827条( 表2)。我们之前研究了使用种族相关关键词的推文的新兴主题[ 41].简而言之,负面情绪的推文包括抱怨日常生活中的麻烦(例如,“我讨厌有人很晚才参加一项运动,就像黑鬼一样,你没有投入我所做的工作”),使用贬损性语言的种族相关侮辱(例如,“中东/阿拉伯口音比大多数事情都让我恼火”),以及表达敌意或提及暴力的罕见推文(例如,“如果他们在亚利桑那州举着墨西哥国旗,他们就应该被逮捕。”)“黑鬼”一词在负面情绪的推文中很常见。然而,推特用户经常将这个词作为俚语随意使用。

推特热门词汇。

术语 Tweets (N=26,027,740), N (%)
黑鬼 8300511 (31.89)
黑鬼 5261115 (20.21)
种族主义 1070770 (4.11)
墨西哥 620957 (2.39)
白人 514111 (1.98)
中国人 498775 (1.92)
种族歧视 422279 (1.62)
穆斯林 381601 (1.47)
亚洲 312520 (1.20)
穆斯林 259998 (1.00)
日本 238588 (0.92)
移民 214416 (0.82)
印度 193782 (0.74)
伊斯兰教 189739 (0.73)
叙利亚 181771 (0.70)
白人女孩 180426 (0.69)
犹太人 170040 (0.65)
贫民窟 167128 (0.64)
难民 165674 (0.64)
黑人 163062 (0.63)

消极和积极情绪推文的地理分布显示在 多媒体附录2 多媒体附录3,分别。美国东南部地区的负面推文比例更高( 多媒体附录2)和美国西部地区积极推文比例较高的聚类( 多媒体附录3)。推特衍生的种族情绪测量方法见 表2.大约40.33%(9,657,039/23,945,052)使用种族相关术语的推文被归类为负面。与中东人相关的推文负面情绪比例最高(638,688/1,274,827,50.10%),而与亚洲人相关的推文负面情绪比例最低(113,172/1,801,780,6.28%)。2015 - 2017年产妇人口学特征见 表3.母亲的平均年龄为29岁,59.74%(6,466,521/10,824,077)已婚,85.99%(9,578,803/ 111,139,992)高中以上学历。此外,6.37%(717,541/11,272,819)无先天性异常的单胎婴儿出生时为低体重儿,7.91%(891,628/11,273,872)为早产儿。

对推特中使用的种族相关术语的负面情绪。

与种族有关的术语 推文数量 带有负面情绪的推文数(%)
种族或少数民族 23945052年 9657039 (40.33)
黑人 15683909年 7073443 (45.10)
中东人 1274827年 638688 (50.10)
拉美裔人 1512566年 172433 (11.40)
亚洲人 1801780年 113172 (6.28)
白人 1577568年 700440 (44.40)

2015 - 2017年产妇分娩特征分析

特征 平均值(SD)或n/ n (%)
年龄、年 28.6 (5.82)
结婚了 6466521/10824077 (59.74)
白,非西班牙裔 5852869/11187000 (52.32)
黑色,非西班牙裔 1600020/11187000 (14.30)
亚洲、非西班牙裔 717706/11187000 (6.42)
拉美裔种族 2666823/11187000 (23.84)
我们出生 8645413/11257974 (76.79)
教育
高中以下 1561190/11139992 (14.01)
高中 2829005/11139992 (25.40)
一些大学 3238463/11139992 (29.07)
大学 2221480/11139992 (19.94)
硕士或博士学位 1289855/11139992 (11.58)
生的结果
低出生体重 717541/11272819 (6.37)
早产 891628/11273872 (7.91)

州一级的种族情绪与低体重和早产有关。在整个人口中,与生活在负面情绪最低水平(第一十分位数)的州的母亲相比,生活在引用种族或少数民族的负面推文水平最高(第三十分位数)的州的母亲的LBW发生率高8% (95% CI 1.04-1.13),早产发生率高8% (95% CI 1.00-1.14)。 表4)。在调查种族或少数民族的出生结果时,影响的方向和程度是相似的,在种族或少数民族母亲中,更多的负面推文提到种族或少数民族与低体重增加13% (95% CI 1.06-1.21)和早产增加10% (95% CI 1.05-1.16)有关。

在检查对特定群体的情绪时,我们发现,引用中东人的负面推文最高水平(第三分位数)的州与种族或少数民族中LBW的发生率较高相关(IR 1.07, 95% CI 1.02-1.12)。更多关于黑人的负面推文(IR 1.08, 95% CI 1.03-1.14)与黑人母亲中更高的LBW发生率相关( 表5)。在早产中也观察到类似的影响。虽然推文中提到白人的情绪与白人母亲的分娩结果无关,但推文中提到种族或少数民族群体的情绪与非西班牙裔白人母亲中更高的低体重(IR 1.08, 95% CI 1.03-1.14)和早产(IR 1.08, 95% CI 1.00-1.17)的发生率相关( 表5)。

随着时间的推移,在研究消极情绪与出生结果之间的关系时,有证据表明,黑人的情绪与年份之间存在相互作用。因此,我们提出的绝对差异的比例和数量的低出生体重和早产儿按年 表6对于引用黑人的负面推文与黑人母亲的出生结果之间的关联,以及引用种族或少数民族的推文与整个人口的出生结果之间的关联。对于黑人母亲来说,随着时间的推移,这种联系变得越来越强。例如,2015年,生活在负面推文中提到黑人的比例最高的州的黑人母亲的LBW比例相差0.65%,这意味着与生活在负面情绪最低的州的母亲相比,婴儿的LBW比例多出3039个。2017年,这一差异增加到1.82%,即8711个LBW婴儿。

国家层面对种族或少数民族的看法和个人层面的生育结果。

州级twitter派生变量(与种族相关的负面tweet的分位数) 低出生体重a、b,发生率比(95% CI)或n 早产a、b,发生率比(95% CI)或n
总样本
第二分位数vs第一分位数(最低) 1.08 (1.03 - -1.13) 1.09 (1.04 - -1.13)
第三tertile 1.08 (1.04 - -1.13) 1.08 (1.00 - -1.14)
数量 9985402年 9988030年
少数民族
第二分位数vs第一分位数(最低) 1.12 (1.04 - -1.19) 1.10 (1.05 - -1.15)
第三tertile 1.13 (1.06 - -1.21) 1.10 (1.05 - -1.16)
数量 4920300年 4921577年
白人
第二分位数vs第一分位数(最低) 1.07 (1.02 - -1.12) 1.09 (1.03 - -1.15)
第三tertile 1.08 (1.03 - -1.14) 1.08 (1.00 - -1.17)
数量 5407779年 5409230年

一个健康结果的数据来源是2015年、2016年和2017年的出生文件。推文的收集时间为2015年6月至2017年12月。

b对每个结果分别运行调整后的对数二项模型。模型控制了年份和州一级的因素,包括非西班牙裔黑人百分比、西班牙裔百分比、南部州指标、人口密度和经济劣势(标准化因素得分,总结了以下变量[%]:失业,部分大学学历,高中学历,贫困儿童,单亲家庭,家庭收入中位数),以及个人层面的因素,包括母亲的年龄,性别,种族,民族,外国出生,教育,婚姻状况,吸烟,体重指数,第一胎状况和产前护理。推特衍生的特征被分为三类,最低的三类作为参照组。报告集群调整错误。

亚群体中州级情绪与出生结果之间关系的分层分析。

对特定群体的州级情绪(负面推文的字节) 低出生体重a、b,发生率比(95% CI)或n 早产a、b,发生率比(95% CI)或n
中东人和穆斯林(少数民族)
第二分位数vs第一分位数(最低) 1.09 (1.04 - -1.14) 1.07 (1.03 - -1.12)
第三tertile 1.07 (1.02 - -1.12) 1.05 (1.02 - -1.09)
数量 4920300年 4921577年
黑人
第二分位数vs第一分位数(最低) 1.10 (1.04 - -1.17) 1.10 (1.06 - -1.16)
第三tertile 1.08 (1.03 - -1.14) 1.09 (1.04 - -1.15)
数量 1413336年 1413938年
拉美裔人
第二分位数vs第一分位数(最低) 0.96 (0.87 - -1.06) 0.96 (0.94 - -0.99)
第三tertile 0.96 (0.89 - -1.04) 0.90 (0.84 - -0.97)
数量 2254029年 2254401年
亚洲人
第二分位数vs第一分位数(最低) 0.98 (0.91 - -1.04) 1.02 (0.97 - -1.07)
第三tertile 1.03 (0.93 - -1.13) 1.10 (1.00 - -1.21)
数量 599580年 599769年
白人
第二分位数vs第一分位数(最低) 1.01 (0.97 - -1.04) 1.00 (0.96 - -1.03)
第三tertile 1.02 (0.97 - -1.07) 0.98 (0.93 - -1.04)
数量 5407779年 5409230年

一个健康结果的数据来源是2015年、2016年和2017年的出生文件。推文的收集时间为2015年6月至2017年12月。

b对每个结果分别运行调整后的对数二项模型。模型控制了年份和州一级的因素,包括非西班牙裔黑人百分比、西班牙裔百分比、南部州指标、人口密度和经济劣势(标准化因素得分,总结了以下变量[%]:失业,部分大学学历,高中学历,贫困儿童,单亲家庭,家庭收入中位数),以及个人层面的因素,包括母亲的年龄,性别,种族,民族,外国出生,教育,婚姻状况,吸烟,体重指数,第一胎状况和产前护理。推特衍生的特征被分为三类,最低的三类作为参照组。报告集群调整错误。

生活在种族情绪最高的州的母亲和生活在种族情绪最低的州的母亲之间的低出生体重和早产的绝对数量和比例的差异。

一年 低出生体重,n/ n (%) 早产,n/ n (%)
总计一个 黑色的b 总计一个 黑色的b
2015 11712/3444706 (0.34) 3039/469659 (0.65) 14261/3444783 (0.41) 3466/470019 (0.74)
2016 23598/3506457 (0.67) 3391/477984 (0.71) 23737/3506174 (0.68) 4415/478272 (0.92)
2017 10490/3040622 (0.35) 8711/479384 (1.82) 16827/3037346 (0.55) 7060/465674 (1.52)

一个对于总样本,曝光是指涉及种族或少数民族的负面情绪推文。

b对于黑人母亲的样本,暴露是指黑人的负面情绪推文。

通过对消极情绪与积极情绪的比例进行建模,进行敏感性分析,以调查研究结果对不同极性情绪的建模是否具有鲁棒性。调查结果显示了类似的模式( 多媒体附录4),与单独建立负面情绪模型相比,在那些针对种族或少数民族的负面或正面推文比例更高的州,LBW和早产的发生率更高。

讨论

这项研究发现,在各州的推特上表达的对种族和少数民族的负面情绪与低体重和早产有关。这些不良关联在所有新生儿、非西班牙裔白人母亲和少数种族或少数民族的新生儿中都是相似的。提到黑人的负面推文与黑人母亲的不良分娩结果有关。同样,提到中东人的负面推文与少数民族的不良出生结果有关。对非西班牙裔白人或西班牙裔母亲的负面推文的关联并不一致。虽然这种关联在2015年至2017年期间趋于稳定,但对于黑人母亲来说,随着时间的推移,黑人种族情绪与不良分娩结果之间的关联变得越来越强。

这是少数几篇利用社交媒体数据评估种族气候与健康结果之间关系的论文之一。此外,我们这样做是基于国家的基础上,并考虑到个人的特点。该结果与先前的研究结果一致,表明社区层面的种族气候与出生结果有关[ 19, 20.]和死亡率[ 42在这个地区。压力已被确定为歧视可能影响健康的途径,也是已知的不良分娩结果的风险因素[ 43].然而,其他途径也是可能的,包括获得教育、就业、保健和住房等资源[ 3.].

以前的研究已经为社会环境对社区健康的影响提供了证据。过去的研究比较了单一地点移民突袭前后的出生结果[ 192001年9月11日的恐怖袭击[ 20.],以及2016年的总统大选[ 44并发现在这些事件发生后,少数民族人口的不良出生结果升高。这些研究的一个局限是没有测量社会背景。因此,我们不能直接评估地区层面的种族偏见是否解释了事件与出生结果之间的关联。制定地方一级的种族偏见措施将推动这一领域的发展,并为调查社会背景在形成健康和健康差异方面的作用提供新的机会。

我们的研究结果表明,提到种族或少数民族的负面情绪推文影响了包括非西班牙裔白人在内的总人口。先前关于种族偏见和歧视的研究往往只研究对少数种族和族裔的影响。这项研究的不同寻常之处在于它调查了全体人口的健康状况。对少数种族和少数民族怀有敌意的社会气氛可能会创造一种对包括白人在内的所有人都不利的环境。这与先前的研究一致,表明社会凝聚力促进人口健康[ 45, 46].对少数种族和少数民族的敌意可能导致对可能有利于白人和其他种族和少数民族群体的共享资源、社会政策和项目的支持减少[ 47, 48].先前的研究发现,生活在黑人隔离地区的黑人母亲和白人母亲的生育结果都很差[ 49, 50].有一些研究调查了种族主义对犯罪者的负面认知和情感影响[ 51, 52].

尽管在过去的一个世纪里,所有群体的不良出生结果率都有所下降,但明显的种族差异仍然存在。在包括产妇死亡率在内的许多其他结果方面也存在类似的差距[ 53]和许多成人疾病和死亡原因[ 54].人际种族主义和结构性种族主义是对健康方面持续存在的种族差异的主要解释,但确认种族主义的因果作用和评估种族主义对健康结果影响趋势的研究受到衡量种族主义的挑战的阻碍。我们的方法具有重要的优势,因为它易于测量和监测,不依赖于自我报告,在全国范围内可用,并且可能扩展到全球。

尽管如此,这项研究也有一些局限性。这些分析没有考虑到居住历史和个人在当前社区居住的时间长短。收集的数据代表了人们愿意在Twitter上表达的内容。Twitter用户并不能代表美国人口,与美国人口相比,Twitter上的年轻用户比例过高。 55].然而,随着时间的推移,社交媒体的使用一直在稳步增长。通过手机接入互联网和社交媒体,使各个社会经济阶层的人都能参与社交媒体。

虽然情绪分析对建立区域层面的种族情绪测量做出了重大贡献,但情绪分析也有重要的局限性。情绪分析使用整条推文来评估推文的情绪或情绪基调,而不仅仅关注推文中提到的种族术语。同样,编码人员手动标记推文,为机器学习算法提供训练数据,他们将推文的情感基调作为一个整体进行标记。因此,虽然推文的语气可能是负面的,但推文中提到的种族或民族可能不是这种负面情绪的主题,这在许多推文中都是如此。此外,推文的情绪基调可能会表现出负面情绪,但并不一定表达偏见,这在我们的数据中也很常见。我们之前的研究表明,有偏见的推文可以与推文的情绪区分开来[ 41].在一些推文中,负面情绪还表达了负面的种族态度或偏见信仰(例如,“中东/阿拉伯口音比大多数事情更让我生气。”)然而,也有使用种族相关术语的负面情绪推文,并不表达偏见信仰。我们通常用“黑鬼”(nigga)这个词来表示这一点(例如,“不能看(职业篮球队)比赛”)。这些黑鬼很无聊。我们也遇到了一些情绪积极的推文,但他们表达了一种偏见的信仰或种族或民族刻板印象(例如,“肯定雇了一个墨西哥清洁工。浴室里有一股非常干净的气味”)。无论如何,在我们的研究中观察到的关联似乎捕捉到了一个与种族态度和出生结果的平均水平相关的信号。未来的工作需要开发模型来捕捉与种族相关的主题和情绪,并将基于twitter的种族背景特征与其他结构性或人际种族主义措施相结合。

这项研究为关于种族态度和偏见的地方水平指标的初步文献体系做出了贡献。虽然不全面,但我们对种族情绪的衡量可能代表了母亲所处的更广泛的社会和文化背景的一个信号。与传统的种族态度或偏见调查相比,从Twitter收集的数据可能是独一无二的。社交媒体可以代表对一系列主题(包括种族态度)的观点的及时数据的丰富来源。这项研究表明,对少数民族的种族气氛可能对少数民族或少数民族以及整个人口产生影响。促进尊重、积极和包容的社会氛围可能对整个人口的出生结果产生有益的健康影响。

Twitter数据收集中使用的术语。

2015-2017年,使用种族相关术语的负面情绪推文的地理分布。

2015-2017年,使用种族相关术语的积极情绪推文的地理分布。

对种族或少数民族的负面情绪与正面情绪的比率与个人层面的出生结果。

缩写 红外

发病率比

激光焊

低出生体重

这项研究是使用由药物滥用研究中心的国家药物早期预警系统协调中心收集的Twitter消息语料库进行的。本研究得到了美国国立卫生研究院(NIH)国家少数民族健康和健康差异研究所(奖励号:R00MD012615) (Dr Nguyen, T, PI),美国国立卫生研究院大数据到知识计划(BD2K)资助(5K01ES025433;R01LM012849)和NIH Commons Credit Pilot Program(授权号:CCREQ-2016-03-00003) (Dr Nguyen, Q, PI)。资助者在研究的设计中没有任何作用;数据分析:对数据的收集、分析或解释;在撰写手稿时;或者是发表结果的决定。

没有宣布。

D 萨阿达 一个 西方发达国家婴儿死亡率和出生结果的社会决定因素:一项跨国系统回顾 环境与公共卫生 2013 06 05 10 6 2296 335 10.3390 / ijerph10062296 23739649 ijerph10062296 PMC3717738 Ouden 艾尔 鲍尔 l Oudenrijn 简历 品牌 R Verloove-Vanhorick SP 极早产和极低出生体重婴儿九岁时的学校表现:五岁时围产期风险因素和预测因素 儿科杂志 1994 9 125 3. 426 434 10.1016 / s0022 - 3476 (05) 83290 - 1 Alhusen 莱托 鲍尔 公里 爱普斯坦 E 专家 P 种族歧视与不良出生结局:一项综合综述 J助产和妇女健康 2016 11 61 6 707 720 10.1111 / jmwh.12490 27737504 PMC5206968 马修斯 T MacDorman 托马 来自2013年期间关联出生/婴儿死亡数据集的婴儿死亡率统计 全国生命属性代表 2015 08 06 64 9 1 30. 26270610 马丁 晶澳 汉密尔顿 奥斯特曼 乔丹 德里斯科尔 正义与发展党 国家生命统计报告 2018 2020-05-07 马里兰州Hyattsville 国家卫生统计中心 出生:2017年的最终数据 https://www.cdc.gov/nchs/data/nvsr/nvsr67/nvsr67_08-508.pdf 沃玛克 LS 雷森 LM 马丁 晶澳 国家卫生统计中心 2018 2020-05-06 马里兰州Hyattsville 国家卫生统计中心 单胎低出生体重率,按种族和西班牙裔划分:美国,2006-2016年 https://stacks.cdc.gov/view/cdc/52611 黑色的 约翰逊 R VanHoose l 美国黑人女性种族主义/歧视感知与健康的关系:2003 - 2013年文献综述 J种族和民族健康差异 2015 03 2 1 11 20. 10.1007 / s40615 - 014 - 0043 - 1 25973361 PMC4426269 Giurgescu C McFarlin 提单 凯文 J 克拉多克 C 阿尔布雷希特 一个 种族歧视与不良出生结局的黑人-白人差异:综述 J助产和妇女健康 2011 56 4 362 370 10.1111 / j.1542-2011.2011.00034.x 21733107 PMC5388001 威廉姆斯 博士 Y 杰克逊 JS 安德森 生理和心理健康的种族差异:社会经济地位、压力和歧视 [J]健康心理 1997 07 2 3. 335 51 10.1177 / 135910539700200305 22013026 2/3/335 Krieger N 史密斯 K Naishadham D 哈特曼 C Barbeau 新兴市场 歧视经验:种族主义和健康人口健康研究自我报告措施的效度和可靠性 社会科学 2005 10 61 7 1576 96 10.1016 / j.socscimed.2005.03.006 16005789 s0277 - 9536 (05) 00097 - 3 Stocke V 被调查者关于种族态度的社会可取性信念的决定因素和后果 方法 2007 01 3. 3. 125 138 10.1027 / 1614 - 2241.3.3.125 一个 英国石油公司 社会可取性偏见和种族/民族构成在教育与移民限制主义态度关系中的作用 社会科学杂志 2019 12 09 52 4 459 467 10.1016 / j.soscij.2014.09.005 Nuru-Jeter 麦克 埃克 托马斯。 医学博士 里夫斯 一个 索普 RJ LaVeist 助教 种族与社会经济地位在健康不平等研究中的相对作用:一个解释问题 公共卫生年度报告 2018 04 01 39 169 188 10.1146 / annurev - publhealth - 040617 - 014230 29328880 Krieger N 西德尼 年代 种族歧视和血压:年轻黑人和白人成年人的CARDIA研究 公共卫生 1996 10 86 10 1370 8 10.2105 / ajph.86.10.1370 8876504 PMC1380646 鲁伊斯 RJ 富勒顿 J 达德利 DJ 产妇应激、内分泌因素和炎症对妊娠期长短的影响 妇产科调查 2003 58 6 415 428 10.1097/01. ogx.0000071160.26072.de Viltart O Vanbesien-Mailliot CC 产前应激对神经内分泌编程的影响 ScientificWorldJournal 2007 09 01 7 1493 537 10.1100 / tsw.2007.204 17767365 PMC5901338 Wadhwa PD 恩特林格 年代 巴斯 C MC 产妇压力对早产的影响:问题和考虑 中国Perinatol 2011 09 38 3. 351 84 10.1016 / j.clp.2011.06.007 21890014 s0095 - 5108 (11) 00058 - 3 PMC3179976 Eskenazi B 标志着 一个 也包括 R 布鲁克纳 T Toniolo P 911事件后纽约市和纽约州北部出生体重过低 哼天线转换开关 2007 11 22 11 3013 20. 10.1093 / humrep / dem301 17905748 dem301 诺瓦克 格隆尼姆斯 Martinez-Cardoso 在一次大规模的移民袭击后,拉丁裔母亲所生婴儿出生结果的变化 国际流行病学 2017 06 01 46 3. 839 849 10.1093 / ije / dyw346 28115577 dyw346 PMC5837605 劳德黛尔 DS 911事件前后加州阿拉伯名字女性的生育结果 人口统计学 2006 02 43 1 185 201 10.1353 / dem.2006.0008 16579214 梅丝洛夫 一个 莱曼 年代 Y Onnela J Rosenquist J 第五届国际AAAI博客与社交媒体会议论文集 2011 07 11 2020-05-06 了解Twitter用户的人口统计数据 https://www.aaai.org/ocs/index.php/ICWSM/ICWSM11/paper/viewPaper/2816 J 在线去抑制效应 Cyberpsychol Behav 2004 06 7 3. 321 6 10.1089 / 1094931041291295 15257832 Bahk CY Cumming Paushter l 马多夫 信用证 汤姆森 一个 布朗斯坦 JS 公开可用的在线工具有助于实时监测疫苗对话和情绪 卫生助理(米尔伍德) 2016 02 35 2 341 7 10.1377 / hlthaff.2015.1092 26858390 35/2/341 质量控制 D H 凯丝 年代 Nsoesie E F 从地理标记的推特数据中建立一个全国社区数据集,用于幸福感、饮食和体育活动指标 公共卫生监测 2016 10 17 2 2 e158 10.2196 / publichealth.5869 27751984 v2i2e158 PMC5088343 Nsoesie E 布朗斯坦 J 流感监测的计算方法:超越时效性 细胞宿主微生物 2015 03 11 17 3. 275 278 10.1016 / j.chom.2015.02.004 25766284 s1931 - 3128 (15) 00061 - x PMC4492472 Y 第27届AAAI人工智能会议论文集 2013 2020-05-06 定位仇恨:检测针对黑人的推文 https://www.aaai.org/ocs/index.php/AAAI/AAAI13/paper/viewPaper/6419 巴特利特 J Reffin J Rumball N 威廉姆森 年代 演示 2014 2020-05-07 反社会媒体 http://cilvektiesibas.org.lv/site/record/docs/2014/03/19/DEMOS_Anti-social_Media.pdf TT H Sandeep 年代 麦卡洛 W Y D 质量控制 推特衍生的对少数民族情绪的测量(2015-2016)以及与美国低出生体重和早产的关联 计算人类行为 2018 12 89 308 315 10.1016 / j.chb.2018.08.010 30923420 PMC6432619 安德森 Hitlin P 皮尤研究中心 2016 2020-05-07 关于种族的社交媒体对话 http://www.pewinternet.org/2016/08/15/social-media-conversations-about-race/ 种族歧视数据库 2018 2020-05-05 http://www.rsdb.org/ VanderWeele T Vansteelandt 年代 统计学及其接口 2009 2020-05-07 关于调解、干预和组合的概念性问题 https://www.intlpress.com/site/pub/pages/journals/items/sii/content/vols/0002/0004/a007/ Kaggle 2018 2020-05-07 密歇根大学 UMICH SI650 -情绪分类 https://www.kaggle.com/c/si650winter11 桑德斯分析 GitHub 2011 2020-05-07 推特情感语料库 https://github.com/zfz/twitter_corpus 国家卫生统计中心 2020-05-07 限制使用的生命统计数据 https://www.cdc.gov/nchs/nvss/nvss-restricted-data.htm 多兰 SM 总值 SJ Merkatz 红外 法伯尔 V 沙利文 LM 马龙 FD 行李搬运工人 特遣部队 尼伯格 康斯托克 CH GD Eddleman K Dugoff l Craigo SD Timor-Tritsch 卡尔 乌尔夫 比安奇 DW Dʼ奥尔顿 出生缺陷对早产和低出生体重的影响 妇产科 2007 110 2、第一部分 318 324 10.1097/01. aog.0000275264.78506.63 路加福音 B 棕色(的) MB 按妊娠、多胎和种族划分的婴儿死亡率风险变化:1989-1991年与1999-2001年 儿科 2006 12 118 6 2488 97 10.1542 / peds.2006 - 1824 17142535 118/6/2488 PMC3623686 DeVellis R 因素分析策略 规模发展:理论与应用 1991 加州纽伯里公园 圣人 Elmstahl 年代 Gullberg B 饮食评估方法的偏倚——共线性和测量误差对功效和观察到的相对风险的影响 国际流行病学 1997 10 26 5 1071 9 10.1093 / ije / 26.5.1071 9363530 美国人口调查局 2020 2020-05-06 美国社区调查 https://www.census.gov/programs-surveys/acs R基金会 R项目 2020 2020-05-06 统计计算的R项目 https://www.r-project.org/ TT 纵纵横 年代 艾伦 针对 毫米 显象 l Trevino R Dasari 年代 质量控制 骄傲、爱和推特咆哮:结合机器学习和定性技术来理解我们的推文揭示了美国的种族 环境与公共卫生 2019 05 18 16 10 1766 10.3390 / ijerph16101766 31109051 ijerph16101766 PMC6571562 得知崔 DH Clouston 年代 Hatzenbuehler 毫升 克莱默 先生 库珀 HLF 威尔逊 SM Stephens-Davidowitz 如果 黄金 RS 链接 BG 基于互联网的地区种族主义测量与黑人死亡率之间的关系 《公共科学图书馆•综合》 2015 4 24 10 4 e0122963 10.1371 / journal.pone.0122963 25909964 玉米饼- d - 14 - 40827 PMC4409363 Wadhwa PD Culhane 摩根富林明 Rauh V 勇敢的 党卫军 霍根 V 睡魔 CA Hobel CJ Chicz-DeMet 一个 Dunkel-Schetter C Garite TJ 格林 l 压力,感染和早产:生物行为学的观点 儿科围产期流行病学 2001 07 15附录2 17 29 10.1046 / j.1365-3016.2001.00005.x 11520397 ppe005 Gemmill 一个 也包括 R 凯西 晶澳 Karasek D Alcala Elser H 托雷斯 JM 美国拉丁裔妇女早产与2016年总统大选的关联 JAMA网络公开赛 2019 07 03 2 7 e197084 10.1001 / jamanetworkopen.2019.7084 31322687 2738344 PMC6647358 壮族 Y 壮族 K T 社会凝聚力对健康至关重要 国际公平与健康 2013 10 28 12 87 10.1186 / 1475-9276-12-87 24165541 1475-9276-12-87 PMC4174898 Gordeev VS 伊根 社会凝聚力、社区复原力和健康:来自社区新政方案的证据 《柳叶刀》 2015 11 386 S39 10.1016 / s0140 - 6736 (15) 00877 - 6 威廉姆斯 博士 劳伦斯 晶澳 戴维斯 英航 种族主义和健康:证据和需要的研究 公共卫生年度报告 2019 04 01 40 105 125 10.1146 / annurev - publhealth - 040218 - 043750 30601726 PMC6532402 第二 种族化对医疗保健的溢出效应:奥巴马总统如何通过种族态度和种族使公众舆论两极分化 美国政治学杂志 2012 56 3. 690 704 10.1111 / j.1540-5907.2011.00577.x Debbink 国会议员 贝德 医学博士 密歇根州大都市区的种族居住隔离和低出生体重 公共卫生 2011 09 101 9 1714 1720 10.2105 / ajph.2011.300152 威廉姆斯 广告 华莱士 贵族 C Mendola P 美国死产的种族居住隔离和种族差异 健康的地方 2018 05 51 208 216 10.1016 / j.healthplace.2018.04.005 29715639 s1353 - 8292 (18) 30157 - 6 PMC6287738 SD 日常生活中的微侵犯:种族、性别和性取向 2010 霍博肯,新泽西 约翰威利父子公司 马德拉 J Colella AJ 海尔哥哥 对施暴者的影响 牛津工作场所歧视手册 2018 纽约,纽约 牛津大学出版社 彼得森 EE 戴维斯 家长 D 考克斯 年代 Syverson C 种子 K Shapiro-Mendoza C 卡拉汉 WM 巴菲尔德 W 妊娠相关死亡的种族/族裔差异——美国,2007-2016年 《凡人周刊 2019 09 06 68 35 762 765 10.15585 / mmwr.mm6835a3 31487273 PMC6730892 国家科学院、工程院和医学院 行动中的社区:实现卫生公平的途径 2017 华盛顿 美国科学院出版社 格林伍德 年代 佩兰 一个 达根 皮尤研究中心 2016 2020-05-05 2016年社交媒体更新 http://downtowndubuque.org/wp-content/uploads/2017/01/Social-Media-Update-2016.pdf
Baidu
map