JPH
公共卫生监测
公共卫生和监测
2369 - 2960
卡塔尔世界杯8强波胆分析
加拿大多伦多
v6i3e17103
32298232
10.2196/17103
原始论文
原始论文
从推特数据评估的州级种族态度与不良出生结局之间的关系:观察性研究
桑切斯
特拉维斯
金
Myeong光宇
卡瓦略
Darlinton
阮
星期四T
谈到MSPH
1
家庭和社区医学系
加州大学旧金山分校
波特雷罗大街1001号
83区80号楼
旧金山,加州,94110
美国
1 6179639595
thu.nguyen@ucsf.edu
https://orcid.org/0000-0003-1185-045X
亚当斯
尼基
博士学位
2
https://orcid.org/0000-0003-3562-4211
黄
蒂娜
英里每小时,博士
3.
https://orcid.org/0000-0001-8165-8231
针对
M玛丽亚
谈到女士
4
https://orcid.org/0000-0001-9644-3081
艾伦
阿玛尼米
英里每小时,博士
5
https://orcid.org/0000-0002-5882-1026
阮
琼C
MSPH博士
3.
https://orcid.org/0000-0003-4745-6681
1
家庭和社区医学系
加州大学旧金山分校
旧金山,加州
美国
2
情报与安全应用研究实验室
马里兰大学
马里兰大学帕克
美国
3.
流行病学和生物统计学系
马里兰大学公共卫生学院
马里兰大学帕克
美国
4
流行病学和生物统计学系
加州大学旧金山分校
旧金山,加州
美国
5
社区卫生科学和流行病学司
加州大学伯克利分校
伯克利分校,
美国
通讯作者:Thu T Nguyen
thu.nguyen@ucsf.edu
Jul-Sep
2020
6
7
2020
6
3.
e17103
18
11
2019
13
3.
2020
2
4
2020
16
4
2020
©Thu T Nguyen, Nikki Adams, Dina Huang, M Maria Glymour, Amani M Allen, Quynh C Nguyen。原发表于JMIR公共卫生与监测(http://publichealth.www.mybigtv.com), 2020年7月6日。
2020
这是一篇根据知识共享署名许可(https://creativecommons.org/licenses/by/4.0/)的条款发布的开放获取文章,该许可允许在任何媒介上不受限制地使用、分发和复制,前提是原始作品首次发表在JMIR公共卫生与监测上,并适当引用。必须包括完整的书目信息,到http://publichealth.www.mybigtv.com上原始出版物的链接,以及版权和许可信息。
背景
在美国,出生结果的种族差异持续存在,而且还在扩大。人际种族主义和结构性种族主义是对出生结果中持续存在的种族差异的主要解释,但确认种族主义的作用和评估种族主义对健康结果影响趋势的研究受到衡量种族主义的挑战的阻碍。大多数关于歧视的研究都依赖于自我报告的歧视经历,很少有研究调查美国国家层面的种族态度和偏见。
客观的
本研究旨在调查与种族或少数民族相关的国家级twitter衍生情绪与出生结果之间的关系。
方法
我们利用Twitter的流媒体应用程序编程接口收集了从2015年6月到2017年12月的26,027,740条推文,其中至少包含一个与种族相关的术语。情感分析使用支持向量机(一种监督机器学习模型)进行。我们构建了对少数民族和特定种族群体的情绪的总体指标。每年,国家级推特衍生的情绪数据与当年的出生数据合并。该研究的参与者是2015年至2017年期间没有先天性异常的单胎分娩的妇女,她们的胎龄(n=9,988,030)或出生体重(n=9,985,402)的数据可用。主要结局为低出生体重(出生体重≤2499 g)和早产(胎龄<37周)。我们使用对数二项回归模型估计了控制个体水平产妇特征(社会人口统计学、产前护理和健康行为)和州一级人口统计学的发病率。
结果
将机器学习模型与手动标记的推文进行比较,识别负面情绪的准确率为91%。与生活在最低分位数州的母亲相比,生活在推特中引用种族或少数民族的负面情绪最高的州的母亲低出生体重(高出8%,95%可信区间为4%-13%)和早产(高出8%,95%可信区间为0%-14%)的发生率更高。在总人口中,涉及少数民族的负面推文越多,出生结果就越不利,包括非西班牙裔白人和种族或少数民族。在分层亚组分析中,涉及特定种族或少数民族群体(黑人、中东人和穆斯林)的负面推文越多,黑人和少数民族的出生结果就越差。
结论
与种族相关的负面社会环境与种族或少数民族以及非西班牙裔白人的不良生育结果有关。
社交媒体
种族偏见
生的结果
种族或少数民族
介绍
早产和低出生体重是婴儿死亡和儿童残疾的主要原因[
1 ,
2 ].在美国,出生结果的种族差异仍然存在[
3. ,
4 并一直在扩大[
5 ].2017年,非西班牙裔白人母亲的早产率为9.05%,而黑人母亲的早产率为13.93%。从2006年到2016年,黑人婴儿的低体重率一直是非西班牙裔白人婴儿的两倍多[
6 ].产妇保健行为、产前护理的充分性和社会人口特征不能完全解释观察到的差异[
3. ].越来越多的证据表明,种族偏见可能在一定程度上造成了这些持续存在的差异[
3. ,
7 ,
8 ].
传统上,歧视的经历是在个人层面上通过自我报告来评估的[
9 ,
10 ].自我报告的种族态度和信仰受到一些限制,包括社会可取性偏见和自我审查[
11 ,
12 ],风险无效暴露评估[
13 ,
14 ].种族歧视的自我报告可受到多种因素的影响,包括应对(例如,否认)、基于人格特征或状态的方面(例如,耻辱意识和基于种族的拒绝敏感性)和种族认同方面(例如,内化的种族主义)[
13 ].虽然个人自我报告的歧视经历可以提供重要信息,但一个地方的社会气候代表了种族偏见和歧视的一个有益方面,它可能对健康产生自己的影响,独立于个人层面的经历。因此,只依赖个人自我报告的数据可能会低估种族主义对健康的影响。
歧视可能通过几种机制影响不良的生育结果。例如,歧视的经历可能会激活应激反应,如果长期经历,可能会导致不良的生育结果。产妇应激可能通过以下三个主要途径影响分娩结局:(1)神经内分泌功能改变,导致母体-胎盘-胎儿内分泌系统激活,促进分娩[
15 ,
16 ];(2)免疫功能改变,导致对感染和炎症反应的易感性增加[
17 ];(3)不适应的应对行为,如吸烟和饮酒[
18 ].还假设歧视通过获得教育、就业、保健和住房等资源来影响生育结果[
3. ,但这是一个长期的过程。
一项创新研究强调了与种族或民族有关的事件的潜在影响,这些事件会在背景层面上改变社会气候。作者调查了2008年爱荷华州波斯特维尔联邦移民突击搜查后的出生结果,这是当时美国历史上最大的一次单点突击搜查。
19 ].将爱荷华州袭击后37周内出生的婴儿的出生体重与一年前相同的37周期间进行比较,拉丁裔母亲,包括在美国出生的拉丁裔母亲,在袭击后生下低体重婴儿的风险增加了24%。在非拉丁裔白人母亲中未观察到LBW的变化。调查人员进行了州一级的分析,发现不仅在波斯特维尔,而且在爱荷华州也有估计的影响。另一项研究发现,2001年9月11日恐怖袭击发生后的6个月与一年前的6个月相比,阿拉伯名字的妇女患低体重儿或早产的风险有所增加。
20. ].这些研究为社会环境对受影响社区健康的潜在影响提供了证据。
社交媒体是公共卫生研究中未得到充分利用的数据来源。每天有数百万条推文被发送,90%的Twitter用户公开了他们的个人资料[
21 ].在网络空间中,人们表达各种各样的观点和信仰,包括那些与种族有关的观点和信仰。此外,研究表明,网络空间提供的匿名感鼓励人们表达他们在面对面互动中可能不会表达的观点[
22 ].这些方面使社交媒体成为捕捉敏感话题(如与种族有关的讨论)的有吸引力的来源。
以前的研究使用Twitter数据来检查主题,如疫苗接种[
23 在营养、锻炼和幸福方面的国家模式[
24 ],并进行健康监察[
25 ].然而,很少有研究调查敏感话题,如社交媒体上的种族和种族主义,之前使用社交媒体数据研究种族主义的研究主要集中在仇恨言论上[
26 ]和种族歧视[
27 ].
为了提供一种与种族或民族相关的社会气候测量方法,并解决先前自我报告的个人层面测量方法的局限性,我们开发了一种新的区域层面的种族情绪测量方法,并研究了其与低体重和早产的关系。我们采取了广泛的方法,收集了涉及种族或民族群体的推文,而不仅仅是仇恨言论或使用种族歧视的推文。然而,传统上被认为是种族歧视的术语可以以非贬义的方式使用,这种挪用在Twitter上很常见。例如,在流行文化中,“黑鬼”一词经常被用作没有价值的群体内用语[
27 ].此外,传达种族情绪的讨论可以在不使用种族歧视的情况下进行。对使用种族相关术语的推文进行更全面的检查可能包括对使用种族诽谤以及中性种族术语(如“黑人”、“非裔美国人”或“亚洲人”)的推文进行情绪分析。在之前的一篇论文中,我们研究了2015年Twitter数据得出的种族情绪与不良出生结果之间的关系[
28 ].在本文中,我们改进了机器学习模型的准确性来标记推文的情绪,将推文的样本量增加了20倍,并使用推特和出生结果数据多年而不是一年来检查关系。
方法
Twitter数据
从2015年6月到2017年12月,使用Twitter的流媒体应用程序编程接口,随机收集了1%的公开推文样本。该分析包括来自美国的带有经纬度坐标或其他“地点”属性的英语推文,这些属性允许识别推文所在的州。样本中包含的所有推文也使用了518个与种族相关的关键词中的一个或多个(
多媒体附录1 )。这些术语是根据美国人口普查中使用的种族和民族分类汇编而成的,之前的研究调查了与种族有关的在线对话。
27 ,
29 ],以及一个种族歧视的在线数据库[
30. ].根据使用的关键词,推文被分为以下五个主要的种族或民族类别:黑人、西班牙裔、亚洲人、白人和中东人。中东类别包括反伊斯兰或与穆斯林有关的推文。
为了进行分析,对Twitter数据进行了清理和处理。我们根据“tweet_id”删除重复的推文。我们确定了排除术语,这些术语倾向于检索不相关的推文,如“黑烟”和“印度路”。为了防止少数非常频繁的用户的不当影响,我们排除了数据集中每年发推超过1000次的用户的推文,这占所有推文的3%到4%。我们总共从2,498,717名Twitter用户中收集了26,027,740条tweet。这项研究被加州大学旧金山分校的机构审查委员会确定为豁免。
情绪分析
我们使用支持向量机(SVM),一种有监督的机器学习模型,来标记推文。我们从人工标记的Sentiment140 (n=498)中获得训练数据[
31 ], Kaggle (n=7086) [
32 ], Sanders (n=5113) [
33 ]和我们的研究小组标记的6481条推文。Sentiment140、Kaggle和Sanders数据集是公开可用的训练数据集,专门用于情感分析。对于我们的主要分析,我们将负面推文(赋值为1)与所有其他推文(赋值为0)进行比较,这些推文是积极或中立的推文(赋值为0)。我们使用五倍交叉验证来评估模型性能,并在负面分类方面达到了高水平的准确性(91%)和高F1分数(84%)。推文也被标记为积极或不积极。我们同样使用了五重交叉验证,获得了89%的准确率和81%的F1分数。州级情绪变量是通过对引用不同种族或民族群体的推文的二分情绪进行平均而创建的。
个人层面的健康数据
我们使用了2015-2017年限制美国出生文件的数据,其中包含地理标识符作为个人层面的出生结果数据。这些文件是在向国家卫生统计中心提交研究提案并获得数据访问许可后获得的[
34 ].该分析仅限于没有先天性异常的单胎出生。先天性畸形[
35 双胞胎、三胞胎和其他高顺序多胞胎增加了低体重儿和早产的风险[
36 ].主要结局为低体重(定义为出生体重≤2499 g)和早产(定义为胎龄<37周)。早产模型包括9,988,030例出生的数据,LBW模型包括9,985,402例出生的数据。
协变量
我们调整了种族情绪和出生结果之间关联的潜在混杂因素。个体水平的母亲特征包括出生年份、母亲年龄(19岁、25岁、29岁、33岁和38岁的线状样条结)、种族(白人、非西班牙裔;黑色,非西班牙裔;美洲印第安人/阿拉斯加原住民,非西班牙裔;亚洲、非西班牙裔;夏威夷原住民/太平洋岛民,非西班牙裔;多种族,非西班牙裔),西班牙裔,婚姻状况(已婚/未婚),教育程度(低于高中,高中或普通教育发展[GED],一些大学,学士学位,硕士学位或博士学位),体重指数(kg/m)2 ),怀孕期间吸烟(妊娠早期、中期或晚期),第一次分娩(是/否),以及妊娠早期开始产前护理(是/否)。我们还调整了州一级的特征,包括非西班牙裔黑人和西班牙裔个人的比例、人口密度(每平方英里)、南部州指标(是/否)和经济劣势(标准化因素得分[
37 ,
38 总结了以下变量[%]:失业;一些大学教育、高中文凭、贫困儿童、单亲家庭和家庭收入中位数)来解释各州人口和经济特征的构成差异。因子评分的使用方法已于先前公布[
24 ].州级协变量是通过美国社区调查的5年估计从2013年到2017年得出的[
39 ].
统计分析
每年,对种族或少数民族的州级情绪与当年的出生数据相结合。我们使用对数二项回归模型估计发病率(IRs),控制了个体水平的产妇特征和国家水平的人口统计学特征。在我们的主要分析中,我们使用与种族相关的术语对推文的负面情绪进行建模,但在敏感性分析中,我们对负面情绪与积极情绪的比例进行建模,以检验结果是否对于不同极性的情绪建模具有鲁棒性。我们在
P < . 05。使用Stata MP 15 (StataCorp LP, College Station, Texas, USA)进行统计分析,使用R软件(R Foundation for statistical Computing, Vienna, Austria)进行绘图[
40 ].
结果
从2015年到2017年,我们收集了26,027,740条推文,其中至少包含一个与种族或民族群体相关的关键词。在被评估的518个术语中,有20个术语出现在75%的推文中,涉及种族或少数民族群体。最热门的推特词汇是“黑鬼/黑鬼”(13,561,626/ 26,027,740,52.10%)、“种族主义者”(1,070,770/ 26,027,740,4.11%)、“墨西哥人”(620,957/ 26,027,740,2.39%)、“白人”(514,111/ 26,027,740,1.98%)和“中国人”(498,775/ 26,027,740,1.92%)。
表1 )。此外,关于黑人的推文有15683909条,关于亚洲人的推文有1801780条,关于白人的推文有15577568条,关于西班牙裔的推文有1512566条,关于中东人的推文有1274827条(
表2 )。我们之前研究了使用种族相关关键词的推文的新兴主题[
41 ].简而言之,负面情绪的推文包括抱怨日常生活中的麻烦(例如,“我讨厌有人很晚才参加一项运动,就像黑鬼一样,你没有投入我所做的工作”),使用贬损性语言的种族相关侮辱(例如,“中东/阿拉伯口音比大多数事情都让我恼火”),以及表达敌意或提及暴力的罕见推文(例如,“如果他们在亚利桑那州举着墨西哥国旗,他们就应该被逮捕。”)“黑鬼”一词在负面情绪的推文中很常见。然而,推特用户经常将这个词作为俚语随意使用。
表1
推特热门词汇。
术语
Tweets (N=26,027,740), N (%)
黑鬼
8300511 (31.89)
黑鬼
5261115 (20.21)
种族主义
1070770 (4.11)
墨西哥
620957 (2.39)
白人
514111 (1.98)
中国人
498775 (1.92)
种族歧视
422279 (1.62)
穆斯林
381601 (1.47)
亚洲
312520 (1.20)
穆斯林
259998 (1.00)
日本
238588 (0.92)
移民
214416 (0.82)
印度
193782 (0.74)
伊斯兰教
189739 (0.73)
叙利亚
181771 (0.70)
白人女孩
180426 (0.69)
犹太人
170040 (0.65)
贫民窟
167128 (0.64)
难民
165674 (0.64)
黑人
163062 (0.63)
消极和积极情绪推文的地理分布显示在
多媒体附录2 和
多媒体附录3 ,分别。美国东南部地区的负面推文比例更高(
多媒体附录2 )和美国西部地区积极推文比例较高的聚类(
多媒体附录3 )。推特衍生的种族情绪测量方法见
表2 .大约40.33%(9,657,039/23,945,052)使用种族相关术语的推文被归类为负面。与中东人相关的推文负面情绪比例最高(638,688/1,274,827,50.10%),而与亚洲人相关的推文负面情绪比例最低(113,172/1,801,780,6.28%)。2015 - 2017年产妇人口学特征见
表3 .母亲的平均年龄为29岁,59.74%(6,466,521/10,824,077)已婚,85.99%(9,578,803/ 111,139,992)高中以上学历。此外,6.37%(717,541/11,272,819)无先天性异常的单胎婴儿出生时为低体重儿,7.91%(891,628/11,273,872)为早产儿。
表2
对推特中使用的种族相关术语的负面情绪。
与种族有关的术语
推文数量
带有负面情绪的推文数(%)
种族或少数民族
23945052年
9657039 (40.33)
黑人
15683909年
7073443 (45.10)
中东人
1274827年
638688 (50.10)
拉美裔人
1512566年
172433 (11.40)
亚洲人
1801780年
113172 (6.28)
白人
1577568年
700440 (44.40)
表3
2015 - 2017年产妇分娩特征分析
特征
平均值(SD)或n/ n (%)
年龄、年
28.6 (5.82)
结婚了
6466521/10824077 (59.74)
白,非西班牙裔
5852869/11187000 (52.32)
黑色,非西班牙裔
1600020/11187000 (14.30)
亚洲、非西班牙裔
717706/11187000 (6.42)
拉美裔种族
2666823/11187000 (23.84)
我们出生
8645413/11257974 (76.79)
教育
高中以下
1561190/11139992 (14.01)
高中
2829005/11139992 (25.40)
一些大学
3238463/11139992 (29.07)
大学
2221480/11139992 (19.94)
硕士或博士学位
1289855/11139992 (11.58)
生的结果
低出生体重
717541/11272819 (6.37)
早产
891628/11273872 (7.91)
州一级的种族情绪与低体重和早产有关。在整个人口中,与生活在负面情绪最低水平(第一十分位数)的州的母亲相比,生活在引用种族或少数民族的负面推文水平最高(第三十分位数)的州的母亲的LBW发生率高8% (95% CI 1.04-1.13),早产发生率高8% (95% CI 1.00-1.14)。
表4 )。在调查种族或少数民族的出生结果时,影响的方向和程度是相似的,在种族或少数民族母亲中,更多的负面推文提到种族或少数民族与低体重增加13% (95% CI 1.06-1.21)和早产增加10% (95% CI 1.05-1.16)有关。
在检查对特定群体的情绪时,我们发现,引用中东人的负面推文最高水平(第三分位数)的州与种族或少数民族中LBW的发生率较高相关(IR 1.07, 95% CI 1.02-1.12)。更多关于黑人的负面推文(IR 1.08, 95% CI 1.03-1.14)与黑人母亲中更高的LBW发生率相关(
表5 )。在早产中也观察到类似的影响。虽然推文中提到白人的情绪与白人母亲的分娩结果无关,但推文中提到种族或少数民族群体的情绪与非西班牙裔白人母亲中更高的低体重(IR 1.08, 95% CI 1.03-1.14)和早产(IR 1.08, 95% CI 1.00-1.17)的发生率相关(
表5 )。
随着时间的推移,在研究消极情绪与出生结果之间的关系时,有证据表明,黑人的情绪与年份之间存在相互作用。因此,我们提出的绝对差异的比例和数量的低出生体重和早产儿按年
表6 对于引用黑人的负面推文与黑人母亲的出生结果之间的关联,以及引用种族或少数民族的推文与整个人口的出生结果之间的关联。对于黑人母亲来说,随着时间的推移,这种联系变得越来越强。例如,2015年,生活在负面推文中提到黑人的比例最高的州的黑人母亲的LBW比例相差0.65%,这意味着与生活在负面情绪最低的州的母亲相比,婴儿的LBW比例多出3039个。2017年,这一差异增加到1.82%,即8711个LBW婴儿。
表4
国家层面对种族或少数民族的看法和个人层面的生育结果。
州级twitter派生变量(与种族相关的负面tweet的分位数)
低出生体重a、b , 发生率比(95% CI)或n
早产a、b , 发生率比(95% CI)或n
总样本
第二分位数vs第一分位数(最低)
1.08 (1.03 - -1.13)
1.09 (1.04 - -1.13)
第三tertile
1.08 (1.04 - -1.13)
1.08 (1.00 - -1.14)
数量
9985402年
9988030年
少数民族
第二分位数vs第一分位数(最低)
1.12 (1.04 - -1.19)
1.10 (1.05 - -1.15)
第三tertile
1.13 (1.06 - -1.21)
1.10 (1.05 - -1.16)
数量
4920300年
4921577年
白人
第二分位数vs第一分位数(最低)
1.07 (1.02 - -1.12)
1.09 (1.03 - -1.15)
第三tertile
1.08 (1.03 - -1.14)
1.08 (1.00 - -1.17)
数量
5407779年
5409230年
一个 健康结果的数据来源是2015年、2016年和2017年的出生文件。推文的收集时间为2015年6月至2017年12月。
b 对每个结果分别运行调整后的对数二项模型。模型控制了年份和州一级的因素,包括非西班牙裔黑人百分比、西班牙裔百分比、南部州指标、人口密度和经济劣势(标准化因素得分,总结了以下变量[%]:失业,部分大学学历,高中学历,贫困儿童,单亲家庭,家庭收入中位数),以及个人层面的因素,包括母亲的年龄,性别,种族,民族,外国出生,教育,婚姻状况,吸烟,体重指数,第一胎状况和产前护理。推特衍生的特征被分为三类,最低的三类作为参照组。报告集群调整错误。
表5
亚群体中州级情绪与出生结果之间关系的分层分析。
对特定群体的州级情绪(负面推文的字节)
低出生体重a、b , 发生率比(95% CI)或n
早产a、b , 发生率比(95% CI)或n
中东人和穆斯林(少数民族)
第二分位数vs第一分位数(最低)
1.09 (1.04 - -1.14)
1.07 (1.03 - -1.12)
第三tertile
1.07 (1.02 - -1.12)
1.05 (1.02 - -1.09)
数量
4920300年
4921577年
黑人
第二分位数vs第一分位数(最低)
1.10 (1.04 - -1.17)
1.10 (1.06 - -1.16)
第三tertile
1.08 (1.03 - -1.14)
1.09 (1.04 - -1.15)
数量
1413336年
1413938年
拉美裔人
第二分位数vs第一分位数(最低)
0.96 (0.87 - -1.06)
0.96 (0.94 - -0.99)
第三tertile
0.96 (0.89 - -1.04)
0.90 (0.84 - -0.97)
数量
2254029年
2254401年
亚洲人
第二分位数vs第一分位数(最低)
0.98 (0.91 - -1.04)
1.02 (0.97 - -1.07)
第三tertile
1.03 (0.93 - -1.13)
1.10 (1.00 - -1.21)
数量
599580年
599769年
白人
第二分位数vs第一分位数(最低)
1.01 (0.97 - -1.04)
1.00 (0.96 - -1.03)
第三tertile
1.02 (0.97 - -1.07)
0.98 (0.93 - -1.04)
数量
5407779年
5409230年
一个 健康结果的数据来源是2015年、2016年和2017年的出生文件。推文的收集时间为2015年6月至2017年12月。
b 对每个结果分别运行调整后的对数二项模型。模型控制了年份和州一级的因素,包括非西班牙裔黑人百分比、西班牙裔百分比、南部州指标、人口密度和经济劣势(标准化因素得分,总结了以下变量[%]:失业,部分大学学历,高中学历,贫困儿童,单亲家庭,家庭收入中位数),以及个人层面的因素,包括母亲的年龄,性别,种族,民族,外国出生,教育,婚姻状况,吸烟,体重指数,第一胎状况和产前护理。推特衍生的特征被分为三类,最低的三类作为参照组。报告集群调整错误。
表6
生活在种族情绪最高的州的母亲和生活在种族情绪最低的州的母亲之间的低出生体重和早产的绝对数量和比例的差异。
一年
低出生体重,n/ n (%)
早产,n/ n (%)
总计一个
黑色的b
总计一个
黑色的b
2015
11712/3444706 (0.34)
3039/469659 (0.65)
14261/3444783 (0.41)
3466/470019 (0.74)
2016
23598/3506457 (0.67)
3391/477984 (0.71)
23737/3506174 (0.68)
4415/478272 (0.92)
2017
10490/3040622 (0.35)
8711/479384 (1.82)
16827/3037346 (0.55)
7060/465674 (1.52)
一个 对于总样本,曝光是指涉及种族或少数民族的负面情绪推文。
b 对于黑人母亲的样本,暴露是指黑人的负面情绪推文。
通过对消极情绪与积极情绪的比例进行建模,进行敏感性分析,以调查研究结果对不同极性情绪的建模是否具有鲁棒性。调查结果显示了类似的模式(
多媒体附录4 ),与单独建立负面情绪模型相比,在那些针对种族或少数民族的负面或正面推文比例更高的州,LBW和早产的发生率更高。
讨论
这项研究发现,在各州的推特上表达的对种族和少数民族的负面情绪与低体重和早产有关。这些不良关联在所有新生儿、非西班牙裔白人母亲和少数种族或少数民族的新生儿中都是相似的。提到黑人的负面推文与黑人母亲的不良分娩结果有关。同样,提到中东人的负面推文与少数民族的不良出生结果有关。对非西班牙裔白人或西班牙裔母亲的负面推文的关联并不一致。虽然这种关联在2015年至2017年期间趋于稳定,但对于黑人母亲来说,随着时间的推移,黑人种族情绪与不良分娩结果之间的关联变得越来越强。
这是少数几篇利用社交媒体数据评估种族气候与健康结果之间关系的论文之一。此外,我们这样做是基于国家的基础上,并考虑到个人的特点。该结果与先前的研究结果一致,表明社区层面的种族气候与出生结果有关[
19 ,
20. ]和死亡率[
42 在这个地区。压力已被确定为歧视可能影响健康的途径,也是已知的不良分娩结果的风险因素[
43 ].然而,其他途径也是可能的,包括获得教育、就业、保健和住房等资源[
3. ].
以前的研究已经为社会环境对社区健康的影响提供了证据。过去的研究比较了单一地点移民突袭前后的出生结果[
19 2001年9月11日的恐怖袭击[
20. ],以及2016年的总统大选[
44 并发现在这些事件发生后,少数民族人口的不良出生结果升高。这些研究的一个局限是没有测量社会背景。因此,我们不能直接评估地区层面的种族偏见是否解释了事件与出生结果之间的关联。制定地方一级的种族偏见措施将推动这一领域的发展,并为调查社会背景在形成健康和健康差异方面的作用提供新的机会。
我们的研究结果表明,提到种族或少数民族的负面情绪推文影响了包括非西班牙裔白人在内的总人口。先前关于种族偏见和歧视的研究往往只研究对少数种族和族裔的影响。这项研究的不同寻常之处在于它调查了全体人口的健康状况。对少数种族和少数民族怀有敌意的社会气氛可能会创造一种对包括白人在内的所有人都不利的环境。这与先前的研究一致,表明社会凝聚力促进人口健康[
45 ,
46 ].对少数种族和少数民族的敌意可能导致对可能有利于白人和其他种族和少数民族群体的共享资源、社会政策和项目的支持减少[
47 ,
48 ].先前的研究发现,生活在黑人隔离地区的黑人母亲和白人母亲的生育结果都很差[
49 ,
50 ].有一些研究调查了种族主义对犯罪者的负面认知和情感影响[
51 ,
52 ].
尽管在过去的一个世纪里,所有群体的不良出生结果率都有所下降,但明显的种族差异仍然存在。在包括产妇死亡率在内的许多其他结果方面也存在类似的差距[
53 ]和许多成人疾病和死亡原因[
54 ].人际种族主义和结构性种族主义是对健康方面持续存在的种族差异的主要解释,但确认种族主义的因果作用和评估种族主义对健康结果影响趋势的研究受到衡量种族主义的挑战的阻碍。我们的方法具有重要的优势,因为它易于测量和监测,不依赖于自我报告,在全国范围内可用,并且可能扩展到全球。
尽管如此,这项研究也有一些局限性。这些分析没有考虑到居住历史和个人在当前社区居住的时间长短。收集的数据代表了人们愿意在Twitter上表达的内容。Twitter用户并不能代表美国人口,与美国人口相比,Twitter上的年轻用户比例过高。
55 ].然而,随着时间的推移,社交媒体的使用一直在稳步增长。通过手机接入互联网和社交媒体,使各个社会经济阶层的人都能参与社交媒体。
虽然情绪分析对建立区域层面的种族情绪测量做出了重大贡献,但情绪分析也有重要的局限性。情绪分析使用整条推文来评估推文的情绪或情绪基调,而不仅仅关注推文中提到的种族术语。同样,编码人员手动标记推文,为机器学习算法提供训练数据,他们将推文的情感基调作为一个整体进行标记。因此,虽然推文的语气可能是负面的,但推文中提到的种族或民族可能不是这种负面情绪的主题,这在许多推文中都是如此。此外,推文的情绪基调可能会表现出负面情绪,但并不一定表达偏见,这在我们的数据中也很常见。我们之前的研究表明,有偏见的推文可以与推文的情绪区分开来[
41 ].在一些推文中,负面情绪还表达了负面的种族态度或偏见信仰(例如,“中东/阿拉伯口音比大多数事情更让我生气。”)然而,也有使用种族相关术语的负面情绪推文,并不表达偏见信仰。我们通常用“黑鬼”(nigga)这个词来表示这一点(例如,“不能看(职业篮球队)比赛”)。这些黑鬼很无聊。我们也遇到了一些情绪积极的推文,但他们表达了一种偏见的信仰或种族或民族刻板印象(例如,“肯定雇了一个墨西哥清洁工。浴室里有一股非常干净的气味”)。无论如何,在我们的研究中观察到的关联似乎捕捉到了一个与种族态度和出生结果的平均水平相关的信号。未来的工作需要开发模型来捕捉与种族相关的主题和情绪,并将基于twitter的种族背景特征与其他结构性或人际种族主义措施相结合。
这项研究为关于种族态度和偏见的地方水平指标的初步文献体系做出了贡献。虽然不全面,但我们对种族情绪的衡量可能代表了母亲所处的更广泛的社会和文化背景的一个信号。与传统的种族态度或偏见调查相比,从Twitter收集的数据可能是独一无二的。社交媒体可以代表对一系列主题(包括种族态度)的观点的及时数据的丰富来源。这项研究表明,对少数民族的种族气氛可能对少数民族或少数民族以及整个人口产生影响。促进尊重、积极和包容的社会氛围可能对整个人口的出生结果产生有益的健康影响。
多媒体附录1
Twitter数据收集中使用的术语。
多媒体附录2
2015-2017年,使用种族相关术语的负面情绪推文的地理分布。
多媒体附录3
2015-2017年,使用种族相关术语的积极情绪推文的地理分布。
多媒体附录4
对种族或少数民族的负面情绪与正面情绪的比率与个人层面的出生结果。
缩写
红外
发病率比
激光焊
低出生体重
这项研究是使用由药物滥用研究中心的国家药物早期预警系统协调中心收集的Twitter消息语料库进行的。本研究得到了美国国立卫生研究院(NIH)国家少数民族健康和健康差异研究所(奖励号:R00MD012615) (Dr Nguyen, T, PI),美国国立卫生研究院大数据到知识计划(BD2K)资助(5K01ES025433;R01LM012849)和NIH Commons Credit Pilot Program(授权号:CCREQ-2016-03-00003) (Dr Nguyen, Q, PI)。资助者在研究的设计中没有任何作用;数据分析:对数据的收集、分析或解释;在撰写手稿时;或者是发表结果的决定。
没有宣布。
[
]1
金
D
萨阿达
一个
西方发达国家婴儿死亡率和出生结果的社会决定因素:一项跨国系统回顾
环境与公共卫生
2013
06
05
10
6
2296
335
10.3390 / ijerph10062296
23739649
ijerph10062296
PMC3717738
[
]2
赴
等
Ouden
艾尔
鲍尔
l
Oudenrijn
简历
品牌
R
Verloove-Vanhorick
SP
极早产和极低出生体重婴儿九岁时的学校表现:五岁时围产期风险因素和预测因素
儿科杂志
1994
9
125
3.
426
434
10.1016 / s0022 - 3476 (05) 83290 - 1
[
]3.
Alhusen
莱托
鲍尔
公里
爱普斯坦
E
专家
P
种族歧视与不良出生结局:一项综合综述
J助产和妇女健康
2016
11
61
6
707
720
10.1111 / jmwh.12490
27737504
PMC5206968
[
]4
马修斯
T
MacDorman
米
托马
我
来自2013年期间关联出生/婴儿死亡数据集的婴儿死亡率统计
全国生命属性代表
2015
08
06
64
9
1
30.
26270610
[
]5
马丁
晶澳
汉密尔顿
是
奥斯特曼
乔丹
德里斯科尔
正义与发展党
国家生命统计报告
2018
2020-05-07
马里兰州Hyattsville
国家卫生统计中心
出生:2017年的最终数据
https://www.cdc.gov/nchs/data/nvsr/nvsr67/nvsr67_08-508.pdf
[
]6
沃玛克
LS
雷森
LM
马丁
晶澳
国家卫生统计中心
2018
2020-05-06
马里兰州Hyattsville
国家卫生统计中心
单胎低出生体重率,按种族和西班牙裔划分:美国,2006-2016年
https://stacks.cdc.gov/view/cdc/52611
[
]7
黑色的
噢
约翰逊
R
VanHoose
l
美国黑人女性种族主义/歧视感知与健康的关系:2003 - 2013年文献综述
J种族和民族健康差异
2015
03
2
1
11
20.
10.1007 / s40615 - 014 - 0043 - 1
25973361
PMC4426269
[
]8
Giurgescu
C
McFarlin
提单
凯文
J
克拉多克
C
阿尔布雷希特
一个
种族歧视与不良出生结局的黑人-白人差异:综述
J助产和妇女健康
2011
56
4
362
370
10.1111 / j.1542-2011.2011.00034.x
21733107
PMC5388001
[
]9
威廉姆斯
博士
余
Y
杰克逊
JS
安德森
注
生理和心理健康的种族差异:社会经济地位、压力和歧视
[J]健康心理
1997
07
2
3.
335
51
10.1177 / 135910539700200305
22013026
2/3/335
[
]10
Krieger
N
史密斯
K
Naishadham
D
哈特曼
C
Barbeau
新兴市场
歧视经验:种族主义和健康人口健康研究自我报告措施的效度和可靠性
社会科学
2005
10
61
7
1576
96
10.1016 / j.socscimed.2005.03.006
16005789
s0277 - 9536 (05) 00097 - 3
[
]11
Stocke
V
被调查者关于种族态度的社会可取性信念的决定因素和后果
方法
2007
01
3.
3.
125
138
10.1027 / 1614 - 2241.3.3.125
[
]12
一个
英国石油公司
社会可取性偏见和种族/民族构成在教育与移民限制主义态度关系中的作用
社会科学杂志
2019
12
09
52
4
459
467
10.1016 / j.soscij.2014.09.005
[
]13
Nuru-Jeter
我
麦克
埃克
托马斯。
医学博士
里夫斯
一个
索普
RJ
LaVeist
助教
种族与社会经济地位在健康不平等研究中的相对作用:一个解释问题
公共卫生年度报告
2018
04
01
39
169
188
10.1146 / annurev - publhealth - 040617 - 014230
29328880
[
]14
Krieger
N
西德尼
年代
种族歧视和血压:年轻黑人和白人成年人的CARDIA研究
公共卫生
1996
10
86
10
1370
8
10.2105 / ajph.86.10.1370
8876504
PMC1380646
[
]15
鲁伊斯
RJ
富勒顿
J
达德利
DJ
产妇应激、内分泌因素和炎症对妊娠期长短的影响
妇产科调查
2003
58
6
415
428
10.1097/01. ogx.0000071160.26072.de
[
]16
Viltart
O
Vanbesien-Mailliot
CC
产前应激对神经内分泌编程的影响
ScientificWorldJournal
2007
09
01
7
1493
537
10.1100 / tsw.2007.204
17767365
PMC5901338
[
]17
Wadhwa
PD
恩特林格
年代
巴斯
C
陆
MC
产妇压力对早产的影响:问题和考虑
中国Perinatol
2011
09
38
3.
351
84
10.1016 / j.clp.2011.06.007
21890014
s0095 - 5108 (11) 00058 - 3
PMC3179976
[
]18
Eskenazi
B
标志着
一个
也包括
R
布鲁克纳
T
Toniolo
P
911事件后纽约市和纽约州北部出生体重过低
哼天线转换开关
2007
11
22
11
3013
20.
10.1093 / humrep / dem301
17905748
dem301
[
]19
诺瓦克
问
格隆尼姆斯
在
Martinez-Cardoso
我
在一次大规模的移民袭击后,拉丁裔母亲所生婴儿出生结果的变化
国际流行病学
2017
06
01
46
3.
839
849
10.1093 / ije / dyw346
28115577
dyw346
PMC5837605
[
]20.
劳德黛尔
DS
911事件前后加州阿拉伯名字女性的生育结果
人口统计学
2006
02
43
1
185
201
10.1353 / dem.2006.0008
16579214
[
]21
梅丝洛夫
一个
莱曼
年代
安
Y
Onnela
J
Rosenquist
J
第五届国际AAAI博客与社交媒体会议论文集
2011
07
11
2020-05-06
了解Twitter用户的人口统计数据
https://www.aaai.org/ocs/index.php/ICWSM/ICWSM11/paper/viewPaper/2816
[
]22
南
J
在线去抑制效应
Cyberpsychol Behav
2004
06
7
3.
321
6
10.1089 / 1094931041291295
15257832
[
]23
Bahk
CY
Cumming
米
Paushter
l
马多夫
信用证
汤姆森
一个
布朗斯坦
JS
公开可用的在线工具有助于实时监测疫苗对话和情绪
卫生助理(米尔伍德)
2016
02
35
2
341
7
10.1377 / hlthaff.2015.1092
26858390
35/2/341
[
]24
阮
质量控制
李
D
孟
H
凯丝
年代
Nsoesie
E
李
F
温
米
从地理标记的推特数据中建立一个全国社区数据集,用于幸福感、饮食和体育活动指标
公共卫生监测
2016
10
17
2
2
e158
10.2196 / publichealth.5869
27751984
v2i2e158
PMC5088343
[
]25
Nsoesie
E
布朗斯坦
J
流感监测的计算方法:超越时效性
细胞宿主微生物
2015
03
11
17
3.
275
278
10.1016 / j.chom.2015.02.004
25766284
s1931 - 3128 (15) 00061 - x
PMC4492472
[
]26
郭
我
王
Y
第27届AAAI人工智能会议论文集
2013
2020-05-06
定位仇恨:检测针对黑人的推文
https://www.aaai.org/ocs/index.php/AAAI/AAAI13/paper/viewPaper/6419
[
]27
巴特利特
J
Reffin
J
Rumball
N
威廉姆森
年代
演示
2014
2020-05-07
反社会媒体
http://cilvektiesibas.org.lv/site/record/docs/2014/03/19/DEMOS_Anti-social_Media.pdf
[
]28
阮
TT
孟
H
Sandeep
年代
麦卡洛
米
余
W
刘
Y
黄
D
阮
质量控制
推特衍生的对少数民族情绪的测量(2015-2016)以及与美国低出生体重和早产的关联
计算人类行为
2018
12
89
308
315
10.1016 / j.chb.2018.08.010
30923420
PMC6432619
[
]29
安德森
米
Hitlin
P
皮尤研究中心
2016
2020-05-07
关于种族的社交媒体对话
http://www.pewinternet.org/2016/08/15/social-media-conversations-about-race/
[
]30.
种族歧视数据库
2018
2020-05-05
http://www.rsdb.org/
[
]31
VanderWeele
T
Vansteelandt
年代
统计学及其接口
2009
2020-05-07
关于调解、干预和组合的概念性问题
https://www.intlpress.com/site/pub/pages/journals/items/sii/content/vols/0002/0004/a007/
[
]32
Kaggle
2018
2020-05-07
密歇根大学
UMICH SI650 -情绪分类
https://www.kaggle.com/c/si650winter11
[
]33
桑德斯分析
GitHub
2011
2020-05-07
推特情感语料库
https://github.com/zfz/twitter_corpus
[
]34
国家卫生统计中心
2020-05-07
限制使用的生命统计数据
https://www.cdc.gov/nchs/nvss/nvss-restricted-data.htm
[
]35
多兰
SM
总值
SJ
Merkatz
红外
法伯尔
V
沙利文
LM
马龙
FD
行李搬运工人
特遣部队
尼伯格
达
康斯托克
CH
汉
GD
Eddleman
K
Dugoff
l
Craigo
SD
Timor-Tritsch
我
卡尔
老
乌尔夫
嗯
比安奇
DW
Dʼ奥尔顿
我
出生缺陷对早产和低出生体重的影响
妇产科
2007
110
2、第一部分
318
324
10.1097/01. aog.0000275264.78506.63
[
]36
路加福音
B
棕色(的)
MB
按妊娠、多胎和种族划分的婴儿死亡率风险变化:1989-1991年与1999-2001年
儿科
2006
12
118
6
2488
97
10.1542 / peds.2006 - 1824
17142535
118/6/2488
PMC3623686
[
]37
DeVellis
R
因素分析策略
规模发展:理论与应用
1991
加州纽伯里公园
圣人
[
]38
Elmstahl
年代
Gullberg
B
饮食评估方法的偏倚——共线性和测量误差对功效和观察到的相对风险的影响
国际流行病学
1997
10
26
5
1071
9
10.1093 / ije / 26.5.1071
9363530
[
]39
美国人口调查局
2020
2020-05-06
美国社区调查
https://www.census.gov/programs-surveys/acs
[
]40
R基金会
R项目
2020
2020-05-06
统计计算的R项目
https://www.r-project.org/
[
]41
阮
TT
纵纵横
年代
艾伦
我
针对
毫米
显象
l
Trevino
R
Dasari
年代
阮
质量控制
骄傲、爱和推特咆哮:结合机器学习和定性技术来理解我们的推文揭示了美国的种族
环境与公共卫生
2019
05
18
16
10
1766
10.3390 / ijerph16101766
31109051
ijerph16101766
PMC6571562
[
]42
得知崔
DH
Clouston
年代
Hatzenbuehler
毫升
克莱默
先生
库珀
HLF
威尔逊
SM
Stephens-Davidowitz
如果
黄金
RS
链接
BG
基于互联网的地区种族主义测量与黑人死亡率之间的关系
《公共科学图书馆•综合》
2015
4
24
10
4
e0122963
10.1371 / journal.pone.0122963
25909964
玉米饼- d - 14 - 40827
PMC4409363
[
]43
Wadhwa
PD
Culhane
摩根富林明
Rauh
V
勇敢的
党卫军
霍根
V
睡魔
CA
Hobel
CJ
Chicz-DeMet
一个
Dunkel-Schetter
C
Garite
TJ
格林
l
压力,感染和早产:生物行为学的观点
儿科围产期流行病学
2001
07
15附录2
17
29
10.1046 / j.1365-3016.2001.00005.x
11520397
ppe005
[
]44
Gemmill
一个
也包括
R
凯西
晶澳
Karasek
D
Alcala
他
Elser
H
托雷斯
JM
美国拉丁裔妇女早产与2016年总统大选的关联
JAMA网络公开赛
2019
07
03
2
7
e197084
10.1001 / jamanetworkopen.2019.7084
31322687
2738344
PMC6647358
[
]45
壮族
Y
壮族
K
杨
T
社会凝聚力对健康至关重要
国际公平与健康
2013
10
28
12
87
10.1186 / 1475-9276-12-87
24165541
1475-9276-12-87
PMC4174898
[
]46
Gordeev
VS
伊根
米
社会凝聚力、社区复原力和健康:来自社区新政方案的证据
《柳叶刀》
2015
11
386
S39
10.1016 / s0140 - 6736 (15) 00877 - 6
[
]47
威廉姆斯
博士
劳伦斯
晶澳
戴维斯
英航
种族主义和健康:证据和需要的研究
公共卫生年度报告
2019
04
01
40
105
125
10.1146 / annurev - publhealth - 040218 - 043750
30601726
PMC6532402
[
]48
第二
米
种族化对医疗保健的溢出效应:奥巴马总统如何通过种族态度和种族使公众舆论两极分化
美国政治学杂志
2012
56
3.
690
704
10.1111 / j.1540-5907.2011.00577.x
[
]49
Debbink
国会议员
贝德
医学博士
密歇根州大都市区的种族居住隔离和低出生体重
公共卫生
2011
09
101
9
1714
1720
10.2105 / ajph.2011.300152
[
]50
威廉姆斯
广告
华莱士
米
贵族
C
Mendola
P
美国死产的种族居住隔离和种族差异
健康的地方
2018
05
51
208
216
10.1016 / j.healthplace.2018.04.005
29715639
s1353 - 8292 (18) 30157 - 6
PMC6287738
[
]51
翼
SD
日常生活中的微侵犯:种族、性别和性取向
2010
霍博肯,新泽西
约翰威利父子公司
[
]52
马德拉
J
Colella
AJ
王
海尔哥哥
对施暴者的影响
牛津工作场所歧视手册
2018
纽约,纽约
牛津大学出版社
[
]53
彼得森
EE
戴维斯
问
家长
D
考克斯
年代
Syverson
C
种子
K
Shapiro-Mendoza
C
卡拉汉
WM
巴菲尔德
W
妊娠相关死亡的种族/族裔差异——美国,2007-2016年
《凡人周刊
2019
09
06
68
35
762
765
10.15585 / mmwr.mm6835a3
31487273
PMC6730892
[
]54
国家科学院、工程院和医学院
行动中的社区:实现卫生公平的途径
2017
华盛顿
美国科学院出版社
[
]55
格林伍德
年代
佩兰
一个
达根
米
皮尤研究中心
2016
2020-05-05
2016年社交媒体更新
http://downtowndubuque.org/wp-content/uploads/2017/01/Social-Media-Update-2016.pdf