发表在6卷第三名(2020): Jul-Sep

本文的预印本(早期版本)可在https://preprints.www.mybigtv.com/preprint/17103,首次出版
从推特数据评估的州级种族态度与不良出生结果之间的关系:观察性研究

从推特数据评估的州级种族态度与不良出生结果之间的关系:观察性研究

从推特数据评估的州级种族态度与不良出生结果之间的关系:观察性研究

原始论文

1美国加州大学旧金山分校家庭与社区医学系

2情报与安全应用研究实验室,马里兰大学,帕克学院,美国

3.美国马里兰大学公共卫生学院流行病学和生物统计系

4美国加州大学旧金山分校流行病学和生物统计学系

5美国加州大学伯克利分校社区健康科学和流行病学分部

通讯作者:

Nguyen Thu T, SCD, MSPH

家庭与社区医学系“,

加州大学旧金山分校

波特雷罗大道1001号

80号楼,83区

旧金山,加利福尼亚州,94110

美国

电话:1 6179639595

电子邮件:thu.nguyen@ucsf.edu


背景:在美国,出生结果上的种族差异持续存在,而且一直在扩大。人际种族主义和结构性种族主义是出生结果中持续存在的种族差异的主要解释,但确认种族主义的作用和评估种族主义对健康结果影响趋势的研究一直受到衡量种族主义的挑战的阻碍。大多数关于歧视的研究都依赖于自我报告的歧视经历,很少有研究在美国国家层面考察种族态度和偏见。

摘要目的:这项研究旨在调查与种族或少数民族相关的州级推特情绪与出生结果之间的关系。

方法:我们利用Twitter的流媒体应用程序编程接口,从2015年6月到2017年12月收集了26,027,740条推文,其中包含至少一个与种族相关的术语。情感分析使用支持向量机进行,这是一种有监督的机器学习模型。我们构建了对少数民族和对特定种族群体的情绪的总体指标。每一年,各州推特上的情绪数据都与当年的出生数据合并。研究参与者是2015年至2017年期间无先天性异常的单胎分娩妇女,她们的胎龄(n=9,988,030)或出生体重(n=9,985,402)数据可用。主要结局为低出生体重(出生体重≤2499 g)和早产(胎龄<37周)。我们使用对数二项回归模型估计了控制个体层面的产妇特征(社会人口学、产前护理和健康行为)和州级人口学的发病率。

结果:将机器学习模型与手动标记的推文进行比较,识别负面情绪的准确性为91%。与生活在最低生育率州的母亲相比,生活在提及种族或少数民族负面情绪推文最高生育率州的母亲,低出生体重(高8%,95% CI 4%-13%)和早产(高8%,95% CI 0%-14%)的发生率更高。在总人口中,包括非西班牙裔白人和种族或少数民族在内,更多涉及少数民族的负面推文与不良出生结果有关。在分层亚组分析中,更多涉及特定种族或少数民族群体(黑人、中东人和穆斯林)的负面推文与黑人和少数民族的不良生育结果有关。

结论:与种族相关的负面社会背景与少数种族或少数民族以及非西班牙裔白人的不良生育结果有关。

JMIR公共卫生监测2020;6(3):e17103

doi: 10.2196/17103

关键字



早产和低出生体重是婴儿死亡和儿童残疾的主要原因[12].在美国,出生结果的种族差异一直存在。3.4]并且一直在扩大[5].2017年,非西班牙裔白人母亲的早产率为9.05%,而黑人母亲的早产率为13.93%。从2006年到2016年,黑人婴儿的LBW率一直是非西班牙裔白人婴儿的两倍多[6].产妇保健行为、产前护理是否充足以及社会人口学特征并不能完全解释所观察到的差异[3.].越来越多的证据表明,种族偏见可能在一定程度上导致了这些持续存在的差异[3.78].

传统上,歧视经历是在个人层面上通过自我报告来评估的[910].自我报告的种族态度和信仰受到许多限制,包括社会期望偏见和自我审查[1112],风险暴露评估无效[1314].种族歧视的自我报告可能受到多种因素的影响,包括应对(如否认)、基于性格特征或状态的方面(如污名意识和基于种族的拒绝敏感性)以及种族认同的方面(如内化的种族主义)[13].虽然个人自我报告的歧视经历可以提供重要信息,但一个地方的社会气候是种族偏见和歧视的一个有利方面,它可能对健康产生独立于个人层面的影响。因此,仅依赖个人自我报告的数据可能会低估种族主义对健康的影响。

歧视可能通过几种机制影响不良的生育结果。例如,歧视的经历可能会激活应激反应,如果长期经历,可能会导致不良的分娩结果。母亲的压力可能通过以下三个主要途径影响分娩结果:(1)改变神经内分泌功能,从而激活促进分娩的母-胎盘-胎儿内分泌系统[1516];(2)改变免疫功能,导致对感染和炎症反应的易感性增加[17];(3)适应不良应对行为,如吸烟、饮酒[18].还有一种假设认为,歧视会通过获得教育、就业、医疗保健和住房等资源来影响出生结果[3.,但这些都是长期的过程。

一项创新研究强调了与种族或民族相关的事件的潜在影响,这种事件在背景层面的社会气候中产生了变化。作者调查了2008年爱荷华州波斯特维尔联邦移民突袭后的生育结果,这在当时是美国历史上最大的单一地点突袭[19].将爱荷华州突袭后37周内出生的婴儿的出生体重与一年前相同的37周期间进行比较,拉丁裔母亲,包括在美国出生的拉丁裔母亲,在突袭后生下低体重婴儿的风险增加了24%。非拉丁裔白人母亲的LBW没有变化。研究人员进行了州级的分析,发现不仅在波斯特维尔,而且在爱荷华州也有估计的影响。另一项研究发现,2001年9月11日恐怖袭击后的6个月与一年前的6个月相比,阿拉伯姓氏的妇女患低体重或早产的风险有所增加[20.].这些研究为社会环境对受影响社区健康的潜在影响提供了证据。

社交媒体是公共卫生研究中未充分利用的数据来源。每天有数百万条推文被发送,90%的推特用户已经公开了他们的个人资料[21].在网络空间中,人们表达各种各样的观点和信仰,包括那些与种族有关的观点和信仰。此外,研究表明,网络空间提供的匿名感让人们更有勇气表达自己在面对面交流时可能不会说出的观点。22].这些方面使得社交媒体成为捕捉敏感话题(如与种族有关的讨论)的有吸引力的来源。

之前的研究使用推特数据来研究主题,比如疫苗接种[23]以及在营养、运动和幸福方面的国家模式[24],并进行健康监察[25].然而,对社交媒体上的种族和种族主义等敏感话题进行调查的研究很少,以前使用社交媒体数据研究种族主义的研究主要集中在仇恨言论[26]和种族歧视[27].

为了提供一种与种族或民族相关的社会气候测量方法,并解决先前自我报告的个人层面测量方法的局限性,我们开发了一种新的区域层面的种族情绪测量方法,并研究了其与LBW和早产的关系。我们采取了广泛的方法,收集了涉及种族或民族群体的推文,而不仅仅是仇恨言论或使用种族歧视的推文。然而,传统上被视为种族歧视的术语可以以非贬义的方式使用,这种重新使用在Twitter上很常见。例如,在流行文化中,“黑鬼”一词经常被用作没有价值的群体术语[27].此外,传达种族情绪的讨论可以在不使用种族歧视的情况下进行。对使用种族相关术语的推文进行更全面的检查可能包括对使用种族侮辱以及“黑人”、“非洲裔美国人”或“亚洲人”等中性种族术语的推文进行情绪分析。在之前的一篇论文中,我们研究了2015年从推特数据中得出的种族情绪与不良出生结果之间的关系[28].在本文中,我们提高了机器学习模型的准确性,以标记推文的情绪,将推文的样本量增加了20倍,并使用多年而不是一年的推特和出生结果数据来检查关系。


Twitter数据

从2015年6月到2017年12月,使用Twitter的流媒体应用程序编程接口,随机收集了1%的公开推文样本。分析包括来自美国的英语推文,这些推文带有经纬度坐标或其他“地点”属性,可以识别推文关联的州。样本中包含的所有推文还使用了518个与种族相关的关键字中的一个或多个(多媒体附件1).这些词汇是根据美国人口普查中使用的种族分类,以及之前对与种族有关的在线对话的研究汇编而成。2729],以及一个种族歧视的在线数据库[30.].根据所使用的关键词,推文被分为以下五个主要种族或民族类别:黑人、西班牙裔、亚裔、白人和中东人。中东类别包括反伊斯兰或与穆斯林有关的推文。

对Twitter数据进行了清理和处理,以便进行分析。我们根据“tweet_id”删除了重复的推文。我们确定了倾向于检索无关推文的排除词,如“黑烟”和“印度路”。为了防止来自少数非常频繁的用户的不适当影响,我们排除了数据集中每年发布超过1000次推文的用户的推文,这些用户占所有推文的3%至4%。我们总共收集了2,498,717名推特用户的26,027,740条推文。这项研究被加州大学旧金山分校的机构审查委员会确定为豁免。

情绪分析

我们使用支持向量机(SVM),一种有监督的机器学习模型来标记推文。我们从手动标记的Sentiment140 (n=498) [31], Kaggle (n=7086) [32],桑德斯(n=5113) [33]和6481条我们研究小组标记的推文。Sentiment140、Kaggle和Sanders数据集是公开可用的训练数据集,专门用于情感分析。在我们的初步分析中,我们将负面推文(赋值为1)与所有其他正面或中性推文(赋值为0)进行了比较。我们使用五重交叉验证来评估模型性能,并达到了较高的负面分类准确率(91%)和较高的F1分数(84%)。推文也被标记为积极或不积极。我们同样使用了五重交叉验证,准确率为89%,F1分数为81%。通过对不同种族或民族的推文的二分情绪进行平均,创建了州级情绪变量。

个人健康数据

我们使用了2015-2017年有地理标识符的受限美国出生文件的数据作为个人层面的出生结果数据。这些文件是在向国家卫生统计中心提交研究计划并获得数据访问批准后获得的[34].分析仅限于没有先天性异常的单胎分娩。先天性异常[35双胞胎、三胞胎和其他高阶多胞胎会增加LBW和早产的风险[36].主要结局为LBW(定义为出生体重≤2499 g)和早产(定义为胎龄<37周)。早产模型包括9,988,030例出生数据,低出生模型包括9,985,402例出生数据。

协变量

我们调整了种族情绪和出生结果之间的潜在混杂因素。个体层面的母亲特征包括出生年份、母亲年龄(19岁、25岁、29岁、33岁和38岁有节的线性样条)、种族(白人、非西班牙裔;黑色,非西班牙裔;美国印第安人/阿拉斯加原住民,非西班牙裔;亚洲、非西班牙裔;夏威夷原住民/太平洋岛民,非西班牙裔;多种族,非西班牙裔),西班牙裔,婚姻状况(已婚/未婚),教育程度(低于高中,高中或通识教育发展[GED],一些大学,学士学位,硕士学位或博士学位),身体质量指数(kg/m)2)、怀孕期间吸烟(第一、第二或第三个月)、第一次分娩(是/否)和前三个月开始产前护理(是/否)。我们还对州级特征进行了调整,包括非西班牙裔黑人和西班牙裔人的比例、人口密度(每平方英里)、南部州指标(是/否)和经济劣势(标准化因素评分[3738]总结如下变量[%]:失业;一些大学教育程度、高中学历、贫困儿童、单亲家庭和家庭收入中位数),以解释各州在人口和经济特征上的构成差异。因子评分的使用已于先前发表[24].州级协变量来源于2013年至2017年美国社区调查的5年估计[39].

统计分析

每年,州级对种族或少数民族的情绪都与当年的出生数据融合在一起。我们使用对数二项回归模型估计发病率(IRs),控制了个体层面的母亲特征和州层面的人口特征。在我们的主要分析中,我们使用与种族相关的术语对推文的负面情绪进行建模,但在敏感性分析中,我们对负面情绪与积极情绪的比率进行了建模,以检查结果是否适用于建模不同的情绪极性。我们在P< . 05。使用Stata MP 15 (StataCorp LP, College Station, Texas, USA)进行统计分析,使用R软件(R Foundation for statistical Computing, Vienna, Austria)进行制图[40].


从2015年到2017年,我们收集了26,027,740条推文,其中包含至少一个与种族或民族有关的关键词。在评估的518个词汇中,有20个词汇出现在75%的推文中,涉及到某个种族或少数民族群体。排在前几位的推特词汇是“黑鬼/黑鬼”(13561626 / 26027740,52.10%)、“种族主义者”(1070770 / 26027740,4.11%)、“墨西哥人”(620957 / 26027740,2.39%)、“白人”(514111 / 26027740,1.98%)和“中国人”(498,775/ 26027740,1.92%)(表1).此外,还有15,683,909条关于黑人的推文,1,801,780条关于亚洲人的推文,1,577,568条关于白人的推文,1,512,566条关于西班牙裔的推文,1,274,827条关于中东人的推文(表2).我们之前研究过使用种族相关关键词的推文新主题[41].简而言之,对于负面情绪的推文,推文的范围从抱怨日常生活中的麻烦(例如,“我讨厌人们像黑鬼一样晚加入体育运动”)到使用贬损语言的种族侮辱(例如,“中东/阿拉伯口音比大多数事情都更让我生气”),以及罕见的表达敌意或提及暴力的推文(例如,“如果他们在亚利桑那举着墨西哥国旗,他们就应该被逮捕。”)在负面情绪的推文中,“黑鬼”一词很常见。然而,推特用户经常把这个词随意用作俚语。

表1。推特热门词汇。
术语 Tweets (N=26,027,740), N (%)
黑鬼 8300511 (31.89)
黑鬼 5261115 (20.21)
种族主义 1070770 (4.11)
墨西哥 620957 (2.39)
白人 514111 (1.98)
中国人 498775 (1.92)
种族歧视 422279 (1.62)
穆斯林 381601 (1.47)
亚洲 312520 (1.20)
穆斯林 259998 (1.00)
日本 238588 (0.92)
移民 214416 (0.82)
印度 193782 (0.74)
伊斯兰教 189739 (0.73)
叙利亚 181771 (0.70)
白人女孩 180426 (0.69)
犹太人 170040 (0.65)
贫民窟 167128 (0.64)
难民 165674 (0.64)
黑人 163062 (0.63)

中显示了负面情绪推文和正面情绪推文的地理分布多媒体附件2而且多媒体,分别。在美国东南部地区,负面推文的聚类比例较高(多媒体附件2)和美国西部地区正面推文比例较高的聚类(多媒体).推特衍生的种族情绪测量在表2.大约40.33%(9,657,039/23,945,052)使用种族相关术语的推文被归类为负面。与中东人相关的推文负面情绪比例最高(638,688/1,274,827,50.10%),而与亚洲人相关的推文负面情绪比例最低(113,172/1,801,780,6.28%)。2015 - 2017年分娩母亲的人口学特征为表3.母亲的平均年龄为29岁,59.74%(6,466,521/10,824,077)已婚,85.99%(9,578,803/11,139,992)至少完成了高中教育。此外,6.37%(717,541/11,272,819)的无先天性异常的单胎婴儿出生时体重不足,7.91%(891,628/11,273,872)出生时早产。

表2。对推特中使用的种族相关术语的负面情绪。
与种族有关的术语 推文数量 负面情绪推文数(%)
少数民族 23945052年 9657039 (40.33)

黑人 15683909年 7073443 (45.10)
中东人 1274827年 638688 (50.10)
拉美裔人 1512566年 172433 (11.40)
亚洲人 1801780年 113172 (6.28)
白人 1577568年 700440 (44.40)
表3。2015 - 2017年产妇分娩特征
特征 平均值(SD)或n/ n (%)
年龄、年 28.6 (5.82)
结婚了 6466521/10824077 (59.74)
白,非西班牙裔 5852869/11187000 (52.32)
黑色,非西班牙裔 1600020/11187000 (14.30)
亚洲、非西班牙裔 717706/11187000 (6.42)
拉美裔种族 2666823/11187000 (23.84)
我们出生 8645413/11257974 (76.79)
教育

不到高中 1561190/11139992 (14.01)

高中 2829005/11139992 (25.40)

一些大学 3238463/11139992 (29.07)

大学 2221480/11139992 (19.94)

硕士或博士 1289855/11139992 (11.58)
生的结果

出生体重低 717541/11272819 (6.37)

早产 891628/11273872 (7.91)

州级的种族情绪与低出生体重和早产有关。在整个人口中,与生活在负面情绪最低(第一不育点)的州相比,生活在负面推文提及少数民族最高水平(第三不育点)的州的母亲,其LBW发生率(95% CI 1.04-1.13)和早产发生率(95% CI 1.00-1.14)分别高出8%和8%。表4).在调查种族或少数民族的分娩结果时,影响的方向和大小是相似的,在种族或少数民族的母亲中,提及种族或少数民族的负面推文与LBW增加13% (95% CI 1.06-1.21)和早产增加10% (95% CI 1.05-1.16)相关。

研究了对特定群体的情绪,我们发现,提到中东人的负面推文最高水平(第三百分位数)的国家与少数种族或少数民族中LBW的发生率较高相关(IR 1.07, 95% CI 1.02-1.12)。更多关于黑人的负面推文(IR 1.08, 95% CI 1.03-1.14)与黑人母亲中LBW的更高发病率相关(表5).早产也有类似的影响。虽然提及白人的推文情绪与白人母亲的分娩结果无关,但提及种族或少数民族的推文情绪与非西班牙裔白人母亲的LBW (IR 1.08, 95% CI 1.03-1.14)和早产(IR 1.08, 95% CI 1.00-1.17)的更高发病率相关(表5).

随着时间的推移,在研究负面情绪和出生结果之间的关系时,有证据表明,针对黑人的情绪和年份之间存在相互作用。因此,我们呈现了LBW和早产比例和数量的绝对差异表6引用黑人的负面推文与黑人母亲的生育结果之间的关联,以及引用种族或少数民族的推文与整个人口的生育结果之间的关联。对于黑人母亲来说,随着时间的推移,这种联系变得更加强烈。例如,2015年,生活在负面推文提及黑人比例最高的州的黑人母亲的体重体重比例相差0.65%,与生活在负面情绪最低的州的黑人母亲的体重体重比例相比,多出了3039个婴儿。2017年,这一差距增加到1.82%,即8711磅重的婴儿。

表4。国家层面对种族或少数民族的情绪和个人层面的生育结果。
州级twitter派生变量(与种族相关的负面推文的字节) 出生体重低a、b
发病率(95% CI)或n
早产a、b
发病率(95% CI)或n
总样本


第二百分位与第一百分位(最低) 1.08 (1.03 - -1.13) 1.09 (1.04 - -1.13)

第三tertile 1.08 (1.04 - -1.13) 1.08 (1.00 - -1.14)

数量 9985402年 9988030年
少数民族


第二百分位与第一百分位(最低) 1.12 (1.04 - -1.19) 1.10 (1.05 - -1.15)

第三tertile 1.13 (1.06 - -1.21) 1.10 (1.05 - -1.16)

数量 4920300年 4921577年
白人


第二百分位与第一百分位(最低) 1.07 (1.02 - -1.12) 1.09 (1.03 - -1.15)

第三tertile 1.08 (1.03 - -1.14) 1.08 (1.00 - -1.17)

数量 5407779年 5409230年

一个健康结果的数据来源是2015年、2016年和2017年的出生档案。推文收集时间为2015年6月至2017年12月。

b调整后的对数二项模型分别用于每个结果。模型控制年份和州级因素,包括非西班牙裔黑人比例、西班牙裔比例、南部州指标、人口密度和经济劣势(概括以下变量的标准化因素评分[%]:失业、部分大学学历、高中学历、贫困儿童、单亲家庭、家庭收入中位数)以及个人层面的因素,包括母亲年龄、性别、种族、民族、外国出生、教育程度、婚姻状况、是否吸烟、身体质量指数、头胎状况和产前护理。推特衍生的特征被分类为词条,以最低的词条作为参照组。会报告集群调整错误。

表5所示。州级情绪与亚组生育结果之间的分层分析。
对特定群体的州一级情绪(负面推文的单位) 出生体重低a、b
发病率(95% CI)或n
早产a、b
发病率(95% CI)或n
中东人和穆斯林(少数民族)


第二百分位与第一百分位(最低) 1.09 (1.04 - -1.14) 1.07 (1.03 - -1.12)

第三tertile 1.07 (1.02 - -1.12) 1.05 (1.02 - -1.09)

数量 4920300年 4921577年
黑人


第二百分位与第一百分位(最低) 1.10 (1.04 - -1.17) 1.10 (1.06 - -1.16)

第三tertile 1.08 (1.03 - -1.14) 1.09 (1.04 - -1.15)

数量 1413336年 1413938年
拉美裔人


第二百分位与第一百分位(最低) 0.96 (0.87 - -1.06) 0.96 (0.94 - -0.99)

第三tertile 0.96 (0.89 - -1.04) 0.90 (0.84 - -0.97)

数量 2254029年 2254401年
亚洲人


第二百分位与第一百分位(最低) 0.98 (0.91 - -1.04) 1.02 (0.97 - -1.07)

第三tertile 1.03 (0.93 - -1.13) 1.10 (1.00 - -1.21)

数量 599580年 599769年
白人


第二百分位与第一百分位(最低) 1.01 (0.97 - -1.04) 1.00 (0.96 - -1.03)

第三tertile 1.02 (0.97 - -1.07) 0.98 (0.93 - -1.04)

数量 5407779年 5409230年

一个健康结果的数据来源是2015年、2016年和2017年的出生档案。推文收集时间为2015年6月至2017年12月。

b调整后的对数二项模型分别用于每个结果。模型控制年份和州级因素,包括非西班牙裔黑人比例、西班牙裔比例、南部州指标、人口密度和经济劣势(概括以下变量的标准化因素评分[%]:失业、部分大学学历、高中学历、贫困儿童、单亲家庭、家庭收入中位数)以及个人层面的因素,包括母亲年龄、性别、种族、民族、外国出生、教育程度、婚姻状况、是否吸烟、身体质量指数、头胎状况和产前护理。推特衍生的特征被分类为词条,以最低的词条作为参照组。会报告集群调整错误。

表6所示。生活在负面种族情绪最高的州和生活在最低的州的母亲之间,低出生体重和早产的绝对数量和比例的差异。
一年 低出生体重,n/ n (%) 早产,n/ n (%)
总计一个 黑色的b 总计一个 黑色的b
2015 11712/3444706 (0.34) 3039/469659 (0.65) 14261/3444783 (0.41) 3466/470019 (0.74)
2016 23598/3506457 (0.67) 3391/477984 (0.71) 23737/3506174 (0.68) 4415/478272 (0.92)
2017 10490/3040622 (0.35) 8711/479384 (1.82) 16827/3037346 (0.55) 7060/465674 (1.52)

一个对于整个样本来说,曝光率是关于种族或少数民族的负面情绪推文。

b对于黑人母亲的样本,曝光是指针对黑人的负面情绪推文。

敏感性分析通过对消极情绪与积极情绪的比例建模进行,以调查研究结果是否适用于建模不同的情绪极性。调查结果显示了类似的模式(多媒体附件4)与单独建模负面情绪的结果相比,在后者中,对少数种族或少数民族发布负面推文的比例大于正面推文的州,LBW和早产的发生率更高。


这项研究发现,在推特上表达的对种族和少数民族的负面情绪与LBW和早产有关。这些不良关联在所有出生人口,非西班牙裔白人母亲的出生,以及整个种族或少数民族的出生中都是相似的。针对黑人的负面推文与黑人母亲的不良分娩结果有关。同样,针对中东人的负面推文也与少数民族的不良生育结果有关。针对非西班牙裔白人或西班牙裔母亲的负面推文并没有始终观察到相关性。虽然在2015年至2017年期间,这种关联趋于稳定,但对于黑人母亲来说,随着时间的推移,提及黑人的种族情绪与不良分娩结果之间的关联越来越强。

这是少数几篇利用社交媒体数据评估种族气候与健康结果关系的论文之一。此外,我们是在国家基础上计算的,并考虑了个人特征。结果与先前的工作一致,表明社区层面的种族气候与出生结果有关[1920.]和死亡率[42]在这个地区。压力已被确定为歧视可能影响健康的一个途径,它是一个已知的不利出生结果的风险因素[43].然而,其他途径是可能的,包括获得教育、就业、保健和住房等资源[3.].

以前的研究已经为社会环境对社区健康的影响提供了证据。过去的研究比较了单一地点移民突袭前后的出生结果[19]、2001年9月11日的恐怖袭击[20.],以及2016年总统大选[44]并发现这些事件后少数民族人口的不良出生结果增加。这些研究的一个局限性是没有测量社会背景。因此,我们不能直接评估区域层面的种族偏见是否解释了事件和出生结果之间的关联。制定地方层面的种族偏见措施将推动该领域的发展,并为调查社会背景在塑造健康和健康差异方面的作用提供新的机会。

我们的结果表明,提及少数种族或少数民族的负面情绪推文影响了包括非西班牙裔白人在内的总人口。先前关于种族偏见和歧视的研究往往只考察了对少数种族和少数民族的影响。这项研究不同寻常,因为它调查了整个人口的健康结果。敌视少数种族和少数民族的社会气氛可能会造成一种对包括白人在内的所有人都有害的环境。这与先前的工作一致,表明社会凝聚力促进人口健康[4546].对少数种族和少数民族的敌意可能导致对共享资源和可能有利于白人和其他种族和少数民族的社会政策和项目的支持退出。4748].先前的研究发现,生活在黑人隔离地区的黑人母亲和白人母亲的生育结果都不佳。4950].有一些研究调查了种族主义对犯罪者的负面认知和情感影响[5152].

尽管在过去的一个世纪中,所有群体的不良出生结果率都有所下降,但明显的种族差异仍然存在。许多其他结果也存在类似的差异,包括孕产妇死亡率[53]以及许多成人疾病和死亡原因[54].人际和结构性种族主义是健康方面持续存在的种族差异的主要解释,但确认种族主义因果作用和评估种族主义对健康结果影响趋势的研究一直受到衡量种族主义的挑战的阻碍。我们的方法具有重要的优势,它易于测量和监测,不依赖于自我报告,可在全国范围内使用,并有可能在全球推广。

然而,这项研究也有一些局限性。这些分析没有考虑居住历史和个人在当前社区生活的时间长短。收集的数据代表了人们愿意在推特上表达的内容。推特用户并不能代表美国人口,与美国人口相比,推特用户中年轻人的比例更高[55].然而,随着时间的推移,社交媒体的使用一直在稳步增长。通过手机访问互联网和社交媒体使来自各个社会经济阶层的人都能参与社交媒体。

虽然情绪分析对建立一个区域层面的种族情绪测量做出了重大贡献,但情绪分析也有重要的局限性。情绪分析使用整条推文来评估推文的情绪或情感基调,而不是只关注推文中提到的种族术语。同样,手动标记推文以为机器学习算法提供训练数据的程序员,将推文的情感基调标记为一个整体。因此,虽然推文的语气可能是消极的,但推文中提到的种族或民族可能不是这种消极的主题,这在许多推文中都是如此。此外,推文的情感基调可能显示出一种负面情绪,但它不一定表达一种偏见的言论,这在我们的数据中也很常见。我们之前的研究表明,带有偏见的推文可能与推文本身的情绪截然不同[41].对于一些推文,负面情绪也表达了负面的种族态度或偏见信仰(例如“中东/阿拉伯口音比大多数事情都更让我生气。”)然而,也有一些负面情绪推文使用了与种族相关的术语,但没有表达偏见信仰。我们通常用“黑鬼”这个词来表示(例如,“看不了(职业篮球队)比赛”。这些黑鬼无聊的AF”)。我们也遇到过一些情绪积极的推文,但他们表达了一种偏见的信仰或种族或民族的刻板印象(例如,“一定是雇了一个墨西哥清洁工。浴室里有一股非常干净的味道”)。无论如何,在我们的研究中观察到的关联似乎捕捉到了一个与种族态度和出生结果的平均水平相关的信号。未来的工作需要开发模型来捕捉与种族相关的主题和情绪,并将基于twitter的种族背景描述与其他结构性或人际种族主义措施相一致。

这项研究有助于新生的关于种族态度和偏见的地方水平指标的文献。虽然不全面,但我们对种族情绪的衡量可能代表了母亲所处的更广泛的社会和文化背景的一个信号。与传统的种族态度或偏见调查相比,从Twitter收集的数据可能是独特的。社交媒体可以提供对包括种族态度在内的一系列话题的观点的丰富及时数据来源。这项研究表明,对少数民族的种族气候可能对少数种族或少数民族以及整个人口有影响。促进尊重、积极和包容的社会气候可能对广大人口的生育结果产生有益的健康影响。

致谢

这项研究使用了国家药物滥用研究中心的国家药物早期预警系统协调中心收集的推特信息语料库。这项研究得到了美国国立卫生研究院(NIH)国家少数民族健康和健康差异研究所(奖励编号:R00MD012615) (Nguyen, T, PI博士)的支持,NIH的大数据到知识计划(BD2K)赠款(5K01ES025433;R01LM012849)和NIH公共信用试点计划(批准号:CCREQ-2016-03-00003) (Nguyen, Q, PI博士)。资助者在研究的设计中没有任何作用;分析:在数据的收集、分析或解释中;写作:在手稿的写作中;或者决定是否公布结果。

利益冲突

没有宣布。

多媒体附件1

用于Twitter数据收集的术语。

DOCX文件,26 KB

多媒体附件2

2015-2017年使用种族相关术语的负面情绪推文的地理分布。

DOCX文件,245 KB

多媒体

2015-2017年使用种族相关术语的积极情绪推文的地理分布情况。

DOCX文件,245 KB

多媒体附件4

对种族或少数民族的消极情绪与积极情绪的比例以及个体层面的生育结果。

DOCX文件,19kb

  1. 西方发达国家婴儿死亡率和出生结果的社会决定因素:一项跨国系统综述。国际环境与公共卫生杂志2013年6月05日;10(6):2296-2335 [免费全文] [CrossRef] [Medline
  2. Hille ET, Ouden AL, Bauer L, Oudenrijn CV, Brand R, Verloove-Vanhorick SP.极早产儿和极低出生体重儿9岁时的学业表现:5岁时围产期危险因素和预测因素。中华儿科杂志1994年9月;125(3):426-434。[CrossRef
  3. Alhusen JL, Bower KM, Epstein E, Sharps P.种族歧视与不良出生结局:综合综述。J助产妇女健康2016年11月;61(6):707-720 [免费全文] [CrossRef] [Medline
  4. 马修斯T,麦克道曼M, Thoma ME。2013年相关出生/婴儿死亡数据集的婴儿死亡率统计。Natl Vital Stat Rep 2015 Aug 06;64(9):1-30 [免费全文] [Medline
  5. 马丁JA,汉密尔顿BE,奥斯特曼MJ,德里斯科尔AK。国家生命统计报告。海茨维尔,马里兰州:国家卫生统计中心;2018.出生人数:2017年最终数据https://www.cdc.gov/nchs/data/nvsr/nvsr67/nvsr67_08-508.pdf[2020-05-07]访问
  6. 沃马克LS,罗森LM,马丁JA。国家卫生统计中心。海茨维尔,马里兰州:国家卫生统计中心;2018.单胎低出生体重率,按种族和西班牙裔划分:美国,2006-2016https://stacks.cdc.gov/view/cdc/52611[2020-05-06]访问
  7. Black LL, Johnson R, VanHoose L.美国黑人女性种族主义/歧视与健康之间的关系:2003 - 2013年文献综述。[J] 2015年3月;2(1):11-20 [免费全文] [CrossRef] [Medline
  8. Giurgescu C, McFarlin BL, Lomax J, Craddock C, Albrecht a .种族歧视与不良出生结果的差异:综述。《助产妇女健康》2011;56(4):362-370 [免费全文] [CrossRef] [Medline
  9. 威廉姆斯DR,余Y,杰克逊JS,安德森NB。身心健康的种族差异:社会经济地位、压力和歧视。中华卫生心理杂志1997年7月;2(3):335-351。[CrossRef] [Medline
  10. 克里格·N,史密斯·K,奈沙哈姆·D,哈特曼·C,巴博·EM.歧视经历:自我报告测量在种族主义与健康人口健康研究中的有效性和可靠性。医学社会科学2005 10月;61(7):1576-1596。[CrossRef] [Medline
  11. Stocké V.调查对象对种族态度的社会可取性信念的决定因素和后果。方法2007年1月;3(3):125-138。[CrossRef
  12. 一个基点。社会期望偏见和种族/民族构成在教育和移民限制主义态度之间的关系中的作用。社会科学学报2019年12月9日;52(4):459-467。[CrossRef
  13. Nuru-Jeter AM, Michaels EK, Thomas MD, Reeves AN, Thorpe RJ, LaVeist TA。健康不平等研究中种族与社会经济地位的相对作用:一个解释问题。年度Rev公共卫生2018年4月1日;39:169-188。[CrossRef] [Medline
  14. 种族歧视和血压:年轻黑人和白人成年人的CARDIA研究。美国公共卫生杂志1996年10月;86(10):1370-1378。[CrossRef] [Medline
  15. 鲁伊斯RJ,富勒顿J,达德利DJ。孕妇应激、内分泌因素和炎症与妊娠期长的相互关系。妇产科调查2003;58(6):415-428。[CrossRef
  16. Viltart O, Vanbesien-Mailliot CC.产前压力对神经内分泌规划的影响。科学世界杂志2007年9月1日;7:1493-1537 [免费全文] [CrossRef] [Medline
  17. 王丽娟,王丽娟,王丽娟。孕期压力对早产的影响。2011年9月;38(3):351-384 [免费全文] [CrossRef] [Medline
  18. Eskenazi B, Marks A, Catalano R, Bruckner T, Toniolo p在纽约市和纽约北部的9·11事件后出生体重较低。嗡嗡再版2007年11月22日(11):3013-3020。[CrossRef] [Medline
  19. Novak NL, Geronimus AT, Martinez-Cardoso AM。在一次大规模移民突袭后,拉丁裔母亲所生婴儿的出生结果变化。国际流行病学杂志2017年6月1日;46(3):839-849 [免费全文] [CrossRef] [Medline
  20. 劳德黛尔DS。9·11前后加州阿拉伯名女性的生育结果。人口统计2006年2月;43(1):185-201。[CrossRef] [Medline
  21. 米斯拉夫,李曼,安Y, Onnela J, Rosenquist J.第五届国际AAAI会议论文集。2011年7月11日。了解Twitter用户的人口统计数据https://www.aaai.org/ocs/index.php/ICWSM/ICWSM11/paper/viewPaper/2816[2020-05-06]访问
  22. 在线去抑制效应。网络心理学报2004年6月;7(3):321-326。[CrossRef] [Medline
  23. Bahk CY, Cumming M, Paushter L, Madoff LC, Thomson A, Brownstein JS。公开可用的在线工具有助于实时监测疫苗对话和情绪。卫生Aff (Millwood) 2016年2月;35(2):341-347。[CrossRef] [Medline
  24. 阮国强,李丹,孟H, Kath S, Nsoesie E,李飞,等。从地理标记的推特数据建立一个国家社区数据集,用于幸福、饮食和体育活动指标。JMIR公共卫生监测2016年10月17日;2(2):e158 [免费全文] [CrossRef] [Medline
  25. Nsoesie E, Brownstein J.流感监测的计算方法:超越时效性。细胞宿主微生物2015 Mar 11;17(3):275-278 [免费全文] [CrossRef] [Medline
  26. 郭毅,王艳。人工智能学术会议论文集。2013。定位仇恨:检测针对黑人的推文https://www.aaai.org/ocs/index.php/AAAI/AAAI13/paper/viewPaper/6419[2020-05-06]访问
  27. 王晓燕,王晓燕,王晓燕。2014。反社交媒体网址:http://cilvektiesibas.org.lv/site/record/docs/2014/03/19/DEMOS_Anti-social_Media.pdf[2020-05-07]访问
  28. 阮婷,孟H, Sandeep S, McCullough M, Yu W, Lau Y,等。推特对美国少数民族情绪的测量(2015-2016年)以及与低出生体重和早产的关系。Comput Human behaviour 2018年12月;89:308-315 [免费全文] [CrossRef] [Medline
  29. 皮尤研究中心,2016。关于比赛的社交媒体对话网址:http://www.pewinternet.org/2016/08/15/social-media-conversations-about-race/[2020-05-07]访问
  30. 种族歧视数据库,2018。URL:http://www.rsdb.org/[2020-05-05]访问
  31. 范伟乐。统计学及其接口。2009。有关调解、干预和组合的概念问题URL:https://www.intlpress.com/site/pub/pages/journals/items/sii/content/vols/0002/0004/a007/[2020-05-07]访问
  32. Kaggle。:密歇根大学;2018.UMICH SI650 -情感分类https://www.kaggle.com/c/si650winter11[2020-05-07]访问
  33. 桑德斯分析。GitHub。2011.Twitter情感语料库网址:https://github.com/zfz/twitter_corpus[2020-05-07]访问
  34. 国家卫生统计中心。限制使用的生命统计数据网址:https://www.cdc.gov/nchs/nvss/nvss-restricted-data.htm[2020-05-07]访问
  35. Dolan SM, Gross SJ, Merkatz IR, Faber V, Sullivan LM, Malone FD,等。出生缺陷对早产和低出生体重的贡献。妇产科2007;110(2,第1部分):318-324。[CrossRef
  36. Luke B, Brown MB.婴儿死亡风险随妊娠、多胎和种族的变化:1989-1991年与1999-2001年。儿科2006年12月;118(6):2488-2497 [免费全文] [CrossRef] [Medline
  37. 因子分析策略。见:规模开发:理论与应用。加利福尼亚州纽伯里公园:Sage;1991.
  38. Elmståhl S, Gullberg B.饮食评估方法的偏差-共线性和测量误差对功率和观察到的相对风险的后果。国际流行病学杂志,1997年10月;26(5):1071-1079。[CrossRef] [Medline
  39. 美国人口普查局,2020年。美国社区调查网址:https://www.census.gov/programs-surveys/acs[2020-05-06]访问
  40. R基金会。R项目,2020年。统计计算R项目网址:https://www.r-project.org/[2020-05-06]访问
  41. 阮文涛,李志强,李志强,李志强,等。骄傲、爱和推特咆哮:结合机器学习和定性技术,了解我们的推文揭示了美国的种族问题。国际环境资源公共卫生2019年5月18日;16(10):1766 [免费全文] [CrossRef] [Medline
  42. 蔡德华,刘志强,刘志强,等。基于互联网的区域种族主义测量与黑人死亡率之间的关联。PLoS One 2015 april 24;10(4):e0122963 [免费全文] [CrossRef] [Medline
  43. Wadhwa PD, Culhane JF, Rauh V, Barve SS, Hogan V, Sandman CA,等。压力、感染和早产:生物行为学视角。儿科围产期流行病学2001年7月;15增刊2:17-29。[CrossRef] [Medline
  44. 张志刚,张志刚,张志刚,陈志刚,等。美国拉丁裔妇女早产与2016年总统大选的关系。2019年美国医学会网络公开赛7月03日;2(7):e197084 [免费全文] [CrossRef] [Medline
  45. 庄勇,庄凯,杨涛。社会凝聚力对健康的影响。Int J Equity Health 2013年10月28日;12:87 [免费全文] [CrossRef] [Medline
  46. Gordeev VS, Egan M.社会凝聚力、社区复原力和健康:来自社区新政方案的证据。柳叶刀2015年11月;386:S39。[CrossRef
  47. Williams DR, Lawrence JA, Davis BA。种族主义和健康:证据和需要的研究。年度修订公共卫生2019年4月01日;40:105-125 [免费全文] [CrossRef] [Medline
  48. 种族化对医疗保健的溢出效应:奥巴马总统如何通过种族态度和种族分化公众舆论。美国政治科学杂志2012;56(3):690-704 [免费全文] [CrossRef
  49. 德宾克议员,巴德博士。密歇根州大都市地区的种族居住隔离和低出生体重。中华医学会公共卫生杂志2011年9月;101(9):1714-1720。[CrossRef
  50. 威廉姆斯AD,华莱士M,诺布尔斯C,门多拉P.美国死产中的种族居住隔离和种族差异。健康场所2018年5月;51:208-216 [免费全文] [CrossRef] [Medline
  51. 翼SD。日常生活中的微侵犯:种族、性别和性取向。新泽西州霍博肯:John Wiley & Sons;2010.
  52. 对犯罪者的影响。在:科莱拉AJ,国王EB,编辑。牛津职场歧视手册。纽约州纽约:牛津大学出版社;2018.
  53. Petersen EE, Davis NL, Goodman D, Cox S, Syverson C, Seed K,等。与怀孕有关的死亡中的种族/民族差异——美国,2007-2016年。MMWR Morb Mortal Wkly Rep 2019年9月06日;68(35):762-765 [免费全文] [CrossRef] [Medline
  54. 国家科学、工程和医学科学院。社区在行动:卫生公平之路。华盛顿:国家科学院出版社;2017.
  55. 胡晓明,陈晓明,陈晓明。2016.皮尤研究中心。社交媒体更新2016网址:http://downtowndubuque.org/wp-content/uploads/2017/01/Social-Media-Update-2016.pdf[2020-05-05]访问


红外光谱:发病率比
激光焊:出生体重低


T·桑切斯编辑;提交18.11.19;同行评议:MG Kim, D Carvalho;对作者13.03.20的评论;修订版本收到02.04.20;接受16.04.20;发表06.07.20

版权

©Thu T Nguyen, Nikki Adams, Dina Huang, M Maria Glymour, Amani M Allen, Quynh C Nguyen。最初发表于JMIR公共卫生与监测(http://publichealth.www.mybigtv.com), 2020年7月6日。

这是一篇根据创作共用署名许可协议(https://creativecommons.org/licenses/by/4.0/)发布的开放获取文章,允许在任何媒介上不受限制地使用、分发和复制,前提是正确引用了首次发表在JMIR公共卫生和监测上的原创作品。必须包括完整的书目信息,http://publichealth.www.mybigtv.com上的原始出版物的链接,以及此版权和许可信息。


Baidu
map