JFR
JMIR表格
形成性研究
2561 - 326 x
卡塔尔世界杯8强波胆分析
加拿大多伦多
v6i1e33792
34870607
10.2196/33792
短论文
短论文
利用Twitter数据监测妊娠期COVID-19疫苗安全性:队列识别的概念验证研究
Eysenbach
冈瑟
Foufi
Vasiliki
伊斯兰教
默罕默德Nazrul
Beazely
迈克尔
黄
蒂娜
克莱因
Ari Z
博士学位
1
生物统计、流行病学和信息学学系
佩雷尔曼医学院
宾夕法尼亚大学
布洛克利大厦四楼
423守护者博士。
费城,宾夕法尼亚州,1904年
美国
1 215 746 1101
ariklein@pennmedicine.upenn.edu
https://orcid.org/0000-0002-8281-3464
奥康纳
凯伦
女士
1
https://orcid.org/0000-0001-7709-3813
Gonzalez-Hernandez
著
博士学位
1
https://orcid.org/0000-0002-6416-9556
1
生物统计、流行病学和信息学学系
佩雷尔曼医学院
宾夕法尼亚大学
费城,宾夕法尼亚州
美国
通讯作者:Ari Z Klein
ariklein@pennmedicine.upenn.edu
1
2022
6
1
2022
6
1
e33792
23
9
2021
4
11
2021
15
11
2021
22
11
2021
©Ari Z Klein, Karen O'Connor, Graciela Gonzalez-Hernandez。最初发表于JMIR Formative Research (https://formative.www.mybigtv.com), 06.01.2022。
2022
这是一篇在知识共享署名许可(https://creativecommons.org/licenses/by/4.0/)条款下发布的开放获取文章,该许可允许在任何媒体上不受限制地使用、分发和复制,前提是原始作品首次发表在JMIR Formative Research上,并适当引用。必须包括完整的书目信息,到https://formative.www.mybigtv.com上原始出版物的链接,以及版权和许可信息。
背景
妊娠期间感染COVID-19与孕产妇死亡、入住重症监护病房和早产风险增加有关;然而,由于缺乏安全性数据,许多孕妇拒绝接种COVID-19疫苗。
客观的
本初步研究的目的是评估Twitter数据是否可用于确定妊娠期COVID-19疫苗接种流行病学研究的队列。具体而言,我们研究了是否有可能确定报告(1)在怀孕期间或围孕期接种了COVID-19疫苗的用户,以及(2)其妊娠结局。
方法
我们开发了正则表达式来搜索2021年7月初之前在推特上宣布怀孕的用户发布的大量推文中关于COVID-19疫苗接种的报告。为了帮助确定用户是否在怀孕期间接种了疫苗,我们利用自然语言处理(NLP)工具来估计产前期间的时间框架。对于发布tweet的用户,时间戳表明他们在怀孕期间接种了疫苗,我们利用额外的NLP工具来帮助识别报告其怀孕结果的tweet。
结果
我们手动验证了自动检测到的推文内容,确定了150名在推特上报告他们在怀孕或围孕期至少接种了一剂COVID-19疫苗的用户。我们手工验证了60例(75%)妊娠中45例的至少一项报告结果。
结论
鉴于妊娠期COVID-19疫苗安全性数据的可得性有限,Twitter可以作为一种补充资源,潜在地提高妊娠人群对COVID-19疫苗接种的接受程度。这项初步研究的结果证明了可扩展方法的发展,以确定更大的流行病学研究队列。
自然语言处理
社交媒体
新型冠状病毒肺炎
数据挖掘
COVID-19疫苗
妊娠结局
介绍
妊娠期感染COVID-19与孕产妇死亡、入住重症监护病房和早产风险增加有关[
1 ];然而,在美国,怀孕期间接种COVID-19疫苗的比例很低[
2 ]。调查显示,怀孕期间拒绝接种COVID-19疫苗的最常见原因是缺乏安全性数据[
3. ,这是有限的,因为怀孕的人被排除在预先授权的临床试验之外。美国疾病控制与预防中心(CDC)最近根据自愿参加V-safe的参与者报告的疫苗接种后健康信息,发布了美国首个关于妊娠期COVID-19疫苗安全性的数据。
4 ]。美国疾病控制与预防中心表示,虽然初步数据没有显示任何明显的安全信号,但仍需要继续监测,特别是在妊娠早期和围孕期(最后一次月经前30天内)。疾病预防控制中心建议,关于妊娠期COVID-19疫苗安全性的更多证据对于提高妊娠人群对COVID-19疫苗的接受度至关重要[
2 ]。
在美国,42%的18-29岁的人和27%的30-49岁的人使用Twitter [
5 ]。我们之前的工作[
6 证明Twitter数据可以用来评估怀孕期间药物暴露的相关结果。因此,我们假设Twitter也可以作为评估怀孕期间接种COVID-19疫苗相关结果的数据来源。尽管用户生成的Twitter数据可能受到类似于CDC讨论的参与者报告数据的潜在限制[
4 (例如,选择偏倚、报告偏倚、误报、样本量小、关于其他风险因素的信息有限),目前其他数据来源的可用性非常有限。本初步研究的目的是评估Twitter数据是否可用于确定妊娠期COVID-19疫苗接种流行病学研究的队列。特别是,我们探讨了是否有可能确定报告(1)在怀孕期间或围孕期接种了COVID-19疫苗的用户,以及(2)其妊娠结局。
方法
宾夕法尼亚大学机构审查委员会对该研究进行了审查,并认为根据美国联邦法规第45节46.101第b段第4类,对公开可用的数据源(45 CFR§46.101(b)(4)),该研究豁免于人体受试者研究。
为了便于对Twitter上关于COVID-19疫苗接种的自我报告进行初步评估,我们开发了6个手写的高精度正则表达式,旨在匹配提到用户至少接种了一剂COVID-19疫苗的推文(
多媒体附录1 )。在前期工作中[
7 ],我们开发了一个自动的自然语言处理(NLP)管道,它可以检测Twitter流应用程序编程接口中宣布用户怀孕的推文,然后持续收集所有公开可用的推文。我们在这些用户发布到2021年7月初的tweet集合上部署了6个正则表达式。为了帮助确定用户是否在怀孕期间(或围怀孕期)接种了疫苗,我们手动将匹配正则表达式的tweet的时间戳与其产前期间的时间框架进行比较。为了帮助估计用户产前的时间范围,我们利用了在我们之前的工作中开发的自动NLP工具[
8 ],它使用一种基于规则的方法来搜索推特上关于婴儿的胎龄、预产期或出生日期的报告,并根据推特中的特定信息提取出怀孕开始和结束日期的估计。
对于那些在推特上发布时间戳表明他们在怀孕期间或围孕期接种了疫苗的用户,我们利用了在我们之前的工作中开发的额外的自动化NLP工具[
9 -
11 ],它使用监督分类来搜索推特上不良妊娠结果的报告,包括流产、死胎、早产、低出生体重、出生缺陷和新生儿重症监护病房入住。为了减少潜在的报告偏差,假设缺乏推文自我报告的不良妊娠结果代表没有不良结果,我们还部署了一个自动化的NLP工具,在我们之前的工作中开发[
12 ],在用户的推文中搜索婴儿出生在至少37周的报道(即用户至少怀孕37周,或预产期在3周或更短时间内),体重至少为5磅8盎司。至少37周的胎龄表明没有流产或早产。出生体重至少为5磅8盎司表明缺乏低出生体重,或者作为活产,流产或死产的报告。如果我们没有自动检测到明确报告孕龄至少为37周的推文,我们将手动分析在此期间发布的推文,以寻找用户仍怀孕的证据。
结果
我们手动验证了自动检测到的推文内容,确定了150名在推特上报告他们在怀孕或围孕期至少接种了一剂COVID-19疫苗的用户。
表1 给出了我们用来识别这150个用户的tweet示例。例如,用户1报告在2021年6月15日怀孕16周,因此我们的自动化工具[
8 估计怀孕始于2021年2月23日。用户1报告于2021年3月24日接种了COVID-19疫苗,大约在怀孕1个月后。用户2在2021年6月21日报告怀孕13周,我们的自动化工具[
8 估计怀孕始于2021年3月22日。用户2于2021年3月6日报告接种新冠疫苗,与围孕期相对应。在推特上
表1 还显示一些用户报告了疫苗制造商(如“#辉瑞疫苗”)或剂量号(如“第二种疫苗”),这有助于将mRNA疫苗与其他类型的疫苗区分开来。根据我们对这150名使用者产前期的估计,其中90人(60.0%)的怀孕可能正在进行中。我们手工验证了60例(75%)妊娠中45例的至少一项报告结果。
表2 给出了这45个用户报告的结果。
表1
表明在怀孕期间或围孕期接种COVID-19疫苗的推文样本。
微博
时间戳
怀孕开始
怀孕结束
用户1
我给这个世界带来了一个生命,这真是太不可思议了。# 16 weekspregnant
2021年6月15日
2021年2月23日
2021年11月30日
今天我接种了第一剂COVID疫苗,对科学感到非常兴奋和感激
2021年3月24日
2021年2月23日
2021年11月30日
用户2
我醒着是因为我已经怀孕13周了……嗯……”早上好 病”
2021年6月21日
2021年3月22日
2021年12月27日
昨晚我买了#辉瑞疫苗!
2021年3月7日
2021年3月22日
2021年12月27日
用户3
离预产期还有93天
2021年4月17日
2020年11月11日
2021年8月18日
我刚打了第二支疫苗。到目前为止我感觉还好……我祈祷这一天都是这样
2021年3月1日
2020年11月11日
2021年8月18日
用户4
我怀孕8个月了。我的家人和我一起开车去了坦帕以防孩子提前出生
2021年6月9日
2020年10月9日
2021年7月16日
很高兴告诉大家我今天接种了现代疫苗
2021年3月6日
2020年10月9日
2021年7月16日
表2
在怀孕期间或围孕期接受COVID-19疫苗接种的Twitter用户自我报告的妊娠结局(N=45)。
自我报告的结果
结果,n (%)一个
样品推
不利的结果
新生儿重症监护病房(NICU)
5 (11)
我做了一个小人类。这很酷。现在是几周的新生儿重症监护室时间。
早产(<37周)
4 (9)
她出生于1月11日……提前3个月……在医院呆了两个半星期
低出生体重(小于5磅8盎司)
1 (2)
他出生时体重3磅9盎司,我们没有一件东西接近适合他。
流产
1 (2)
在过去的四个星期里,我流产了一次……家人的死亡……宠物死亡……我的车坏了……
死胎
0 (0)
N/Ab
出生缺陷
0 (0)
N/A
正常的结果
学期(≥37周)c
39 (87)
他在第37周首次亮相。我们6点15分到达医院,7点45分完全扩张,他8点22分就到了!
正常出生体重(≥5磅8盎司)
7 (16)
他昨晚8点49分乘飞机到达。他重7磅11盎司,真不敢相信他是我的!
一个 在一些怀孕中发现了多种结果;因此,总结果的总和和百分比分别大于45%和100%。
b -不适用。
c 我们没有发现后来的推特明确指出活产的怀孕也包括在内。
讨论
主要研究结果
我们的研究表明,有用户在Twitter上报告他们在怀孕期间接种了疫苗,包括怀孕早期和围孕期,其中许多人报告了他们的怀孕结果。因此,本研究的结果证明了开发可扩展的方法,以在Twitter上确定更大的队列,用于妊娠期COVID-19疫苗接种的流行病学研究。这项研究中的150名用户是根据截至2021年7月初发布的推文确定的。自确定这些用户以来,我们重新部署了用于检测自我报告COVID-19疫苗接种的推文的6个正则表达式和用于估计产前时间框架的NLP工具[
8 ]用户的推文[
7 收集到2021年11月。即使仅使用正则表达式,我们也自动识别出大约2000名发布了匹配tweet的额外用户,预计到期日期在2021年或2022年。在未来的工作中,我们将手动验证他们的推文,以确定将这些额外的用户纳入我们在怀孕期间或围孕期接种COVID-19疫苗的队列中。因此,初始队列的规模很小——150个用户——似乎在很大程度上反映了这项研究开始的时间点,而不是Twitter数据的大规模效用。
我们的初步结果表明,早产和流产的报告在很大程度上不受潜在报告偏倚的影响,因为我们在40例(98%)未发现早产或流产的妊娠中检测到39例胎龄至少为37周。然而,低出生体重的报告可能受到潜在的报告偏倚的影响,因为我们在44例(16%)未确定低出生体重的妊娠中仅检测到7例出生体重至少为5磅8盎司。考虑到我们最初的Twitter用户样本很小,我们没有发现任何出生缺陷或死胎的报告也就不足为奇了,这在美国的发生率为3% [
13 ]及少于1% [
14 ),分别。尽管如此,我们之前的工作[
9 -
11 表明用户确实会在Twitter上报告这些罕见的结果。虽然完整的比较超出了本研究的范围,但在报告的胎龄至少为20周的怀孕总数中,Twitter上报告的早产比例(9.09%)与美国在COVID-19大流行之前的发病率(10.23%)相似[
15 ]及V-safe参与者报告的比例(9.4%)[
4 ]。
结论
鉴于妊娠期COVID-19疫苗安全性数据的可得性有限,推特可作为持续监测的补充资源,并有可能提高妊娠人群对COVID-19疫苗接种的接受度。未来的工作方向包括开发方法来检测更大的队列,并进行流行病学研究,将他们的怀孕结果与在Twitter上宣布怀孕的用户的怀孕结果进行比较[
7 但在COVID-19疫苗可用之前分娩。
多媒体附录1
用于检测自我报告COVID-19疫苗接种的推文的正则表达式。
缩写
疾病预防控制中心
疾病控制和预防中心
NLP
自然语言处理
这项工作得到了美国国立卫生研究院国家医学图书馆(资助号R01LM011176)的支持。
AK开发了正则表达式,分析了Twitter上的怀孕结果数据,并撰写了手稿。KO分析了推特数据,以确定在怀孕期间接种COVID-19疫苗的用户,并编辑了手稿。GGH指导了整个研究设计并编辑了稿件。
没有宣布。
[
]1
Allotey
J
切除
E
莎·博内特
米
狂吠
米
Chatterjee
年代
丘
T
目前,
l
Llavall
交流
迪克西特
一个
周
D
巴拉吉
R
李
如果
邱
X
元
米
Coomar
D
谢赫。
J
劳森
H
安萨里
K
车我们
米
van Leeuwen
E
Kostova
E
Kunst
H
卡里尔
一个
Tiberi
年代
Brizuela
V
Broutet
N
喀拉海
E
金
CR
Thorson
一个
Oladapo
Olufemi T
Mofenson
林恩
萨莫拉
哈维尔
Thangaratinam
沙琪拉
PregCOV-19活体系统评价联盟
2019冠状病毒病妊娠期临床表现、危险因素及母婴结局:活系统评价和荟萃分析
BMJ
2020
09
01
370
m3320
10.1136 / bmj.m3320
32873575
PMC7459193
[
]2
Razzaghi
H
Meghani
米
Pingali
C
起重机
B
Naleway
一个
温特劳布
E
切尼克斯贝格
助教
拉弥亚
乔丹
欧文
SA
考夫曼
TL
Vesco
乐
戴利
曼氏金融
德西尔瓦
米
多纳休
J
Getahun
D
格伦
年代
Hambidge
SJ
杰克逊
l
Lipkind
海关
纳尔逊
J
Zerbo
O
Oduyebo
T
单例
晶澳
帕特尔
SA
2020年12月14日至2021年5月8日,美国八个综合卫生保健组织,怀孕期间孕妇COVID-19疫苗接种覆盖率
《凡人周刊
2021
06
18
70
24
895
899
10.15585 / mmwr.mm7024e2
34138834
PMC8220952
[
]3.
Goncu世界货币基金
年代
Oluklu
D
Atalay
一个
Menekse喜神贝斯
D
Tanacan
一个
Moraloglu Tekin
O
领域
D
孕妇接受COVID-19疫苗的情况
[J]妇产科
2021
08
154
2
291
296
10.1002 / ijgo.13713
33872386
[
]4
Shimabukuro
T
金
年代
迈尔斯
T
莫罗
P
Oduyebo
T
Panagiotakopoulos
l
马尔克斯
P
奥尔森
C
刘
R
常
K
艾灵顿
年代
比凯尔
V
斯穆特
一个
绿色
C
利卡塔
C
张
B
Alimchandani
米
Mba-Jonas
一个
马丁
年代
哇
J
Meaney-Delman
D
CDC v-safe COVID-19妊娠登记小组
mRNA - Covid-19疫苗在孕妇中的安全性初步发现
[英]医学
2021
06
17
384
24
2273
2282
10.1056 / NEJMoa2104983
33882218
PMC8117969
[
]5
Auxier
B
安德森
米
2021年的社交媒体使用情况
皮尤研究中心
2021
04
07
2021-08-02
https://www.pewresearch.org/internet/2021/04/07/social-media-use-in-2021/
[
]6
高德
年代
Chiuve
年代
Weissenbacher
D
克莱因
一个
奥康纳
K
平淡无奇
米
马林
米
巴塔查里亚
米
Scarazzini
LJ
Gonzalez-Hernandez
G
怀孕期间社交媒体上与健康相关的帖子对出生缺陷的药物流行病学评估
药物Saf
2019
03
42
3.
389
400
10.1007 / s40264 - 018 - 0731 - 6
30284214
10.1007 / s40264 - 018 - 0731 - 6
PMC6426821
[
]7
衬衣
一个
Chandrashekar
P
玛吉医生
一个
蔡
H
克莱因
一个
冈萨雷斯
G
从社交媒体中发现孕妇队列进行安全监测和分析
J Med Internet Res
2017
10
30.
19
10
e361
10.2196 / jmir.8164
29084707
v19i10e361
PMC5684515
[
]8
Rouhizadeh
米
玛吉医生
一个
克莱因
一个
衬衣
一个
冈萨雷斯
G
一种基于规则的方法,从上下文社交媒体帖子中确定怀孕时间表
2018
数字健康国际会议
2018年4月23日至26日
法国里昂
16
20.
10.1145/3194658.3194679
[
]9
克莱因
阿兹
衬衣
一个
蔡
H
Weissenbacher
D
Gonzalez-Hernandez
G
出生缺陷研究的社交媒体挖掘:一种基于规则的、自举的方法,用于收集Twitter上罕见的健康相关事件的数据
J生物医学信息
2018
11
87
68
78
10.1016 / j.jbi.2018.10.001
30292855
s1532 - 0464 (18) 30197 - 7
PMC6295660
[
]10
克莱因
阿兹
衬衣
一个
Weissenbacher
D
Gonzalez-Hernandez
G
为出生缺陷的数字流行病学扩展Twitter
NPJ数字医学
2019
2
96
10.1038 / s41746 - 019 - 0170 - 5
31583284
170
PMC6773753
[
]11
克莱因
阿兹
蔡
H
Weissenbacher
D
莱文
LD
Gonzalez-Hernandez
G
一个自然语言处理管道,以推进Twitter数据在不良妊娠结果的数字流行病学中的使用
J生物医学信息
2020
112年代
100076
10.1016 / j.yjbinx.2020.100076
34417007
s2590 - 177 x 30010 - x (20)
[
]12
克莱因
阿兹
Gebreyesus
一个
Gonzalez-Hernandez
G
在Twitter上自动识别怀孕结果的数字流行病学比较组
中国科学院国际学术会议
2020
2020
317
325
32477651
PMC7233041
[
]13
美国疾病控制与预防中心
主要出生缺陷总体流行率的最新情况——1978-2005年佐治亚州亚特兰大市
《凡人周刊
2008
01
11
57
1
1
5
18185492
mm5701a2
[
]14
Hoyert
D
格雷戈里
E
2015-2017年胎儿死亡档案中的死因数据
全国生命属性代表
2020
04
69
4
1
20.
32510316
[
]15
马丁
晶澳
汉密尔顿
是
奥斯特曼
MJK
德里斯科尔
正义与发展党
出生人数:2019年的最终数据
全国生命属性代表
2021
04
70
2
1
51
33814033