这是一篇基于知识共享署名许可(https://creativecommons.org/licenses/by/4.0/)的开放获取文章,该许可允许在任何媒介上不受限制地使用、分发和复制,前提是原始作品首先发表在JMIR infoepidemiology上,并适当引用。必须包括完整的书目信息,到https://infodemiology.www.mybigtv.com/上原始出版物的链接,以及版权和许可信息。
2021年是预防COVID-19疫苗接种的一年,这在普通人群中引发了更广泛的讨论,有些人赞成接种疫苗,有些人反对接种疫苗。受欢迎的社交媒体平台推特在提供有关COVID-19疫苗的信息方面发挥了重要作用,并有效地观察了公众的反应。我们关注的是来自日本和印度尼西亚的推文,这两个国家有大量的twitter用户,在这两个国家,对副作用的担忧一直被认为是疫苗犹豫的一个重要原因。
本研究旨在调查Twitter如何被用来报道疫苗相关的副作用,并比较辉瑞和Moderna在日本和印度尼西亚开发的两种信使RNA (mRNA)疫苗类型对这些副作用的提及。
我们从Twitter上获取了2021年1月1日至2021年12月31日期间与COVID-19疫苗及其副作用相关的日语和印度尼西亚关键词的推文数据。然后,我们删除了推文频率高的用户,并将多个用户的推文合并为一个句子,专注于用户层面的分析,结果是总共有214,165个用户(日本)和12,289个用户(印度尼西亚)。然后,我们对数据进行过滤,选择只提到辉瑞或Moderna的推文,并删除同时提到辉瑞和Moderna的推文。我们将副作用数与辉瑞和Moderna发布的公开报告进行了比较。之后,使用逻辑回归模型比较辉瑞和Moderna疫苗在每个国家的副作用。
我们观察到公开报道和推文的副作用比例有所不同。具体来说,“发烧”在推特上被提及的频率远高于公开报道的预期。我们还观察到来自日本和印度尼西亚的辉瑞疫苗和Moderna疫苗报道的副作用差异,日本推文报道的辉瑞疫苗副作用较多,印度尼西亚推文报道的Moderna疫苗副作用较多。
我们注意到在Twitter上进行疫苗副作用监测和信息传播可能产生的后果,因为发烧似乎被过度代表了。这可能是由于发热可能具有更高的严重性或可测量性,并讨论了进一步的影响。
疫苗接种已被提议作为遏制和结束COVID-19大流行的解决方案之一[
疫苗的推出引起了普通人群的各种反应,无论是支持还是反对疫苗接种。Bonnevie等[
作为当今最受欢迎的社交媒体平台之一,Twitter已被广泛用作COVID-19信息流行病学研究的来源(见[
大多数关于COVID-19疫苗接种和推特的研究都集中在对疫苗接种的普遍集体态度上。马塞克和利奇[
在本文中,我们重点关注了日本和印度尼西亚这两个位于太平洋的岛国关于广泛可用的信使RNA (mRNA)疫苗的推文,这两个国家拥有大量的Twitter用户(全球Twitter用户排名前10位)[
2021年在全球范围内采用了COVID-19疫苗接种。日本于2021年2月开始为医护人员接种疫苗,于2021年4月开始为老年人接种疫苗[
在两种文化中发现的疫苗犹豫背后的一个关键背景是副作用的作用。在日本,除了性别、生活安排、经济状况和心理问题等其他因素外,对不良副作用的担忧可以说是不愿接种疫苗的主要原因[
最后,我们检查了不同国家在推特上发现的辉瑞和Moderna疫苗的副作用报告是否存在差异。这是因为两国关于疫苗(和制造商特异性)副作用的公开研究仍然有限,据我们所知,只有一项由Kitagawa等人进行的研究[
为了了解公众对日本和印度尼西亚疫苗接种运动的普遍看法,我们使用日语(ja)和印度尼西亚语(id;从2021年1月1日到2021年12月31日(UTC)的整个2021年(基于Twitter的语言过滤器)。搜索查询包括疫苗和副作用的关键字,不包括转发(见
所有数据均使用Python Twarc库(版本2.8.3)在Twitter上进行学术研究访问[
COVID-19疫苗相关关键词列表。
条款一个 | 关键词(以逗号分隔) | ||||
|
日本 | 印尼 | |||
|
|||||
|
与疫苗相关的 | ファイザー,モデルナ | 辉瑞,现代化 | ||
|
|||||
|
副作用 | 副反応 | efek, kipi | ||
|
疲劳 | 疲労,疲れ,倦怠感,だるい,だるさ | 利拉,迦派,迦派,佩勒,利玛斯,利提 | ||
|
头疼 | 小猫,小猫 | 停下,sakit kepala | ||
|
肌肉疼痛 | 筋肉痛 | nyeri otot | ||
|
发冷 | 寒気,悪寒,さむけ | meriang, menggigil | ||
|
发热 | 熱,高熱,微熱,発熱,熱が高い,熱があった,熱がある,熱が出た,熱風邪 | demam, panas | ||
|
恶心想吐 | www.qqqq.com www.qqqq.com www.qqqq.com | mual |
一个翻译成英文。
本文中列出的比较百分比来自辉瑞公司发表的公开报告(新闻稿)[
对于两种语言的推文,最初的预处理步骤是删除用户名和网页链接。之后,对于日语推文,我们删除了表情符号和特殊字符(如日语标点符号)。然后使用mecab-ipadic-NEologd对推文进行标记化[
为了分别评估这两种疫苗,我们对tweet进行了过滤,只选择了辉瑞或Moderna这两个术语。提到这两种疫苗的推文被删除并排除在分析之外。接下来,我们将数据中tweet数超过10条的用户帐户定义为“高频用户”。我们删除了这些高频用户,以避免数据因来自同一个人的过多推文计数而产生偏差。然后,我们根据用户帐户对tweet进行分组,重点关注用户级分析。如果用户有多条推文,它们会被合并成一句话进行分析。这是为了减少因同一个人在不同的推特上多次发布其副作用而产生的偏见。
之后,包含“Pfizer”的tweet被编码为1,而包含“Moderna”的tweet被编码为0。如前所述,考虑到各自的疫苗接种时间表,我们排除了提及这两种类型(辉瑞和Moderna)的推文,并在此阶段将其过滤掉。这一步的结果变量作为逻辑回归分析的结果变量。
过滤后的tweet示例如图所示
日语微博:“我的意思是,我的意思是。”2回目のファイザーワクチンの接種後、夜から次の日にかけて、微熱と頭痛と接種部位の痛みを感じます。若い人の方が熱が出やすいと思われます。#ファイザー#コロナワクチン (Good evening everyone. After the second dose of Pfizer vaccine, I feel a slight fever, headache and pain at the vaccination site during the night and the next day. It seems that younger people are more prone to fever. #pfizer #coronavaccine)
印尼的微博:
逻辑回归分析是一种分析与二元结果变量的关联的统计方法[
这项研究不要求参与者参与任何身体或精神干预。由于该研究没有使用个人身份信息,因此根据日本国家政府规定的《涉及人体受试者的医学和健康研究伦理准则》,该研究无需机构审查委员会的批准。
本研究使用的最终数据集包括来自214,165名用户的286,887条日语推文和来自12,289名用户的14,484条印度尼西亚推文。
从推特中计数。
|
日本 | 印尼 | |||||
|
辉瑞 | 现代化 | 总计 | 辉瑞 | 现代化 | 总计 | |
微博, | 283530年 | 3357 | 286887年 | 5684 | 8800 | 14484年 | |
每个用户的tweet数,平均值(SD) | 1.344 (0.890) | 1.028 (0.221) | 1.339 (0.885) | 1.122 (0.449) | 1.218 (0.606) | 1.178 (0.549) | |
个人用户(合并tweet后),n | 210899年 | 3266 | 214165年 | 5063 | 7226 | 12289年 | |
|
|||||||
|
副作用 | 101794年 | 1224 | 103018年 | 1535 | 4628 | 6163 |
|
疲劳 | 39724年 | 406 | 40130年 | 375 | 356 | 731 |
|
头疼 | 34878年 | 398 | 35276年 | 457 | 858 | 1315 |
|
肌肉疼痛 | 25167年 | 339 | 25506年 | 9 | 37 | 46 |
|
发冷 | 9361 | 143 | 9504 | 248 | 780 | 1028 |
|
发热 | 131172年 | 1993 | 133165年 | 2089 | 2386 | 4475 |
|
恶心想吐 | 5334 | 49 | 5383 | 105 | 396 | 501 |
在公开报告中,第二次剂量比第一次剂量更频繁地观察到副作用。然而,在我们的数据集中,我们缺乏来自tweet的可比信息来类似地区分第一剂量和第二剂量的副作用。除了发烧,我们注意到所有副作用在公开报告中的报告频率都比在推特中更高(更高的百分比)。雷达图显示了公开报告中第一剂量和第二剂量的每种副作用与从推特中获得的副作用的比较
通过对比日本和印尼的推文,辉瑞和Moderna在日本的推文中出现疲劳、肌肉疼痛和发烧等副作用的比例高于印尼的推文。头痛、寒战和恶心的比例也有所不同,印度尼西亚的推文比例更高。不管疫苗类型如何,发烧是迄今为止推特上报道最多的副作用。
日本推文中有关辉瑞疫苗的所有副作用的百分比略高于有关Moderna疫苗的百分比,即使两者的推文总数明显不同。另一方面,在印度尼西亚的推特中,现代疫苗副作用的百分比更高。我们还注意到,报告的肌肉疼痛的百分比非常小,这可能是由于使用不恰当的词来表示这种类型的疼痛。例如,没有多少使用者能够准确地定位身体疼痛的部位。一个更一般的术语“疼痛”可能比特定的术语“肌肉疼痛”更适合代表这种副作用。
从辉瑞和Moderna的公开报告中获得的疫苗接种后经历的副作用百分比,与我们在Twitter样本中发现的百分比进行比较。一般副作用的总体百分比在辉瑞的报告中没有提及,副作用在推特中的百分比是用特定副作用的推特数除以过滤的推特总数来计算的。1:第一剂疫苗;第二:第二剂疫苗;ID:印尼文;JA:日本的推文。
然后,我们比较了Twitter上提到的辉瑞和Moderna疫苗的副作用,副作用作为预测因素,疫苗类型(辉瑞或Moderna)作为结果变量。大多数预测变量显著(
Nagelkerke R2日语推文的比例为1.2%。在解释该模型时,我们发现,在有关辉瑞疫苗的推文中出现总称“副作用”的几率约为1.907倍。对于特定的术语(即肌肉疼痛、发烧、头痛和恶心),比值比相互接近:它们在辉瑞的推文中被提及的可能性分别是1.338、1.357、1.362和1.458倍,这表明这些术语在辉瑞疫苗的推文中比在Moderna疫苗的推文中出现的频率更高。然而,只有寒战的优势比很小。这与Kitagawa等人过去报道的结果不同[
印度尼西亚的推文显示出不同的结果,因为除了疲劳和发烧之外,所有其他副作用似乎不太可能在关于辉瑞疫苗的推文中被提及,而更有可能在关于Moderna疫苗的推文中被提及。Nagelkerke R2为17.4%。然而,我们注意到疲倦在关于辉瑞疫苗的推文中出现的频率明显高于关于Moderna疫苗的推文。仔细观察发热的95%置信区间(95% CI),其值为1,表明辉瑞和Moderna疫苗在这两种副作用上可能没有什么区别。
日语和印尼语推文的逻辑回归分析结果。
变量 | 系数 | 标准错误 |
|
优势比 | 95%可信区间 | |
|
||||||
|
(拦截) | 3.551 | 0.043 | <措施 | 34.831 | - - - - - -一个 |
|
副作用 | 0.646 | 0.043 | <措施 | 1.907 | 1.755 - -2.073 |
|
疲劳 | 0.489 | 0.054 | <措施 | 1.631 | 1.468 - -1.814 |
|
头疼 | 0.309 | 0.055 | <措施 | 1.362 | 1.223 - -1.517 |
|
肌肉疼痛 | 0.291 | 0.059 | <措施 | 1.338 | 1.191 - -1.503 |
|
发冷 | -0.101 | 0.087 | 二十五分 | 0.904 | 0.762 - -1.072 |
|
发热 | 0.305 | 0.042 | <措施 | 1.357 | 1.250 - -1.473 |
|
恶心想吐 | 0.377 | 0.146 | . 01 | 1.458 | 1.095 - -1.941 |
|
||||||
|
(拦截) | 0.455 | 0.036 | <措施 | 1.576 | - - - - - - |
|
副作用 | -1.461 | 0.042 | <措施 | 0.232 | 0.214 - -0.252 |
|
疲劳 | 0.238 | 0.084 | 04 | 1.269 | 1.077 - -1.495 |
|
头疼 | -0.294 | 0.068 | <措施 | 0.745 | 0.653 - -0.851 |
|
肌肉疼痛 | -0.98 | 0.398 | . 01 | 0.375 | 0.172 - -0.818 |
|
发冷 | -1.029 | 0.080 | <措施 | 0.358 | 0.306 - -0.418 |
|
发热 | 0.003 | 0.043 | 总收入 | 1.003 | 0.922 - -1.092 |
|
恶心想吐 | -0.821 | 0.120 | <措施 | 0.440 | 0.348 - -0.557 |
一个不适用。
我们的研究结果突出了Twitter上对副作用的表述与公开新闻稿中报道的百分比之间的巨大差距:对于大多数副作用,我们发现Twitter用户报告的百分比远远低于公开报道的百分比。我们的第一个结果集中在Twitter上报告的计数和公开新闻发布的观察计数的描述性比较上。考虑到有几项研究利用Twitter上的症状报告进行流行病学监测,我们的研究表明,至少对于疫苗副作用监测,相对于其他(较轻的)副作用,我们可能存在过度描述“发烧”的风险。虽然我们的研究没有明确地研究这一现象背后的原因,但我们推测了一些可能的解释。
首先,这可能反映出外行人和卫生专业人员对疫苗接种的看法和谈论方式的差异[
第二,较高的发烧报告率可能是由于它易于由非专业公众成员测量。体温计广泛可用和广泛使用,并且有一般惯例(阈值)来确定一个人是否发烧。另一方面,其他副作用,如寒战、头痛和疲劳,有时可能没有明确的、客观的阈值和测量方法,这些对于外行人来说是常识。由于这些副作用的模糊性和主观性,Twitter用户可能会犹豫是否更新他们的状态,尤其是与发烧相比,它有一个明确而客观的门槛。因此,可能经历不止一种副作用的Twitter用户可能会决定只报告更清晰、更容易观察到的副作用。
最后,另一个可能的原因可能是研究中观察到的人(公开报告)和在推特上分享他们经历的推特用户之间的年龄差异。在Statista进行的一项调查中,年龄在20岁至29岁之间的日本受访者中,近80%的人使用微博和社交网络服务Twitter。虽然这表明日本年轻人的渗透率也很高,但年龄较大的人群使用它的程度要低得多[
我们在日本和印度尼西亚的推特上的发现也不同于在美国的英语推特上报道的(疫苗)副作用,在美国,疼痛、疲劳和头痛被列为辉瑞和Moderna疫苗的前三大副作用[
无论如何解释,我们的研究似乎表明,“发烧”作为一种主观上更强的疫苗副作用,在日本和印度尼西亚的Twitter上被讨论得更多。一个可能的后果是推特上的回音室效应[
虽然我们的调查仅限于Moderna和辉瑞(Pfizer)的疫苗,但这些疫苗在印度尼西亚获得批准的时间相对较晚,而且我们没有审查其他疫苗生产商(如科兴(Sinovac)、阿斯利康(AstraZeneca))关于副作用的推文。因此,围绕疫苗及其副作用的一些言论在早期的推文中没有被捕捉到。其次,一些推文还详细阐述了副作用,但没有提及接种的具体疫苗类型。第三,tweets的搜索查询被限制在指定的关键字(
最后,我们没有控制推文中的否定。然而,我们为每种疫苗和语言抽样了100条推文。在所有抽样的推文中,我们将观察重点放在发烧上,这是我们的推特数据集中发现的最常见的副作用,并发现只有少数推文包含否定。基于对样本的人工检查,我们发现,在63条提到发烧的推文中,有15条(发烧)被否定,占辉瑞疫苗相关推文的23.80%。通过同样的过程,我们在Moderna tweets中获得了32.76%的否定。与此同时,在印度尼西亚的推文中,辉瑞疫苗对发烧的否定率为21.43%,Moderna疫苗对发烧的否定率为16.67%。否定在Twitter分析中是一个困难的挑战,因为表达否定的方式有很多,不一定能通过指定的否定词轻松过滤掉[
我们也没有办法验证这些推文是来自个人还是非个人(如公司)账户,以及该账户背后的个人是否真的接种了疫苗,并对报道的副作用进行了后续确认。最后,我们也缺乏足够的信息,关于副作用是来自第一剂、第二剂还是第三剂疫苗,因为我们仅限于与Twitter API查询的语言过滤器匹配的用户在tweet中分享的副作用,而没有任何更深入的人口统计或上下文信息。
我们发现,发烧是日本和印度尼西亚推文中报道的最普遍的副作用,这可能反映了社交媒体对报道严重或可测量的副作用(如发烧)的偏见。此外,在检查来自不同疫苗制造商的副作用时,我们发现Twitter从日本和印度尼西亚获得的信息不一致,因为在日本,关于辉瑞疫苗的推文报道的副作用相对较多,而在印度尼西亚,关于Moderna疫苗的推文报道的副作用较多。因此,鉴于Twitter和疫苗新闻稿的发现存在不一致和差距,我们谨慎乐观地认为,Twitter可以证明对疫苗副作用的信息流行病学监测是有用的,这种监测最适合于检测日本和印度尼西亚人群中发烧症状的流行程度。
日语推文的推文ID。
印度尼西亚tweets的Tweet ID。
辉瑞(A)和Moderna (B)的雷达图,显示了每种副作用百分比的比较。
日本科学促进会
日本科学技术振兴机构
信使核糖核酸
战略国际研究合作计划
本工作得到日本科学技术振兴机构(JST)战略国际研究合作计划(SICORP)资助号JPMJSC2107,日本和日本科学促进协会(JSPS) KAKENHI资助号JP22K12041的支持。
KF在KL的协助下收集数据并进行分析,KF和KL撰写了稿件,SW和EA提供了重要的意见。所有作者都对研究的概念化和最初的研究设计做出了贡献。EA和SW监督这个项目。
没有宣布。