卡塔尔世界杯8强波胆分析|卡塔尔世界杯4强波胆分析

霁

JMIR Infodemiology

2564 - 1891

卡塔尔世界杯8强波胆分析

加拿大多伦多

v2i2e39504

36277140

10.2196/39504

原始论文

监测日本和印度尼西亚推特上对COVID-19疫苗副作用的提及:信息流行病学研究

麦基

蒂姆

郭

斯蒂芬。

班达

胡安

松田

Shinichi

Ferawati

琪琪

MStat 1

https://orcid.org/0000-0003-0717-0769

刘

Kongmeng

博士学位 1

https://orcid.org/0000-0002-0755-7173

Aramaki

二

博士学位 1

https://orcid.org/0000-0003-0201-3609

Wakamiya

祥子

博士学位 1

科学技术研究生院奈良科学技术研究所

8916 - 5, Takayama-cho

Ikoma, 630 - 0192

日本 81 743725250 wakamiya@is.naist.jp

https://orcid.org/0000-0002-9371-1340

1 科学技术研究生院奈良科学技术研究所

Ikoma

日本

通讯作者:Shoko Wakamiya wakamiya@is.naist.jp

Jul-Dec 2022

4 10 2022

2 2

e39504

12 5 2022 24 6 2022 29 7 2022 19 9 2022

©Kiki Ferawati, Kongmeng Liew, Eiji Aramaki, Shoko Wakamiya。最初发表于JMIR infoepidemiology (https://infodemiology.www.mybigtv.com)， 04.10.2022。

2022

这是一篇基于知识共享署名许可(https://creativecommons.org/licenses/by/4.0/)的开放获取文章，该许可允许在任何媒介上不受限制地使用、分发和复制，前提是原始作品首先发表在JMIR infoepidemiology上，并适当引用。必须包括完整的书目信息，到https://infodemiology.www.mybigtv.com/上原始出版物的链接，以及版权和许可信息。

背景

2021年是预防COVID-19疫苗接种的一年，这在普通人群中引发了更广泛的讨论，有些人赞成接种疫苗，有些人反对接种疫苗。受欢迎的社交媒体平台推特在提供有关COVID-19疫苗的信息方面发挥了重要作用，并有效地观察了公众的反应。我们关注的是来自日本和印度尼西亚的推文，这两个国家有大量的twitter用户，在这两个国家，对副作用的担忧一直被认为是疫苗犹豫的一个重要原因。

客观的

本研究旨在调查Twitter如何被用来报道疫苗相关的副作用，并比较辉瑞和Moderna在日本和印度尼西亚开发的两种信使RNA (mRNA)疫苗类型对这些副作用的提及。

方法

我们从Twitter上获取了2021年1月1日至2021年12月31日期间与COVID-19疫苗及其副作用相关的日语和印度尼西亚关键词的推文数据。然后，我们删除了推文频率高的用户，并将多个用户的推文合并为一个句子，专注于用户层面的分析，结果是总共有214,165个用户(日本)和12,289个用户(印度尼西亚)。然后，我们对数据进行过滤，选择只提到辉瑞或Moderna的推文，并删除同时提到辉瑞和Moderna的推文。我们将副作用数与辉瑞和Moderna发布的公开报告进行了比较。之后，使用逻辑回归模型比较辉瑞和Moderna疫苗在每个国家的副作用。

结果

我们观察到公开报道和推文的副作用比例有所不同。具体来说，“发烧”在推特上被提及的频率远高于公开报道的预期。我们还观察到来自日本和印度尼西亚的辉瑞疫苗和Moderna疫苗报道的副作用差异，日本推文报道的辉瑞疫苗副作用较多，印度尼西亚推文报道的Moderna疫苗副作用较多。

结论

我们注意到在Twitter上进行疫苗副作用监测和信息传播可能产生的后果，因为发烧似乎被过度代表了。这可能是由于发热可能具有更高的严重性或可测量性，并讨论了进一步的影响。

新型冠状病毒肺炎疫苗 COVID-19疫苗辉瑞现代化疫苗副作用副作用推特逻辑回归

介绍背景

疫苗接种已被提议作为遏制和结束COVID-19大流行的解决方案之一[ 1- 3.]。在疫苗广泛部署之前，一项早期的Twitter民意调查显示，公众对疫苗接种的态度大多是积极的，许多人表示他们会寻求接种疫苗，尽管对疫苗的安全性仍然存在担忧[ 4]。然而，这些担忧一直存在于公众的视线中，包括安全性、疫苗的异常快速发展以及注射后可能产生的副作用等问题。 5]。在2021年初与疫苗相关的搜索趋势中也观察到这些，当时所产生的副作用被确定为一个重要的关注领域[ 6]。

疫苗的推出引起了普通人群的各种反应，无论是支持还是反对疫苗接种。Bonnevie等[ 7]在2020年大流行之前和大流行中期调查了疫苗接受情况，并在Twitter上发现了更强烈的疫苗反对意见。在Lyu等人的研究中，这一趋势出现了逆转[ 8通过话题建模和情绪分析，研究了推特上公众对COVID-19疫苗接种的认知和反应，发现早期关于疫苗的讨论源于疫苗的开发阶段，后来公众的情绪倾向于积极的前景。

作为当今最受欢迎的社交媒体平台之一，Twitter已被广泛用作COVID-19信息流行病学研究的来源(见[ 9])，以现有的通过该平台进行流行病监测的文献为基础。例如，在流感的情况下，Twitter已被用作估计个体诊断的检测工具[ 10]以及作为社会监测，作为发现疾病爆发的早期预警工具发挥作用[ 11]。尽管Twitter在流行病学监测研究中很有用，但也存在局限性，例如在COVID-19大流行的早期，错误信息的传播[ 12这可能会影响这些数据。在本文中，我们建议Twitter也可以以类似的方式用于监测COVID-19疫苗接种的副作用，重点关注日本和印度尼西亚的辉瑞和Moderna疫苗。

对COVID-19疫苗接种的态度

大多数关于COVID-19疫苗接种和推特的研究都集中在对疫苗接种的普遍集体态度上。马塞克和利奇[ 13]对提及阿斯利康、辉瑞和Moderna的英文推文进行了基于词典的情绪分析，发现人们对辉瑞和Moderna的情绪普遍比阿斯利康更积极。Sattar和Arifuzzaman [ 14分析了公众对COVID-19疫苗接种意识的相关情绪的推文，发现尽管疫苗有副作用，但仍有强烈的积极情绪。郭等[ 15]使用潜在的Dirichlet分配主题模型来识别与澳大利亚COVID-19疫苗接种相关的推文主题，并对推文进行情绪分析，发现积极情绪的推文数量仅略大于消极情绪的推文数量，从而引发了对疫苗广泛接受的担忧。然而，这些研究大多是用西方和英语的样本进行的，对于非英语语言的推文的类似研究相当缺乏。

在本文中，我们重点关注了日本和印度尼西亚这两个位于太平洋的岛国关于广泛可用的信使RNA (mRNA)疫苗的推文，这两个国家拥有大量的Twitter用户(全球Twitter用户排名前10位)[ 16])。由于日语和印尼语在各自的国家普遍使用[ 17， 18]，它提供了一个相对可控的环境来观察每个国家的独特模式。这允许将Twitter的使用情况置于更广泛的社会背景下，以进行额外的解释和行为分析，特别是在这次大流行中。

2021年在全球范围内采用了COVID-19疫苗接种。日本于2021年2月开始为医护人员接种疫苗，于2021年4月开始为老年人接种疫苗[ 19]。2021年6月，接种率开始迅速上升，并继续上升，到2021年底，接种率已超过80% [ 20.]。与此同时，印度尼西亚于2021年1月开始接种疫苗，重点是卫生保健工作者，其次是老年人和公职人员，最后是普通公众[ 21]。尽管早期的疫苗接种运动使用了Coronavac和阿斯利康(AstraZeneca)疫苗，但从2021年8月起，该国开始在疫苗接种和加强剂中使用Moderna和辉瑞疫苗。到2021年底，印度尼西亚46.7%的人口接种了全面疫苗。

在两种文化中发现的疫苗犹豫背后的一个关键背景是副作用的作用。在日本，除了性别、生活安排、经济状况和心理问题等其他因素外，对不良副作用的担忧可以说是不愿接种疫苗的主要原因[ 22]。疫苗犹豫在年轻一代中也明显比在老一代中更常见[ 23]。与此同时，在印度尼西亚，对疫苗安全性的担忧、对疫苗的不信任以及对副作用的担忧被确定为疫苗犹豫的几个常见原因[ 24]。由于Twitter已被用于识别COVID-19的症状[ 25]，我们在本文中提出，它也可以用于检查COVID-19疫苗接种的副作用。此外，通过将Twitter上的副作用计数与辉瑞和Moderna疫苗的3期临床试验报告的副作用率进行比较，我们可以观察到Twitter上副作用的信息传播模式，这些模式可能是Twitter独有的(例如，在Twitter上提到的副作用是被夸大、适当还是被低估)。这些结果可能会确定Twitter对疫苗副作用监测的有用性，或者说明该平台上存在的错误信息偏见。

最后，我们检查了不同国家在推特上发现的辉瑞和Moderna疫苗的副作用报告是否存在差异。这是因为两国关于疫苗(和制造商特异性)副作用的公开研究仍然有限，据我们所知，只有一项由Kitagawa等人进行的研究[ 26通过自我报告的数据比较了日本现有的Moderna和辉瑞疫苗的副作用。对日本和印度尼西亚分别进行了分析。

方法数据微博收藏

为了了解公众对日本和印度尼西亚疫苗接种运动的普遍看法，我们使用日语(ja)和印度尼西亚语(id;从2021年1月1日到2021年12月31日(UTC)的整个2021年(基于Twitter的语言过滤器)。搜索查询包括疫苗和副作用的关键字，不包括转发(见表1)。在这两个国家使用的所有疫苗中，我们将查询限制在Moderna和辉瑞公司，因为这两种疫苗都在这两个国家使用。虽然阿斯利康的疫苗在这两个国家也有使用，但在日本要少得多，而且在公共领域以各种各样的名字来代表，所以相关的推文更难获得。

所有数据均使用Python Twarc库(版本2.8.3)在Twitter上进行学术研究访问[ 27]。由于推文配额的限制，我们无法访问大量的日本推文，因此我们无法获得只提到“疫苗”或只提到“副作用”的推文。因此，用于日本和印度尼西亚推特抓取的疫苗关键词包括疫苗类型(“Pfizer”和“Moderna”)，副作用关键词则是美国疾病控制与预防中心(Centers for Disease Control and Prevention)用英文描述的症状:疲倦、头痛、肌肉疼痛、发冷、发烧和恶心[ 28]。同样，印度尼西亚政府的官方网页上也列出了COVID-19疫苗接种后的症状清单，简称为 kipi(在印尼: Kejadian ikutan pasca imunisasi) ［ 29]。日本政府的相关消息人士也提到了同样的症状，但不包括恶心，但包括腹泻[ 30.]。我们决定排除腹泻，因为它没有在印度尼西亚的来源中列出，并且现代公共报告中没有详细的流行情况。然而，由于有相应的统计数据，我们决定在本研究中保留恶心，并且日本的一些关于疫苗副作用的研究也引用了这一研究[ 26， 31]。该症状列表随后被翻译成日文和印尼文，并从同义词中添加了其他关键字(参见表1)。

表1

COVID-19疫苗相关关键词列表。

条款^一个			关键词(以逗号分隔)
			日本		印尼
疫苗
	与疫苗相关的	ファイザー,モデルナ		辉瑞,现代化
副作用
	副作用	副反応		efek, kipi
	疲劳	疲労,疲れ,倦怠感,だるい,だるさ		利拉，迦派，迦派，佩勒，利玛斯，利提
	头疼	小猫，小猫		停下，sakit kepala
	肌肉疼痛	筋肉痛		nyeri otot
	发冷	寒気,悪寒,さむけ		meriang, menggigil
	发热	熱,高熱,微熱,発熱,熱が高い,熱があった,熱がある,熱が出た,熱風邪		demam, panas
	恶心想吐	www.qqqq.com www.qqqq.com www.qqqq.com		mual

^一个翻译成英文。

公开报告数据

本文中列出的比较百分比来自辉瑞公司发表的公开报告(新闻稿)[ 32]和Moderna [ 33]。对于辉瑞，这些数据包括来自16至55岁的参与者，而对于Moderna，这些数据包括来自18至64岁的参与者。接种疫苗后7天采集，并归类为全身性不良反应。

推文数据的预处理

对于两种语言的推文，最初的预处理步骤是删除用户名和网页链接。之后，对于日语推文，我们删除了表情符号和特殊字符(如日语标点符号)。然后使用mecab-ipadic-NEologd对推文进行标记化[ 34- 36]，它将术语简化为最简单的形式，以方便进一步分析。所有关键字过滤都是使用全宽字符完成的。对于印度尼西亚的tweet，所有字符都被设置为小写，非ascii字符被删除。

为了分别评估这两种疫苗，我们对tweet进行了过滤，只选择了辉瑞或Moderna这两个术语。提到这两种疫苗的推文被删除并排除在分析之外。接下来，我们将数据中tweet数超过10条的用户帐户定义为“高频用户”。我们删除了这些高频用户，以避免数据因来自同一个人的过多推文计数而产生偏差。然后，我们根据用户帐户对tweet进行分组，重点关注用户级分析。如果用户有多条推文，它们会被合并成一句话进行分析。这是为了减少因同一个人在不同的推特上多次发布其副作用而产生的偏见。

之后，包含“Pfizer”的tweet被编码为1，而包含“Moderna”的tweet被编码为0。如前所述，考虑到各自的疫苗接种时间表，我们排除了提及这两种类型(辉瑞和Moderna)的推文，并在此阶段将其过滤掉。这一步的结果变量作为逻辑回归分析的结果变量。

过滤后的tweet示例如图所示文本框1。由于推特的隐私政策，这些推文样本被改写了。本研究处理的数据集的Tweet ID在多媒体附录1(日语推文)和多媒体附录2印尼(微博)。在每个过滤后的tweet中，我们对合并的tweet应用指定关键字的单词匹配。如果出现了“副作用”一词，那么这一列就被标记为“1”，如果没有，那么就被标记为“0”。总共有7个预测变量:效果、疲劳、头痛、肌肉疼痛、发冷、发烧和恶心。使用精确的单词匹配来检查每个副作用的存在。例如，基于日本的推文文本框1，发烧和头痛的一栏标记为1，其余的副作用标记为0。提到的“疼痛”没有被归类为“肌肉疼痛”，所以它被标记为0。

过滤tweet的例子。

日语微博:“我的意思是，我的意思是。”2回目のファイザーワクチンの接種後、夜から次の日にかけて、微熱と頭痛と接種部位の痛みを感じます。若い人の方が熱が出やすいと思われます。＃ファイザー＃コロナワクチン (Good evening everyone. After the second dose of Pfizer vaccine, I feel a slight fever, headache and pain at the vaccination site during the night and the next day. It seems that younger people are more prone to fever. #pfizer #coronavaccine)

印尼的微博: Efek dosis是现代成员aku menangis karena sakit demam, menggigil, badan terasa nyeri Dan sakit kepala(第二次服用Moderna的副作用是发烧、发冷、疼痛、头痛，痛得哇哇大哭)

逻辑回归分析

逻辑回归分析是一种分析与二元结果变量的关联的统计方法[ 37]。在本研究中，我们按国家分别进行了逻辑回归模型:日本和印度尼西亚。结果变量是疫苗类型(辉瑞或Moderna)，预测变量是确定的副作用:副作用、疲劳、头痛、肌肉疼痛、发冷、发烧和恶心(来自推特)。然后，我们通过使用从模型参数中获得的优势比来检查每种疫苗类型特定副作用的可能性。采用显著性水平5%来构建优势比的置信区间。采用Nagelkerke R对模型进行评价²［ 38]。所有统计分析均使用SPSS 28.0.1 (IBM Corp, Armonk, NY)进行。分析中包含的所有变量都是二元的。

道德的考虑

这项研究不要求参与者参与任何身体或精神干预。由于该研究没有使用个人身份信息，因此根据日本国家政府规定的《涉及人体受试者的医学和健康研究伦理准则》，该研究无需机构审查委员会的批准。

结果与临床试验公开报告数据(新闻稿)的比较

本研究使用的最终数据集包括来自214,165名用户的286,887条日语推文和来自12,289名用户的14,484条印度尼西亚推文。表2显示合并后的最终tweet计数和每个副作用的详细细分。对于最终的数据集，日语的每用户平均推文数小于印尼语的每用户平均推文数，如下所示表2。但是，由于我们按用户聚合tweet，因此我们将重点放在合并tweet的用户计数上，以便进行后续分析。在印度尼西亚数据集中，关于辉瑞疫苗和Moderna疫苗的推文比例分别为58.80%和41.20%，其中提到Moderna的推文更多。在日本的数据中，98.47%的推文提到了辉瑞。辉瑞和Moderna疫苗2021年底在日本的接种比例分别为79.85%和20.08%，其他(阿斯利康)为0.08% [ 39]。我们无法获得印度尼西亚的可比统计数据。

表2

从推特中计数。

		日本			印尼
		辉瑞	现代化	总计	辉瑞	现代化	总计
微博,		283530年	3357	286887年	5684	8800	14484年
每个用户的tweet数，平均值(SD)		1.344 (0.890)	1.028 (0.221)	1.339 (0.885)	1.122 (0.449)	1.218 (0.606)	1.178 (0.549)
个人用户(合并tweet后)，n		210899年	3266	214165年	5063	7226	12289年
个人使用者提到任何疫苗的副作用，n
	副作用	101794年	1224	103018年	1535	4628	6163
	疲劳	39724年	406	40130年	375	356	731
	头疼	34878年	398	35276年	457	858	1315
	肌肉疼痛	25167年	339	25506年	9	37	46
	发冷	9361	143	9504	248	780	1028
	发热	131172年	1993	133165年	2089	2386	4475
	恶心想吐	5334	49	5383	105	396	501

图1显示了辉瑞和Moderna在新闻稿中报道的副作用，其次是我们研究中观察到的tweet百分比。图中包含了tweets中单词匹配得到的副作用以及与公开报道数据的对比，以说明tweets数据捕捉副作用的能力。新闻发布报告的副作用百分比与推特数据报告的副作用百分比之间似乎存在差异，日本和印度尼西亚推特的副作用百分比之间略有差异。

在公开报告中，第二次剂量比第一次剂量更频繁地观察到副作用。然而，在我们的数据集中，我们缺乏来自tweet的可比信息来类似地区分第一剂量和第二剂量的副作用。除了发烧，我们注意到所有副作用在公开报告中的报告频率都比在推特中更高(更高的百分比)。雷达图显示了公开报告中第一剂量和第二剂量的每种副作用与从推特中获得的副作用的比较多媒体附录3，其值与副作用计数相对应表2中所示值的百分比图1。

通过对比日本和印尼的推文，辉瑞和Moderna在日本的推文中出现疲劳、肌肉疼痛和发烧等副作用的比例高于印尼的推文。头痛、寒战和恶心的比例也有所不同，印度尼西亚的推文比例更高。不管疫苗类型如何，发烧是迄今为止推特上报道最多的副作用。

日本推文中有关辉瑞疫苗的所有副作用的百分比略高于有关Moderna疫苗的百分比，即使两者的推文总数明显不同。另一方面，在印度尼西亚的推特中，现代疫苗副作用的百分比更高。我们还注意到，报告的肌肉疼痛的百分比非常小，这可能是由于使用不恰当的词来表示这种类型的疼痛。例如，没有多少使用者能够准确地定位身体疼痛的部位。一个更一般的术语“疼痛”可能比特定的术语“肌肉疼痛”更适合代表这种副作用。

图1

从辉瑞和Moderna的公开报告中获得的疫苗接种后经历的副作用百分比，与我们在Twitter样本中发现的百分比进行比较。一般副作用的总体百分比在辉瑞的报告中没有提及，副作用在推特中的百分比是用特定副作用的推特数除以过滤的推特总数来计算的。1:第一剂疫苗;第二:第二剂疫苗;ID:印尼文;JA:日本的推文。

疫苗副作用的Logistic回归分析

然后，我们比较了Twitter上提到的辉瑞和Moderna疫苗的副作用，副作用作为预测因素，疫苗类型(辉瑞或Moderna)作为结果变量。大多数预测变量显著( 表3)，表明报告的副作用在辉瑞和Moderna疫苗之间有显著差异。然而，我们注意到，大样本量导致的高统计功率可能会影响统计检验的计算和各自的 P价值。我们首先报告日本数据的结果，然后分别报告印度尼西亚数据。

Nagelkerke R²日语推文的比例为1.2%。在解释该模型时，我们发现，在有关辉瑞疫苗的推文中出现总称“副作用”的几率约为1.907倍。对于特定的术语(即肌肉疼痛、发烧、头痛和恶心)，比值比相互接近:它们在辉瑞的推文中被提及的可能性分别是1.338、1.357、1.362和1.458倍，这表明这些术语在辉瑞疫苗的推文中比在Moderna疫苗的推文中出现的频率更高。然而，只有寒战的优势比很小。这与Kitagawa等人过去报道的结果不同[ 26]，世卫组织通过在日本进行的问卷调查研究，比较了两种疫苗的副作用发生率，发现接受Moderna疫苗的人报告的副作用比接受辉瑞疫苗的人更多。

印度尼西亚的推文显示出不同的结果，因为除了疲劳和发烧之外，所有其他副作用似乎不太可能在关于辉瑞疫苗的推文中被提及，而更有可能在关于Moderna疫苗的推文中被提及。Nagelkerke R²为17.4%。然而，我们注意到疲倦在关于辉瑞疫苗的推文中出现的频率明显高于关于Moderna疫苗的推文。仔细观察发热的95%置信区间(95% CI)，其值为1，表明辉瑞和Moderna疫苗在这两种副作用上可能没有什么区别。

表3

日语和印尼语推文的逻辑回归分析结果。

变量		系数	标准错误	P价值	优势比	95%可信区间
日本推
	(拦截)	3.551	0.043	<措施	34.831	- - - - - -^一个
	副作用	0.646	0.043	<措施	1.907	1.755 - -2.073
	疲劳	0.489	0.054	<措施	1.631	1.468 - -1.814
	头疼	0.309	0.055	<措施	1.362	1.223 - -1.517
	肌肉疼痛	0.291	0.059	<措施	1.338	1.191 - -1.503
	发冷	-0.101	0.087	二十五分	0.904	0.762 - -1.072
	发热	0.305	0.042	<措施	1.357	1.250 - -1.473
	恶心想吐	0.377	0.146	. 01	1.458	1.095 - -1.941
印尼推
	(拦截)	0.455	0.036	<措施	1.576	- - - - - -
	副作用	-1.461	0.042	<措施	0.232	0.214 - -0.252
	疲劳	0.238	0.084	04	1.269	1.077 - -1.495
	头疼	-0.294	0.068	<措施	0.745	0.653 - -0.851
	肌肉疼痛	-0.98	0.398	. 01	0.375	0.172 - -0.818
	发冷	-1.029	0.080	<措施	0.358	0.306 - -0.418
	发热	0．003	0.043	总收入	1.003	0.922 - -1.092
	恶心想吐	-0.821	0.120	<措施	0.440	0.348 - -0.557

^一个不适用。

讨论主要研究结果

我们的研究结果突出了Twitter上对副作用的表述与公开新闻稿中报道的百分比之间的巨大差距:对于大多数副作用，我们发现Twitter用户报告的百分比远远低于公开报道的百分比。我们的第一个结果集中在Twitter上报告的计数和公开新闻发布的观察计数的描述性比较上。考虑到有几项研究利用Twitter上的症状报告进行流行病学监测，我们的研究表明，至少对于疫苗副作用监测，相对于其他(较轻的)副作用，我们可能存在过度描述“发烧”的风险。虽然我们的研究没有明确地研究这一现象背后的原因，但我们推测了一些可能的解释。

首先，这可能反映出外行人和卫生专业人员对疫苗接种的看法和谈论方式的差异[ 40]。我们的研究可能过于依赖相对专业的术语(例如，肌肉疼痛)，这些术语可能不是更广泛的非专业人群(至少在日本和印度尼西亚)最容易理解的术语。因此，外行人和专业人士在重点和用词上的差异可能导致用于描述疫苗接种后所经历的副作用的不同表达。考虑到我们的研究使用了更“专业”的术语，我们对肌肉疼痛或寒战等副作用的研究结果可能没有充分代表可用的推文。

第二，较高的发烧报告率可能是由于它易于由非专业公众成员测量。体温计广泛可用和广泛使用，并且有一般惯例(阈值)来确定一个人是否发烧。另一方面，其他副作用，如寒战、头痛和疲劳，有时可能没有明确的、客观的阈值和测量方法，这些对于外行人来说是常识。由于这些副作用的模糊性和主观性，Twitter用户可能会犹豫是否更新他们的状态，尤其是与发烧相比，它有一个明确而客观的门槛。因此，可能经历不止一种副作用的Twitter用户可能会决定只报告更清晰、更容易观察到的副作用。

最后，另一个可能的原因可能是研究中观察到的人(公开报告)和在推特上分享他们经历的推特用户之间的年龄差异。在Statista进行的一项调查中，年龄在20岁至29岁之间的日本受访者中，近80%的人使用微博和社交网络服务Twitter。虽然这表明日本年轻人的渗透率也很高，但年龄较大的人群使用它的程度要低得多[ 41]。过去的一项研究也表明，辉瑞疫苗的全身副作用发生率在年轻参与者中明显高于老年人[ 31]，这一发现之前也被推广到日本的背景下[ 42]。国内Twitter用户的比率也表明，有些人不使用Twitter，这意味着他们不会通过Twitter分享他们的副作用。由于疫苗副作用的发生率在年龄较大的人群中较高，而Twitter的普及率较低，这也可能影响Twitter上可能发现的副作用的数量。

我们在日本和印度尼西亚的推特上的发现也不同于在美国的英语推特上报道的(疫苗)副作用，在美国，疼痛、疲劳和头痛被列为辉瑞和Moderna疫苗的前三大副作用[ 43]。一个可能的原因是人们在Twitter上表达自己的方式存在文化差异，这可能源于他们各自的文化背景和习惯。与个人主义文化(如美国)相比，集体主义文化(如日本和印度尼西亚)的人在社交媒体上可能不那么开放和活跃[ 44]。因此，美国的用户可能会在社交媒体上更详细、更频繁地报告他们的症状，而日本和印度尼西亚的用户可能会“保留”他们的帖子，以应对更严重的副作用(即发烧)。无论如何，我们建议未来关于疫苗副作用信息流行病学监测的研究可考虑主要关注这些国家与发烧相关的关键词。

无论如何解释，我们的研究似乎表明，“发烧”作为一种主观上更强的疫苗副作用，在日本和印度尼西亚的Twitter上被讨论得更多。一个可能的后果是推特上的回音室效应[ 45]，这可能会导致疫苗犹豫或其他厌恶行为。为了说明，由于这种不成比例的报道，以Twitter用户Marie为例，她目前正在考虑接种疫苗。她可能会注意到，许多用户在她的Twitter feed上讨论他们的发烧经历，认为这是接种疫苗的副作用，这可能会导致对发烧风险的过度描述，这可能会阻止她接种疫苗。相比之下，如果推特以更有代表性的方式讨论副作用，玛丽就会准确地描述风险，可能不会因为这个原因而劝阻接种疫苗。我们再次注意到，副作用是日本对疫苗犹豫不决的一个重要原因[ 22]并假设推特上强烈副作用的过度表现可能是导致犹豫的原因之一，尽管需要后续研究来验证这一假设。

限制

虽然我们的调查仅限于Moderna和辉瑞(Pfizer)的疫苗，但这些疫苗在印度尼西亚获得批准的时间相对较晚，而且我们没有审查其他疫苗生产商(如科兴(Sinovac)、阿斯利康(AstraZeneca))关于副作用的推文。因此，围绕疫苗及其副作用的一些言论在早期的推文中没有被捕捉到。其次，一些推文还详细阐述了副作用，但没有提及接种的具体疫苗类型。第三，tweets的搜索查询被限制在指定的关键字( 表1)，不包括表中未列出的其他可能的单词，我们也没有考虑推文所表达的积极或消极情绪。最后，我们只关注了只提到一种疫苗的推文，并删除了同时提到两种疫苗的推文。然而，在观察期间，人们同时接种辉瑞和Moderna疫苗的可能性很小，推特上提到这两种疫苗的主要是新闻报道和相关讨论，而不是公众实际经历的副作用。

最后，我们没有控制推文中的否定。然而，我们为每种疫苗和语言抽样了100条推文。在所有抽样的推文中，我们将观察重点放在发烧上，这是我们的推特数据集中发现的最常见的副作用，并发现只有少数推文包含否定。基于对样本的人工检查，我们发现，在63条提到发烧的推文中，有15条(发烧)被否定，占辉瑞疫苗相关推文的23.80%。通过同样的过程，我们在Moderna tweets中获得了32.76%的否定。与此同时，在印度尼西亚的推文中，辉瑞疫苗对发烧的否定率为21.43%，Moderna疫苗对发烧的否定率为16.67%。否定在Twitter分析中是一个困难的挑战，因为表达否定的方式有很多，不一定能通过指定的否定词轻松过滤掉[ 46]。虽然否定处理可能会改善最终结果，但在过去的研究中，它似乎并没有阻碍推文在显示真实世界(未经过滤)数据的一致模式方面的效用[ 47]。考虑到在我们的随机推特样本中，每种语言中观察到的两种疫苗的阴性百分比相似，我们决定保留所有推特用于这些分析。

我们也没有办法验证这些推文是来自个人还是非个人(如公司)账户，以及该账户背后的个人是否真的接种了疫苗，并对报道的副作用进行了后续确认。最后，我们也缺乏足够的信息，关于副作用是来自第一剂、第二剂还是第三剂疫苗，因为我们仅限于与Twitter API查询的语言过滤器匹配的用户在tweet中分享的副作用，而没有任何更深入的人口统计或上下文信息。

结论

我们发现，发烧是日本和印度尼西亚推文中报道的最普遍的副作用，这可能反映了社交媒体对报道严重或可测量的副作用(如发烧)的偏见。此外，在检查来自不同疫苗制造商的副作用时，我们发现Twitter从日本和印度尼西亚获得的信息不一致，因为在日本，关于辉瑞疫苗的推文报道的副作用相对较多，而在印度尼西亚，关于Moderna疫苗的推文报道的副作用较多。因此，鉴于Twitter和疫苗新闻稿的发现存在不一致和差距，我们谨慎乐观地认为，Twitter可以证明对疫苗副作用的信息流行病学监测是有用的，这种监测最适合于检测日本和印度尼西亚人群中发烧症状的流行程度。

多媒体附录1

日语推文的推文ID。

多媒体附录2

印度尼西亚tweets的Tweet ID。

多媒体附录3

辉瑞(A)和Moderna (B)的雷达图，显示了每种副作用百分比的比较。

缩写

jsp

日本科学促进会

JST

日本科学技术振兴机构

信使核糖核酸

SICORP

战略国际研究合作计划

本工作得到日本科学技术振兴机构(JST)战略国际研究合作计划(SICORP)资助号JPMJSC2107，日本和日本科学促进协会(JSPS) KAKENHI资助号JP22K12041的支持。

KF在KL的协助下收集数据并进行分析，KF和KL撰写了稿件，SW和EA提供了重要的意见。所有作者都对研究的概念化和最初的研究设计做出了贡献。EA和SW监督这个项目。

没有宣布。

Dhama

Sharun

女子

Dadar

米

马利克

辛格

Chaicumpa

新出现的冠状病毒感染COVID-19:疫苗、免疫疗法和治疗方法的设计和开发进展与前景

哼疫苗免疫剂 2020 06 02 16 6 1232 1238

10.1080 / 21645515.2020.1735227

32186952

PMC7103671

Fadda

米

艾博年

搁浅船受浪摇摆

当COVID-19疫苗准备好时，我们都准备好了吗?

国际公共卫生 2020 07 65 6 711 712

10.1007 / s00038 - 020 - 01404 - 4

32529534

10.1007 / s00038 - 020 - 01404 - 4

PMC7288619

Yamey

Schaferhoff

米

哈契

脑袋

米

赵

麦克达德

乐

确保全球获得COVID-19疫苗

《柳叶刀》 2020 05 02 395 10234 1405 1406

10.1016 / s0140 - 6736 (20) 30763 - 7

32243778

s0140 - 6736 (20) 30763 - 7

PMC7271264

Eibensteiner

Ritschl

纳瓦兹

足总

泽

党卫军

Tsagkaris

Kulnik

圣

克鲁岑

Klager

Volkl-Kernstock

年代

Schaden

Kletecka-Pulker

米

Willschke

Atanasov

一个

尽管存在安全问题，人们仍愿意接种COVID-19疫苗:推特民意调查分析

J Med Internet Res 2021 04 29 23 4 e28973

10.2196/28973

33872185

v23i4e28973

PMC8086789

Latkin

代顿

易

Konstantopoulos

一个

Boodram

美国对新冠病毒疫苗的信任:社会生态学视角

社会科学 2021 02 270 113684

10.1016 / j.socscimed.2021.113684

33485008

s0277 - 9536 (21) 00016 - 2

PMC7834519

一个

罗素

Mihalcea

培根

霍夫曼

年代

Resnicow

与COVID-19疫苗相关的在线搜索行为:信息流行病学研究

JMIR Infodemiology 2021 1 1 e32127

10.2196/32127

34841200

v1i1e32127

PMC8601025

Bonnevie

Gallegos-Jeffrey

一个

Goldbarg

伯德

smyster

量化2019冠状病毒病大流行期间推特上反对疫苗的人数

卫生保健传播杂志 2020 12 15 14 1 12 19

10.1080 / 17538068.2020.1858222

律

汉

埃尔

Luli

门将

推特上与COVID-19疫苗相关的讨论:主题建模和情绪分析

J Med Internet Res 2021 06 29 23 6 e24435

10.2196/24435

34115608

v23i6e24435

PMC8244724

班达

Tekumalla

王

余

刘

丁

Chowell

用于开放科学研究的大规模COVID-19 Twitter聊天数据集——国际合作

ArXiv 2020 04 07 1

32550247

2004.03688

PMC7280901

Wakamiya

年代

卡瓦依

Aramaki

基于twitter的流感检测:基于间接信息的tweet:文本挖掘研究

公共卫生监测 2018 09 25 4 3. e65

10.2196 / publichealth.8627

30274968

v4i3e65

PMC6231889

Yousefinaghani

年代

达拉

Poljak

贝尔纳多

谢里夫

年代

对Twitter爆发检测潜力的评估:禽流感个案研究

Sci代表 2019 12 03 9 1 18147

10.1038 / s41598 - 019 - 54388 - 4

31796768

10.1038 / s41598 - 019 - 54388 - 4

PMC6890696

Kouzy

Abi Jaoude

Kraitem

一个

埃尔阿拉姆

卡拉姆反对

阿迪

Zarka

Traboulsi

阿克勒说道

电子战

巴多尔

冠状病毒传播:量化推特上的COVID-19错误信息流行

Cureus 2020 03 13 12 3. e7255

10.7759 / cureus.7255

32292669

PMC7152572

Marcec

Likic

使用Twitter对阿斯利康/牛津、辉瑞/BioNTech和Moderna COVID-19疫苗进行情绪分析

研究生医学J 2022 07 98 1161 544 550

10.1136 / postgradmedj - 2021 - 140685

34373343

postgradmedj - 2021 - 140685

PMC8354810

Sattar

Arifuzzaman

年代

COVID-19疫苗接种意识及后果:美国推特数据的公众情绪分析和接种人口预测

应用科学 2021 06 30. 11 13 6128

10.3390 / app11136128

郭

片

Vadde

王

澳大利亚推特用户与COVID-19疫苗接种相关的推文主题和情绪:机器学习分析

J Med Internet Res 2021 05 19 23 5 e26953

10.2196/26953

33886492

v23i5e26953

PMC8136408

迪克森

年代

2022年推特用户最多的国家

Statista 2022 07 27

2022-09-23

https://www.statista.com/statistics/242606/number-of-active-twitter-users-in-selected-countries/

伯尼尔

一个

《日语入门》

Babbel杂志 2021 07 28

2022-09-23

https://www.babbel.com/en/magazine/guide-to-japanese-language

Devlin

有多少人说印尼语?在哪里说印尼语?

Babbel杂志 2021 05 11

2022-09-23

https://www.babbel.com/en/magazine/how-many-people-speak-indonesian-where-is-it-spoken

王

年代

日本将于周三开始推广疫苗

美国有线电视新闻网 2021 02 17

2022-09-23

https://edition.cnn.com/world/live-news/coronavirus-pandemic-vaccine-updates-02-16-21/h_45ac6dc81faf4905a94fb4c8ab93092a

20.

Hasell

马修

Beltekian

麦克唐纳

Giattino

Ortiz-Ospina

拱形门

米

里奇

COVID-19跨国检测数据库

科学数据 2020 10 08 7 1 345

10.1038 / s41597 - 020 - 00688 - 8

33033256

10.1038 / s41597 - 020 - 00688 - 8

PMC7545176

焦

Aditya

一个

印度尼西亚开始推广COVID-19疫苗，佐科威是第一个接种疫苗的人

时间 2021 01 13

2022-09-23

https://time.com/5929160/indonesia-vaccine-rollout-jokowi/

大久保

吉冈

Ohfuji

年代

松尾

Tabuchi

日本COVID-19疫苗犹豫及其相关因素

疫苗(巴塞尔) 2021 06 17 9 6 662

10.3390 / vaccines9060662

34204465

vaccines9060662

PMC8234307

汗

MSR

Watanapongvanich

年代

Kadoya

日本年轻一代对新冠疫苗的犹豫

环境与公共卫生 2021 11 07 18 21 11702

10.3390 / ijerph182111702

34770216

ijerph182111702

PMC8583353

印度尼西亚卫生部国家免疫技术咨询小组(NITAG) 联合国儿童基金会世卫组织

印度尼西亚COVID-19疫苗接受情况调查 2020 11

2022-09-23

https://covid19.go.id/storage/app/media/Hasil%20Kajian/2020/November/vaccine-acceptance-survey-en-12-11-2020final.pdf

Boon-Itt

年代

Skunkan

Twitter上公众对COVID-19大流行的看法:情绪分析和主题建模研究

公共卫生监测 2020 11 11 6 4 e21978

10.2196/21978

33108310

v6i4e21978

PMC7661106

北川

甲斐绸

Sugiyama

一个

长岛

年代

Kurisu

一个

野村证券

Omori

秋田犬

Shigemoto

田中

Ohge

日本对BNT162b2和mRNA-1273 mRNA COVID-19疫苗的不良反应

J .感染化学 2022 04 28 4 576 581

10.1016 / j.jiac.2021.12.034

35058126

s1341 - 321 x (22) 00002 - 2

PMC8747950

twarc 2022-09-23

https://twarc-project.readthedocs.io/en/latest/

接种COVID-19疫苗后会发生什么

疾病控制和预防中心 2022-09-23

https://www.cdc.gov/coronavirus/2019-ncov/vaccines/expect/after.html

关于COVID-19疫苗接种后副作用或反应的信息

kipi 2022-09-23

https://kipi.covid19.go.id/

30.

COVID-19疫苗

日本厚生劳动省 2022-09-23

https://www.mhlw.go.jp/stf/covid-19/vaccine.html

出云

Kuse

Awano

语气

米

坂本

高田

Muto

藤本

saki

一个

伊藤

松本

Inomata

米

日本BNT162b2信使核糖核酸冠状病毒病2019疫苗的副作用和抗体滴度转移

和Investig 2021 09 59 5 635 642

10.1016 / j.resinv.2021.06.003

34210623

s2212 - 5345 (21) 00111 - 8

PMC8214200

波兰人

《外交政策》

托马斯。

Kitchin

Absalon

Gurtman

一个

洛克哈特

年代

佩雷斯

莱托

佩雷斯马克

Moreira

艾德

Zerbini

贝利

Swanson

卡

Roychoudhury

年代

Koury

李

Kalina

西弗吉尼亚州

库珀

Frenck

密特

噢

Tureci

内尔

Schaefer

一个

Unal

年代

Tresnan

马瑟

年代

Dormitzer

公关

Şahin

詹森

格鲁伯

C4591001临床试验组

BNT162b2 mRNA新冠病毒疫苗的安全性和有效性

[英]医学 2020 12 31 383 27 2603 2615

10.1056 / NEJMoa2034577

33301246

PMC7745181

巴登

El sah

嗯

Essink

Kotloff

弗雷

年代

诺瓦克

Diemert

斯佩克特

Rouphael

克里奇

McGettigan

Khetan

年代

•西格尔画

索利斯

Brosz

一个

Fierro

施瓦兹

Neuzil

科里

吉尔伯特

琼斯

Follmann

Marovich

米

Mascola

Polakowski

Ledgerwood

格雷厄姆

废话

班尼特

Pajon

骑士的

Leav

邓

周

汉

年代

Ivarsson

米

米勒

zak

COVE研究小组

mRNA-1273 SARS-CoV-2疫苗的有效性和安全性

[英]医学 2021 02 04 384 5 403 416

10.1056 / NEJMoa2035389

33378609

PMC7787219

佐藤

桥本

时候喜欢

米

词距词典mecabipadneologd的实现及其在信息检索中的有效应用

2017

第23届自然语言处理协会年会

2017年3月13日至17日

筑波，茨城县，日本

佐藤

基于网络语言资源的新词词典

Neologd / mecab- ipadd - Neologd 2015

2022-09-23

https://github.com/neologd/mecab-ipadic-neologd

佐藤

桥本

他说

NEologd分词词典生成系统的操作(日语)

2016

日本信息处理学会，自然语言处理特别兴趣小组(IPSJ-SIGNL

2016年12月20日至22日

东京

nl - 229 15

Hosmer小

Lemeshow

年代

斯特

处方

应用逻辑回归 2013

新泽西州霍博肯,

约翰威利父子公司

Nagelkerke

NJD

关于决定系数一般定义的说明

生物统计学 1991 78 3. 691 692

10.1093 / biomet / 78.3.691

COVID-19疫苗

日本首相办公室 2022-09-23

https://www.kantei.go.jp/jp/headline/kansensho/vaccine.html

罗

霁

唐

杜

探讨专业人士和外行人对COVID-19疫苗的表达差异:文本挖掘方法

J Med Internet Res 2021 08 27 23 8 e30715

10.2196/30715

34346885

v23i8e30715

PMC8404777

Twitter在日本2021财年的渗透率(按年龄组划分)

Statista 2022 09 07

2022-09-23

https://www.statista.com/statistics/1077538/japan-twitter-penetration-rate-by-age-group/

Saita

米

严

伊藤

Sasano

Seyama

Naito

两剂BNT162b2 mRNA COVID-19疫苗后的反应原性:来自日本医护人员的真实证据

J .感染化学 2022 01 28 1 116 119

10.1016 / j.jiac.2021.09.009

34580011

s1341 - 321 x (21) 00258 - 0

PMC8443338

丽安

在

杜

唐

使用机器学习方法从Twitter数据中监测COVID-19疫苗不良事件(VAE)

疫苗(巴塞尔) 2022 01 11 10 1 103

10.3390 / vaccines10010103

35062764

vaccines10010103

PMC8781534

杰克逊

拉

王

社交网站使用中的文化差异:中美比较研究

人类行为中的计算机 2013 5 29 3. 910 921

10.1016 / j.chb.2012.11.024

Colleoni

罗札

一个

Arvidsson

一个

回音室还是公共领域?利用大数据预测Twitter上的政治倾向和衡量政治同质性

J Commun 2014 03 19 64 2 317 332

10.1111 / jcom.12084

Kharde

弗吉尼亚州

Sonawane

年代

Twitter数据的情感分析:技术综述

IJCA 2016 04 15 139 11 5 15

10.5120 / ijca2016908625

Aramaki

Maskawa

年代

盛田昭夫

米

推特捕捉流感:使用推特检测流感流行

2011

自然语言处理经验方法研讨会

2011年7月27日至31日

英国爱丁堡