这是一篇开放获取的文章,根据创作共用署名许可(https://creativecommons.org/licenses/by/4.0/)的条款发布,允许在任何媒介上无限制地使用、分发和复制,前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。
COVID-19大流行对全球公共卫生和社会经济产生了重大影响,因此通过接种COVID-19疫苗实现群体免疫是保护人民和恢复经济的重要因素。在所有国家中,日本在几个月内成为COVID-19疫苗接种率最高的国家之一,尽管日本的疫苗信心在世界范围内最低。
我们试图通过推特分析,在全球疫苗置信水平最低的情况下,找出日本快速接种新冠疫苗的原因。
我们从2021年2月1日至9月30日的时间轴内的大规模公共COVID-19推特聊天数据集中下载了与COVID-19相关的日本推文。每日接种病例数从日本首相办公室官方网站收集。预处理后,我们进行了一格和二格令牌分析,计算了交叉相关和Pearson相关系数(
我们筛选了190,697条与疫苗相关的推文。通过n-gram令牌分析,我们发现了整个时期内最多的字母和字母。在排名前6位的所有组合中,同时包含“储备”和“场所”两个关键词的推文与每日疫苗接种病例的相关性最大(
我们的研究表明,对COVID-19危险的认识可能会增加接种疫苗的意愿。在疫苗供应充足的情况下,有效提供疫苗预约信息可能是人们接种疫苗的重要因素。在我们的研究期间,我们没有发现日本疫苗信心增加的证据。我们建议政策制定者分享关于传染病和疫苗接种的准确和及时的信息,并努力使疫苗保留信息更顺利地提供。
自2019年12月出现首例COVID-19病例以来,COVID-19已在全球蔓延,并已成为国际关注的突发公共卫生事件[
高疫苗接种率被认为是由高疫苗信心所促进的[
但是,自大规模疫苗接种开放以来(2021年5月24日),日本的疫苗接种速度令人印象深刻。截至2021年6月1日,日本的第一剂疫苗接种率约为6.8%,超过70%的人口在2021年9月30日之前至少接受了一剂疫苗[
推特是一个广泛使用的社交媒体平台,由于其量大、实时可用、便于公众搜索和访问等优点,越来越受到公共卫生研究人员的关注。
这项回顾性研究旨在确定日本与快速COVID-19疫苗接种相关的公众情绪和担忧。我们假设疫苗接种率的上升可能是由于公众对疫苗的信心增强(S1)和对感染的恐惧(S2)等主观因素,以及包括充足的疫苗供应(O1)和有效的疫苗交付预约相关信息(O2)等客观因素。为了验证这些假设,我们收集了2021年2月1日至9月30日期间发布的与疫苗相关的推文。然后,我们对收集到的推文进行预处理,并进行了符号分析、情感分析和主题建模。
在以往的大规模Twitter分析工作中,经过预处理后,主要有4种自然语言处理(NLP)方法:n-gram token analysis [
本研究中使用的数据来自大规模的公开COVID-19推特聊天数据集[
然后对下载的推文进行清理和处理。使用Python包tweepy过滤转发。没有包含疫苗相关关键词的推文被删除。中过滤使用的关键字
为了方便起见,我们的结果中所有日语单词都直接以英语翻译形式呈现。中提供了英日翻译表
在许多其他NLP任务之前,标记化是必要的,特别是对于许多非拉丁语言,例如日语。我们删除了Python包NLTK中预定义的英语和日语停止词[
相关系数在社交媒体分析中被广泛应用。在谷歌Trends分析中,计算传染病报告病例数与相关关键词搜索趋势之间的相关性。在推特分析中,还调查了每日感染或死亡病例与相关推文数量或情绪评分之间的相关性[
在n-gram分析之后,在与COVID-19疫苗接种相关的社交媒体分析中,经常使用情绪分析来探索实时的公众态度,这可能反映了对COVID-19疫苗和相关政策的接受程度[
主题建模应用于从不同情绪的推文中识别细粒度信息[
然后,我们检查了与不同主题相关的推文的趋势。定义所有收集的tweet中的第i条tweet为
这项研究使用了乔治亚州立大学Panacea实验室收集的公开和可访问的推文,允许免费下载。我们声明,我们的分析总体上符合Twitter的使用政策,但没有确定发布推文的具体个人。此外,从PMOJ下载的疫苗接种病例数是公开的政府数据。因此,所描述的活动不符合人体主体研究的要求,也不需要机构审查委员会的审查。
根据数据集中的ID和地区信息,我们下载了在2021年2月1日至9月30日期间发布的979,636条日语推文。经过筛选,筛选出190,697条与疫苗相关的推文。因此,与疫苗相关的推文总数从2月份的14758条增加到8月份的34692条,然后在9月份减少到27824条。
PELT算法检测到的字母词频率变化点为6个,排名前6位的字母词分别为日语单词“感染”、“日本”、“储备”、“辉瑞”、“会场”和“突变”。与疫苗安全性有关的unigram“副作用”总体排名第八。从2月到9月,“感染”、“储备”和“场地”三个字母逐渐进入前3名,如图所示
PELT算法检测到的重词频次变化点为5个,排在前5位的是日语重词“Astra + Zeneca”、“reserve + available”、“article + Reuters”、“venue + reserve”、“medical care + workers”。从6月到9月,“储备+可用”和“场地+储备”两大组合进入前2,“阿斯特拉+利康”的排名从5月开始下降,如图
在ungram的相关分析中,“reserve”和“venue”的时间滞后均为0,疫苗接种病例连续5天领先含有“infection”的推文数。后计算
每月十大字母的翻译。条形图的长度表示每个月推文中的词语频率。
每月十大八卦的翻译。条形图的长度表示每个月推文中的词语频率。
同时包含“储备”和“地点”两个字母的推文趋势,以及每日首次接种疫苗病例的曲线。
对于biggram,“venue + reserve”biggram与unigram分析重叠,被排除在这一部分。“储备+可用”和“文章+路透社”两组的时间滞后为0,疫苗接种病例分别领先“阿斯特拉+利康”和“医疗+工作者”116天和63天。“储备+可用”和“文章+路透社”两组的交叉相关性最高。“Astra + Zeneca”(
在所有推文中,有4453条(2.3%)是正面的,19340条(10.1%)是负面的,164687条(86.4%)是中性的,2217条(1.2%)是正面和负面情绪混合的。每日标记为正面和负面的推文数量的比较显示在
每日正面(橙色)和负面(绿色)推文数量的比较。
8种情绪的dov显示在
疫苗相关推文中8种情绪的每日平均效度。
每个LDA主题的前10个关键字显示在
“感染”相关推文数量的期望与“疫苗信心”相关推文数量的比值示于
潜狄利克雷分配模型分析2个主题的前10个关键词。条形表示权重,可以看作是每个主题中关键字的伪计数。
“感染”相关推文数量预期与“疫苗信心”相关推文数量之比。
高疫苗接种率被认为是由高疫苗信心所促进的[
有几个结果支持假设S2。在符号分析中所示
从主题建模结果中获得了更多假说S2的证据。从主题1(“感染”)的关键词中,我们可以看出公众对感染和死亡率的关注。变异的病毒和强大的病例也导致了恐惧。Willis等人[
我们还提供了接种疫苗和假设O2之间存在密切关系的证据。Bigram分析
我们没有发现假说S1的任何证据。Macaraan报告称,菲律宾人对COVID-19疫苗接种计划的态度从犹豫转变为信心[
我们的结果部分与测量疫苗犹豫的5c模型(信心、能力、便利、计算和集体责任)有关[
我们承认,我们的研究可能存在一些潜在的局限性:(1)日本Twitter用户的人口结构不平衡[
这项回顾性研究旨在确定日本快速疫苗接种过程的原因,这可能对推动全球传染病疫苗接种具有指导意义。总之,我们的工作表明,对COVID-19危险的认识增加了接种疫苗的意愿;在疫苗供应充足的情况下,有效的预约信息传递可能会为人们提供更多的接种机会。衡量疫苗犹豫的模型可能还需要提高提供保留信息作为衡量标准的效率。基于我们的发现,我们建议公共卫生政策制定者和政府分享关于传染病和疫苗接种的准确和及时的信息。此外,加强多层次相关机构和新媒体业务的紧密合作,可使疫苗预约信息的传递更加顺畅。
疫苗相关推文的关键词选择及相应的翻译;论文中使用的英语翻译和相应的日语原文;使用五倍交叉验证对不同LDA主题数进行平均对数似然得分。
与符号
亚马逊网络服务
价度
潜在狄利克雷分配
自然语言处理
剪枝精确的线性时间
日本首相办公室
这项工作得到了JST SPRING(授权号JPMJSP2110)的支持。
QN和JL进行分析并起草手稿。所有作者都构思了这项研究,解释了结果,并修改了手稿。所有作者均已阅读并批准最终稿。
没有宣布。