发表在gydF4y2Ba在gydF4y2Ba25卷gydF4y2Ba(2023)gydF4y2Ba

本文的预印本(早期版本)可在gydF4y2Bahttps://preprints.www.mybigtv.com/preprint/44965gydF4y2Ba,首次出版gydF4y2Ba.gydF4y2Ba
COVID-19期间由于心理健康状况和经济脆弱性造成的情绪困扰:使用半监督机器学习算法对调查相关推特数据进行回顾性分析gydF4y2Ba

COVID-19期间由于心理健康状况和经济脆弱性造成的情绪困扰:使用半监督机器学习算法对调查相关推特数据进行回顾性分析gydF4y2Ba

COVID-19期间由于心理健康状况和经济脆弱性造成的情绪困扰:使用半监督机器学习算法对调查相关推特数据进行回顾性分析gydF4y2Ba

原始论文gydF4y2Ba

1gydF4y2Ba美国纽约州雪城大学麦克斯韦公民与公共事务学院公共行政与国际事务部gydF4y2Ba

2gydF4y2Ba美国纽约州雪城大学麦克斯韦公民与公共事务学院政策研究中心gydF4y2Ba

3.gydF4y2Ba早稻田大学高级研究院,东京,日本gydF4y2Ba

4gydF4y2Ba日本东京Wako大学人文科学学院gydF4y2Ba

通讯作者:gydF4y2Ba

上田美智子博士gydF4y2Ba

公共行政与国际事务部gydF4y2Ba

麦克斯韦尔公民与公共事务学院gydF4y2Ba

锡拉丘兹大学gydF4y2Ba

埃格斯大厅426号gydF4y2Ba

锡拉丘兹,纽约州,13244gydF4y2Ba

美国gydF4y2Ba

电话:1 3154439046gydF4y2Ba

电子邮件:gydF4y2Bamiueda@syr.edugydF4y2Ba


背景:gydF4y2Ba在快速发展的公共卫生危机期间,如COVID-19大流行期间,利用社交媒体用户在社交媒体上的帖子作为一种相对简单和经济有效的方法,迅速受到欢迎。然而,创建这些职位的个人的特征在很大程度上是未知的,因此很难确定受此类危机影响最大的个人群体。此外,心理健康状况的大型注释数据集不容易获得,因此,有监督的机器学习算法可能不可行或成本太高。gydF4y2Ba

摘要目的:gydF4y2Ba这项研究提出了一个机器学习框架,用于实时监测心理健康状况,不需要大量的训练数据。通过调查链接的推文,我们根据日本社交媒体用户的属性和心理状况跟踪了COVID-19大流行期间的情绪困扰程度。gydF4y2Ba

方法:gydF4y2Ba我们于2022年5月对居住在日本的成年人进行了在线调查,收集了他们的基本人口统计信息、社会经济状况和心理健康状况,以及他们的推特账号(N=2432)。我们使用一种称为潜在语义标度(LSS)的半监督算法,计算了研究参与者在2019年1月1日至2022年5月30日期间发布的所有推文(N=2,493,682)的情绪困扰评分,数值越高表明情绪困扰水平越高。在按年龄和其他标准排除用户后,我们在2019年和2020年检查了560人(23.03%)(18-49岁)生成的495021条(19.85%)推文。我们估计了固定效应回归模型,通过社交媒体用户的心理健康状况和特征,来检查他们在2020年相对于2019年相应周的情绪困扰水平。gydF4y2Ba

结果:gydF4y2Ba我们的研究参与者的情绪困扰估计水平在学校关闭开始的那一周(2020年3月)有所增加,并在2020年4月初紧急状态开始时达到峰值(估计系数=0.219,95% CI 0.162-0.276)。他们的情绪痛苦程度与COVID-19病例数量无关。我们发现,政府诱导的限制对弱势群体的心理状况产生了不成比例的影响,包括低收入、不稳定就业、抑郁症状和自杀意念。gydF4y2Ba

结论:gydF4y2Ba这项研究建立了一个框架来实施对社交媒体用户情绪困扰水平的近实时监测,强调了使用与调查相关的社交媒体帖子作为行政和大规模调查数据的补充来持续监测他们的健康状况的巨大潜力。鉴于其灵活性和适应性,所提出的框架很容易扩展到其他目的,例如检测社交媒体用户的自杀倾向,并可用于流数据,以持续测量任何感兴趣的群体的状况和情绪。gydF4y2Ba

中国医学杂志,2016;25:e44965gydF4y2Ba

doi: 10.2196/44965gydF4y2Ba

关键字gydF4y2Ba



背景gydF4y2Ba

作为一场全球卫生危机,COVID-19大流行给全球决策者带来了前所未有的挑战。这一疾病不仅对公众的身体健康构成重大威胁,而且由于疾病本身的后果和政府为遏制疾病蔓延而采取的行动(包括城市/社区封锁、学校关闭和行动限制),也造成了严重的心理痛苦。gydF4y2Ba

在迅速发展的公共卫生危机期间,如COVID-19大流行,持续监测人口的心理健康至关重要。然而,对人口心理健康的实时监测仍然具有挑战性,主要原因是缺乏可用于监测目的的适当数据和技术。传统的公共卫生监测方法,包括使用医院和死亡记录的方法,通常在报告时存在时滞。他们也缺乏关于患者或死者的详细信息,比如他们的社会经济地位。精心设计的大规模调查数据可以揭示人群的心理状况,但不适合持续监测,因为长时间频繁调查是不可可行的。gydF4y2Ba

最近的一种方法使用数字追踪,如社交媒体帖子,来了解普通人群或社交媒体用户的情绪和状况[gydF4y2Ba1gydF4y2Ba].这种方法在COVID-19大流行期间受到欢迎,是一种相对简单且经济有效的选择,因此有许多研究分析了推特数据的内容,以了解社交媒体用户的情绪和心理健康[gydF4y2Ba2gydF4y2Ba-gydF4y2Ba8gydF4y2Ba].虽然它们提供了一个强大的框架,但创建这些帖子的个人的身份和属性在很大程度上是未知的。因此,很难了解哪部分社交媒体用户受到危机及其相关中断的重大影响;例如,之前的研究分析了推文,目前还不清楚处于财务困境的个人是否比财务稳定的个人受到疫情的影响更严重。有人提出了计算社交媒体用户属性的方法,但这些方法仅限于基本的人口统计信息,如年龄群体和性别[gydF4y2Ba9gydF4y2Ba].gydF4y2Ba

目标gydF4y2Ba

这项研究有两个目的。首先,我们提出了一个机器学习框架,用于实时监测心理健康状况,不需要大量的训练数据。其次,使用与调查相关的推文,我们根据特征和心理状况跟踪了日本社交媒体用户在COVID-19大流行期间的情绪困扰程度。我们假设当(1)感染数量增加时,社交媒体用户的情绪困扰水平增加;(2)与covid -19相关的新闻数量增加,因为这可能会增加他们的焦虑和恐惧;(3)政府引入了重大的社会限制;(4)当媒体报道名人自杀身亡时。最后一个假设的产生,是因为先前的研究结果强烈表明,在媒体报道了著名的自杀事件后,自杀人数往往会增加[gydF4y2Ba10gydF4y2Ba,gydF4y2Ba11gydF4y2Ba]以及推特用户对这些报道的情绪化反应[gydF4y2Ba12gydF4y2Ba,gydF4y2Ba13gydF4y2Ba].据报道,2020年日本发生了两起名人自杀事件。第一次是7月中旬,一名30岁的男演员,第二次是9月底,一名40岁的女演员。gydF4y2Ba

Twitter是这项研究的一个合适的数据来源。Twitter是日本最受欢迎的社交媒体平台之一,日本的活跃用户数量估计在6000万左右,几乎占到日本人口的一半,在世界上排名第二[gydF4y2Ba14gydF4y2Ba].gydF4y2Ba

COVID-19在日本gydF4y2Ba

我们的研究重点是COVID-19大流行的第一年(2020年)和2019年作为基准期。2020年1月15日,日本确诊首例COVID-19病例,2月初又有消息称,一艘停泊在横滨港的游轮上出现了聚集性COVID-19病例。学校于2020年3月2日开始停课,持续了约3个月。该国于2020年4月7日首次宣布进入紧急状态。在紧急状态期间没有实行封锁。紧急状态于2020年5月25日解除,直到2021年1月才宣布紧急状态。到2020年初夏,生活短暂地恢复了正常。6月19日取消了跨县流动限制,政府于7月22日启动了鼓励国内旅行的补贴计划,一直持续到2020年12月28日。该国2020年3月至12月的平均严格指数为36.66(满分为100),低于七国集团其他国家同期的平均指数66.50 [gydF4y2Ba15gydF4y2Ba].截至2020年12月31日,日本新冠肺炎病例总数和死亡人数分别为1901.94人和28.17人/ 100万人,而七国集团其他国家的相应数字分别为34588.96人和909.79人/ 100万人[gydF4y2Ba15gydF4y2Ba].gydF4y2Ba


调查gydF4y2Ba

我们于2022年5月8日和24-28日对居住在日本的成年人进行了匿名在线调查,这是一个更大项目的一部分。我们请一家名为调查研究中心(survey Research Center)的商业调查公司从其注册参与者中抽取样本,该公司是日本规模最大的注册参与者,有200多万人。gydF4y2Ba

调查分两步进行。首先,调查公司向居住在日本、年龄在18岁以上的参与者发出了一份关于Twitter使用情况的简短问卷。那些回答说他们经常在他们的公共Twitter账户上上传帖子的人,以及那些明确同意我们为研究目的下载他们过去和将来的推文的人,然后被要求提供他们的Twitter处理号(账户名),这是调查的第一部分。然后,我们使用Twitter的应用程序编程接口(API)验证每个用户帐户的存在性和使用频率。只有那些拥有合法账户的人被邀请参加调查的第二部分。在第二部分中,我们询问了参与者的基本人口统计信息、社会经济地位、心理健康状况和孤独感(稍后会详细介绍)。调查公司预先筛选了无效和不完整的回答,因此,调查中没有遗漏的数据。我们样本的初始大小是2432。gydF4y2Ba

我们排除了729名未通过调查中2个注意力检查问题的参与者;失败表明对任务缺乏承诺。其他基于参与者Twitter使用情况的排除标准将在后面的Twitter数据收集小节中解释。gydF4y2Ba

道德的考虑gydF4y2Ba

参与者在一份在线表格中明确表示同意参与调查,并检索过去和未来的推文(2019年1月1日至2022年6月30日)。调查是匿名的,参与者可以随时关闭浏览器退出调查。完成后,他们从调查公司获得了少量的金钱补偿。该研究得到了Wako大学伦理委员会的批准(批准号:2022-004)。gydF4y2Ba

措施gydF4y2Ba

调查的主要问题包括参与者的年龄、性别、家庭年收入(以200万日元为单位,14850.40美元为增量)、就业状况和就业类型(如果有工作的话)。其他人口统计信息,如婚姻状况和居住地区,包括在问卷中,但没有在本研究中使用。参与者被分为3个年龄组(18-29岁、30-39岁和40-49岁)。在这项研究中,我们将参与者的年龄限制在18到49岁之间,因为老一辈人不太可能积极使用Twitter。gydF4y2Ba16gydF4y2Ba].此外,积极使用Twitter的老年人不太可能是老年人口的代表。我们根据年龄标准从分析中排除了737名(29.98%)参与者。gydF4y2Ba

对于收入群体,我们将样本分为两组:家庭年收入低于600万日元(截至2022年11月为44,551.20美元)或同等收入的人群,以及家庭年收入≥600万日元的人群。截至2020年,日本家庭收入中位数和平均水平分别为440万日元(32,670.88美元)和560万日元(41,581.12美元)[gydF4y2Ba17gydF4y2Ba].gydF4y2Ba

就业状况和就业类型被合并为一个变量,参与者被分为“永久雇员”、“兼职/临时工或失业者”和“非劳动力”。第二类包括短期合同工、派遣工、兼职/小时工和正在积极寻找工作的人。当我们按就业状况和类型对数据进行分层时,不属于这3类中的任何一类的参与者,例如那些在就业状况中选择“其他”的参与者,被排除在分析之外。gydF4y2Ba

我们使用9项患者健康问卷(PHQ-9)测量参与者的抑郁症状水平[gydF4y2Ba18gydF4y2Ba].PHQ-9的总分范围从0到27,我们将参与者分为两组,“无抑郁症状”和“有抑郁症状”,使用10分或更高的分数作为后者的分界点,建议[gydF4y2Ba19gydF4y2Ba].样本的Cronbach α为。91。gydF4y2Ba

我们还用PHQ-9的最后一项(第9项)测量了自杀意念的水平。这个问题问的是,在过去的两周里,被试者有多少次被“死了会更好”或“以某种方式伤害自己”的想法困扰。对第9项的回应显示与实际自杀风险有关[gydF4y2Ba20.gydF4y2Ba,gydF4y2Ba21gydF4y2Ba].我们将参与者分为两组:“没有自杀念头”(回答“完全没有”的人)和“有自杀念头”(回答“几天”、“一大半天”或“几乎每天”的人)。gydF4y2Ba

孤独感的程度由3项孤独感量表[gydF4y2Ba22gydF4y2Ba].总分从3分到9分,根据之前的研究,参与者被分为两组,以6分或6分以上为“孤独”类别的分界点。gydF4y2Ba23gydF4y2Ba,gydF4y2Ba24gydF4y2Ba].gydF4y2Ba

需要指出的是,参与者的特征和状况是在2022年5月测量的,因此,他们在2019年和2020年可能会有所不同。特别是,一些参与者的心理健康状况可能在大流行的高峰期更糟,这可能导致其中一些人被错误地归类为“无抑郁症状”类别,例如,实际上他们在2020年就有这种心理症状(另见后面的讨论部分)。gydF4y2Ba

数据gydF4y2Ba

新闻报道gydF4y2Ba

我们还收集了2020年与COVID-19相关的新闻报道数量和报告的COVID-19病例数量的数据,以研究媒体对COVID-19的报道量和COVID-19感染率的严重程度与情绪困扰水平之间的关系。有关新闻报道的数据来自日本放送协会(NHK;国家公共媒体),该网站记录了过去与COVID-19有关的所有新闻[gydF4y2Ba25gydF4y2Ba],我们计算每周新闻报道的数量。我们没有区分国内和国际事件。关于COVID-19的第一份报告于2020年1月5日发布,涉及中国武汉报告的一例原因不明的肺炎病例。每周新增确诊病例总数由“我们的世界”数据网站计算[gydF4y2Ba15gydF4y2Ba].gydF4y2Ba

推文gydF4y2Ba

自2019年1月以来,我们使用Twitter API和学术开发人员帐户收集了参与者在Twitter上的全部历史公开帖子,这允许我们无限制地下载特定用户的公开帖子。gydF4y2Ba

我们回顾性地收集了所有调查参与者在2019年1月1日至2022年5月30日期间发布的所有推文(N=2,493,682)。然后,我们使用一种称为潜在语义缩放(LSS)的半监督算法为每条推文计算一个窘迫分数[gydF4y2Ba26gydF4y2Ba].对于本研究而言,这是一种理想的内容分析方法,因为创建一个关键词字典来检测精神痛苦的所有迹象,或者选择大量这样的推文来训练有监督的机器学习算法(例如神经网络)是不可实现的。gydF4y2Ba

LSS识别所有其他单词的语义,包括推文中的表情符号,基于几个表征情绪困扰状态的“种子词”。该算法通过计算种子词与语料库中所有其他词之间的语义相似性来实现这一点。在选择情感困扰的种子词时,我们首先使用“词汇”创建了一个与消极精神状态相关的候选词列表gydF4y2Ba日语情感表达词典gydF4y2Ba[gydF4y2Ba27gydF4y2Ba],然后用LSS模型来手动检查它们的语义。在最终确定种子词之前,我们丢弃了与情绪困扰不一定相关的词具有高度相似度的候选词(gydF4y2Ba表1gydF4y2Ba).在计算单词之间的语义相似性时,我们包括了我们在2019年至2022年期间收集的所有推文,以尽可能多地为算法提供信息。gydF4y2Ba

表1。种子词用于情感上的痛苦。gydF4y2Ba
状态gydF4y2Ba 日本gydF4y2Ba 英语(翻译)gydF4y2Ba
更糟糕的是gydF4y2Ba 悩み,心配,嘆く,泣く,悔しい,困る,しんどい,苦痛gydF4y2Ba 担心、哀叹、哭泣、后悔、烦恼、烦恼、苦恼、痛苦gydF4y2Ba
更好的gydF4y2Ba 楽しみ,絶好調,喜ぶ,笑う,嬉しい,幸せ,のんびり,元気gydF4y2Ba 有趣,伟大,高兴,笑,快乐,放松,精力充沛gydF4y2Ba
LSS算法gydF4y2Ba

LSS对文档特征矩阵进行奇异向量分解(SVD),以估计单词的语义接近度。在数学上,该方法类似于其他降维技术,如因子分析。SVD首先应用于文档术语矩阵gydF4y2BaDgydF4y2Ba,gydF4y2Ba

在哪里gydF4y2Ba包含字向量gydF4y2BavgydF4y2Ba1gydF4y2Bav,……gydF4y2BafgydF4y2Ba为了所有的文字。接下来是平均相似度gydF4y2BaggydF4y2Ba1gydF4y2Bag,……gydF4y2BafgydF4y2Ba在S中的种子词的词向量之间计算,以创建所有词的极性得分,gydF4y2BapgydF4y2Ba年代gydF4y2Ba:gydF4y2Ba

在哪里gydF4y2Ba因为(vgydF4y2BaxgydF4y2Ba, vgydF4y2BaygydF4y2Ba)gydF4y2Ba词向量之间的余弦相似度是多少gydF4y2BaxgydF4y2Ba而且gydF4y2BaygydF4y2Ba.我们将文档维度设置为200,以捕获SVD中单词的更多基本语义。我们计算了一条推文的极性得分gydF4y2BakgydF4y2Ba,包括gydF4y2BaFgydF4y2Ba,通过取极性分数的和gydF4y2BaggydF4y2BafgydF4y2Ba根据单词的出现频率进行加权gydF4y2BahgydF4y2BafgydF4y2Ba:gydF4y2Ba

在哪里gydF4y2BaNgydF4y2Ba是推文的总字数。极性分数重新集中到语料库的总体平均值,并通过分数的SD重新缩放。这种重新缩放使得分数更容易解释,因为它们在SD=1时分布在0附近。gydF4y2Ba

最后,我们确定了不活跃用户的帖子、非日文的帖子、只包含流行新闻网站链接的帖子以及转发的帖子。在排除了仅由此类帖子组成的帖子的用户(N=406, 16.69%)后,我们得到了一个由560人(23.03%)在2019年和2020年生成的495021条(19.85%)推文的语料库。在最终数据集中的495,021条推文中,488,284条(98.64%)被分配了LSS评分并用于后续分析。gydF4y2Ba

由人工编码员验证LSSgydF4y2Ba

我们通过将LSS评分与人工注释人员的手动编码结果进行比较,验证了LSS评分的有效性。在这项任务中,我们使用了先前在试点研究中收集的随机公共推文子集(N=800),在该研究中我们构建了一个大型公共推文语料库。使用中列出的种子词gydF4y2Ba表1gydF4y2Ba,我们首先使用试点数据计算LSS分数,这与本研究的数据集相似。我们请了3名日语母语的人工注释人员独立阅读800条推文,然后,对每条推文,仅根据内容判断推文者的情绪状态。换句话说,编码员只能查看一条推文,而不能查看同一用户或用户资料发布的后续或之前的推文。这3名编码人员分别将这800条推文编码为“好”、“中性”或“坏”的情绪状态。如果3名编码员将每条推文评为“坏”(或“好”),我们给它打2分(或-2分);如果编码被分开,但2名编码员将其评为“坏”(或“好”),我们给每条推文打1分(或-1分)。我们给所有其他结果都打了0分。然后,我们计算了5个人类注释分数类别(-2,-1,0,1和2)的平均LSS分数,以检查它们之间的关联。gydF4y2Ba

回归分析gydF4y2Ba

为了跟踪大流行期间情绪痛苦水平的每周变化,我们使用个人推文估计了以下模型:gydF4y2Ba

在哪里gydF4y2BaLSSgydF4y2Ba我,不gydF4y2Ba是gydF4y2BaLSSgydF4y2Ba个人推文得分gydF4y2Ba我gydF4y2Ba在时间gydF4y2BatgydF4y2Ba,gydF4y2BawgydF4y2BaτgydF4y2Ba是2020年week的一个指标变量,gydF4y2BaδgydF4y2BaτgydF4y2Ba是否有一个系数与每周指标相关gydF4y2Ba> wgydF4y2BaτgydF4y2Ba,gydF4y2BaγgydF4y2Ba我gydF4y2Ba对个人有固定效果吗gydF4y2Ba我gydF4y2Ba,并包含一年中的第几周和一周中的第几天的固定效果。因此,该模型考虑了个体之间的基线异质性,例如他们固有的痛苦水平和心理健康状况,以及研究参与者在不同时期的情绪的任何基线变化,包括季节性(每周变化)和周内变化。我们估计了所有参与者的模型,然后根据他们的属性(如性别和孤独感)分别评估大流行期间的重大事件是否对不同群体的个体产生了不同的影响。注意,模型中包括用户固定效应,因此,不需要人口统计控制,估计策略利用参与者LSS评分的时间变化。SEs按参与者分组。gydF4y2Ba


样本特征gydF4y2Ba

表2gydF4y2Ba报告参与者的数量,按他们的属性和抑郁症状的水平,自杀意念,和孤独。当我们按性别对数据进行分层时,由于人数较少,我们排除了3名选择“其他”或“不愿回答”的参与者。同样,当我们按就业状况/类型进行分析时,那些选择“其他”作为职业的人(N= 13,2.3%)被排除在分析之外。gydF4y2Ba

表2。样本特征(N=560)。gydF4y2Ba
特征gydF4y2Ba 参与者,n (%)gydF4y2Ba
性(N = 557)gydF4y2Ba一个gydF4y2Ba

男性gydF4y2Ba 237 (42.5)gydF4y2Ba

女gydF4y2Ba 320 (57.5)gydF4y2Ba
年龄(年)gydF4y2Ba

~ 29gydF4y2Ba 83 (14.8)gydF4y2Ba

- 39gydF4y2Ba 228 (40.7)gydF4y2Ba

40至49gydF4y2Ba 249 (44.5)gydF4y2Ba
收入(日元/美元)gydF4y2BabgydF4y2Ba

< 600万(<44,551.20)gydF4y2Ba 350 (62.5)gydF4y2Ba

≥6万(≥44,551.20)gydF4y2Ba 210 (37.5)gydF4y2Ba
就业(N = 547)gydF4y2BacgydF4y2Ba

兼职/临时工或失业者gydF4y2Ba 174 (31.8)gydF4y2Ba

正式员工gydF4y2Ba 294 (53.8)gydF4y2Ba

不在劳动力市场gydF4y2Ba 79 (14.4)gydF4y2Ba
抑郁症状gydF4y2Ba

没有gydF4y2Ba 384 (68.6)gydF4y2Ba

是的(phq - 9gydF4y2BadgydF4y2Ba> = 10)gydF4y2Ba 176 (31.4)gydF4y2Ba
自杀意念gydF4y2BaegydF4y2Ba

没有gydF4y2Ba 391 (69.8)gydF4y2Ba

是的gydF4y2Ba 169 (30.2)gydF4y2Ba
孤独gydF4y2Ba

不孤独(3项孤独<6)gydF4y2Ba 284 (50.7)gydF4y2Ba

孤独(3项孤独感≥6项)gydF4y2Ba 276 (49.3)gydF4y2Ba

一个gydF4y2Ba排除3名参与者。gydF4y2Ba

bgydF4y2Ba1日元= 0.0074美元。gydF4y2Ba

cgydF4y2Ba排除13名参与者。gydF4y2Ba

dgydF4y2BaPHQ-9: 9项患者健康问卷。gydF4y2Ba

egydF4y2Ba在PHQ-9的第9项中,如果参与者回答说他们被“死了会更好”的想法所困扰,或者在过去两周内以某种方式伤害自己几天或更长时间,那么在自杀意念问题上,他们被归类为“是”。gydF4y2Ba

LSSgydF4y2Ba

LSS分数的验证gydF4y2Ba

首先,我们通过视觉检查分配给单词和表情符号的极性分数来检查LSS分数的整体有效性。在gydF4y2Ba图1gydF4y2Ba,第一个图在x轴上显示了单词和表情符号的估计极性,数值越高表示消极状态越严重(即痛苦程度越高)。它们在语料库中的频率显示在y轴上。黑色突出显示的单词表示在危机聊天服务中经常出现的单词,因此,这些单词可能与高水平的情绪困扰有关。第二张图显示了仅表情符号的极性得分。这两幅图都表明,代表负面情绪、话题和问题的词汇和表情符号的极性得分大于0,这表明情绪更低落。gydF4y2Ba

其次,我们检查了LSS分数是否与3名人工编码器的注释结果一致。gydF4y2Ba图2gydF4y2Ba显示了每一级人类注释分数95% ci的平均LSS分数。它表明,被人类编码员评为表现出“糟糕”精神状态的推文得到了更高的极性分数,这表明LSS分数与人类编码员的评分保持了高度的一致性。LSS得分与人类得分之间的相关性为r=0.71 (Pearson相关系数)。gydF4y2Ba

‎gydF4y2Ba
图1。估计单词和表情符号的极性。x轴显示了数据集中包含的单词(上)和表情符号(下)的估计极性得分,值越高代表情绪困扰的程度越高。顶部面板中突出显示的单词代表了在危机聊天服务中经常出现的单词,因此表明了消极的精神状态。gydF4y2Ba
‎gydF4y2Ba
图2。平均LSS分数vs人工注释分数。LSS:潜在语义缩放。gydF4y2Ba
LSS分数概述gydF4y2Ba

研究期间的平均LSS评分为0.092 (SD=1.030)。最高和最低分分别为-5.888和5.050。图S1gydF4y2Ba多媒体附件1gydF4y2Ba为LSS分数的分布。分析中使用的推文数量在2019年为232,722条(47.66%),2020年为255,562条(52.34%)。中用户属性和其他特征对LSS分数的描述性统计如表S1和表S2所示gydF4y2Ba多媒体附件1gydF4y2Ba.此外,2020年tweets的周计数如图S2所示gydF4y2Ba多媒体附件1gydF4y2Ba总体痛苦程度似乎与推文数量无关。gydF4y2Ba

图3gydF4y2Ba描述了LSS分数,以显示在我们的研究期间,参与者的总体痛苦水平是如何演变的。该图中使用的LSS分数是2019年每个参与者平均得分的偏差,因此,该图显示了2019冠状病毒病前情绪困扰水平的平均变化。我们通过在所有数据点的5%上拟合局部回归模型来平滑LSS分数。该图显示了95% CI区间(虚线)的平均分(实线)。蓝色虚线表示4天前首相宣布关闭日制学校(2020年3月2日)。阴影区域表示第一次紧急状态生效的时期(2020年4月7日至5月25日)。垂直的橙色虚线表示有两起艺人自杀事件(2020年7月18日和9月27日)。gydF4y2Ba

图3gydF4y2Ba显示,在2020年大流行的初始阶段,学校关闭前后,LSS得分有所上升,这表明情绪困扰水平上升。2020年4月初宣布进入紧急状态时,总体LSS得分进一步提高,但在紧急状态解除时,情绪困扰水平恢复到基线水平。到2020年秋季,LSS总分变为负值,表明到2020年秋季,总体情绪困扰水平下降。在媒体报道名人自杀事件前后,人们的情绪痛苦水平没有明显上升,尽管在第一起案件发生前后,情绪痛苦水平有小幅上升。gydF4y2Ba

为了研究与covid -19相关的新闻报道和推特用户的情绪困扰水平之间的关系,gydF4y2Ba图4gydF4y2Ba图中为2020年每周新闻报道总数和每周平均LSS得分。gydF4y2Ba图4gydF4y2Ba表明2020年春天,当媒体对COVID-19的报道增多时,情绪困扰的水平也有所增加。截至2020年6月下旬(第26周),关于COVID-19的新闻报道数量降至历史最低水平,相应的,LSS评分显示的情绪困扰水平也有所改善。请注意,图中显示的新闻也包含积极的消息,包括信使RNA (mRNA)疫苗的开发,并于2020年12月批准紧急使用,这可能解释了年底新闻报道数量与LSS评分之间的一些差异。如图S3所示gydF4y2Ba多媒体附件1gydF4y2Ba在美国,确诊病例的数量似乎与估计的危难程度无关。gydF4y2Ba

‎gydF4y2Ba
图3。情绪困扰轨迹:2019年1月- 2020年12月。蓝色竖线(E1)表示宣布并开始关闭学校的那一周,阴影区域(E2)表示紧急状态生效的时期。橙色竖线(E3, E4)表示据报有艺人自杀身亡的周数。gydF4y2Ba
‎gydF4y2Ba
图4。2020年与新冠肺炎相关的新闻报道数量和LSS得分。LSS:潜在语义缩放。gydF4y2Ba

回归分析gydF4y2Ba

图5gydF4y2Ba显示了2020年每周指标的估计系数(gydF4y2Ba),并按性别划分,95%为ci。请注意,所示系数是与相应基线周的偏差,在估计这些系数时控制了用户特定特征。就像在gydF4y2Ba图3gydF4y2Ba,蓝色虚线(E1)表示宣布并开始关闭学校的那一周(第9周,2月26日至3月3日),阴影区域表示实行紧急状态的时期(E2, 14至21周)。橙色虚线代表了两起名人自杀事件(E3和E4,第29周和第39周)。在正文中以图形形式给出了估计的系数,以及它们的数值和gydF4y2BaPgydF4y2Ba的表S3-S10中gydF4y2Ba多媒体附件1gydF4y2Ba.表S3还列出了每周的日期以及与covid -19相关的重大事件的简要描述。gydF4y2Ba

顶部面板gydF4y2Ba图5gydF4y2Ba证实了在gydF4y2Ba图3gydF4y2Ba;情绪痛苦水平在学校开始关闭的那一周有所增加,并在紧急状态开始时达到顶峰(E2,第14周)。第14周的估计系数为0.219(95%可信区间0.162-0.276)。与此同时,在艺人意外自杀死亡的几周内(E3和E4),一旦控制了用户属性和痛苦水平的基线时间波动,情绪痛苦水平在统计上没有显著变化。gydF4y2Ba

根据底部面板gydF4y2Ba图5gydF4y2Ba,当学校开始停课时,女性的情绪困扰水平有统计学意义上的升高(E1;估计系数=0.187,95% CI 0.104 ~ 0.271),但男性的变化幅度较小(估计系数=0.113,95% CI 0.001 ~ 0.224)。在紧急状态开始时,男性和女性似乎都经历了更大的情绪痛苦增加,但大约一个月后,两组人的痛苦水平都回到了基线。gydF4y2Ba

我们还根据年龄、收入和就业状况/工作类型分别对模型进行了估计。我们发现最年轻的年龄组(18-29岁)在学校关闭期间经历了最大的增长(E1,图S4)gydF4y2Ba多媒体附件1gydF4y2Ba).此外,最年轻的群体在2020年秋季和冬季的痛苦水平没有得到改善。相比之下,在2020年的最后几个月,40多岁人群的痛苦程度甚至低于2019年。如gydF4y2Ba图6gydF4y2Ba,收入组的分析表明,从第8周开始,甚至在学校宣布关闭之前,并在第9周(E1)开始,直到第18周(除了第11周,他们的情绪困扰水平与2019年没有区别),低收入组的情绪困扰水平在统计上有显著增加。收入相对较高的个人在紧急状态开始时的痛苦程度仅短暂增加(E2)。gydF4y2Ba

图7gydF4y2Ba显示参与者按就业类型和就业状况分类时的回归结果。那些工作不稳定或失业的人在2020年春季(12-19周),甚至在宣布紧急状态(E2)之前,他们的情绪痛苦水平在统计上有8周的显著增加,而在有稳定工作或没有劳动力的人中,没有观察到这种长期的痛苦水平上升。gydF4y2Ba

抑郁症状与自杀倾向的回归结果(gydF4y2Ba图8gydF4y2Ba)表明,那些没有抑郁症状的人在紧急状态开始时(E2)经历了痛苦水平的上升,但他们的痛苦水平在紧急状态宣布后的第四周恢复到基线水平。相比之下,那些有抑郁症状的人在紧急状态下经历了更大、更持久的痛苦水平上升。然而,一旦紧急状态结束,他们的痛苦程度又回到基准时期。gydF4y2Ba

从自杀性水平的分析中得出了一个类似的图(底部面板,gydF4y2Ba图8gydF4y2Ba).那些偶尔或更频繁有自杀念头的人在紧急状态下经历了更长的、更高水平的情绪痛苦,但在没有自杀倾向的个体中没有观察到这种模式。在名人自杀事件发生的几周内(E3和E4),我们没有观察到情绪痛苦水平有任何统计上的显著增加,即使是那些有抑郁症状或自杀念头的人。gydF4y2Ba

最后,与不孤独的个体相比,被归类为孤独的个体在紧急状态期间经历了更大更长的情绪痛苦水平的增长,但在紧急状态结束时,他们的痛苦水平又回到了基线水平(图S5)gydF4y2Ba多媒体附件1gydF4y2Ba).除了在紧急状态下痛苦程度上升外,他们的情绪痛苦模式与不孤独的人没有太大区别。gydF4y2Ba

‎gydF4y2Ba
图5。相对于2019年,2020年估计的情绪困扰水平:所有参与者和性别。估计的模型包括用户固定效应、年度固定效应和每周固定效应。蓝色竖线(E1)表示宣布并开始关闭学校的那一周,阴影区域(E2)表示紧急状态生效的时期。橙色竖线(E3, E4)表示据报有艺人自杀身亡的周数。估计中使用的推文数量为488,284(全部)、292,002(59.80%为女性)和189,562(38.82%为男性)。各类别受访者人数分别为560人(全体)、320人(女性57.14%)、237人(男性42.32%)。W:一周。gydF4y2Ba
‎gydF4y2Ba
图6。2020年相对于2019年的估计情绪困扰水平:按家庭收入计算。估计使用的推文数量为317,767条(少于600万日元/ 44,551.20美元)和170,517条(等于或超过600万日元)。每个类别的受访者人数分别为350人(低于600万日元)和210人(等于或超过600万日元)。蓝色竖线(E1)表示宣布并开始关闭学校的那一周,阴影区域(E2)表示紧急状态生效的时期。橙色垂直线(E3, E4)表示艺人自杀死亡的报告周数。W:一周。gydF4y2Ba
‎gydF4y2Ba
图7。2020年相对于2019年的估计情绪困扰水平:按就业类型和就业状况分列。估计中使用的推文数量为170,269(兼职/临时工或失业者),238,218(正式员工)和68,215(非劳动力)。每个类别的受访者人数分别为174人(兼职/临时工或失业者)、294人(正式雇员)和79人(非劳动力)。蓝色竖线(E1)表示宣布并开始关闭学校的那一周,阴影区域(E2)表示紧急状态生效的时期。橙色垂直线(E3, E4)表示艺人自杀死亡的报告周数。W:一周。gydF4y2Ba
‎gydF4y2Ba
图8。相对于2019年,估计2020年的情绪困扰水平:通过抑郁症状和自杀意念的存在。估计中使用的推文数量为331,227(无抑郁症状)、157,057(有抑郁症状)、307,018(无自杀意念)和181,266(有自杀意念)。每个类别的受访者人数分别为384人(无抑郁症状)、176人(有抑郁症状)、391人(无自杀意念)和169人(有自杀意念)。蓝色竖线(E1)表示宣布并开始关闭学校的那一周,阴影区域(E2)表示紧急状态生效的时期。橙色垂直线(E3, E4)表示艺人自杀死亡的报告周数。W:一周。gydF4y2Ba

主要研究结果gydF4y2Ba

这项研究提出了一个机器学习框架,用于实时监测社交媒体用户的心理健康状况,不需要大量的训练数据。该研究使用半监督算法和与调查相关的推文,估计了COVID-19大流行期间日本推特用户子集的情绪痛苦程度。我们通过视觉检查语料库中单词和表情符号的估计极性,并确认它们与人类注释结果的相关性来验证LSS分数。在确认了LSS分数的有效性后,我们观察了2019年和2020年LSS总分的轨迹。我们发现,当引入重大社会限制或有关COVID-19的新闻报道数量增加时,研究参与者的情绪痛苦水平会升高。我们还发现,研究参与者的情绪痛苦程度与COVID-19阳性病例的数量无关。这些结果表明,在大流行的最初几个月里,遏制政策,而不是疾病本身的传播或相关的恐惧,是这些社交媒体用户情绪痛苦的来源。这一发现与其他国家的危机聊天或电话热线服务接到的与自杀相关的电话数量一致,这些电话数量与遏制政策的引入呈正相关,而不是与感染率呈正相关[gydF4y2Ba28gydF4y2Ba,gydF4y2Ba29gydF4y2Ba].gydF4y2Ba

我们的回归分析揭示了参与者情绪困扰相对于大流行前水平升高的精确时间。如果没有这项研究中的高频数据,这样精确的测量是不可能的。对于我们的研究参与者来说,与covid -19相关的两个与情绪困扰水平升高相关的事件是3月初的学校关闭和2020年4月的紧急状态宣布。我们的研究结果还表明,学校关闭对女性的影响可能略大于对男性的影响。关闭学校对日本职业女性的影响可能更大,因为与其他高收入国家相比,她们往往承担更大的育儿和家务劳动负担[gydF4y2Ba30.gydF4y2Ba].在2020年3月至5月学校关闭期间,请假的女性员工人数为770万,而同期请假的男性员工人数为350万[gydF4y2Ba31gydF4y2Ba].此外,据估计,学校关闭对有配偶和年幼子女的女工就业状况的影响,要大于有配偶但没有子女的女工[gydF4y2Ba32gydF4y2Ba].gydF4y2Ba

更重要的是,我们的分析清楚地揭示了大流行期间与较高痛苦水平相关的社会经济属性。我们发现,低收入的研究参与者比收入相对较高的研究参与者遭受的痛苦更严重、更持久。请注意,我们的分析根据每个人的潜在社会经济条件进行了调整。我们还发现,在我们的样本中,学校关闭和紧急状态对永久和非永久工人的影响是不对称的。在紧急状态期间,学校和托儿设施突然关闭,商店和餐馆关闭,使许多兼职和小时工失业,没有或只有很少的工资补偿。有些人甚至丢掉了工作;与2019年同月相比,仅在2020年4月,拥有非永久职位的女性工人数量就减少了70万,并且在整个2020年都在持续下降,而长期工人的数量则延续了自大流行前时期以来的增长趋势[gydF4y2Ba32gydF4y2Ba].gydF4y2Ba

在整个分析过程中,我们没有发现任何证据表明,媒体对名人自杀的报道影响了我们研究参与者的情绪痛苦水平,包括那些有抑郁症状和自杀意念的人。这个结果有些出乎意料,因为大量研究显示,在媒体报导著名的自杀事件后,自杀死亡的人数往往会增加。[gydF4y2Ba10gydF4y2Ba,gydF4y2Ba11gydF4y2Ba].此外,这种媒体报道的影响也在推特用户中显现出来;对于媒体报道的著名自杀事件,他们往往会做出情绪化的反应,尤其是当死者是一个相对年轻的艺人,以及当死亡被认为是意外的时候。gydF4y2Ba12gydF4y2Ba,这与2020年自杀的两名艺人的描述完全吻合。事实上,日本的自杀死亡人数在2020年7月突然增加,当时媒体报道了第一起事件,尽管在大流行的头几个月,自杀死亡人数低于以前的趋势。2020年10月,就在媒体报道第二起著名自杀事件后,女性自杀人数出现了急剧上升,与前5年同期相比增长了约70% [gydF4y2Ba33gydF4y2Ba].我们的研究没有发现媒体报道后情绪痛苦水平有任何升高的一个潜在原因可能在于我们的种子词;它们是为了捕捉一般的情绪困扰水平,这与自杀意念是不同的。另一个原因可能与自杀死亡很少见有关;即使在2020年自杀死亡人数最高的月份(10月),自杀死亡人数也有2230人[gydF4y2Ba34gydF4y2Ba],这相当于日本每10万人中有1.776人死亡。可能需要更大的样本来捕捉那些可能受到媒体报道名人自杀事件显著影响的人的情绪痛苦水平的变化。gydF4y2Ba

限制gydF4y2Ba

这项研究有几个局限性。首先,我们的研究结果是基于相对较少的Twitter用户,因此不能推广到日本的普通人群,甚至是所有的社交媒体用户。因此,在解释我们的实质性发现时,必须谨慎。其次,与所有其他分析社交媒体数据的研究一样,我们的发现可能无法推广到社交媒体用户之外。尽管推特是日本最受欢迎的社交媒体平台之一,但它的用户不一定能代表普通公众。此外,我们的抽样方案并不是为了创建日本普通人群或Twitter用户的代表性样本。第三,如前所述,我们对参与者的分类可能不一定反映他们在大流行高峰期或基线期的属性或状况。我们在2022年5月测量了参与者的属性和条件,我们认为自2020年以来它们基本没有变化的假设可能并不成立。例如,在我们的研究中,根据2022年PHQ-9分数被归类为“有自杀倾向”的个体可能在2020年被归为“无自杀倾向”组,但我们无法检查这种可能性。第四,有可能患有不良心理健康状况的个人更有可能使用私人账户,他们可以将其与公共账户分开维护,以揭示他们的真实感受和状况,因此,我们的研究可能低估了他们的情绪困扰水平。 Thus, caution is warranted in interpreting the results, especially regarding those related to at-risk individuals. Finally, we restrospectively retrieved past tweets, and thus, our data set lacks tweets that were deleted prior to our data retrival in May 2022. In particular, it is possible that some of our participants deleted their past tweets about their distressed conditions during the peak period of the pandemic, which might have resulted in the underestimation of their distress level.

优势与贡献gydF4y2Ba

尽管如此,本研究在实质和方法上都做出了一些重要贡献。从本质上讲,据我们所知,我们的研究是第一个根据用户属性单独跟踪社交媒体用户情绪困扰水平轨迹的研究。之前的研究只能了解推特用户的整体情绪[gydF4y2Ba2gydF4y2Ba-gydF4y2Ba8gydF4y2Ba]或不得不依赖估算的人口统计数据[gydF4y2Ba35gydF4y2Ba].此外,之前的研究还没有使用这些条件的标准构造来分析推文用户的心理状况,如抑郁症状的存在、自杀意念和孤独。我们研究的另一个优势是,我们能够估计大流行期间和大流行前社交媒体用户的情绪困扰水平。因此,我们可以发现大流行期间相对于他们潜在的情绪痛苦水平的变化。gydF4y2Ba

本研究还通过建立一个框架来实现对社交媒体用户情绪困扰水平的近实时监测,对该领域做出了重大的方法学贡献。LSS是一种半监督算法,只需要几个种子词进行训练。关于精神健康状况的大量注释数据集很少;因此,监督学习算法通常是不可行的或太昂贵。即使这样的数据集存在,带注释的数据集也可能很快过时,特别是在社交媒体领域,单词、首字母缩写、首字母缩写和表情符号的新用法不断出现和消失。LSS也优于基于词汇或规则的情感分析方法,如语言查询和单词计数(LIWC) [gydF4y2Ba36gydF4y2Ba]及价感字典及情感推理器(VADER) [gydF4y2Ba37gydF4y2Ba]因为它的半监督算法可以识别语料库中特定领域的极性词。gydF4y2Ba

由于其灵活性和适应性,我们的框架很容易扩展到其他目的。例如,一旦我们确定了表征这些条件的适当种子词,就可以直接应用我们的框架来衡量自杀或孤独的程度。此外,对其他语言(如英语、德语、中文、阿拉伯语)的推文语料库执行相同的分析只需要翻译我们的种子词。gydF4y2Ba

因此,本研究中提出的框架可以有多种应用。它可以用于流式数据,以连续测量任何感兴趣的群体的状况和情绪,只要目标群体编写的文本数据可用。可以从提议的框架中受益的文本数据包括论坛(如Reddit)和社交媒体帖子中的评论,以及在线对话,如危机文本服务。我们的框架的另一个应用包括在社交媒体上检测痛苦的人,量身定制的信息可能会发送给他们,以促进他们寻求帮助的行为。gydF4y2Ba

结论gydF4y2Ba

我们的研究强调了利用所提出的方法作为行政和大规模调查数据的补充,持续监测社交媒体用户心理健康的巨大潜力。我们的研究结果还表明,在COVID-19大流行的早期阶段,政府诱导的事件不成比例地影响了弱势群体的心理状况,包括那些低收入、不稳定的就业、抑郁症状和自杀意念的人。gydF4y2Ba

致谢gydF4y2Ba

MU和KW构思并设计了研究,MU和HS设计并管理了调查,KW和MU收集并分析了数据,MU起草了手稿的主要部分,KW和HS对重要的智力内容进行了关键修改。所有作者均已阅读并批准稿件。gydF4y2Ba

这项研究由电信发展基金会资助。资助者在研究设计、数据收集和分析、发表决定或手稿准备中没有任何作用。gydF4y2Ba

数据AvailablitygydF4y2Ba

这项研究的数据包含潜在的Twitter用户身份信息,因此不能共享。根据参与者的同意和与调查公司的合同,只有研究团队的成员才能访问这些数据。分析脚本可根据要求从相应作者处获得。gydF4y2Ba

利益冲突gydF4y2Ba

没有宣布。gydF4y2Ba

‎gydF4y2Ba
多媒体附件1gydF4y2Ba

补充表格和数字。gydF4y2Ba

PDF档案(adobepdf档案),1305 KBgydF4y2Ba

  1. Salathé M, Bengtsson L, Bodnar TJ, Brewer DD, Brownstein JS, Buckee C,等。数码流行病学。公共科学图书馆,2012;8(7):e1002616 [j]gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  2. Abd-Alrazaq A, Alhuwail D, Househ M, Hamdi M, Shah Z.在COVID-19大流行期间推特用户最关心的问题:信息监测研究。J Med Internet Res 2020 april 21;22(4):e19016 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  3. Boukobza A, Burgun A, Roudier B, Tsopra R.在大流行期间同时捕捉公共主题和情绪的深度神经网络:在COVID-19推文数据集上的应用。JMIR Med Inform 2022年5月25日;10(5):e34306 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  4. Chandrasekaran R, Mehta V, Valkunde T, Moustakas E.关于COVID-19大流行的推文的主题、趋势和情绪:时间信息监测研究。J Med Internet Res 2020年10月23日;22(10):e22624 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  5. Kruspe A, Häberle M, Kuhn I,朱旭。新冠肺炎大流行期间欧洲推特信息的跨语言情感分析。arXiv预印本于2020年8月27日在线发布[gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  6. 洪敏,许洁,苏松,等。新冠疫情情绪的社交网络分析:人工智能的应用。J Med Internet Res 2020 Aug 18;22(8):e22590 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  7. 张h, Rempel E, Roth D, Carenini G, Janjua新西兰。追踪北美推特上的COVID-19话语:使用主题建模和基于方面的情感分析的信息流行病学研究。J Med Internet Res 2021 Feb 10;23(2):e25431 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  8. Tri Sakti AM, Mohamad E, Azlan AA。印度尼西亚COVID-19大规模社会限制意见挖掘:网络媒体的公众情绪和情绪分析J Med Internet Res 2021 Aug 09;23(8):e28249 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  9. 王喆,Hale S, Adelani D, Grabowicz P, Hartman T, Flöck F,等。多语言社交媒体数据的人口推断和代表性人口估计。2019年发表于:WWW '19:万维网大会;2019年5月13日至17日;旧金山,加州,2056-2067页。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  10. Niederkrotenthaler T, Fu K,叶psf, Fong DYT, Stack S,程q,等。媒体报道名人自杀后自杀率的变化:一项元分析。中华流行病学杂志2012年11月;66(11):1037-1042。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  11. Niederkrotenthaler T, Braun M, Pirkis J, Till B, Stack S, Sinyor M,等。媒体自杀报道与自杀之间的关联:系统回顾和元分析。BMJ 2020 Mar 18;368:m575 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  12. Fahey RA, Matsubayashi T, Ueda M.追踪社交媒体上的维特效应:对推特上突出的自杀死亡的情绪反应和随后的自杀增加。2018年12月;219:19-29 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  13. Niederkrotenthaler T, Till B, Garcia D.推特上的名人自杀:与瑞典DJ Tim Bergling别名Avicii的死亡相关的活动,内容和网络分析。《情感失调》2019年2月15日;245:848-855。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  14. Kepios。Twitter统计数据和趋势:2023年Twitter基本统计数据和趋势。DATAREPORTAL。URL:gydF4y2Bahttps://datareportal.com/essential-twitter-statsgydF4y2Ba[2022-12-06]访问gydF4y2Ba
  15. COVID-19(冠状病毒)数据。数据世界。URL:gydF4y2Bahttps://covid.ourworldindata.org/gydF4y2Ba[2022-11-28]访问gydF4y2Ba
  16. 信息和传播媒介使用情况报告(摘要)(日文)。内政和通信部,2022年。URL:gydF4y2Bahttps://www.soumu.go.jp/main_content/000831289.pdfgydF4y2Ba[2022-11-21]访问gydF4y2Ba
  17. 2021年居住条件综合调查总结报告。厚生劳动省,2022年。URL:gydF4y2Bahttps://www.mhlw.go.jp/toukei/saikin/hw/k-tyosa/k-tyosa21/dl/12.pdfgydF4y2Ba[2022-11-21]访问gydF4y2Ba
  18. Spitzer RL, Kroenke K, Williams JB。PRIME-MD自我报告版本的验证和效用:PHQ初级保健研究。中国医学杂志1999年11月10日;282(18):1737-1744。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  19. 克伦克K,斯皮策RL,威廉姆斯JB。PHQ-9:一个简短的抑郁症严重程度测量的有效性。J Gen Intern Med 2001 9月;16(9):606-613 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  20. Louzon SA, Bossarte R, McCarthy JF, Katz IR。通过PHQ-9测量的自杀意念是否可以预测退伍军人病人的自杀?精神科服务2016年5月1日;67(5):517-522。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  21. Simon GE, Rutter CM, Peterson D, Oliver M, Whiteside U, Operskalski B,等。PHQ-9抑郁问卷的回答是否预测随后的自杀企图或自杀死亡?精神科杂志2013年12月1日;64(12):1195-1202 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  22. Hughes ME, Waite LJ, Hawkley LC, Cacioppo JT。在大型调查中衡量孤独的简短尺度:来自两项基于人群的研究结果。Res Aging 2004;26(6):655-672 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  23. Steptoe A, Shankar A, Demakakos P, Wardle J.老年男性和女性的社会隔离、孤独和全因死亡率。中国科学院学报(自然科学版)2013年4月9日;21 (3):597 -5801 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  24. Victor CR, Pikhartova J.孤独的地方还是孤独的人?调查孤独感与居住地的关系。BMC公共卫生2020年5月27日;20(1):778 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  25. covid -19相关报告完整档案(日文)。日本放送协会。2022.URL:gydF4y2Bahttps://www3.nhk.or.jp/news/special/coronavirus/chronology/gydF4y2Ba[2022-09-03]访问gydF4y2Ba
  26. 潜在语义缩放:一种用于新领域和语言的半监督文本分析技术。共同方法方法2020年11月01日;15(2):81-102。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  27. 山本K. SNOW D18:日语情感表达词典。JNLP。2018.URL:gydF4y2Bahttps://www.jnlp.org/GengoHouse/snow/d18gydF4y2Ba[2021-04-13]访问gydF4y2Ba
  28. Brülhart M, Klotzbücher V, Lalive R, Reich SK.求助电话揭示的COVID-19大流行期间的心理健康问题。自然学报2021年12月;600(7887):121-126。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  29. 张志刚,李志刚,张志刚,张志刚,等。在COVID-19大流行和封锁期间,与自杀有关的电话打给国家危机热线服务。J精神病学Res 2021 7月;139:193-196 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  30. 性别平等白皮书:2018。日本内阁府,2019年。URL:gydF4y2Bahttp://www.gender.go.jp/about_danjo/whitepaper/h30/gaiyou/index.htmlgydF4y2Ba[2020-10-03]访问gydF4y2Ba
  31. 劳动力调查。日本统计局,2020年。URL:gydF4y2Bahttp://www.stat.go.jp/data/roudou/index.htmgydF4y2Ba[2022-12-02]访问gydF4y2Ba
  32. 《性别平等白皮书:2021》。日本内阁府,2022年。URL:gydF4y2Bahttps://www.gender.go.jp/about_danjo/whitepaper/r03/zentai/index.html#pdfgydF4y2Ba[2022-12-02]访问gydF4y2Ba
  33. 2020年预防自杀白皮书。厚生劳动省,2021年。URL:gydF4y2Bahttps://www.mhlw.go.jp/stf/seisakunitsuite/bunya/hukushi_kaigo/seikatsuhogo/jisatsu/jisatsuhakusyo2021.htmlgydF4y2Ba[2022-12-02]访问gydF4y2Ba
  34. 2020年的自杀统计数据。国家警察厅,2021年。URL:gydF4y2Bahttps://www.npa.go.jp/safetylife/seianki/jisatsu/R03/R02_ jisatuno_joukyou.pdfgydF4y2Ba[2022-11-21]访问gydF4y2Ba
  35. 张超,徐松,李智,胡松。通过推特数据挖掘了解COVID-19大流行期间人群的担忧、情绪和差异:大规模横断面研究。J Med Internet Res 2021 Mar 05;23(3):e26482 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  36. Pennebaker JW。在:弗朗西斯M,布斯R,编辑。语言探究与字数统计:LIWC2001。新泽西州马赫瓦:埃尔鲍姆;2001.gydF4y2Ba
  37. Hutto C, Gilbert E. VADER:一个节俭的基于规则的社交媒体文本情感分析模型。2014年5月16日出席:第八届网络日志和社交媒体国际会议(ICWSM-14);2014年6月1日至4日;密歇根州安娜堡,216-225页网址:gydF4y2Bahttp://comp.social.gatech.edu/papers/icwsm14.vader.hutto.pdfgydF4y2Ba[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba


‎gydF4y2Ba
API:gydF4y2Ba应用程序编程接口gydF4y2Ba
LSS:gydF4y2Ba潜在语义标度gydF4y2Ba
phq - 9:gydF4y2Ba9项病人健康问卷gydF4y2Ba
圣言:gydF4y2Ba奇异向量分解gydF4y2Ba


A Mavragani编辑;提交12.12.22;A Macanovic, A Matsuo的同行评审;对作者10.01.23的评论;订正版本收到30.01.23;接受21.02.23;发表16.03.23gydF4y2Ba

版权gydF4y2Ba

©Michiko Ueda, Kohei Watanabe, Hajime Sueki。最初发表于《医疗互联网研究杂志》(//www.mybigtv.com), 2023年3月16日。gydF4y2Ba

这是一篇开放获取的文章,根据创作共用署名许可(https://creativecommons.org/licenses/by/4.0/)的条款发布,允许在任何媒介上无限制地使用、分发和复制,前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。gydF4y2Ba


Baidu
map