发表在第6卷第9期(2022):9月

这是一个成员出版物牛津大学

本文的预印本(早期版本)可在https://preprints.www.mybigtv.com/preprint/30113,首次出版
自言自语还是内心尖叫:对工作情绪的探索性研究

自言自语还是内心尖叫:对工作情绪的探索性研究

自言自语还是内心尖叫:对工作情绪的探索性研究

原始论文

1英国牛津大学工程科学系生物医学工程研究所

2昆士兰科技大学信息系统学院,布里斯班,澳大利亚

3.达卡大学心理学系,达卡,孟加拉国

4英国剑桥安格利亚鲁斯金大学工程与建筑环境学院

5牛津大学高级研究中心(OSCAR),牛津大学,中国苏州

通讯作者:

Marzia Hoque Tania博士

生物医学工程研究所

工程科学系

牛津大学

气实验室

老道研究校园

牛津,OX3 7DQ

联合王国

电话:44 1865617670

电子邮件:marzia.hoquetania@eng.ox.ac.uk


背景:每年有数百万工人遭受与工作有关的疾病。由于工作场所造成的不适和压力,工作日的损失通常会导致健康状况不佳。当前的大流行以及大流行后社会经济和工作文化的转变可能继续导致与工作有关的不良情绪。这项研究对最先进的技术进行了批判性调查,确定了在认识工人对福利支持的需求方面的研究差距,我们希望了解如何收集这些证据来改变劳动力和工作场所。

摘要目的:基于情绪分析的最新进展,本研究旨在仔细研究社交媒体作为评估员工对工作场所情绪的工具的潜力。

方法:这项研究收集了一个大型推特数据集,包括大流行和大流行前的推文,通过人在环的方法结合无监督学习和元启发式优化算法来促进。通过自然语言处理技术预处理的原始数据使用生成统计模型和基于词汇辅助规则的模型进行评估,将词汇特征映射到情绪强度。这项研究还分配了人工注释,并进行了与工作相关的情绪分析。

结果:一种混合方法,包括使用潜在狄利克雷分配的主题建模,从语料库中识别出最热门的主题,以了解Twitter用户如何参与有关工作情绪的讨论。排序的方面通过重叠的聚类和低主题间距离来描述。然而,进一步的分析,包括情感推理者的价感词典,表明不同主题之间的负面极性较少。相比之下,为这项研究创建的人类注释数据集包含更多的负面情绪。在本研究中,通过标记数据集揭示的情感并置也得到了n-gram分析的支持。

结论:开发的数据集表明,与工作相关的情绪被投射到社交媒体上,这为更好地支持员工提供了机会。工作场所的基础设施、工作性质、行业和特定组织的文化、雇主、同事、个人特有的习惯和教养,都在为组织生产力做出贡献的任何工作成年人的健康和福祉中发挥作用。因此,从定性和定量上理解复杂的潜在因素的起源和影响,可以通过依赖实证证据来指导下一代工作场所推动积极的变化。因此,这项研究概述了一种全面的方法,以获取与工作相关的健康的更深入的见解。

JMIR Form Res 2022;6(9):e30113

doi: 10.2196/30113

关键字



背景与动机

人类文明的经济增长,以及我们对医学的理解结合最近的技术进步,给我们带来了如何设计工业4.0时代的劳动力管理系统的问题。职业健康的形象已逐渐从与工伤密切相关转变为与工作有关的疾病。在欧洲国家中,大多数英国劳动力相信他们的健康或安全不会因为工作场所而受到威胁。1]。然而,为了提高工作场所管理的效率,仍有许多工作要做,因为每天仍有数百万工人患有与工作有关的疾病[12]。

根据健康与安全执行局(HSE)最近发布的2020年至2021年期间的报告,170万名工人患有与工作有关的疾病,其中约一半是由于压力、抑郁或焦虑[1]。在大流行前的报告中,由于工作场所的原因,有80万名工人出现了心理健康问题,无论是新出现的问题还是长期存在的问题,造成1 790万个工作日的损失。根据劳工调查的研究,工作量大、工作期限过长、责任过重、缺乏足够的管理支持、暴力、威胁或欺凌,以及工作中的变动(例如改革),估计是造成心理健康欠佳的主要原因[2]。虽然不同行业的因素不同,但就职业而言,专业职业(例如,包括但不限于科学家、工程师、程序员、卫生工作者、教学和教育专业人员)与所有职业相比,压力水平更高。

如果与工作有关的心理健康还不是一个问题,那么COVID-19又增加了一个维度。英国国家统计局的最新报告很好地反映了大流行期间英国成年人抑郁症的增加[3.]。尽管HSE从LFS研究中提出了自我报告的与工作有关的压力、抑郁和焦虑,但这一发现与英国成年人的心理健康数据相呼应[4]。HSE报告还量化了不同年龄段和性别对工作幸福感的影响。根据世界卫生组织的报告,抑郁和焦虑等精神障碍的性别差异相当普遍[5]。因此,建立一个有弹性的工作场所需要全面了解损失工作日的年龄和性别差异,以避免人为和算法偏见。

就其本质而言,心理健康问题和福祉很难衡量,HSE有两个不同的数据源进行分析,其中没有一个记录实时数据。此外,由于长时间或不规律的工作时间、压力、焦虑、恐慌、隐藏的或不切实际的期望、工作不安全感、就业市场不稳定、社会压力、激烈的竞争和大男子主义文化,导致了不健康的生活方式,这些与工作有关的新的或长期的健康问题往往以饮食失调、不规律或睡眠不足和成瘾的形式表现出来。

通过将每个属性分别标记为相关的影响和促成因素来探究表面症状之下的问题会增加复杂性,因为暴露这种脆弱性可能会导致失业或至少阻碍职业发展。因此,大约15%的在职成年人表现出现有精神健康状况的症状是可以理解的[6]因为每年有30万人因精神健康问题而失业[7]。相比之下,技术进步为利用可穿戴传感器、物联网和人工智能(AI)的力量打开了大门,以收集关于人群一般心理健康问题以及特定行业的个性化环境(在工作场所内部或由于工作场所)的更丰富的见解。

先进的技术支持

使用搜索词,如“心理健康和人工智能”、“心理健康和决策支持系统”、“心理健康和移动健康”,探索最近的四分之一期刊和顶级会议出版物,以及“心理健康和移动应用程序”,通过谷歌Scholar、PubMed、PsycArticles、ScienceDirect和Psychology and Behavioral Sciences Collection搜索引擎,我们发现文献中更广泛的领域涵盖了严重精神疾病,如精神分裂症[8-11];焦虑障碍[12]如创伤后应激障碍[13];发育障碍,例如注意力缺陷/多动障碍[14];当然,还有往往不被认为是影响日常生活质量的职业健康危害后果的疾病[1516] -然而,忽视这些早期迹象甚至可能引发自杀倾向[17-19]。

与身体健康类似,对心理健康方面的最新研究主要面向筛查、诊断和表型分析[20.-23]。然而,基于网络的[2425]和基于移动设备的干预[26-29也不远了。

文献中研究了广泛的技术支持,从简单的工具开始,如传统的SMS文本消息[30.到支持人工智能的聊天机器人等尖端技术[31]。心理健康和幸福应用程序在全球有数百万的安装量[32,这使得对此类应用程序的需求显而易见;然而,很少有研究来验证和验证这些应用程序为用户的心理健康带来积极变化的能力。

不管有没有智能手机的整合,最近人工智能的进步已经带来了一些商业成功,比如《巴比伦》[33], Quarte [34], Lyra [35],姜[36], Woebot [37]和BioBeats [38],以支持健康和福祉,并与世界一流大学进行合作研究。市场上大多数可用的应用程序都由支持人工智能的聊天机器人组成,并使用自然语言处理(NLP),例如K [39以及Woebot的CBT。

在使用数据驱动方法的心理健康领域,总部位于纽约的初创公司Spring health [40),为员工的心理健康开发了一种人工智能驱动的个性化分类和症状检查器,而总部位于伦敦的BioBeats公司则为压力管理提供人工智能干预。BioBeats开发了一款采用企业对企业模式的智能应用程序,可以根据生理数据(睡眠时间、质量和心率变动性)、心理数据(情绪日志)和神经心理数据(脑功能测试)提供健康评分,这些数据都是通过他们的BioBase移动应用程序和BioBeam可穿戴设备收集的。像BioBeats这样的工具可以让用户了解个人的心理健康状况。这种经过科学验证的福利工具可以被认为是公司提供的福利。通过使用BioBeats平台收集员工的实时匿名汇总数据,雇主可以跟踪员工的健康状况,并在需要时采取措施,例如提供量身定制的支持。持续的监控可以帮助理解甚至量化公司政策的变化是否损害了员工的福利。

社交媒体平台的感悟:相关作品

如今,微博已经成为互联网用户之间流行的交流工具。在Twitter和Facebook等提供微博服务的热门网站上,每天都会出现数百万条微博信息。这是由于微博的性质,人们在微博上实时发布自己对各种话题的看法,讨论时事,抱怨,表达对日常生活的积极情绪。由于微博平台的信息格式自由,易于访问,互联网用户倾向于从传统的通信工具(如传统的博客或邮件列表)转向微博服务。因此,社交媒体的使用已经成为现代社会日常生活中不可分割的一部分。

在微博平台的选择方面,文献中已经观察到隐私问题[41]。自我表露的类型也会对此类社交媒体的使用产生影响[41]。可以看出,Twitter用户的自我表露度较高。Shane-Simpson等人认为,喜欢社交的人更喜欢使用Facebook。41]。

社交媒体的一些积极使用案例包括流行病研究。推特被用来探索各种各样的问题,比如情绪变化[42],锁定[43]、对医院护理管理的看法[44]、防疫注射[45],以及远程工作[46]。使用社交媒体进行健康和福祉研究很常见,但主要局限于参与者招募。然而,在圣地亚哥的一项研究中,通过推特来观察当地人的健康状况,测量自评的心理健康、睡眠质量和心脏病[47]。

在此之前,Bryan等人使用了美国军事人员的社交媒体资料数据。48来寻找自杀的预测因素。对推文的分析揭示了他们生活的各个方面,以及压力情况下的触发因素,如健康问题、适应不良或回避型应对策略、情绪状态和认知。它已经被Bryan等人观察到[48自杀用户和非自杀用户的发帖方式是不同的。研究人员还观察到,在消极情绪帖子之后,自杀前“触发”帖子增加。有自杀倾向的人经常发关于适应不良的帖子,之后会有一些消极情绪的帖子[48]。

在英国的成年工作人员中,建筑业的自杀现象更为普遍[49];使用毒品、酒精、大麻和其他物质在这些劳动力中也很常见[50]。虽然没有针对建筑工人进行具体说明,但利用基于twitter的广告数据,报道的文章探讨了使用大麻的原因和大麻使用者的特征[51]。

有几项研究调查了在社交媒体上分享诱惑的心理学原理,以及那些在社交媒体上分享的人的心理状况,以及分享的程度。52]。然而,还需要进行更关键的临床验证探索。相比之下,人们在社交媒体上分享是为了保持社会联系,即使这不是一种病态的需要。

Kelly等人使用了数千名14岁青少年的人口数据[53试图调查心理健康是否与社交媒体的使用有关。该研究得出结论,社交媒体的使用与抑郁症状之间存在正相关关系。影响社交媒体使用的其他因素包括睡眠质量差、自卑、身体形象差以及网络骚扰。这些因素也是抑郁症的潜在症状。社交媒体的使用会增加人们的社交孤立感[54]。过度使用社交媒体也会导致社交媒体疲劳,影响心理健康。55]。

虽然上述研究显示了人们为什么在社交媒体上分享的心理层面,但个人使用社交媒体的基本原理及其影响可能更加复杂[[56]。此外,正如Bell等人所观察到的,使用神经系统黑客的“游戏化”等技术工具可以影响社交媒体的使用。57]。

社交媒体可以成为一种创新的干预工具。然而,这种影响可能是双向的,因为韦恩斯坦[58在探索关系互动、自我表达、兴趣驱动的探索和浏览等变量时,他们观察到了社交媒体的跷跷板效应。

有趣的是,社交媒体行业拥有最深刻的见解,而第三方以“个性化”和“增强体验”的名义,有能力引发社交媒体成瘾,尚未得到广泛的研究。

“五大人格特征”(即神经质、宜人性、尽责性、开放性和外向性)59])可以通过数字足迹从社交媒体上获得的数据来追踪[60]。对个性特征的估计和量化可以支持社交媒体的使用,使其在社交媒体本身的个性化功能之外获得更大的利益。重要的是,在基于对情绪的低估或高估采取行动之前,将对在互联网平台上“分享”情绪的心理需求的理解与机器学习的情绪量化测量联系起来。

研究的目标

本文对理解和分析工作情绪如何表达的方法和工具进行了调查,可以进一步用于标记此类问题并设计有效的干预措施。本文在介绍部分介绍了文献综述,探讨了报道的文章和可用的最先进的技术支持。本文还对脆弱的方面进行了批评。这项研究的主要贡献包括:(1)据我们所知,这是第一个对包括大流行和大流行前推文在内的与工作有关的情绪进行情感分析和主题检测的工作;(2)基于混合搜索方法收集了大型数据集;(3)我们创建了一个标记数据集;(4)将提供预处理后的完整数据集,以及标注后的工作情绪数据集,为进一步研究创造机会。

本文的其余部分组织如下。方法部分介绍了用于批判性地调查Twitter上与工作有关的情绪的方法,然后在结果部分对结果进行分析。本文在讨论部分进行了深入讨论,强调了身心健康相互交织的恶性循环,以及与技术使用有关的伦理问题。本文还讨论了为劳动力提供人工智能精神健康支持系统的概念框架。最后,在总结全文的同时,讨论了本研究的局限性和有待改进的地方。


微博平台

这项研究探讨了Twitter上与工作相关的情绪。Twitter每月拥有3.19亿活跃用户,由于数据源的性质,现在已经成为研究人员、组织和个人调查公共卫生趋势的金矿。Twitter允许开发人员使用应用程序编程接口从其存档中获取数据(即推文)。在文献的基础上,预计情绪分析等人工智能工具将帮助我们更好地理解人们如何谈论和感受特定的健康话题或状况——在这种情况下,实时与工作相关的心理健康问题。

数据获取和处理

在这项研究中,我们使用了基于python的库sn刮刀(社交网络服务刮刀)[61使用定义的主关键字来获取推文文本框1。根据Edo-Osagie等人描述的过程,我们使用这些关键字来制定提取推文的关键字[62]。该搜索查询的日期为2018年1月1日至2021年12月31日,结果显示有100万条推文包含至少一个关键词,要么作为标签,要么在推文正文中。

主要关键字,用于形成获取推文的关键字。

主要关键字

  • 名词:“工作”,“工作”,“行业”,“劳动”,“劳动”,“办公室”,“工作场所”,“职业”,“雇佣”,“雇员”,“雇主”,“公司”,“公司”,“企业”,“职业”,“截止日期”,“隔间”,“工作场所”
  • 形容词:“压力”、“焦虑”、“抑郁”、“效率低下”、“多任务处理”、“崩溃点”、“超负荷”、“倦怠”、“压力大”、“压力大”、“令人震惊”、“危险”、“有问题”、“不受欢迎”、“悲伤”、“挣扎”、“压力大”、“抑郁”、“生病”、“疾病”、“精神紧张”、“最好的运气”、“积极向上”、“团结一心”、“积极进取”、“有成就”、“让我们完成它”、“麦克风掉了”、“同意”、“快乐”、“好”、“享受”、“骄傲”、“满意”、“糟糕”、“不幸”、“抱歉”、“糟糕”、“更糟”、“糟糕”、“受伤”、“累”、“漫长的一天”、“无聊”、“筋疲力尽”、“希望”、“第二家”、“站在一起”、“万事如意”、“更多的事情要做”
  • 短语:“过度工作”、“工资奴隶”、“铁器工作”、“心理健康”、“恭喜办公室”、“工作生活”、“工作狂”、“工作生活平衡”、“工作压力”、“办公室糟糕的一天”、“当工作变得艰难时,工作狂就会继续工作”、“回归”、“重新开始”、“工作生活平衡”
文本框1。主要关键字,用于形成获取推文的关键字。

关键字选择过程

混合步骤

Twitter搜索使用单词来查找与任务相关的推文。这些单词或句子的部分被称为关键词。适当的关键字有助于查找和获取高效且准确的推文[63]。因此,关键字的选择是提取推文的关键步骤。我们采用了双重过程来选择关键字。

阶段1:从面板中收集关键字

首先,研究人员组成了一个专业人士小组,评估在工作场所和工作中情绪表达的语言多样性。该小组共有7名成员,他们精通社交媒体,拥有成功的高等教育背景,并在工作中担任负责任的职务。响应是使用谷歌Forms收集的。我们收到了来自不同行业和专业的反馈,包括软件工程师、公司高管和学者。该小组还包括来自工作权利组织的专家。工作年限也作为背景资料记录;然而,由于面板的大小,它没有用于数据分析。

在这个阶段,小组成员被问及他们如何在社交媒体上表达与工作有关的情绪,特别是在Twitter上。这些回答都是匿名记录的。小组成员被问及他们在表示工作和工作场所时的语言偏好(包括具有相似语义的单词和短语,以及类似的表达情感的形容词,无论是积极的、消极的还是中性的)。我们把这些词分为三类,分别显示在文本框2

第一类,也表示名词中的文本框1,表示“工作”的语义表达,由自然语言用户(即Twitter上的工作成年人小组)手动识别。这些关键词只表示与工作相关的东西。相比之下,第二类旨在捕捉核心情绪。第2类词汇可以与任何事物相关,包括工作和工作场所。然而,在同义词后面加上形容词工作工作场所意思是表达的情绪与工作有关。

例如,“办公室”或“雇主”这两个词本身并不总是表达对工作生活的情感,它们还可以用在许多其他方面,比如工作场所的地址或招聘启事。

此外,形容词“struggle”或“good”单独也可以与任何事物相关。然而,为了提高搜索效率并获取更多与上下文相关的推文,我们搜索了同时包含“办公室”和“好”或“办公室”和“挣扎”的推文。

此外,参加的专业人员来自一个特定区域,人数有限。虽然他们的职业有多样性,但他们使用的词汇和短语肯定不能完全代表或匹配数百万其他专业人士和员工的词汇和短语。因此,我们可以将类别1中的每个单词与类别2中的每个单词组合起来,从而获得更多的关键字可能形式。

简而言之,创建第一类和第二类背后的原因是:(1)为了搜索包含基于工作的情感的推文,我们需要与“工作”或“工作场所”相关的单词或同义词(第一类),以及与这些相关的表达“情感”或“情感”的单词(第二类)。(2)为了获得更多样化和最多的推文,我们需要从语用角度最大化所有可能形式的关键词,因此,将它们分为不同的类别。表示为文本框1,帮助我们将类别1和类别2相互结合,增加关键字的数量。

随后,我们还从专业人士(第三类)中获得了一些直接描述工作情绪的短语,如“工资奴”和“恭喜办公室”。

中单词和短语的类别文本框1用于表示工作和工作场所。

中单词和短语的类别文本框1

  • 第一类:暗示工作、办公室或工作场所的单词和短语
  • 第2类:表示情感的单词和短语(可以是积极的、消极的或中性的)
  • 第三类:明确表达对工作、办公室或工作场所的情感的短语
文本框2。文本框1中用于表示工作和工作场所的单词和短语的类别。
阶段2:使用算法制定关键字

尽管一组专业人士经过了精心挑选,但由于人为偏见、社交媒体、互联网上的拼写习惯以及与工作相关的行话,对关键词的需求还是有所增强。此外,我们只考虑了英语关键字,而世界上有数千种语言。因此,收集的单词和短语可能是有限的,而世界各地数百万工人使用的单词和短语可能要多得多。因此,为了生成更多的关键词,我们使用了单词表示的全局向量(GloVe),它可以处理数十亿条推文,并根据上下文生成同义词。此阶段的工作流程如图所示文本框3

GloVe是一种著名的算法,它使用数十亿条推文生成具有上下文的同义词。因此,在第二阶段,我们使用GloVe为类别1和类别2中的每个单词生成5个同义词文本框1。我们将类别1中的所有单词及其生成的同义词视为前缀列表,将类别2中的所有单词及其生成的同义词视为后缀列表。这些前缀和后缀列表包含唯一的单词。对于前缀列表中的每个单词,我们添加后缀列表中的所有单词,并生成种子关键字列表。让我们假设前缀列表是(workplace, corporate),后缀列表是(stress, good)。因此,种子关键词列表是(职场压力,职场好处,企业压力,企业好处)。

我们使用“种子关键字列表”中的每一项来获取种子推文,以定义最终的关键字。对于列表中的每一项,我们根据空间对单词进行拆分,并搜索包含这些单词的推文。例如,前面提到的“种子关键字列表”中的“职场压力”一项包含两个词:“职场”和“压力”。因此,我们搜索了以任意顺序和任意数字同时包含“工作场所”和“压力”的推文。

随后,我们使用这些种子推文和种子关键词,使用强大的元启发式优化算法(即粒子群优化算法)生成最终的关键词。

阶段2的流程。

  • 对于类别1和类别2中的每个单词或短语,生成5个同义词
  • 将类别1中的所有单词和短语及其同义词视为前缀列表
  • 考虑第2类中的所有单词和短语及其同义词作为后缀列表
  • 生成所有可能的种子关键字(例如,关键字列表为KT):
    • 对于前缀列表中的每个单词或短语:Wpre
      • 对于后缀列表中的每个单词或短语:Wpst
        • KT次方。add (Wpre +‘+ Wpst)
  • 使用这个来获取种子推文KT
    • 对于中的每个关键字KT
      • 如果关键字包含多个单词:
        • 拆分单词
        • 获取包含这些单词的tweet
  • 利用这些种子关键词和在粒子群优化算法中提取的种子tweets生成实际关键词
文本框3。阶段2的流程。

数据预处理

预处理的目的是从数据中清除所有冗余和不必要的内容,并使其精确,以找到更准确的词,可以帮助分析推文。为了实现这一目标,对提取的tweet进行了系统预处理(图1)在开始分析之前,使用一些Python库,如Pandas, NumPy和自然语言工具包(NLTK)。

每条推文都被转换为小写,以便轻松识别重复的单词,并将其标记化,以将推文转换为单词列表。删除选定的关键字有助于更好地估计单词的频率,并容易发现用于表达情感的实际单词。缩略语被扩展到原来的形式。数据清理步骤还包括从推文中删除字母数字单词、url、标记文本、提及单词、停止单词、标签、重复字符、标点符号、空格和单个字符。随后,通过lemmmization和stem实现了正常化。

图1所示。标记数据和未标记数据的预处理和分析步骤。LDA:潜狄利克雷分配;VADER:情感推理器的价感字典。
查看此图

这项研究的目的是检查个人推文,而不是组织或商业推文。为了分离这样的推文,需要删除更多的单词,这些单词被标记为广告词文本框4。此外,为了简化分析,还必须删除不完整和拼写错误的单词以及无法识别的缩短单词。通过对随机处理的推文进行定性检验,验证了预处理步骤的质量。该检查在每个预处理步骤之后进行。定性检验也支持无意义词和广告推文的识别。

标签数据集中的广告和无意义的单词。

无意义的广告词

  • 无意义的字:佤邦佤邦rt,
  • 广告文字:点击优惠券
文本框4。标签数据集中的广告和无意义的单词。

数据处理和标记

本文对推文(文本框1)通过潜狄利克雷分配[64]模式,使用Gensim (RARE Technologies Ltd) [65]图书馆,以探索在Twitter上讨论的问题和情感推理的价感字典(VADER) [66模型来估计每条推文的情绪。

调查从识别处理过的数据集中最热门的单词开始。Gensim的语料库返回一个ID术语字典对象,该对象随后通过将每个标记化的tweet转换为单词矩阵来创建一个语料库。后来,来自Gensim库的LDA模型生成函数使用这个字典和语料库并返回一个LDA模型。该LDA模型由若干特定主题组成。每个话题都包含了一些单词,以及它们在推文中的权重。使用LDA模型,所有的推文被划分为几个主题,这使我们能够理解每条推文可以代表更广泛的分类的方面。

然而,这些主题之间的重叠是预料之中的,这可能会妨碍准确地确定主题的一个方面。因此,有必要探讨主题的最佳数量。每个具有特定数量主题的LDA模型都具有特定的一致性。相干性衡量的是多个文档上下文之间语义相似度的得分,相干性值越高,基于上下文的主题分布越好[67]。因此,一致性较高的LDA模型具有最优的主题数量,因此重叠的主题较少。此外,在LDA之上的LDA Mallet包装器提供了更好的主题分布和一致性,因此,我们使用LDA Mallet包装器来确定最佳的主题数量[68]。之后,我们将优化后的LDA Mallet主题转换为LDA Model主题进行可视化,如图所示图2。这种优化是通过从2到31个不同主题的迭代过程来实现的。每次迭代的相干值如图所示多媒体附件1

由于主题优化,在NLTK的意见字典库的帮助下,分配了更广泛的情绪极性(即,积极,消极和中性)。本研究中使用的方面探索过程也可以在算法1中观察到(文本框5)。

接下来,通过分析每条推文,使用词典和基于规则的模型VADER将未标记的推文分类为我们预定义的3种情绪极性(积极、消极和中性)。VADER考虑了社交媒体微博中使用的情感词汇,以及用于识别情感强度的通用语法和句法规则。此外,它结合了以人为本的方法,将定性分析与实证验证和实验调查相结合,利用人群的智慧来根据句子的情感计算值。此外,他们的算法与精益词汇和基于规则的模型的性能与其他知名和熟悉的情感分析基准进行了比较[66],通过考虑推文的积极和消极,估计复合值在−0.05到+0.05之间。如果tweet的情感值在−0.05和+0.05之间,则该tweet为中性。值< - 0.05的推文为阴性,值>+0.05的推文为阳性。但数值越低,负性强度越高,数值越高,正性强度越高。

计算复合值和可视化,每个类别的百分比帮助我们确定哪个类别的推文数量更多,而每个推文的复合值的可视化帮助我们实现每个极性的值波动。

除了机器分配的情绪极性之外,这项研究还包括对3200个未处理的随机推文子集进行手动标记,作为一种务实的方法,进一步分析积极、消极和中立的推文,有更高的机会识别情绪和讽刺的并置。由于标注是在预处理之前进行的,所以也考虑了感叹号和表情符号。除了手动检查这些标记的推文外,还通过单词包、每个类别的热门单词及其相应频率以及共轭词来调查这些推文。

图2。具有前30个显著词的最佳题目数分布。PC1:主成分1;PC2:主成分2。
查看此图
算法1:从潜狄利克雷分配模型中找到主题的极性分配。

算法1

  • 输入:主题列表
  • 输出:每个主题的方面
  • /* from nltk。导入opinionLexicon
  • topicList =主题列表
  • sentimentList =
  • Topic wise sentiment List */
    • positiveWordFromLexicon = set(opinionLexicon. Positive()) /*来自opinionLexicon */的积极词汇
    • negtiveWordFromLexicon = set(opinionLexicon.negative()) /*来自opinionLexico */的否定词
    • positiveWords = getTopWords(labeledPositiveTweets) /*来自Positive Labeled tweets的积极词汇*/
    • negativeWords = getTopWords(labeledNegativeTweets) /*来自正面标记tweets的负面单词*/
    • ForEach主题topicList
      • positiveCount = 0
      • negativeCount = 0
      • neutralCount = 0
    • ForEach的话题。单词表
      • 如果(in positiveWordFromLexicon) OR (word in positiveWords)然后:
        • positiveCount = 0
      • 如果(in negtiveWordFromLexicon) OR (word in negativeWords)然后:
        • negativeCount += 1
      • 如果not in (negtiveWordFromLexicon AND negativeWords AND positiveWordFromLexicon AND positiveWords) then:
        • neutralCount += 1
      • if (positiveCount > negativeCount) AND (positiveCount > neutralCount) then:
        • sentimentList[topic:Id] = Positive
      • if (negativeCount > positiveCount) AND (negativeCount > neutralCount) then:
        • sentimentList[topic:Id] =负数
      • if (neutralCount > negativeCount) AND (neutralCount > negativeCount) then:
        • sentimentList[topic:Id] =中性
文本框5。算法1:从潜狄利克雷分配模型中找到主题的极性分配。

伦理批准

该研究方案由安格利亚鲁斯金大学卫生、教育、医学和社会关怀学院联合健康学院研究伦理委员会批准(AH-SREP-19-055)。


数据集从NLP的角度以及使用定性方法进行分析。

未标记数据分析

对未标记数据进行2倍分析。首先,我们通过使用Gensim LDA模型将数据转换为主题来分析数据,并使用NLTK意见字典来探索各个方面。其次,我们使用VADER模型来分析数据集,并定义每个推文的极性。

多媒体附件1,我们可以看到主题的数量和对应的相干值,从中可以看出,随着主题数量的增加,相干值也在增加,在24、27、29三个指标上相干值最高,为0.54。但是,随着相干值的增加,话题数越少,话题间的重叠越少,话题分布越好。可视化的主题分布图2结果表明,当主题数为28时,LDA模型的重叠度较其他模型低。因此,我们选择主题索引的最优数量为27个,这意味着该模型索引的最优主题数量为28个(相关度最高为0.54,主题之间重叠较少)[69]。此外,在图2,我们显示了数据集的前30个显著术语(右侧)以及主题间距离图(左侧)。

图3显示了每个主题的顶部单词的词云,以及它们更广泛的极性,其中积极、消极和中性极性的比例分别为28%(8/28)、61%(17/28)和11%(3/28)。根据我们的分析,一些来自消极极性的热门词汇是糟糕的,糟糕的,失去的,失去的,税收,工资,金钱,工人,生活,家庭,社会,警察,时间,会议,电话,护理,covid,健康,劳动,年,周,时间。消极话题中还出现了许多非正式(俚语)词汇。正面词汇排名靠前的是业务,挑战,生产力,缩放,会议,查找,群组,应用程序,检查,服务,食物,工人,爱,伟大,惊人,学校,孩子,日子,故事从中性极性来看,排名靠前的单词是投票,民意调查,即将到来,城镇,今晚,比赛,球队,新闻,今天。还有一些来自中性话题的词图3糟糕,会议,时间,一天。然而,相似的术语可以用于不同的上下文,主题分布提供了关于主题上下文的一些想法;例如,主题5表示财务方面,主题0表示基于网络的会议和会议,主题7是关于体育的。

在接下来的步骤中,使用VADER分析每条推文。它考虑了一条推文的语义和上下文含义,并计算出一个显示推文情绪强度的值。在这个值的基础上,我们将每条推文标记为积极、消极或中性。在图4,我们根据情绪强度来可视化推文的数量。大多数推文都在−0.30到+0.30之间,这表明消极或积极情绪的强度很低。它还表明,相当多的推文表达了中性情绪(强度值从−0.05到+0.05)。

图3。在未标记的数据集中,使用潜狄利克雷分配槌对每个主题进行排名。
查看此图
图4。基于情感推理的价觉字典的未标记推文情感强度。
查看此图

表1显示推文的强度级别,而在图5,我们可以观察到48.72%(716,843/1,471,209)的推文情绪为正面,39.18%(576,462/1,471,209)的推文情绪为负面,12.09%(177,904/1,471,209)的推文情绪为中性。从表1,我们观察到大多数正面推文的强度值在0.50到0.75之间。其次最大推文数量的强度在0.75到1.0之间,这表明积极情绪的强度更高。相比之下,表达负面情绪的推文的最大数量在- 0.50到- 0.25之间,表明负面情绪的强度处于中等水平。

图5,我们还发现1.44%(21,171/1,471,209)的推文提到了“Covid”一词,其中0.67%(9854/1,471,209)为正面推文,0.64%(9426/1,471,209)为负面推文,0.13%(1891/1,471,209)为中性推文。

LDA模型中发现的负面话题为61% (17/28)图5显示大约一半的推文(716,843/1,471,209,48.72%)表达了积极的情绪。这表明,根据使用VADER进行的分析,尽管负面推文的数量可能相对较少,但它们意味着与与工作相关的心理健康相关的积极推文的主题更加多样化。

表1。情绪强度的每个象限的推文数量。
情绪强度组别 推文,n (%)
-1.0到-0.75 138659 (9.42)
-0.75到-0.50 158974 (10.8)
-0.50到-0.25 180014 (12.23)
-0.25到-0.05 99028 (6.73)
-0.05到0.05 177691 (12.07)
0.05 ~ 0.25 105703 (7.18)
0.25至0.50 199827 (13.58)
0.50至0.75 207439 (14.09)
0.75至1.0 203874 (13.85)
图5。使用价感字典进行情感推理的积极、消极和中性未标记推文的比例。
查看此图

标签数据分析

在手动标记的数据集的基础上,超过一半的推文(1952/3200,61%)被分类或发现是负面的;只有三分之一的推文(1088/3200,34%)积极表达了与工作有关的心理健康。极少量的推文(160/ 3200,5%)对工作和心理健康之间的关系持中立态度。

在预处理和消除关键字之后,对这个手动标记的数据集进行数字检查,揭示了10个最常见的单个单词及其每个极性的频率,如图所示表23.,4。这些数字还显示了与工作或工作中的心理健康密切相关的词语,或明或暗。某些词,如时间,就像生命,一天,得到,需要,,在正面和负面推文中都出现了很高的频率,从语言学上来说,这并不奇怪。因此,把这些词放在上下文中是很重要的,因为这些词(表23.,4)与前面或后面的单词in放在一起多媒体附录23.,4

表2。正面推文中出现频率最高的10个词语及其对应频率。
单词 频率,n (%)
时间 93 (13.1)
一天 88 (12.5)
得到 81 (11.5)
生活 74 (10.5)
68 (9.6)
64 (9)
63 (9)
就像 60 (8.5)
一年 58 (8.2)
需要 57 (5)
表3。负面推文中出现频率最高的10个词语及其对应频率。
单词 频率,n (%)
时间 153 (13.6)
就像 139 (12.3)
得到 138 (12.1)
生活 136 (12)
一天 117 (10.3)
105 (9.3)
88 (7.8)
需要 88 (7.8)
85 (7.5)
一个 83 (7.3)
表4。中性推文中出现频率最高的10个词及其对应频率。
单词 频率,n (%)
健康 10 (13)
9 (11.7)
得到 9 (11.7)
员工 8 (10.4)
8 (10.4)
使 7 (9.1)
7 (9.1)
生活 7 (9.1)
一年 6 (7.8)
需要 6 (7.8)

例如,时间与工作和心理健康有关,在积极和消极的推文中都有出现。在积极的推文中,其他一些与时间结合在一起的词是假期,季节,赚钱,家庭,财务,燃烧,消费,孩子,生活,关心,艰难的,而在负面推文中,时间则与“。失去的,错过的,saynotostress(对压力说不),乐趣,贿赂,兼职,加班,见鬼,全职。从这个数字检查,似乎人们谈论的时间是与他们有关的家庭,假期,生活,经济状况,孩子虽然与工作或心理健康有积极联系,但消极情绪主要与工作有关兼职全职,或额外的时间。随着时间的推移,低收入和对收入来源的不安全感可能是造成这种负面情绪的一些潜在原因。

其他一些常用单词,如一年在积极的推文中一天在负面推文中也隐含着时间。一些与year结合的单词是父母,人,两年辛苦,一半,最好,通过了。在负面推文中,一些词是共轭词漫长的一天,漫长的交通,周五,情绪化,延迟,项目,偏头痛,拥挤,疯狂,流血,筋疲力尽,工作周,葬礼,不合理的。负面推文中还出现了一些俚语。分析排名靠前的单词,它们的相邻单词的意思,以及排名靠前的单词的共轭词,时间是标签数据中谈论最多的关于工作和心理健康的话题。

出现频率第二高的单词是就像。虽然它在正面推文中出现的频率相对较低,但在负面推文中却很频繁。在积极的推文中,一些共轭词是善良,从未笑过,问题,损失,感觉,死亡。相比之下,负面推文中的一些共轭词则是感觉,诊断,机会,什么都没有,可怕,孤立,相当。这个词感觉在这两个类别中也很普遍;负面推文将感觉与诸如需要,从不,幻想,新鲜的。在积极的推文中,它与诸如锯,任何合适的东西,浮动

得到是在积极和消极类别中使用频率第三高的单词。然而,在积极的推文中,它与诸如松了一口气被驱逐出境打破律师助理需要的模式完成祝福得到爱,舒适的触摸而在负面推文中,它与诸如允许分享去掉今晚的意思是成绩不好的试着睡觉享受钱伤心,紧张愤怒

生活是另一个经常出现的词。在积极的推文中,它与诸如平衡触摸目标首页个人音乐,休息。这意味着工作与生活的平衡问题。负面推文中的一些共轭词是个人私人整个损失有压力的释放professionale艰难的最近才认识人生,正常的生活

积极的推文也包含了诸如好,帮助,而负面推文则包含了诸如感觉,事物,制造,

中性的推文大多包含这样的词健康,雇员,好,制造,需要,睡眠,工作场所,其中最常见的n-gram是信仰健康行为,罢工,难搞的人,黑人吸毒,红人,吸引买票,打破律师助理,员工欣赏,少数族裔,受影响,好,想法使工作场所,狂欢,劳动生活,智力生活平衡,婚姻,周末,执行,打破

使用频率最高的单词及其n-gram被用来表达相反的观点;本研究对标记的推文进行了手工定性评估。在贴有标签的推文中,许多人声称他们的生活方式充满了压力从黎明到黄昏在家里,在工作中。这一观察结果与n-gram分析一致。与榜首词分析类似,在手动评估期间,倦怠问题是显而易见的。

对于一些人来说,假期增加了他们的压力,因为假期后工作量的压力-这种情绪的基本原理是无法通过分析工具感知的。

对许多推特用户来说,从家到办公室的通勤压力很大,这也与n-gram分析一致。

推特用户经常直接交流他们与工作有关的生理和精神症状,比如背痛,头痛,紧张,焦虑,睡眠不足,食欲不振,在单词。推特用户试图通过吸烟和吸毒来减轻工作压力,这在基于n-克的分析中也很明显。

也有很多推文只用大写表示工作压力,强调巨大的压力。对该数据集的定性检查揭示了体育世界、教育、卫生专业以及选举方面的工作压力,这些都没有通过基于n-gram的分析得到突出。

在被标记的推文中发现了工作家庭平衡、婚姻和关系问题,n-gram分析也强调了这一点。消防等高风险工作与工作压力和婚姻生活有关。工作压力大、与配偶相处时间少,导致情绪暴躁的言论也很明显。推特用户(即推特用户)也谈到了由于工作压力而导致的坏情绪。推特用户对工作压力和疲惫的因果关系表示困惑。

推特用户谈到自杀时,并不是直接的想法或被动的自杀意念,而是与他们所在社会群体的压力有关的自杀事件。目前尚不清楚当事人是否属于他们自己的工作小组或专业兄弟会,还是他们认识的某个自杀与工作有关的人。

手工定性分析也揭示了一些有趣的应对机制;例如,在推特上发表不恰当的评论被认为是应对工作压力的策略之一。关于与工作相关的心理健康的积极推文也主要集中在应对策略上,比如听某些热门艺术家的音乐、玩游戏、看电视上的情景喜剧、旅行、与朋友共度时光以及社交饮酒。推特用户还分享了“放下工作压力,优先考虑生活”、“人生无常哲学”等自动建议。积极的推特用户鼓励人们练习正念和放松,以缓解工作压力。

不同的研究和研究结果对标记数据集中的大多数中性推文做出了贡献。由于对关键词的谨慎选择,关于更广泛的情绪极性的模糊性受到了限制。然而,一些中性标签的推文包含了如何应对工作压力的建议,因为它们不能被明确归类为积极的。

分析情绪和心理健康相关的问题并不是一项简单的任务,因为情绪通常是混合或矛盾的。我们可以将混合情绪描述为对不同对立情绪组合的同时体验,积极情绪和消极情绪可以同时发生,这一点在本节中也很明显。


挑战

2019年至2020年,工作日损失的经济费用估计为160亿比索(193亿美元)[1]。官方数据显示,由于工伤和健康不佳,英国政府(英国人口)承担了35亿英镑(42亿美元)的支出[1]。忽视这种普遍存在的与工作有关的健康状况不佳现象,会增加国家疾病负担,这可能不会反映为不健康和有毒工作条件造成的直接成本。2018年至2019年,由于员工因工作原因请病假,雇主面临32亿英镑(39亿美元)的损失。1]。大流行和大流行后时期的社会经济后果造成了更令人不安的环境。不开心的员工会阻碍任何组织的整体发展和生产力。7071]。然而,与工作有关的身心疾病所造成的大部分经济负担是由工人及其朋友和家人承担的,他们还承受着这种逆境带来的情感困难。因此,打破不良健康结果的恶性循环是国家、组织和个人层面的一个利益点。

如今,心理健康和幸福已成为新的流行语,这可以被认为是积极和消极的信号。认识到问题总是第一步。更多关于心理健康问题的能见度和公开讨论可能会为减少耻辱和打破这一主题的禁忌打开大门。雇主的自我意识和战略方法可能会大大减少工作场所引起的心理健康影响。许多商业和非营利组织一直试图通过提供企业对企业的支持来进入这一市场,例如Minddistrict [72]、健康保障员工援助计划[73],以及纳菲尔德健康[74]。

基于人工智能的数据驱动方法已经在预测职场中辞职者方面显示出了良好的效果。75]。Zegami [76牛津大学(University of Oxford)推出的一项研究一直在开发一种工具,利用年龄、工资、福利和工作地点等广泛数据来识别不开心的员工[77]。

工作场所的情绪可以通过语言、肢体语言、生理参数、行为或对他人的反应来表达。然而,当背景叙述也是问题的一部分时,证明问题的根本原因可能具有挑战性——心理、社会经济、文化和个人特定的特征可能决定了这种情绪是如何被感知和表达的。此外,三分之一与工作有关的疾病是由于肌肉骨骼疾病[1]。临床医生和职业健康专家一致认为,肌肉骨骼疾病与精神健康问题有关,其机制尚不清楚。[7879]。与工作有关的疾病与身心影响有关,形成了习惯的恶性循环,例如与工作有关的焦虑和压力导致失眠,从而导致头痛,增加兴奋剂的摄入,从而导致更多的不眠之夜,从而导致压力,循环往复。

结合现有技术的框架

复杂而动态的关系(图6工作模式、生活方式、个性化的工作模式、职业危害、健康和幸福都与工作场所的情绪交织在一起。利用人工智能和大数据分析的力量,可以构建一个描述性模型,以揭示利益相关者(如个人、雇主和行业)之间的共同责任。

本研究为了解与工作有关情绪的脆弱区提供一个框架,以促进更好的工作实践和健康结果(图7)。在图7,问题空间内的全局描述符可以大致分为以下三个领域:(1)由职业性质引起的行业特定元素(例如,夜班临床医生);(2)特定组织的工作场所文化(如社交饮酒文化);(3)社会描述指标,如总幸福指数、政治稳定性、犯罪率、就业率、生活费用、经济、社会包容性、多样性和容忍度,这些数据可以从国家和全球数据库中汇总。这些全局描述符直接影响局部描述符,形成牢不可破的模式;然而,影响因人而异。

了解个人对这些外部变量的感受可能不会反映在数字上(见引言部分)或明确地表达在文字上(见本部分)。通过本地描述符对与工作相关的情绪负责的因素进行更深入的洞察,需要通过让劳动力参与该过程来共同产生。通过实时生活方式跟踪,交叉引用描述模型的局部描述符,以及精神健康障碍的全局描述符(通过电子健康记录收集的数据),可以为支持人工智能的预测模型提供信息。基于证据的预测将使利益攸关方能够做出明智的决定,设计适当的预防措施以减少与工作有关的疾病的流行,并引入有效的干预措施以保持劳动力的健康和快乐。

图6。工作生活与健康之间的动态关系。
查看此图
图7。为劳动力提供人工智能精神健康支持的高级架构。
查看此图

关于超智能情感检测的论述

在数据化时代,在公共平台上分享个人信息的习惯和必要性,以及对信息分享结果的控制,是一个硬币的两面。无忧无虑的用户放弃隐私权的后果增加了那些甚至没有参与该过程的用户的隐私被侵犯的风险。最终用户往往不知道“cookie”和“个性化”等数字陷阱,也不知道人工智能具有看不见的数据链接的新兴和不可思议的力量,导致意外发现一个不为人知的(捏造的)故事和数据泄露。这样的结果往往是由于数据控制者和数据处理者的疏忽造成的。例子可见于文献[80-82]。

这项研究提出了一个假设的数据图,展示了公开可用的分解数据如何揭示员工的“数字”心理健康(图8)。雇主可以通过分析时间戳的数字足迹来评估和预测员工的表现;然而,如果没有对数据收集和处理的完全同意,没有强有力的数据治理和数据伦理,这是有问题的。这样的概要分析,如图8,可以在第三方组织中构建,甚至可以通过机器人构建。虽然《一般数据保护条例》在一定程度上保护联合王国和欧洲联盟区域内的这种个人数据挖掘和处理,但应注意保护脆弱的劳动力,他们的心理健康状况已经很差。虽然这项研究提倡采用更全面的方法,使用广泛的技术工具,以更好地了解职业健康问题,并改善劳动力的健康和福祉,但在使用这些新兴技术时应谨慎,以避免数字监控的潘多拉盒子的产生。

图8。没有安全漏洞的自我数字监控。
查看此图

研究局限性与未来工作

Twitter是最受研究人员欢迎的微博之一,数以百万计的人在上面表达他们的感受。由于其字符限制,用户必须写入特定的数据,这有助于分析数据。此外,Twitter为研究人员提供了应用程序编程接口,以获取和分析大量归档的推文[83]。然而,并不是所有的职场成年人都在使用社交媒体,也不是所有的推特用户都善于表达自己的语言,而且单个的微博事件可能不足以感知更深层的情感。此外,数百万用户更喜欢使用其他微博网站来表达自己的情绪。因此,尽管Twitter对研究人员有很多好处,但单独使用Twitter作为数据源是有局限性的。虽然这项研究考虑的是公开的推文,但这项研究需要得到一个内部伦理委员会的批准。他们批准的理由是,推文不能直接被引用在报纸上,推文也不会被追踪。因此,我们不能包含和分析任何个人数据,如用户名和位置。有关纳入这些资料的更详细资料,可在别处找到[84-86]。然而,本研究使用了广泛的数据获取过程来避免这些限制。此外,考虑到伦理限制,案例研究将要求我们招募参与者,这需要仔细完成,因为不断意识到被分析可能会妨碍推文的自发性。未来对同一推特进行地理分析和纵向观察,可以提供更丰富的见解和更好的与工作有关的情绪背景,以揭示一种模式,如果它存在的话。但是,应优先考虑数据处理中的数据治理,并始终保持谨慎,以免用户的隐私受到阻碍。虽然包括案例研究和地理分析超出了本研究的范围,但我们鼓励在未来这样做。

结论

本文概述了目前与工作有关的心理健康状况,其在工作时间之外的连锁反应,以及如何处理。对上述100万条推文的研究显示,人们愿意在社交媒体上分享与工作有关的情绪的不同方面。本研究的主要发现概述于文本框6

这项研究分析了数千条推文,揭示了职场人士关心的方面,这在一定程度上与LFS的调查是一致的。但是,这一主题需要更综合的方法。此外,反讽、讽刺、表情符号、多极化和单词歧义是NLP领域的一些具有挑战性的方面,需要进一步加强。因此,我们强调探索技术驱动的解决方案如何支持解开工作、身心健康和生活方式之间动态交织的关系,以保护我们的劳动力并改变工作场所。

本研究的主要发现。

重要发现

  • 研究人员还确定了人们用来表达与工作有关的情绪的词汇类型。
  • 无论是表达悲伤还是快乐,在Twitter上关于工作的表达中,俗语和雄辩都被观察到。
  • 正面和负面推文中重叠的一组单词表示乐观,相比之下,不受欢迎的情绪影响着他们生活中的同一实体(日子、生活和时间)。
  • 时间变量(一天时间,),生活,需要都是正面和负面推文中的主要词汇,这从图表中可以明显看出。主题分析提供了一种跨情感的上下文叙述感。例如,主题5表示金融方面,主题0表示基于互联网的会议和会议,主题7表示体育方面。
文本框6。本研究的主要发现。

致谢

这项工作部分得到了国家卫生研究所(NIHR)牛津生物医学研究中心(BRC)的支持,部分得到了香港脑心血管健康工程中心(COCHE)的InnoHK项目的支持。DAC是英国牛津大学流行病科学研究所的研究员。MHT得到了工程和物理科学研究委员会医疗保健技术挑战奖(EP/N020774/1)的支持。本文仅代表作者个人观点,并不代表NHS、NIHR、卫生部、InnoHK - ITC、工程与物理科学研究委员会或牛津大学。

利益冲突

没有宣布。

多媒体附件1

潜狄利克雷分配模型对2 ~ 31个主题的相干值。

PDF档案(adobepdf档案),105kb

多媒体附件2

正面推文中带有前一个和下一个单词的热门单词(三元组合)。

PDF档案(adobepdf档案),433 KB

多媒体

负面推文中的前一个和下一个单词(三元组合)。

PDF档案(adobepdf档案),452 KB

多媒体附件4

来自中性推文的前一个和下一个单词(三元组合)的热门单词。

PDF档案(adobepdf档案),320 KB

  1. 健康和安全行政主页HSE。2022.URL:https://www.hse.gov.uk[2022-06-08]访问
  2. 劳动力调查。英国国家统计局,2020年。URL:https://www.ons.gov.uk/surveys[2022-06-08]访问
  3. Leach C, Finning K, Kerai G, Vizard T.成人冠状病毒和抑郁症,英国:2021年7月至8月。英国国家统计局,2021年10月1日。URL:https://www.ons.gov.uk/peoplepopulationandcommunity/wellbeing/articles/coronavirusanddepressioninadultsgreatbritain/julytoaugust2021[2022-06-08]访问
  4. 心理健康的未来五年展望。NHS英格兰,2016年2月https://www.england.nhs.uk/wp-content/uploads/2016/02/Mental-Health-Taskforce-FYFV-final.pdf[2022-06-08]访问
  5. 心理健康和药物使用。世界卫生组织。URL:https://www.who.int/teams/mental-health-and-substance-use/overview[2022-06-08]访问
  6. 汉普森E,索内吉U,雅各布A,梅库B,加汉HM。心理健康和雇主:投资的理由。监控德勤2017年10月https://www2.deloitte.com/content/dam/Deloitte/uk/Documents/public-sector/deloitte-uk-mental-health-employers-monitor-deloitte-oct-2017.pdf[2022-08-19]访问
  7. 史蒂文森LD,法默P.在工作中蓬勃发展:心理健康和雇主的回顾。GOV.UK。2017年10月26日。URL:https://www.gov.uk/government/publications/thriving-at-work-a-review-of-mental-health-and-employers[2022-08-19]访问
  8. 卡尔马迪,格雷纳,阿格拉瓦尔,希瓦库玛尔,纳拉亚纳斯瓦米,布朗,等。利用多脑分组集成学习改进精神分裂症预测,向精神健康领域的人工智能迈进。NPJ精神分裂症2019 1月18日;5(1):2 [免费全文] [CrossRef] [Medline]
  9. Chivilgina O, Wangmo T, Elger BS, Heinrich T, Jotterand F.精神分裂症谱系障碍的管理:系统综述。国际社会精神病学杂志2020年11月;66(7):642-665。[CrossRef] [Medline]
  10. Günther MP, Kirchebner J, Lau S.在精神分裂症机器学习算法的高危罪犯患者亚组中识别直接胁迫。前沿精神病学2020;11:415 [免费全文] [CrossRef] [Medline]
  11. 蔡旭,谢东,Madsen K,王勇,Bögemann SA,张E,等。基于静息态功能MRI数据的精神分裂症分类机器学习的可泛化性。Hum Brain Mapp 2020 Jan;41(1):172-184 [免费全文] [CrossRef] [Medline]
  12. Lipschitz J, Miller CJ, Hogan TP, Burdick KE, Lippin-Foster R, Simon SR,等。抑郁和焦虑的移动应用的采用:患者兴趣和参与障碍的横断面调查研究。JMIR医疗卫生2019年1月25日;6(1):e11334 [免费全文] [CrossRef] [Medline]
  13. 张军,张建军,邓克利。基于脑磁连接组的创伤后应激障碍分类方法。科学通报2020 Apr 03;10(1):5937 [免费全文] [CrossRef] [Medline]
  14. poussreliu CR, Andersson G, Dobrean a .注意缺陷/多动障碍移动应用程序:系统综述。Int J Med Inform 2020年6月;138:104133 [免费全文] [CrossRef] [Medline]
  15. 刘志强,刘志强,杨晓明,等。职业卫生服务利用和精神障碍所致疾病缺勤的社会经济差异:一项基于登记册的回顾性队列研究国际环境与公共卫生2020年3月20日;17(6):2020-2021 [免费全文] [CrossRef] [Medline]
  16. 奥田Y,岩崎S,德口Y,尼塔T,三竹T,坂口A,等。非医务职业卫生工作人员的职业倦怠和职业压力源。占领地中海(伦敦)2020年3月12日;70(1):45-51 [免费全文] [CrossRef] [Medline]
  17. Milner A, Maheen H, Currier D, LaMontagne A.澳大利亚建筑工人中的男性自杀:导致死亡的主要压力源的定性分析。BMC Public Health 2017 Jun 19;17(1):584-586 [免费全文] [CrossRef] [Medline]
  18. Gradus J, Rosellini A, Horváth-Puhó E, Street A, Galatzer-Levy I, Jiang T,等。使用机器学习和丹麦单一支付人医疗保健登记数据预测性别自杀风险美国医学杂志精神病学2020年1月1日;77(1):25-34 [免费全文] [CrossRef] [Medline]
  19. 林国强,杨松,林超,刘志强。基于机器学习的军人自杀意念预测。IEEE生物医学健康通报2020年7月;24(7):1907-1916。[CrossRef]
  20. hasanpour S,富田N, DeLise T, Crosier B, Marsch LA。基于深度神经网络和Instagram社交媒体数据识别药物使用风险。神经精神药理学2019 Feb 24;44(3):487-494 [免费全文] [CrossRef] [Medline]
  21. Geraci J, Wilansky P, de Luca V, Roy A, Kennedy JL, Strauss J.将深度神经网络应用于电子病历中的非结构化文本注释,用于青少年抑郁症的表型。基于证据的心理健康2017年8月24日;20(3):83-87 [免费全文] [CrossRef] [Medline]
  22. Powell AC, Torous JB, Firth J, Kaufman KR.心理健康应用程序创造价值。BJPsych Open 2020年2月05日;6(2):e16 [免费全文] [CrossRef] [Medline]
  23. Arenas-Castañeda PE, Aroca Bisquert F, Martinez-Nicolas I, Castillo Espíndola LA, Barahona I, Maya-Hernández C,等。墨西哥农村社区普遍心理健康筛查,重点关注使用智能手机的自杀行为:基于智能屏幕的人口调查方案英国医学杂志公开赛2020年7月19日;10(7):e035041 [免费全文] [CrossRef] [Medline]
  24. Görlich D, Faldum a .在ICare中实施在线干预:生物统计学的角度。互联网Interv 2019 Apr;16:5-11 [免费全文] [CrossRef] [Medline]
  25. D'Alfonso S, Santesteban-Echarri O, Rice S, Wadley G, Lederman R, Miles C,等。人工智能辅助青少年心理健康在线社会治疗《前线精神》2017;8:796 [免费全文] [CrossRef] [Medline]
  26. Drissi N, Ouhbi S, Janati Idrissi MA, Ghogho M.高评级焦虑应用程序的自我管理和治疗相关功能和特征分析。Int J Med Inform 2020年9月;141:104243 [免费全文] [CrossRef] [Medline]
  27. Bakker D, Kazantzis N, Rickwood D, Rickard N.智能手机提供的情绪和焦虑相关问题认知行为治疗策略的开发和试点评估:MoodMission。Cognit Behav Pract 2018 11月;25(4):496-514 [免费全文] [CrossRef]
  28. Boonstra T, Werner-Seidler A, O?Dea B, Larsen M, Christensen H.智能手机应用程序调查社会连接和心理健康之间的关系。在:第39届IEEE医学和生物工程学会(EMBC)国际年会论文集。2017年发表于:第39届IEEE医学与生物工程学会国际年会(EMBC);2017年7月11-15日;济州岛,韩国。[CrossRef]
  29. Callan JA, Dunbar Jacob J, Siegle GJ, Dey A, Thase ME, DeVito Dabbs A,等。CBT MobileWork©:以用户为中心的抑郁症移动心理健康应用程序的开发和测试。Cogn Ther Res 2020年9月25日;45(2):287-302。[CrossRef]
  30. Kannisto K Korhonen J, Adams C, Koivunen M, Vahlberg T, Välimäki MA。mobile.net基于健康的随机对照试验招募和随访期间退出的相关因素,以鼓励有严重精神健康问题的人坚持治疗。J Med Internet Res 2017 Feb 21;19(2):e46 [免费全文] [CrossRef] [Medline]
  31. Ly KH, Ly A, Andersson G.促进心理健康的全自动对话代理:使用混合方法的试点随机对照试验。互联网Interv 2017 12月;10:39-46 [免费全文] [CrossRef] [Medline]
  32. Tania M, Andreev I, Temdee P.数字心理健康支持的艺术和科学。在:2020年数字艺术、媒体和技术联合国际会议与ECTI电气、电子、计算机和电信工程北方部分会议(ECTI DAMT & NCON)的会议记录。2020年出席:2020年数字艺术、媒体和技术联合国际会议,与ECTI电气、电子、计算机和电信工程北方分会会议(ECTI DAMT & NCON);2020年3月11日至14日;泰国芭堤雅。[CrossRef]
  33. 通过赋予医生人工智能来彻底改变医疗保健。巴比伦的健康。URL:https://www.babylonhealth.com/en-gb/ai[2021-07-04]访问
  34. 四方健康主页。四方的健康。URL:https://www.quartethealth.com/[2021-07-04]访问
  35. 情感健康的聪明方法。莱拉的健康。URL:https://www.lyrahealth.com/[2021-07-04]访问
  36. 按需心理保健。姜。URL:https://www.ginger.com/[2021-07-04]访问
  37. 心理健康的关系代理。Woebot健康。URL:https://woebothealth.com/[2021-07-04]访问
  38. 在数字化优先的护理和研究下,生活更长久、更充实。人类。URL:https://huma.com/[2021-07-04]访问
  39. 这是没有系统的医疗保健。K的健康。URL:https://khealth.com/[2021-07-04]访问
  40. 心理健康,正好适合你春季健康。URL:https://www.springhealth.com/[2021-07-04]访问
  41. Shane-Simpson C, Manago A, Gaggi N, Gillespie-Lynch K.为什么大学生更喜欢Facebook、Twitter或Instagram?网站的可见性,隐私和自我表达之间的紧张关系,以及对社会资本的影响。Comput Human behaviour 2018年9月;86:276-288 [免费全文] [CrossRef]
  42. 王杰,范勇,Palacios J, Chai Y, gutta - jeanrenaud N, Obradovich N,等。COVID-19大流行期间情绪变化的全球证据。Nat Hum Behav 2022 3月17日;6(3):349-358。[CrossRef] [Medline]
  43. 曹山,MacLean A,陈华,李林,杨勇,巴特扎。第二次封城期间的公众态度:使用加拿大安大略省的推文进行情绪和主题分析。国际J公共卫生2022年2月21日;67:1604658 [免费全文] [CrossRef] [Medline]
  44. Cuenca-Zaldívar JN, Torrente-Regidor M, Martín-Losada L, Fernández-De-Las-Peñas C, Florencio LL, Sousa PA,等。利用电子护理病历探索COVID-19大流行第一波期间住院患者的情绪和护理管理:描述性研究JMIR Med Inform 2022年5月12日;10(5):e38308 [免费全文] [CrossRef] [Medline]
  45. 尹浩,宋旭,杨松,李娟。新型冠状病毒肺炎疫苗讨论的情感分析与话题建模。万维网2022年2月25日;25(3):1067-1083 [免费全文] [CrossRef] [Medline]
  46. Saura JR, Ribeiro-Soriano D, Zegarra Saldaña P.探索远程工作对Twitter用户情绪的挑战:从数字技术发展到后大流行时代。J Business Res 2022年3月;142:242-254。[CrossRef]
  47. Gibbons J, Malouf R, Spitzberg B, Martinez L, Appleyard B, Thompson C,等。以推特为基础的社区情绪测量作为居民健康状况的预测指标。PLoS One 2019;14(7):e0219550 [免费全文] [CrossRef] [Medline]
  48. Bryan C, Butner J, Sinclair S, Bryan A, Hesse C, Rose A.军事人员在社交媒体网络上出现自杀死亡的预测因素。自杀生命威胁行为研究2018 Aug;48(4):413-430 [免费全文] [CrossRef] [Medline]
  49. 温莎-谢拉德B.职业自杀,英国:2011年至2015年。英国国家统计局,2017年3月17日。URL:https://bit.ly/3oNMgs6[2022-06-08]访问
  50. Sherratt F, Welfare K, Hallowell M, Hoque Tania M.娱乐用大麻合法化:劳动力的安全、道德和法律观念。J Constr Eng Manag 2018年6月;144(6):04018048 [免费全文] [CrossRef]
  51. 丹纽拉提特R, Zatreh M, Lamy F, Nahhas R, Martins S, Sheth A,等。一项基于推特的大麻浓缩物使用调查。毒品酒精依赖2018年6月01日;187:155-159 [免费全文] [CrossRef] [Medline]
  52. Sung Y, Lee J, Kim E, Choi S.为什么我们发布自拍:理解发布自己照片的动机。个人Indiv Diff 2016七月;97:260-265 [免费全文] [CrossRef]
  53. Kelly Y, Zilanawala A, Booker C, Sacker A.社交媒体使用与青少年心理健康:来自英国千年队列研究的发现。EClinicalMedicine 2018年12月;6:59-68 [免费全文] [CrossRef] [Medline]
  54. 李志强,李志强,李志强,等。美国年轻人中社交媒体的使用和感知的社交隔离2017年7月;53(1):1-8 [免费全文] [CrossRef] [Medline]
  55. Dhir A, Yossatorn Y, Kaur P, Chen S.在线社交媒体疲劳与心理健康——强迫性使用,害怕错过,疲劳,焦虑和抑郁的研究。Int J Inform Manag 2018年6月;40:141-152。[CrossRef]
  56. Beyens I, Pouwels JL, van Driel II, Keijsers L, Valkenburg PM。社交媒体对幸福感的影响因青少年而异。科学通报2020 july 01;10(1):10763 [免费全文] [CrossRef] [Medline]
  57. 贝尔B,卡萨利J,邓巴L.自拍物化:自我物化和积极反馈(“赞”)与在社交媒体上发布性物化自我图像的频率相关。身体形象2018年9月26日:83-89 [免费全文] [CrossRef] [Medline]
  58. 社交媒体拉锯:积极和消极影响青少年的情感福祉。新媒体Soc 2018 Feb 21;20(10):3597-3623 [免费全文] [CrossRef]
  59. Oshio A, Taku K,平野M, Saeed G.弹性与大五人格特征:一个元分析。个人Indiv Diff 2018年6月;127:54-60 [免费全文] [CrossRef]
  60. Azucar D, Marengo D, Settanni M.从社交媒体上的数字足迹预测五大人格特征:一项元分析。个人Indiv Diff 2018 Apr;124:150-159 [免费全文] [CrossRef]
  61. GitHub Universe:全球开发者盛会。GitHub。URL:https://github.com/[2022-08-19]访问
  62. Edo-Osagie O, Iglesia BD, Lake I, Edeghere O.一种用于推特数据分析的自动关键词选择的进化方法。在:混合人工智能系统。hai 2020。可汗:施普林格;2020.
  63. 搜索tweet。Twitter。URL:https://developer.twitter.com/en/docs/twitter-api/tweets/search/integrate/build-a-query[2022-08-19]访问
  64. Blei DM, Ng AY, Jordan MI.潜狄利克雷分配。J Mach Learn Res 2003; 3:93 -1022。
  65. Gensim:人类主题建模。Gensim。URL:https://radimrehurek.com/gensim/[2020-09-28]访问
  66. Hutto C, Gilbert E. VADER:一个节俭的基于规则的社交媒体文本情感分析模型。Proc Int AAAI Conf Web Social Media 2014;8(1):216-225。
  67. 评估主题模型:潜狄利克雷分配(LDA)。面向数据科学,2019年8月19日。URL:https://towardsdatascience.com/evaluate-topic-model-in-python-latent-dirichlet-allocation-lda-7d57484bb5d0[2022-05-21]访问
  68. 主题建模- Python中的LDA木槌实现-第2部分。中。2020年6月30日。URL:https://medium.com/swlh/topic-modeling-lda-mallet-implementation-in-python-part-2-602ffb38d396[2022-05-21]访问
  69. Prabhakaran S.主题建模与Gensim (Python)。机器学习+ 2018年3月26日。URL:https://www.machinelearningplus.com/nlp/topic-modeling-gensim-python/[2022-05-21]访问
  70. 约翰逊S,罗伯逊I,库柏CL。工作中的生产力和幸福感。湛:施普林格国际出版;2017.
  71. 贝尔特C,德内夫J,沃德g员工幸福感对生产力有影响吗?SSRN J 2019 10月17日。[CrossRef]
  72. 为医疗保健提供者提供的数字心理健康平台。Minddistrict。URL:https://www.minddistrict.com/[2021-07-04]访问
  73. 健康保证。URL:https://www.healthassured.org/[2021-07-04]访问
  74. 公司的医疗保健。纳菲尔德健康中心。URL:https://www.nuffieldhealth.com/corporate-healthcare[2021-07-04]访问
  75. Holtom B, Allen d,预测谁会退出的更好方法。《哈佛商业评论》2019年8月16日。URL:https://hbr.org/2019/08/better-ways-to-predict-whos-going-to-quit[2022-08-19]访问
  76. 端到端成像AI专家结合独特的工具和机器学习服务。Zegami。URL:https://zegami.com/[2021-07-04]访问
  77. 人工智能在你辞职之前就知道你要辞职了,还会警告你的老板。英国《每日电讯报》2019年10月14日。URL:https://www.telegraph.co.uk/technology/2019/10/14/ai-knows-resign-do-warns-boss/[2022-08-19]访问
  78. Oakman J, Macdonald W, Bartram T, Keegel T, Kinsman N.预防肌肉骨骼和精神健康障碍的工作场所风险管理实践:有什么差距?安全科学2018年1月;101:220-230 [免费全文] [CrossRef]
  79. Maakip I, Keegel T, Oakman J.工作方式和肌肉骨骼不适(MSD):探索马来西亚工作文化的影响。J Occup Rehabil 2015 12月;25(4):696-706 [免费全文] [CrossRef] [Medline]
  80. 李勇,杨旭,孙鹏,祁华,吕松。名人- df: DeepFake取证的大规模挑战数据集。见:2020年IEEE/CVF计算机视觉和模式识别(CVPR)会议记录。2020年发表于:2020 IEEE/CVF计算机视觉和模式识别会议(CVPR);2020年6月13日至19日;西雅图,华盛顿州,美国。[CrossRef]
  81. 卡德瓦拉德C,格雷厄姆-哈里森e透露:剑桥分析公司在重大数据泄露中收集了5000万Facebook个人资料。《卫报》。2018年3月17日。URL:https://www.theguardian.com/news/2018/mar/17/cambridge-analytica-facebook-influence-us-election[2022-08-19]访问
  82. 艾萨克J,汉娜MJ。用户数据隐私:Facebook、Cambridge Analytica和隐私保护。计算机2018 8月;51(8):56-59。[CrossRef]
  83. 使用Twitter作为数据源:当前社交媒体研究工具概述。伦敦政治经济学院2015年7月10日。URL:http://blogs.lse.ac.uk/impactofsocialsciences/2015/07/10/social-media-research-tools-overview/[2022-08-19]访问
  84. Gore RJ, Diallo S, Padilla J. You are what You tweet:将美国肥胖率的地理差异与twitter内容联系起来。PLoS One 2015 9月2日;10(9):e0133505 [免费全文] [CrossRef] [Medline]
  85. 帕迪拉JJ,卡瓦克H,林奇CJ,戈尔RJ,迪亚洛SY。推特上旅游景点访问情绪的时空调查。PLoS One 2018 6月14日;13(6):e0198857 [免费全文] [CrossRef] [Medline]
  86. IPG媒体实验室2012年5月31日。URL:https://medium.com/ipg-media-lab/twitter-use-2012-pew-research-centers-internet-american-life-project-dbbaffad4c3d[2022-08-19]访问


人工智能:人工智能
手套:字表示的全局向量
HSE:健康与安全执行局
LDA:潜在狄利克雷分配
LFS:劳动力统计调查
NLP:自然语言处理
NLTK:自然语言工具包
维德:情感推理的价感字典


A Mavragani编辑;提交01.05.21;同行评审:MS Kaiser, D Huang, R Gore;对作者29.05.21的评论;修订本收到日期:03.07.22;接受10.08.22;发表30.09.22

版权

©Marzia Hoque Tania, Md Razon Hossain, Nuzhat Jahanara, Ilya Andreev, David A Clifton。最初发表于JMIR Formative Research (https://formative.www.mybigtv.com), 30.09.2022。

这是一篇开放获取的文章,根据创作共用署名许可协议(https://creativecommons.org/licenses/by/4.0/)的条款发布,允许在任何媒介上不受限制地使用、分发和复制,前提是正确引用了首次发表在JMIR Formative Research上的原创作品。必须包括完整的书目信息,https://formative.www.mybigtv.com上的原始出版物的链接,以及此版权和许可信息。


Baidu
map