发表在第6卷第9期(2022):9月

本文的预印本(早期版本)可在https://preprints.www.mybigtv.com/preprint/39013,首次出版
基于网络的心理健康社区的弹性:用半自动文本分析建立一个弹性字典

基于网络的心理健康社区的弹性:用半自动文本分析建立一个弹性字典

基于网络的心理健康社区的弹性:用半自动文本分析建立一个弹性字典

原始论文

1澳大利亚研究委员会(ARC)自动化决策与社会卓越中心(ADM+S),斯威本科技大学,维多利亚,澳大利亚

2社会创新研究所,斯威本科技大学,维多利亚,澳大利亚

通讯作者:

康永斌博士

澳大利亚研究理事会自动化决策与社会卓越中心(ADM+S)

斯威本科技大学

约翰·圣

山楂

3122年维多利亚,

澳大利亚

电话:61 3 9214 5904

电子邮件:ykang@swin.edu.au


背景:弹性是一个公认的基于优势的概念,用于应对变化、逆境和危机。这一概念支撑了个人和基于社区的心理健康问题预防方法,并形成了数字干预措施。在线心理健康同行支持论坛通过提供可访问的场所来分享心理问题的生活经验和寻求支持,在增强复原力方面发挥了突出作用。然而,关于恢复力是否以及如何实现的研究很少,阻碍了服务提供商优化恢复力结果的能力。

摘要目的:本研究旨在创建一个反映在线心理健康同行支持论坛中弹性的特征和实现的弹性字典。研究结果可用于指导进一步分析,并通过有针对性的调节和管理来提高心理健康论坛的弹性结果。

方法:利用主题建模和定性内容分析,提出了一种半自动创建弹性词典的方法。我们提出了一个系统的四阶段分析管道,预处理原始论坛帖子,发现核心主题,概念化弹性指标,并生成一个弹性字典。我们的方法应用于澳大利亚SANE(精神分裂症:国家紧急情况)运营的精神健康论坛,分析了2018年至2020年期间2357名用户的70179个论坛帖子。

结果:本研究开发的弹性词典和分类法揭示了弹性指标(即“社会资本”、“归属感”、“学习”、“适应能力”和“自我效能”)是如何被论坛上经常讨论的主题所表征的;每个主题的前10个最相关的描述性术语及其同义词;以及弹性的相关性,反映了更全面(或复合)的指标分类,更有可能促进其他指标的实现。研究表明,弹性指标“学习”、“归属感”和“社会资本”的实现更为普遍,“归属感”和“学习”是“社会资本”和“适应能力”在2年研究期间的基础。

结论:这项研究提出了一个弹性词典,提高了我们对弹性方面如何在基于网络的心理健康论坛中实现的理解。该词典就如何改进培训以支持和增强调节心理健康论坛讨论的自动化系统提供了新颖的指导。

JMIR Form Res 2022;6(9):e39013

doi: 10.2196/39013

关键字



背景

心理健康是我们个人和集体思考、相互交流和享受生活的基本能力。1].心理健康挑战在世界范围内日益增加,对社会和经济繁荣产生了负面影响[2-4].2017年的调查[5]发现全世界大约七分之一的人(相当于10亿人)患有精神疾病。在澳大利亚,政府统计报告显示,大约20%的人(480万人)经历过与焦虑相关的疾病和抑郁症等心理健康问题[6].在2020年至2021年COVID-19大流行期间,340万16岁至85岁的澳大利亚人(占该年龄组的17%)向心理健康专业人员寻求帮助[7].由于封锁和保持社会距离的要求,COVID-19大流行与一些人所说的“前所未有的精神健康危机”有关[8],加快社区和数字干预的需求[9].

向他人寻求支持是增强复原力的重要组成部分[10].在此基础上,已经证明在线同侪支持的心理健康论坛(例如,那些由慈善机构Beyond Blue在澳大利亚运营的活动。11, SANE[精神分裂症:全国紧急状态]澳大利亚[12]和ReachOut [13])在为患有精神疾病的人建立社会联系、分享知识和经验,以及提供情感支持方面发挥着越来越重要的作用[414].这类论坛使有共同经历、咨询和指导的人能够直接接触到这些人,从而补充了公共资助和私人卫生服务。在论坛内,经过专门培训的工作人员、志愿者和未经培训的同行提供了一个支持性和安全的空间,让人们进行交谈并被倾听。1516].有证据显示,这些益处包括:17]:(1)建立安全和信任的关系,(2)确保互惠和互惠的价值观,(3)促进经验知识的验证和应用,(4)通过同伴支持使同伴发挥领导作用,(5)使同伴发现和利用自己的优势。作为临床和远程保健服务的补充,仍然需要更好地了解同行支持论坛的优势,并优化其管理和调节。

弹性是一个公认的基于优势的概念,而不是基于缺陷或伤害的概念。产生复原力是解决社区环境中心理健康问题的一种定期建议的方法,属于卫生保健的预防性模式[81819].弹性在多个学科中有不同的理解,是面对逆境、创伤、悲剧、威胁,甚至是重大压力来源时的个人和集体适应能力[20.].在应对挑战时,有弹性的个人和社区可以利用个人和集体的心理社会资源来应对和适应[4].因此,一个人的弹性可以对他们的心理健康产生积极的影响。然而,还需要更多的研究来了解弹性的特征,以及它是如何通过专门的基于网络的心理健康支持环境(如同行支持论坛)的互动来实现的。这项研究提供了一种方法和发现,可以帮助论坛服务提供商展示他们的成果,并调整他们的审核实践,以优化弹性建设互动。

之前的工作

尽管在线心理健康同行支持论坛在建立适应力方面具有潜在效用,是否而且如何恢复力得以实现被参与者的研究很少受到关注。现有研究的重点是基于弹性或力量的资源,方法分为两种:(1)使用用户调查进行定性分析;(2)使用人工或大规模人工智能技术对基于网络的论坛数据进行定性和定量分析。第一种方法集中于在特定事件期间(例如,COVID-19大流行[919])或来自某些组别(例如大学生[18]或青少年[21])。用户调查数据不太擅长展示弹性是如何通过论坛互动和话语实现的,因为它是在某个时间点上的横断性,并提出了调查设计师提出的具体问题,这可能与论坛用户的感知和体验不一致。

第二个研究方向是随着自然语言处理(NLP)和机器学习的最新进展而发展起来的。这些方法已显示出利用论坛内容作为探索公共卫生问题的数据集的前景[22].然而,这些工作大多集中在“风险”和“危害”上,而不是集中在优势上。例如,一个分类系统被用于帮助基于网络的同行支持,它根据版主需要关注的紧急程度将论坛消息分类为不同的风险级别[23].一项研究[3.]比较了2个基于网络的抑郁症论坛(Beyond Blue [11),r /抑郁在Reddit上[24])使用基于用户情绪和讨论主题的NLP技术。NLP技术也被用于识别基于网络的健康论坛(HealthBoards [25],启发[26]和HealthUnlocked [27),根据心理健康消费者的对话,与COVID-19大流行有关。其他研究应用NLP来检测情绪和情绪(如恐惧、愤怒、悲伤和快乐)[28-30.]以诊断抑郁症[3132]以及理解悲伤的过程[33]和重音[34].如上所述,这些研究倾向于针对与精神疾病相关的风险,在识别基于网络数据集的基于优势的交互以及基于网络的服务如何有助于产生积极的健康结果方面留下了差距。

本研究的目的

随着精神卫生服务部门寻求优化和扩大数字支持干预措施,需要对论坛活动采取新的分析和监测方法。在这项研究中,我们利用NLP技术来揭示弹性指标,以及弹性是如何在在线同行支持论坛中实现的。这项工作提供了新的见解,如何在论坛中实现弹性通过建立一个弹性的字典这揭示了两年论坛活动中讨论的韧性主题。

更具体地说,我们生成的弹性字典显示了(1)表征弹性的主题类型和(2)不同弹性指标之间的关系。这些见解揭示了特定弹性指标的更广泛(更抽象或常见)和更狭窄(更具体)的性质。论坛服务提供商和研究人员可以使用弹性词典来说明弹性是由论坛实现的,以及这种情况是如何发生的。它可以帮助监测论坛用户在一段时间内实现的弹性变化,并了解是什么促使弹性变化,无论是在论坛内部还是由外部事件刺激的。通过建立一种在非结构化文本数据中量化弹性的方法,弹性字典可以帮助论坛管理员和创建者更有战略地思考如何设计论坛,并更有效地维护和调节论坛。揭示弹性的特征以及随着时间的推移实现的程度也可以帮助非营利组织吸引资金来维持和进一步发展这些论坛。

为了达到我们的目标,我们调查了以下研究问题(RQs):

  • RQ1:我们如何使用主题(即帖子的主要主题)及其描述性术语来描述弹性指标?
  • 随着时间的推移,弹性指标是如何实现的,哪些指标比其他指标更占主导地位?
  • RQ3:我们如何创建一个反映每个弹性指标的特征以及弹性指标之间相关性的弹性字典?

为了解决这些rq,我们采用了一种半自动的方法,使用的方法包括主题建模(NLP中的一种统计建模)和开发人类的知识

为了解决RQ1,我们探索了发现主要主题概念的最佳方法主题,在论坛数据中使用主题建模。随后,使用定性方法,我们将这些主题映射到弹性指标。这些主题及其描述术语构成了弹性词典的受控词汇。

为了研究RQ2,我们观察了弹性患病率通过分析指定时间段内输入论坛数据的比例。然后,我们分析了每个弹性指标随时间的流行情况。

为了探索RQ3,我们使用映射到每个弹性指标的主题结果创建了一个弹性字典。为了在实现方面确定弹性指标之间的相关性,我们检查了来自输入论坛的弹性指标的共现模式,以自动构建弹性指标的分类(即:弹性分类).这种弹性分类阐明了弹性指标是依赖于其他弹性指标还是独立于其他弹性指标。

在这项工作中,我们使用了SANE澳大利亚的两个论坛产生的数据。SANE论坛是澳大利亚最大的基于网络的心理健康同伴支持社区之一,有心理健康问题的年龄≥18岁的人可以在这里注册并参与支持、培训和教育。用户可以通过论坛与其他经历类似心理健康挑战的人(即同龄人)互动。

据我们所知,这项研究是第一个通过检查主题和弹性指标之间的关系,并分析基于网络的心理健康论坛的弹性指标之间的相关性来探索弹性词典的构建的研究,使用NLP和人类知识。本研究的意义在于以下几个方面。首先,我们介绍了基于力量的弹性是如何在基于更广泛的基于网络的心理健康讨论的网络心理健康论坛中发展的。先前的研究试图做到这一点;然而,它们的规模较小,并受到特定事件(如COVID-19大流行)的限制[8914]或由某些年龄组别[21821].其次,弹性词典可以提供基于证据的信息,有助于设计和维护更好的心理健康支持服务,以及改善对寻求心理健康支持的人的反应。特别是,这种好处对于非营利精神卫生组织来说是有价值的,因为它们经常难以获得和分配资源来改善他们的服务。最后,这项工作表明,如何通过使用支持论坛的数据来提高精神卫生服务的有效性,这些数据的价值正日益得到认识[2230.].


总体设计

概述

创建弹性字典的半自动方法的4个阶段显示在图1.论坛帖子是第一个预处理以确保去标识并执行标记化以生成有意义的术语。第二个,主题建模用于发现帖子中讨论的关键主题(即主题)。第三,使用专题编码过程将主题映射到弹性指标框架。第四,基于对各岗位弹性指标的共现分析,建立了弹性分类。然后,通过将弹性分类法与前4个阶段的所有结果集成,生成了一个弹性字典。在接下来的章节中,我们在介绍了数据集和研究中使用的弹性指标的性质之后,对各个阶段进行了详细的描述。

图1。4阶段分析管道,用于预处理论坛帖子,查找主题,概念化弹性指标,并构建弹性字典。NMF:非负矩阵分解;词性。
查看此图
SANE论坛数据

SANE Australia是一个全国性的精神健康慈善机构,通过提供同伴支持服务、培训和咨询来支持受精神疾病影响的澳大利亚人。SANE数据来自两个基于网络的论坛:(1)“生活体验论坛”和(2)“朋友、家人和照顾者论坛”。前者是为有复杂心理健康问题的人准备的,而后者是为他们的支持者和照顾者准备的。SANE论坛由精神健康从业者主持,旨在提供一个安全、匿名的网络空间,供人们讨论精神健康及相关问题[35].论坛为参与者提供社会联系,允许分享感觉和情绪,并通过对话提供信息来源。论坛讨论旨在帮助受精神疾病影响的消费者探索积极的途径来解决影响他们生活的问题。根据SANE 2020年的年度报告,2020年有21041名注册论坛成员,151137名澳大利亚人使用了论坛[35].

我们从2018年第三季度(2018年7月开始)到2020年第四季度(2020年12月结束)从SANE论坛获得了全国样本。在这项研究中,研究人员与SANE论坛管理员合作,共获得了2357名用户的70179篇帖子。

弹性指标

利用Berkes和Ross提出的弹性框架[36,结合了心理学和社区发展方法,我们确定了个人和社区弹性的共同组成部分。伯克斯和罗斯[36]设计了一个关于社区中人们生活的弹性概念框架,使这一概念能够解释影响个人心理健康和福祉的更广泛的生态系统因素。尽管有一系列的恢复能力的方法,这个框架对于理解一个论坛的成员如何实现恢复能力是有用的,考虑到他们在实际的实地社区和基于网络的论坛对等社区中的位置。

所采用的恢复力方法的前提是理解有恢复力的人和社区需要获得一组个人、人际或社区资源。在研究证据的基础上,这些涉及学习或者获得新的知识、信息和技能,从而提高应对变化的能力[37];社会资本或者能够接触到人际网络,以及他们能够促进的支持、信任和融合;一种感觉归属感,包括属于群体和地方,接受成为群体的一部分,以及导致认同形成的过程[38];适应能力或者利用资源来促进适应和积极的行为改变[39];而且自我效能感或者能够自我组织或朝着一种受控制的状态努力[36].这些指标的定义以及它们如何在精神卫生的背景下在概念上实现显示在表1.在本研究中,弹性词典的生成集中在这5个指标上。

从理论上讲,我们希望看到弹性的每个指标在基于网络的讨论环境中表现出来的方式有所变化(与其他环境相比),以及它们在流行程度上的差异[36].这意味着一些指标应作为生成器或资源,而其他指标应作为弹性能力的属性或特征,如适应能力或自我效能的实例。通过RQ3测试这些依赖关系,并应用阶段4中描述的分类学分析。

表1。弹性指标,它们的定义,以及它们在基于网络的论坛中的概念实现。
弹性指标 定义 社区论坛实现
社会资本[38 进入社交网络,获得支持、信任和社会融合
  • 形成社会关系,个人可以从中获得信任和支持
  • 表示愿意分享与心理健康问题相似的经历
属于(38 归属于人和地方,被接纳为群体的一部分,以及导致认同形成的过程
  • 向别人介绍自己
  • 与那些经历类似挑战的人分享故事和生活经历,并按照他们自己的节奏参与
学习(37 获得知识、信息和技能发展的途径
  • 与他人分享应用知识和经验知识
  • 提供关于如何实践良好心理健康的建议,以及如何驾驭心理健康服务的策略
适应能力[39 利用资源,使适应和积极的行为改变
  • 在回应论坛上的建议或信息时,自我报告自己的活动或行为变化
自我效能感(36 自我组织或工作的能力,以获得受控状态的感觉
  • 在他们的生活或状况方面传达控制的感觉
  • 支持他人,让他们对自己改变的行为或积极的生活方式的选择负责,让他们感觉自己在掌控之中
伦理批准

大学伦理委员会批准了这项研究(R/2019/033)。此外,我们始终遵守SANE的道德规范和数据治理政策,其中包括建立数据共享协议,匿名化帖子以保护论坛用户的身份,并应用数据安全协议。

第一阶段:论坛帖子的预处理

在预处理阶段,我们的目标是将每个帖子分解成更小的基本意义单元。删除用户标识符(id或名称)以去识别帖子。然后将帖子分成句子,进行词性标记,并删除停顿词(如,,并不会提供有用的资料)。剩下的词被转换成词元形式,将词的屈折变化形式组合在一起。那些太短而不能为主题建模增加价值的帖子(<5个术语)被删除。最后,剩余的术语被用作下一个“主题建模”阶段的输入。

阶段2:主题建模

概述

主题建模因其在大型文本文档语料库中发现潜在主题主题的能力而受到关注[4041].主题是一个特定的、可识别的主题,由一组内聚的术语定义,这些术语表示该主题的特征。非负矩阵分解[42]被选为一种方法,因为它在短文本文档中发现主题的有效性,以及它发现广泛和特定主题的能力。作为一种分析论坛帖子的方法,NMF可以帮助识别经常随着时间讨论的广泛主题和可能与周期性事件相关的更具体的主题[43].

NMF的一个关键思想是分解术语文档矩阵n通过一个(n是论坛帖子的数量,和是项的个数)分成2个非负子矩阵,n通过kW (k题目的数量)和k通过H,使得A近似于W和H的乘法,记为A在A中,一个词在一个文档中的权重是通过一个定义明确的方法来测量的,即词频率-逆文档频率加权方案[44],通过术语频率和稀有度。The matrix W represents the document membership weights over the topics. Each row denotes a document, and each column corresponds to a topic. Sorting the values of a column (topic) provides the ranking of the most relevant documents for the column. The matrix H contains the term weights relative to each of the topics. A row defines a topic. Sorting the values on each row provides the ranking of the most relevant terms (descriptors) of each topic.

主题输入生成

经过预处理后,每个帖子都由一个术语列表表示。在应用主题建模之前,我们执行了两个步骤来生成主题输入。在第一步中,这些职位根据一年“季度”的时间长短被分成不连贯的集合。这个收集期最适合用于确定粒度主题(即,既不太广泛也不太具体)。从2018年第三季度到2020年第四季度,这产生了10次post collection。第二步涉及从每个集合中使用术语频率逆文档频率加权方案构建术语文档矩阵a。

两层NMF主题建模

两层NMF方法[45]被应用于术语文档矩阵(用A*表示),以发现更广泛(寿命更长)和更具体(寿命更短)的主题。该过程提取整个时间框架(2018年第三季度至2020年第四季度)中观察到的更广泛的主题,以及每个季度的特定主题,生成两个主题层。在第一层中,我们发现k主题,叫做基本主题,从A*的每个术语文档矩阵A中使用NMF,其中k用户指定的参数。该层的输出是来自所有不相交post collection的2个矩阵W和H的集合,分别用W*和H*表示。在第二层,我们确定了另一种类型的主题,称为合奏的话题通过分析2018年第三季度至2020年第四季度产生的所有基础主题之间的异同。通过将H* (图2).每个H包括k主题及其组成术语。在B中,每行对应一个基本主题,每列是来自原始帖子的一个术语。B中的每个条目都显示了一个术语与基本主题关联的权重(或重要性),其中权重由第一层NMF推断。如图2, B的尺寸为10 ×k通过为H*,由H的10个不同矩阵组成(从2018年Q3到2020年Q4)条款。

图2。通过叠加第一层非负矩阵分解生成的H*矩阵来构造矩阵B的概念说明。
查看此图

从B开始,我们应用NMF进行生产k”集成主题,其中k”是用户指定的参数,因此产生B≈W' × H',其中(1)W'表示'集合主题上的基本主题隶属度权重,(2)H'矩阵表示每个集合主题的术语权重。为了产生原始帖子在集合主题上的隶属度权重,我们计算了以下表达式:

D≈c × w 'T(方程1)

这里,C是基于文档的主题矩阵,它由W*的每个矩阵W堆叠而成,就像B由H*的矩阵创建一样。D为文档集成主题矩阵,W'T是W'的转置。D中的每一行都是一个原始帖子,每一列表示一个集成主题。

阶段3:弹性概念化

概述

在本节中,我们将介绍如何使用相关主题对每个弹性指标进行概念化。在这种情况下,概念化是指根据定性论坛帖子中的相关讨论主题(即主题)指定弹性指标特征的过程。首先,我们介绍如何使用发现的主题来描述每个指标。其次,我们提出了一种确定弹性指标是否随时间变化的方法。这可以为它们随时间变化的动态特性提供额外的见解。

将主题映射到弹性指标

在这里,我们的目标是将主题与相关弹性指标联系起来(即,与我们之前讨论的预定弹性框架相关)。为此,我们进行了定性内容分析,其中关于论坛上发生的事情及其目标的知识用于评估主题的含义,并将每个主题与相关指标联系起来。作为定性数据,我们分析了顶部的意义NN是用户指定的参数)用于每个主题的描述性术语。作为补充数据,我们还检查了与每个主题最相关的帖子,以更严格地分析与弹性指标相关的主题的含义。这一内容分析是使用预定义的弹性指标框架进行演绎的。请注意,根据专题分析,一个主题可以映射到>1弹性指标。我们遵循了最近的一项工作,显示了将主题建模与定性方法相结合的好处,特别是在分析的解释和语境化阶段[46].在这里,我们的重点是了解主题的性质及其与弹性指标的关联,这些关联基于上下文的领域知识和最常包含它们的帖子。仅凭顶部无法对主题进行有意义的解释N作为主题的词语并不独立于它们所出现的帖子。

生成和分析的两类定性数据如下。

首先,顶部N最能描述每个集合主题的术语(以下简称“主题”)是从矩阵B生成的主题-术语矩阵H'中识别出来的(回顾阶段2中提出的B≈W' × H';图2).注意,H'中的每一行表示所有项相对于一个主题的权重。我们生成了这些顶部N对权重进行排序。检查这些术语的集体含义为每个主题到相关弹性指标的映射过程提供了信息。的价值N,我们用了15。

其次,我们将每个主题与其最相关的原始主题关联起来。这种关联是从矩阵D(公式1)中识别出来的,矩阵D表示所发现主题的原始帖子的隶属度权重。通过对这些权重进行排序,我们确定了最高的权重每个主题最相关的帖子。在我们的研究中,我们选择20作为的值.通过对这些帖子进行内容分析,我们深入了解了围绕每个主题的词汇和思想范围。

弹性流行度分析

弹性患病率分析可以根据弹性指标随时间的实现来确定其动态。我们估计弹性流行率为与最相关的弹性指标相关的原始职位的比例。通过这种分析,我们确定了哪些弹性指标在特定时期显著或模糊地实现了。因此,使用弹性流行度分析估计了一段时间内的弹性实现模式。要分析心理弹性的普遍性,有必要注释每个职位都有其最相关的弹性指标。这是通过以下2个步骤实现的。首先,回顾一下文档集成主题矩阵D(公式1),我们确定了每个帖子在每个主题上的隶属度权重。根据每个帖子在所有主题中的权重,我们为每个帖子注释了权重最高的主题;因此,这个话题被认为是这篇文章中最重要的话题。其次,我们注意到每个主题在前一步中都映射到其相关的弹性指标(请参阅将主题映射到弹性指标部分)。图3使用人工示例说明这两个步骤。

图3。说明用于用最相关的弹性指标注释帖子的2个步骤。第一步展示了如何用公式1中的文档集成主题矩阵D中最相关的主题注释每篇文章。第二步用第一步结果中最具弹性的指标注释每篇文章,并将结果从主题映射到最相关的弹性。
查看此图

阶段4:弹性词典的构建

在本节中,我们将介绍建立弹性分类法的动机和方法,该分类法是弹性词典的一部分。然后,我们详细说明弹性字典的定义和创建。

弹性分类推理

我们创建弹性分类法的目的是提高我们对以下方面的理解:(1)弹性指标之间在实现方面的相关性(即指标是独立实现的还是共同实现的)以及(2)哪些指标可能促进其他指标的实现。为了实现这一目标,我们的方法利用了弹性指标的实现共存。这些共同出现的现象可以通过注释的帖子来观察(参见阶段3中的方法)。分类法可以以一种自动的方式将指标之间的关系概念化,从而为理解弹性实现关系提供信息。一般来说,分类学中的关键关系是“is-a”关系[47].“is-a”关系具有层次结构,因此,它的传递性是通过导航分类法中实体之间的层次关系在逻辑上推断出来的。直观地,在我们的环境中,弹性指标在弹性分类中的定位越高,它就越广泛或更抽象。位置越低,特异性越强。给定分类法中两个指标之间的层次路径,我们可以推导出排名较低的指标,这些指标最有可能影响较高指标的实现。因此,从分类法中获得的语义知识可以促进弹性指标的共实现分析。

为了创建弹性分类法,我们的基本目标是检查原始帖子中注释的弹性指标的共同出现情况。特别地,我们使用了流行的包容方法[4849],该方法已被证明对自然语言处理中的分类学学习有效;也就是说,根据这种共现知识,我们建立了一个弹性指标x包含另一个弹性指标y如果贴子带有注释y是否注释了帖子的子集x.在此方案的基础上,我们可以找到弹性指标之间的分类关系。

弹性字典生成

通过将调查结果聚合到这一点,我们生成了一个弹性字典,它表示(1)弹性指标如何由特定主题表征,(2)每个主题如何由特定的描述性术语表示,哪些术语是相似的,以及(3)弹性指标之间存在哪些语义关系。弹性词典可以提高对每个弹性指标的含义和实现的语义覆盖的理解。这本词典包含了中所描述的特征文本框1

弹性字典的特性。

弹性词典功能

  • 弹性指标弹性指标。
  • 指示弹性分类中确定的给定指标的直接父弹性指标。
  • 主题提供与使用人工知识确定的每个弹性指标相关的主题列表。
  • 主题的重量表示每个主题随时间变化的平均权重。为了计算这个权重,我们首先通过从文档集成主题矩阵d中确定文章相对于主题的最高隶属度权重来找到与每篇文章最相关的主题。在某种意义上,这个权重也被视为文章中主题(最重要的主题)的权重。其次,我们计算了所有帖子中最重要主题的平均权重。因此,该特性表示每个主题相对于所有主题的相对重要性。
  • 主题文字表示每个主题的前10个最具描述性的术语。
  • 类似条款描述主题术语的同义词,旨在增加主题术语的语义。由于没有现有的基于网络的心理健康社区的同义词词典,我们的方法利用了一种叫做“同义词词典”的机器学习技术字嵌入.词嵌入用于识别每个主题术语的同义词,根据它们在输入论坛帖子中与其他术语的共现情况。请注意,词嵌入倾向于通过识别在相似上下文中一起出现的最近的单词来指示相似的单词。因此,词嵌入捕获的同义词可能不是“纯粹的”同义词,这取决于输入上下文(例如,如果两个术语“好”和“坏”经常在相似的上下文中同时出现,则可以将其识别为同义词)。我们使用了一个名为word2vec [50]作为词嵌入模型,该模型在分析词的语义分析方面表现出许多优势。
文本框1。弹性字典的特性。

第一阶段:心理健康论坛帖子的预处理

从2357名用户最初发布的70179条帖子中,图4按时间季度显示帖子的数量。作为主题建模的输入,我们使用69.56%(48,819/70,179)的帖子。注意,我们删除了30.44%(21360 / 70179)长度小于5个单词(即太短)的帖子。

图5显示前50个术语的词频在发布数据。大多数由名词组成(例如,一天帮助需要道路,一年),动词(例如,帮助需要感觉知道认为想要,对不起)和形容词(例如,伟大的,),而副词则相对较少使用(例如,真的).总的来说,从48,819个帖子中,我们在预处理阶段后提取了14,938个术语。最低、平均、最高任期分别为6个、30个、1182个。

图4。精神分裂症摘要:2018-第三季度至2020-第四季度样本中的国家紧急情况(SANE)论坛帖子。
查看此图
图5。从48819个帖子中观察到词频排名前50的词汇。
查看此图

阶段2:主题建模

根据2018年第三季度至2020年第四季度,48819个帖子被分为10个独立的帖子集合。从每个集合中,我们发现了使用NMF的主题。为了生成主题,k而且k”必须提供,在哪里k而且k”分别确定要生成的基本主题和集成主题的数量。没有确定这些数字的通用方法[43].在我们的研究中,我们使用了一个固定值10作为k,假设我们同样从每个集合中发现了正在讨论的10个主要主题。初步实验发现k=10(范围为k=5-15)给出了一个既不太笼统也不太具体的信息主题集。为了发现k”集成课题中,采用了较为复杂的变型方法k”从10到20,以1为增量选择一个最佳数字。由于我们不知道有多少基本主题是相似的或不同的,我们使用一个广泛使用的指标来测量整个时间轴上基本主题的相似性和方差,主题连贯性51].这种方法衡量的是顶部之间的相似度N每个主题的术语。从话题连贯的角度来看,可解释性越强的话题,生成的所有话题的平均连贯得分就越高。为了测量主题连贯性,我们使用了词嵌入[43来测量顶部之间的相似性N主题中的术语。这种相似性是使用词嵌入向量之间的余弦相似度来估计的。的价值N,我们采用了O 'Callaghan等人在研究中的建议[43].我们从整个帖子数据中使用word2vec [50].最后,利用主题连贯性,我们选择15作为最优值k”图6显示生成的15个集成主题。对于每个主题,前15个描述性术语根据它们的权重(重要性)进行垂直排名(第一行是最具描述性的术语)。主题中每个术语的权重由“红条”显示,其中主题中所有术语的权重之和归一化为1。

图6。15个生成的集成主题,其中每个主题由其前15个描述性术语表示。
查看此图

阶段3:弹性概念化

将主题映射到弹性指标的结果

根据以前的工作进行的定性专题分析[52]由4位具有定性心理健康研究专业知识的研究人员(第二、第三和第四作者)进行,以解释主题的含义并为其分配描述性主题标签。这些标签,如图6,通过在确定的主题中排名前15位的单词和与该主题相关的排名前20位的帖子中寻找最合适的含义来描述每个主题。首先,研究人员熟悉了主题建模结果,独立地注意到用于提供主题词和帖子的语义代表性标签的初始想法。随后,主题标签进行了比较和改进,以达到令人满意的研究人员之间的共识。然后,每个研究人员根据建立的弹性理论,通过演绎过程将最终商定的主题标签归属于5个弹性指标中的≥1个。最后,团队对这些分组进行了审查,并对一致性进行了改进(表2).

确定的主题反映了论坛的目标,即为患有精神健康疾病的人提供持续、可获得的对等支持。虽然经常讨论抑郁和焦虑等精神疾病的具体情况,但它们不是所确定主题的重点;也就是说,尽管一些话题直接表达了心理健康问题,如“睡眠”和“面临困难”,但日常挑战和社会联系和支持指标是更常见的话题。主题也有一个重要的时间维度,这是我们的方法的一个优势,它考虑主题随着时间的推移。2年的帖子样本和基于季度的主题建模表明,圣诞节、除夕和生日等年度活动或庆祝活动通常被引用,这表明随着时间的推移,社交联系作为论坛的一个特征的重要性。大多数话题表达了人际社会联系的建立和维持:“欢迎”、“共情”、“良好祝愿”、“支持”、“爱”、“友谊”和“欣赏”。有几个话题是自我导向的:“感恩”、“反思”和“了解”。后者很重要,但更罕见的适应指标和自我意识,这是恢复力所必需的。

研究人员将主题归结为弹性指标,考虑每个主题的前15个单词和相关的前20个帖子。没有假设主题是否符合所有弹性指标,以及主题是否可以归因于1、>1或没有指标。研究人员之间达成了强烈的一致,在达成一致之前,会注意到一些小的差异并进行讨论。将主题映射到弹性指标的结果显示在表2,并附有示例文章。

表2。将主题映射到弹性指标的结果。
弹性指标 映射的话题 例子的帖子
社会资本 感恩、欣赏、日常生活、爱、支持、祝福、共情、乐趣和友谊
  • “[…]you did good???? so you did do the dishes eventually. Just organised my bedside table and tidied backyard (courtyard), will get back to it in the morn, ta” [Gratitude]
  • “哇,谢谢你们这些不可思议的人类!在此呼应x1000 [x]的情绪。
  • “从这些周期中获得帮助的方法是谈论它们。把它们写在一张纸上交给pdoc会有帮助吗?“(支持)
归属感 感恩、欣赏、日常生活、爱、祝福、庆祝、共情、欢迎、乐趣和友谊
  • “再次欢迎来到论坛……],it sounds like you’ve been through a lot so it’s understandable that you’re under so much stress.” [Welcoming]
  • “新南威尔士州、维多利亚州、ACT和Tassie的大家新年快乐”[庆祝活动]
  • “我也厌倦了我的身体问题,但一步一个脚印,我伟大的朋友,与你同行,我一直在你身边,[…]”(友谊)
学习 反思、支持和了解
  • “听音乐确实有帮助。需要学会摒弃那些无益的负面声音。“(支持)
  • “我很努力地想透过眼泪看清楚。这很难,但我决心去那里。只要知道你在这里,我就有力量x????“(了解)
适应能力 反射
  • “在这个过程中我会想念你……),pray that the transition is as smooth as possible.” [Reflection]
自我效能感 面对困难和睡眠
  • “嗨,我感到非常焦虑。我试着控制它,但感觉我内心一片混乱。我感到呼吸急促,心跳加速”(面对困难)
  • “人们的焦虑程度超出了记录。我昨晚一觉没睡,情绪特别低落。“睡眠

大多数话题都归因于“社会资本”和“归属感”指标。这与众所周知的社交媒体的属性一致,社交媒体鼓励并通过交际来发挥作用,而不是信息或对话意图[53].在职位这一广泛的社会语用功能中,我们可以看到一系列区分建立和维持社会联系的不同方法的主题。与“学习”、“适应能力”和“自我效能”相关的主题很少,这些可以被认为是表现出的弹性的更明确的表达,其中变化、适应和应对成为可能。

弹性流行度分析结果

图7显示了由恢复力流行度分析得出的恢复力流图,该分析确定了恢复力指标随时间实现的动态。创建此流图是为了可视化我们对弹性流行度的理解[54],这是一种流行的方法,用于显示不同类别(即弹性指标)随时间的变化。流图不是将值可视化为传统的y轴,而是偏移每个“堆栈”的基线,使其围绕x轴对称。这将导致流的形状,说明值随时间的变化。通过这个流图,我们分析了弹性指标在不同季度的实现情况,用x轴表示。

共3个发现可以总结为图7.首先,每个指标的流行度根据帖子的比例(y轴)而变化,每个单独的流形状的高度表示每个指标随时间的流行度。y轴不是正的或负的,而是显示了最佳的堆叠安排。其次,“学习”和“归属感”是整个时间轴上实现最多的两个指标。其次最常见的指标是“社会资本”,而“自我效能”和“适应能力”在时间轴上实现得较少,在不同的时间点上,浅流形状出现和消失。第三,前3个主要指标(即“学习”、“归属感”和“社会资本”)在时间轴上没有明显的季节性峰值和周期性模式。然而,“归属感”和“社会资本”在2020年第一季度都被观察到略强。相比之下,“自我效能”和“适应能力”的实现随时间变化显著:(1)“自我效能”在2019-Q1、2019-Q2、2019-Q4和2020-Q1期间几乎没有实现,(2)“适应能力”在2019-Q1、2019-Q4和2020-Q2 - q4期间的实现似乎也很弱。调查这些观察结果的可能原因可能是未来研究的一个有用领域。

图7。精神分裂症的恢复力指标实现:国家紧急情况(SANE)澳大利亚。
查看此图

阶段4:弹性词典的构建

弹性分类推断的结果

考虑到弹性指标映射到职位的共同出现,我们构建了一个弹性分类。我们使用树图表示(图8),表示弹性指标按2个层次共实现。第一个层次有“归属”和“学习”两个指标。这些是更高层次和更一般的指标。这意味着这些指标普遍实现,作为恢复力的基本方面。“社会资本”是包含在“归属感”中的更具体的指标。这意味着,只要“社会资本”实现了,“归属感”也就最有可能实现。同样的联系也适用于“学习”和“适应能力”。从另一个角度来看,我们还可以对5个弹性指标的覆盖范围进行解释,其中每个指标的覆盖范围用矩形大小表示。“社会资本”显然是通过“归属”实现的,“适应能力”则是通过“学习”实现的。颜色用于表示相似的特征,其中更具体的指标由相同颜色的较深强度表示。 The indicator “self-efficacy” was realized independently, regardless of the other 4 indicators. The emergent taxonomy can be used to gain insights into which indicators are more likely to corealize and what types of conceptual relations are observable between indicators, as inferred by their corealization.

图8。澳大利亚SANE(精神分裂症:一种国家紧急情况)帖子诱导的复原力分类法以树状图表示,按矩形大小显示每个复原力指标概念的覆盖范围。
查看此图
弹性字典生成结果

表3显示了创建的弹性字典,演示了(1)由“parent”表示的每个弹性指标的父项,(2)与从中获得的每个指标相关的主题表1(3)主题的相对重要性(“主题权重”),以及(4)每个主题的前10个描述性术语(“主题词汇”)。每个描述性术语最相似的5个术语在多媒体附件1

总之,弹性词典提供了两组见解。首先,在整个研究期间和每个季度内确定了与不同弹性指标相关的主题集,揭示了恒定和周期性的主题。这些主题和主题词形成了一组有用的语义集合,可以帮助描述每个弹性指标。其次,与弹性指标相关的主题权重、流行度和共现度可用于构建弹性分类。这种分类揭示了弹性的基本指标——归属感和学习——以及更具体和不太普遍的指标——社会资本(归属)和适应能力(学习)——自我效能独立于其他指标实现。

表3。根据本研究构建的弹性字典。
弹性指标,家长和主题 主题权重(%) 主题文字
社会资本

归属感


感激之情 3.6 好声音早晨新闻主意听到运气高兴祝愿关心


升值 6.1 谢谢分享感谢回复文字类标签真的看你


日常生活 7.7 一天今天照片走生日伟大美好的一周昨天少


爱的 3.3 爱拥抱送思考猫关心hon大愿望跳


支持 2.4 需要帮助的人,需要支持的人,真正关心的人


好希望 1.6 希望生日还好嘿快快乐乐今天享受好高兴


同理心 1.3 抱歉听到真的高兴知道声音关心难一刻到达


有趣的 1.6 哈哈,好的,今天上班,步行一周,也许回家


友谊 1 朋友你好关心抱抱xx送棒今天大妈妈
归属感

感激之情 3.6 好声音早晨新闻主意听到运气高兴祝愿关心

升值 6.1 谢谢分享感谢回复文字类标签真的看你

日常生活 7.7 一天今天照片走生日伟大美好的一周昨天少

爱的 3.3 爱拥抱送思考猫关心hon大愿望跳

好希望 1.6 希望生日还好嘿快快乐乐今天享受好高兴

庆祝活动 3.1 新年快乐新的圣诞生日快乐的祝愿来到最后一个家庭

同理心 1.3 抱歉听到真的高兴知道声音关心难一刻到达

欢迎 11.5 支持欢迎广大社区成员精神分享健康观经验

有趣的 1.6 哈哈,好的,今天上班,步行一周,也许回家

友谊 1 朋友你好关心抱抱xx送棒今天大妈妈
学习

反射 5.2 想人们的生活方式使尝试说需要来也许

支持 2.4 需要帮助的人,需要支持的人,真正关心的人

知道 44.8 知道说要工作的人真的很努力让生活
适应能力

学习


反射 5.2 想人们的生活方式使尝试说需要来也许
自我效能感

面临的困难 2.6 感觉真感觉让路自由坏了右瞬间痛

睡眠 4 昨晚睡觉,明天昨晚睡觉,今天睡觉,工作,早

主要研究结果

本文提出了一种从在线心理健康同行支持论坛数据中生成弹性字典的半自动方法。采用系统的四相分析管道(图1)预处理原始论坛帖子,发现核心主题,概念化弹性指标,并生成弹性字典。我们承诺探索弹性指标如何在基于网络的心理健康社区中实现,通过展示其主题范围或讨论方式以及弹性不同方面之间的相互依赖性,丰富每个弹性指标的特征。

本研究的一个主要贡献是,它提供了一种可复制的方法,以生成进一步的弹性和其他主题或理论为重点的词典。提出的方法管道可以应用于由其他精神卫生组织主办的在线支持论坛,以更好地了解他们的网络社区,并建立对弹性实现的更深入的理解。

为了解决RQ1,我们提出了一种通过主题分析同时使用2层NMF主题建模技术和人类知识的方法,以发现和标记15个实质性主题,并将它们映射到5个弹性指标。每个弹性指标都有其相关主题(表2而且3.).分析显示,随着时间的推移,我们发现了与建立和维持社会联系和联系、建立信任和归属感相关的话题,包括通过分享圣诞节、除夕和生日等里程碑事件,以及更常规的时刻。反思和知识分享说明了学习的重要性。此外,分享与精神疾病相关的困难和持续的问题,如睡眠不足,说明了论坛在参与者在日常生活中面临的精神健康困难中导航自我效能和代理方面的作用。

我们追踪了相关职位在一段时间内的比例,以揭示弹性不同方面的普遍性(RQ2)。图7“学习”、“归属感”和“社会资本”占主导地位,“自我效能”和“适应能力”出现频率较低。这些发现也有助于回答RQ3,解决不同弹性指标之间的关系。为了进一步澄清,我们开发了一个弹性字典,它显示了每个弹性指标是如何通过一组相关主题、每个主题最相关的描述性术语(包括它们的同义词)以及从输入后数据观察到的弹性指标之间的语义关系(表3而且多媒体附件1).为了建立不同弹性指标之间的相互依赖关系,制定了一种分类方法(图8),强调了弹性的产生者(归属感和学习)与结果导向(社会资本、适应能力和自我效能)指标之间的关系,与现有的弹性研究一致[27].

越来越多的研究试图评估基于网络的心理健康同伴支持的影响。同行支持论坛提供了一种可以大规模提供支持的卫生干预形式;然而,它们也在优化效益和评估的设计方面提出了挑战。新的NLP计算方法与定性分析相结合,为解决这些挑战提供了机会。我们利用基于nlp的统计分析和定性分析来产生新的见解。这项工作超出了定性内容分析研究的能力,这些研究试图通过横截面和小规模的调查或访谈来确定对弹性的影响[914181921].

我们的工作确定了基于力量的弹性指标及其之间的关系。这代表了对以往研究的进步或改变,这些研究倾向于关注与心理健康有关的风险和消极问题,包括确定消极症状[3132],情绪[3334],以及潜在的自残风险[23].尽管应对风险和干预以支持人们很重要,但审视通过网络论坛产生的优势和资源的能力也很重要。作为对这些方法的补充,我们的工作采用了基于优势的方法,由此产生的弹性词典能够添加一个积极的背景,以加深对论坛影响及其最有效属性的理解。

弹性字典的好处是它可以用于(1)显示弹性,正如当前理论所理解的那样,是通过论坛上的活动来实现的;(2)提高对网络论坛上实现的弹性方面的理解;(3)通过展示弹性的不同方面是如何特征化的,以及弹性主题是如何嵌入在某些讨论中,为培训工作人员和志愿者建立基于证据的资源;(4)改善心理健康论坛的设计和自动审核,使分析超越风险和伤害,转向基于力量的复原力指标;以及(5)帮助进一步的文本分析,作为建立弹性检测系统的词汇集,可以帮助精神卫生保健提供者设计以改善他们的服务结果并说明他们的影响。

本研究对具有潜在深远意义的研究和实践具有重要意义。首先,弹性本身,它是如何形成的,以及通过什么过程和手段,人们知之甚少。在心理健康实践中,弹性往往是一个定义不清的概念。在这里,我们展示了作为概念框架的一部分,指标如何随着时间的推移与基于网络的论坛中的活动和讨论产生共鸣。因此,通过将当代数据分析技术应用于新数据,我们对这一有争议的概念的社会和心理学知识做出了贡献。其次,就实践而言,这项工作显示了(重新)使用通过服务生成的新数据来提供有用信息的潜力,这些信息可以帮助设计和维护这些服务,更好地响应健康消费者,并显示其影响。对于努力确保和分配稀缺资源的非营利组织来说,这些都是重要的问题。这项工作应促使精神卫生服务机构提高其处理数据的能力,因为它显示出数据和数据技能的巨大潜力和创新用途。

限制

这项研究有一些局限性,可以在未来的研究中加以解决。首先,它专注于从一个论坛和数据源(即SANE Australia)创建一个弹性字典。从多个数据源构建弹性字典并探索相似性和差异性将非常有用。通过这样做,我们可能会深入了解各个论坛的共同和独特的弹性指标。如果弹性实现是不同的,那么可以根据不同的论坛和组织目标、管理策略和用户统计数据进行探索。第二,这项研究是“静态的”,因为它使用了大量现有的历史数据。考虑到基于网络的心理健康论坛是一种不断增长的服务类型,研究如何使弹性词典能够根据新的论坛数据逐步演变可能是有用的。

结论

在本文中,我们提出了一种有前途的方法来创建一个弹性词典,它提供了对心理健康同行支持论坛的主要主题的见解,以及这些主题实现弹性的不同指标的方式。开发的混合NLP和定性方法为帮助论坛提供者分析和理解论坛通过基于优势的弹性分析所产生的影响奠定了新的基础。除了说明不同恢复力指标随时间的流行,分类法还展示了不同指标之间的相互依赖性,揭示了哪些指标是与其他指标(社会资本和适应能力)相关的基础(归属和学习)。由此产生的弹性词典提供了一个基准和词汇集,可以帮助进一步的研究。它还可以用于通知通常基于与风险、伤害和精神疾病或痛苦的诊断指标相关的术语的自动化系统,为论坛内容和互动的调节添加了基于优势的方法。

致谢

这项工作由澳大利亚研究委员会自动化决策与社会卓越中心(CE200100005, 2020-2027)和澳大利亚研究委员会发现项目(DP200100419, 2020-2023)资助。作者还想感谢塔斯马尼亚大学的Sherridan Emery博士,感谢她对主题标签的帮助。

利益冲突

没有宣布。

多媒体附件1

完整的弹性字典。

PDF档案(adobepdf档案),91 KB

  1. 心理卫生:加强我们的应对。世界卫生组织,2022年6月17日。URL:https://www.who.int/news-room/fact-sheets/detail/mental-health-strengthening-our-response[2022-06-17]访问
  2. 青少年心理健康研究中的弹性概念。青少年健康杂志2021年11月;69(5):689-695。[CrossRef] [Medline
  3. Moßburger L, Wende F, Brinkmann K, Schmidt T.通过文本挖掘探索在线抑郁症论坛:Reddit和一个策划在线论坛的比较。见:第五届社交媒体挖掘健康应用研讨会论文集和共享任务。2020年发表于:SMM4H '20;2020年6月28日;西班牙巴塞罗那,p. 70-81网址:https://aclanthology.org/2020.smm4h-1.11CrossRef
  4. Park I, Sarnikar S, Cho J.基于短语级文本分析的在线健康社区有效性促进信息支持对健康弹性的影响。Inf Manag 2020 12月;57(8):103372 [免费全文] [CrossRef
  5. 全球心理健康:从数据中得出的五个关键见解。《数据中的世界》2018年5月16日。URL:https://ourworldindata.org/global-mental-health[2021-09-16]访问
  6. 澳大利亚的心理健康:快速指南。澳大利亚议会2019年2月14日。URL:https://www.aph.gov.au/About_Parliament/Parliamentary_Departments/Parliamentary_Library/pubs/rp/rp1819/Quick_Guides/MentalHealth[2021-09-16]访问
  7. 国家心理健康和幸福研究。《2020-21年国家心理健康与幸福研究》的第一个见解。澳大利亚统计局,2021年8月12日。URL:https://www.abs.gov.au/articles/first-insights-national-study-mental-health-and-wellbeing-2020-21[2022-04-13]访问
  8. 陈国昌,皮勒TF,何格伟。COVID-19大流行期间的复原力和心理健康:来自明尼苏达州和香港的研究结果J Affect discord 2021年12月1日;免费全文] [CrossRef] [Medline
  9. 韦多里尼N,阿莫雷蒂S, Montejo L, García-Rizo C, Hogg B, Mezquida G,等。COVID-19大流行期间的复原力和心理健康。J情感失调2021年3月15日;283:156-164 [免费全文] [CrossRef] [Medline
  10. 梅奥诊所的员工。韧性:培养忍受困难的技能。梅奥诊所。URL:https://www.mayoclinic.org/tests-procedures/resilience-training/in-depth/resilience/art-20046311[2021-09-17]访问
  11. 抑郁-超越蓝色论坛。URL:https://www.beyondblue.org.au/get-support/online-forums/depression[2022-06-01]访问
  12. 理智的澳大利亚。URL:https://www.sane.org/[2022-06-01]访问
  13. 不会。URL:https://au.reachout.com/[2022-09-07]访问
  14. Hechanova MR, Alianan Jr AS, Jocson RM, Villasanta AP. 2019冠状病毒病大流行期间的在线弹性支持小组:菲律宾的经验。社区健康社会包容2022;26(1):56-65。[CrossRef
  15. Fisher EB, Miller SM, Evans M, Luu SL, Tang PY, Dreyer Valovcin D,等。COVID-19、压力、创伤和同伴支持——实地观察。Transl Behav Med 2020 Aug 07;10(3):503-505 [免费全文] [CrossRef] [Medline
  16. 参与在线心理健康:来自beyondblue论坛影响者的见解。新媒体Soc 2018 july 11;20(12):4748-4764 [免费全文] [CrossRef
  17. Gillard S, Foster R, Gibson S, Goldsmith L, Marks J, White S.描述了一种基于原则的方法来开发和评估同伴工作者的角色,因为同伴支持已成为主流心理健康服务。2017年6月12日;21(3):133-143。[CrossRef
  18. 吴艳,桑志强,张晓春,马格拉夫。中国大学生心理弹性与心理健康的关系:纵向交叉滞后分析。前沿精神2020年2月5日;11:108 [免费全文] [CrossRef] [Medline
  19. Riehm KE, Brenneke SG, Adams LB, Gilan D, Lieb K, Kunzler AM,等。COVID-19大流行期间心理弹性与精神痛苦变化之间的关联。J影响失调2021年3月1日;282:381-385 [免费全文] [CrossRef] [Medline
  20. 建立你的适应能力。美国心理学会。URL:https://www.apa.org/topics/resilience[2021-09-16]访问
  21. 刘文杰,周琳,王晓强,杨宝霞,王勇,蒋建峰。心理弹性在青少年负性生活事件与抑郁关系中的中介作用。2019年12月33(6):116-122。[CrossRef] [Medline
  22. 康威,胡敏,查普曼WW。利用自然语言处理,利用社交媒体和消费者生成数据解决公共卫生研究问题的最新进展。2019年8月;28(1):208-217 [免费全文] [CrossRef] [Medline
  23. Milne DN, McCabe KL, Calvo RA。通过自动分诊,提高在线同行支持中的主持人响应能力。J Med Internet Res 2019 april 26;21(4):e11410 [免费全文] [CrossRef] [Medline
  24. r /抑郁状态。Reddit。URL:https://subredditstats.com/r/depression[2022-06-01]访问
  25. HealthBoards。URL:https://www.healthboards.com[2022-06-01]访问
  26. 激发。URL:https://www.inspire.com[2022-06-01]访问
  27. HealthUnlocked。URL:https://www.healthunlocked.com[2022-06-01]访问
  28. 文本挖掘心理健康论坛-从用户体验中学习。见:第26届欧洲信息系统会议论文集。2018年发表于:ECIS '18;2018年6月23-28日;朴茨茅斯,英国p. 91网址:https://aisel.aisnet.org/ecis2018_rp/91/
  29. 莫文文,吕杰,谢登卡,李志强,李志强,等。Twitter上围绕COVID-19大流行的全球情绪:Twitter趋势分析JMIR公共卫生监测2020年5月22日;6(2):e19447。[CrossRef] [Medline
  30. Calvo RA, Milne DN, Hussain MS, Christensen H.使用非临床文本在心理健康应用中的自然语言处理。2017年1月30日;23(5):649-685。[CrossRef
  31. Park A, Conway M.在线健康社区成员心理状态的纵向变化:了解参与在线抑郁社区的长期影响。J Med Internet Res 2017年3月20日;19(3):e71 [免费全文] [CrossRef] [Medline
  32. 雅兹达瓦,马赫达内贾德,巴贾吉,罗明,W, Sheth A, Monadjemi AH,等。社交媒体中的多模态心理健康分析。PLoS One 2020年4月10日;15(4):e0226248 [免费全文] [CrossRef] [Medline
  33. Patton DU, MacBeth J, Schoenebeck S, Shear K, McKeown K.在Twitter上包容悲伤:用定性分析和自然语言处理分析帮派参与青年在Twitter上的悲伤表达。Biomed Inform Insights 2018年4月3日;10:1178222618763155 [免费全文] [CrossRef] [Medline
  34. Loveys K, Crutchley P, Wyatt E, Coppersmith G.小而强大:从社交媒体语言量化心理健康的情感微观模式。在:第四届计算语言学和临床心理学研讨会论文集。2017年发表于:CLPsych '17;2017年8月3日;加拿大温哥华,第85-95页。[CrossRef
  35. 2019-2020年SANE澳大利亚年度亮点。SANE澳大利亚,2021年。URL:https://www.sane.org/about-sane/annual-reports-highlights[2022-06-01]访问
  36. Berkes F, Ross H.社区恢复力:朝向综合方法。自然资源2013 1月;26(1):5-20 [免费全文] [CrossRef
  37. Brown K, Westaway E.环境变化的机构、能力和恢复力:从人类发展、福祉和灾难中吸取的教训。2011年11月21日;36(1):321-342 [免费全文] [CrossRef
  38. 加强农村社区恢复力的分析:来自社区土地所有权的证据。J农村种马2013年7月;31:36-46 [免费全文] [CrossRef
  39. Fazey I, Fazey JA, Fischer J, Sherren K, Warren J, Noss RF,等。适应能力和学会学习是社会-生态恢复力的杠杆。前沿生态环境2007 9月;5(7):375-380 [免费全文] [CrossRef
  40. 市场营销中的主题建模:最新进展和研究机会。中国汽车工程学报,2019;39(3):327-356。[CrossRef
  41. 李志强,李志强。基于主题建模方法的短文本数据分析。Front Artif Intell 2020年7月14日;3:42 [免费全文] [CrossRef] [Medline
  42. 李德德,承宏。通过非负矩阵分解学习对象的各部分。自然杂志1999年10月21日;401(6755):788-791。[CrossRef] [Medline
  43. 李文杰,李文杰,李文杰。主题建模中描述符的一致性分析。Expert Syst app 2015 Aug;42(13):5645-5657 [免费全文] [CrossRef
  44. Aizawa A. tf-idf测度的信息理论视角。Inf Process Manag 2003 Jan;39(1):45-65 [免费全文] [CrossRef
  45. 王晓明,王晓明,王晓明。基于矩阵分解的主题建模稳定性研究。专家系统应用2018年1月;91(C):159-169。[CrossRef
  46. 杨晓明,杨晓明,Mäkelä .基于定性政策研究的主题建模与文本分析。政策研究,2021年2月;49(1):300-324 [免费全文] [CrossRef
  47. 姜亚波,李国强,李国强。一种基于图形的分类学习方法。IEEE知识数据学报2016年2月1日;28(2):524-536。[CrossRef
  48. 姜玉波,吴杰,Kneebone L, Sellis T.精化主题术语和支持分类的主题索引方法:APO数字存储库的案例研究。Decis支持系统2021 7月;146:113542 [免费全文] [CrossRef
  49. 李国强,李国强。基于文本的域分类学习方法研究。数据知识2013年1月;83:54-69 [免费全文] [CrossRef
  50. 陈凯,陈志强,陈志强。基于向量空间的词表示估计算法。计算资源存储库2013 [免费全文
  51. 陈勇,张宏,刘锐,叶志,林杰。基于LDA和NMF的短文本主题挖掘实验探索。基于知识的系统2019年1月;163:1-13 [免费全文] [CrossRef
  52. Braun V, Clarke V,运用心理学的主题分析。精神病学鉴定2006年1月;3(2):77-101。[CrossRef
  53. 新媒体,网络和phatic文化。收敛2008 11月01日;14(4):387-400。[CrossRef
  54. Bider L.流线图:如何制作它们以及你需要知道什么。2020年10月19日。URL:https://flourish.studio/2020/10/19/streamgraphs/[2021-10-10]访问


NLP:自然语言处理
NMF:非负矩阵分解
中移动:研究问题
理智:精神分裂症:全国紧急事件


编辑:T Leung;提交25.04.22;S Chen, G Makwana同行评议;对作者19.05.22的评论;修订本收到日期:06.06.22;接受18.08.22;发表22.09.22

版权

©yongbin Kang, Anthony McCosker, Peter Kamstra, Jane Farmer。最初发表于JMIR形成研究(https://formative.www.mybigtv.com), 22.09.2022。

这是一篇开放获取的文章,根据创作共用署名许可协议(https://creativecommons.org/licenses/by/4.0/)的条款发布,允许在任何媒介上不受限制地使用、分发和复制,前提是正确引用了首次发表在JMIR Formative Research上的原创作品。必须包括完整的书目信息,https://formative.www.mybigtv.com上的原始出版物的链接,以及此版权和许可信息。


Baidu
map