这是一篇开放获取的文章,根据创作共用署名许可协议(https://creativecommons.org/licenses/by/4.0/)发布,该协议允许在任何媒体上不受限制地使用、分发和复制,前提是要正确引用最初发表在《医学互联网研究杂志》上的原始作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物链接,以及版权和许可信息。gydF4y2Ba
自杀是一个巨大的公共卫生挑战。中国每年有2亿人试图自杀。现有的自杀预防项目需要自杀者主动寻求帮助,但他们中的许多人寻求所需帮助的动机很低。我们建议积极和有针对性的自杀预防策略可以促使更多有自杀想法和行为的人寻求帮助。gydF4y2Ba
这项研究的目的是测试在线主动自杀预防(PSPO)的可行性和可接受性,这是一种基于社交媒体的新方法,将主动自杀倾向的识别与专门的危机管理结合起来。gydF4y2Ba
我们首先在网上找到了一个微博群。专家分析了他们对遗书的评论,为自杀识别的机器学习模型提供了训练集。最佳表现模型被用来自动识别暗示自杀想法和行为的帖子。接下来,一条包含危机管理信息的微博直接消息被发送给那些被模型识别出有自杀风险的用户,其中包括自杀相关问题、抑郁、寻求帮助行为和可接受性测试等措施。对于那些回复邮件的人,训练有素的咨询师为他们提供了量身定制的危机管理。采用简体中文语言调查和字数统计方法,对患者咨询前后1个月的心理语言文本进行分析。gydF4y2Ba
2017年4月共有27007条评论被分析。其中2786人(10.32%)被分类为有自杀念头和行为的迹象。该检测模型具有较高的检测精度(0.86)、查全率(.78)、f -测度(.86)和准确率(.88)。2017年7月3日至2018年7月3日,我们共向12486名社交媒体用户发送了24727条直接信息,5542人(44.39%)回复。超过三分之一被联系的用户完成了直接信息中包含的问卷调查。有效回答中,89.73%(1259/1403)报告有自杀念头,但超过一半(725/1403,51.67%)报告没有寻求过帮助。9项患者健康问卷(PHQ-9)平均得分为17.40 (SD 5.98)。超过三分之二的参与者(968/1403,69.00%)认为PSPO方法是可以接受的。此外,有2321名用户回复了这条直接信息。对比咨询前后1个月微博中死亡导向词的使用频率,我们发现死亡导向词的使用频率显著下降,未来导向词的使用频率显著增加。gydF4y2Ba
PSPO模型适用于确定有自杀风险的人群。当后续采用积极的危机管理时,它可能是对现有预防项目的有益补充,因为它有可能增加有自杀想法和行为但寻求帮助动机低的人获得反自杀信息的可能性。gydF4y2Ba
全球每年大约有100万人死于自杀。自杀除了对公共卫生构成巨大挑战外,还会造成重大经济损失,加剧劳动力短缺。据估计,到2020年,每年约有153万人死于自杀,而企图自杀的人数将增加10至20倍[gydF4y2Ba
目前全球实施的预防自杀方法包括学校筛查、初级保健提供者筛查和看门人培训,所有这些方法都是针对普通人群的,涉及被动等待需要帮助的人[gydF4y2Ba
与大多数发展中国家一样,中国的精神卫生保健处于发展的早期阶段[gydF4y2Ba
互联网已经成为许多人生活中不可缺少的一部分。因此,研究人员已经开始使用人们自己生成的在线信息来识别自杀的想法和行为。gydF4y2Ba
中国有一半的人口使用互联网。大约五分之二(40.9%)的中国网民使用新浪微博,即中国版的Twitter [gydF4y2Ba
据我们所知,此前还没有研究通过社交媒体主动识别自杀个体和专门的危机管理相结合。此外,越来越多的研究表明(1)网络自杀预防方法的不足[gydF4y2Ba
评估主动自杀预防在线(PSPO)的研究协议。gydF4y2Ba
我们提出了一种新的基于互联网的方法,主动自杀在线预防(PSPO),用于识别和预防自杀的想法和行为gydF4y2Ba
2012年3月17日,微博博主邹帆因抑郁症自杀身亡,此事在网上引起了广泛关注。自从她去世后,她的博客就成了自杀者分享自己感受和想法的“秘密花园”。截至2018年7月24日,她的网上遗书已经有130多万条评论,其中很多都包含自杀信息。这个微博群由有自杀念头的人和没有自杀念头的人组成。我们分析了邹凡网上遗书的留言。使用新浪官方微博应用程序编程界面获取2017年4月1日至28日发布的评论,并手工标注为训练集。从2017年7月3日到2018年7月3日发布的评论,由开发的机器学习模型获取并自动识别。关于用于构建机器学习模型(例如,帖子中自杀想法和行为的编码系统,机器学习模型的特征选择)的进一步细节在数据分析中提供。gydF4y2Ba
所有被机器学习模型识别为表达自杀想法和行为的微博博主都被邀请通过直接消息加入研究。没有排除标准,因为我们的目标是向尽可能多的有自杀倾向的社交媒体用户提供帮助和支持。gydF4y2Ba
在我们之前的研究中设计的直接信息[gydF4y2Ba
如果用户回复了直接消息,咨询师就会针对用户的具体问题提供支持。12名有处理自杀个案经验的注册顾问(2男10女,平均年龄23.08岁[标准差1.08])接受培训,以直接通讯方式提供辅导服务。gydF4y2Ba
自杀的想法和行为通过两项测试进行了测试,这些测试都是根据以前的研究选择的[gydF4y2Ba
求助行为由两个项目评估[gydF4y2Ba
可接受性是用一个项目来衡量的(“你觉得这种积极的帮助有多可接受?”),并采用李克特7分制进行评分(1 =完全不同意,7 =完全同意)。我们认为4分或更高的评分表明该程序是可接受的。gydF4y2Ba
辅导员培训以解决问题疗法为基础[gydF4y2Ba
由于本研究使用的数据都是公开的,传统的知情同意是不合适的。在识别部分,我们采取措施对数据分析中的数据进行匿名化,以尽量减少个人信息的无意泄露或可能泄露个人在线身份线索的信息。在研究的危机管理部分,参与者在同意参加项目时自愿给予知情同意。该项目获得了中国科学院心理研究所制度审查委员会的伦理批准,伦理批准文号为H16003。gydF4y2Ba
监督学习的第一步是获得一个训练集。为了实现机器学习模型的良好性能,本研究决定不使用人群外包[gydF4y2Ba
有自杀想法和行为的评论被标记为积极训练样本,10,000条没有自杀想法和行为的帖子被随机选择为消极训练样本。提高机器学习模型性能的另一个策略是基于理论的特征选择。计算机科学领域的研究人员倾向于通过随机使用语言分析(如n-grams和情感分析)来选择预测特征,而没有理论或经验基础[gydF4y2Ba
建立自杀想法和行为二元分类检测模型,判断评论是否提示自杀想法和行为。我们使用支持向量机(SVM)、决策树、随机森林和具有10倍交叉验证的逻辑回归算法来训练检测模型,因为这些机器学习算法是预测心理特征和情绪以及检测自杀意念最广泛使用的方法[gydF4y2Ba
由于在线调查完成时回复率较低,我们无法收集phq -9后1个月的数据。我们使用语言频率变化作为危机管理的有效性指标。采用简体中文语言调查与字数统计(SCLIWC),研究微博博主在项目开始前1个月至项目结束后1个月的语言变化。SCLIWC是文本分析程序LIWC的修订版,旨在在微博上以简体中文表现良好[gydF4y2Ba
2017年4月1日至28日,每周进行四次人工注释。在27,007条评论中,10.32%(2786/27,007)被认为有自杀的想法和行为。其中81.44%(2269/2786)、13.75%(383/2786)和4.81%(134/2786)的信息编码分别为自杀意念、自杀计划和自杀未遂(gydF4y2Ba
在2017年7月3日至2018年7月3日期间发表的387823条评论中,有24727条(6.38%)被机器学习模型识别为具有自杀想法和行为的迹象。gydF4y2Ba
手动识别2017年4月发布的自杀评论。gydF4y2Ba
日期gydF4y2Ba | 评论(n)gydF4y2Ba | 自杀的评论gydF4y2Ba | |||
自杀念头和行为,n (%)gydF4y2Ba | 自杀意念,n (%)gydF4y2Ba | 自杀计划,n (%)gydF4y2Ba | 自杀企图,n (%)gydF4y2Ba | ||
4/01-4/07gydF4y2Ba | 6975gydF4y2Ba | 849 (12.17)gydF4y2Ba | 702 (82.69)gydF4y2Ba | 107 (12.60)gydF4y2Ba | 40 (4.71)gydF4y2Ba |
4/08-4/14gydF4y2Ba | 6201gydF4y2Ba | 682 (11.00)gydF4y2Ba | 561 (82.26)gydF4y2Ba | 90 (13.20)gydF4y2Ba | 31 (4.55)gydF4y2Ba |
4/15-4/21gydF4y2Ba | 6467gydF4y2Ba | 563 (8.71)gydF4y2Ba | 457 (81.17)gydF4y2Ba | 82 (14.56)gydF4y2Ba | 24 (4.26)gydF4y2Ba |
4/22-4/28gydF4y2Ba | 7364gydF4y2Ba | 692 (9.40)gydF4y2Ba | 549 (79.33)gydF4y2Ba | 104 (15.03)gydF4y2Ba | 39 (5.64)gydF4y2Ba |
总计gydF4y2Ba | 27007年gydF4y2Ba | 2786 (10.32)gydF4y2Ba | 2269 (81.44)gydF4y2Ba | 383 (13.75)gydF4y2Ba | 134 (4.81)gydF4y2Ba |
机器学习模型的性能。gydF4y2Ba
模型性能和特性集gydF4y2Ba | 支持向量机gydF4y2Ba一个gydF4y2Ba,平均值(SD)gydF4y2Ba | DTgydF4y2BabgydF4y2Ba,平均值(SD)gydF4y2Ba | 射频gydF4y2BacgydF4y2Ba,平均值(SD)gydF4y2Ba | LRgydF4y2BadgydF4y2Ba,平均值(SD)gydF4y2Ba | |
|
|||||
一个gydF4y2BaegydF4y2Ba | 多多(幅)gydF4y2Ba | 点(02)gydF4y2Ba | .87点(幅)gydF4y2Ba | .87点(幅)gydF4y2Ba | |
BgydF4y2BafgydF4y2Ba | 多多(幅)gydF4y2Ba | .76(幅)gydF4y2Ba | .85(幅)gydF4y2Ba | .87点(幅)gydF4y2Ba | |
CgydF4y2BaggydF4y2Ba | .85(幅)gydF4y2Ba | .76(幅)gydF4y2Ba | .85(幅)gydF4y2Ba | 多多(幅)gydF4y2Ba | |
|
|||||
一个gydF4y2Ba | 尾数就(02)gydF4y2Ba | .68点(0。)gydF4y2Ba | 综合成绩(02)gydF4y2Ba | .79 (02)gydF4y2Ba | |
BgydF4y2Ba | .80(幅)gydF4y2Ba | 综合成绩(幅)gydF4y2Ba | .74点(幅)gydF4y2Ba | .79(幅)gydF4y2Ba | |
CgydF4y2Ba | .85(幅)gydF4y2Ba | 综合成绩(幅)gydF4y2Ba | 收(幅)gydF4y2Ba | .80(幅)gydF4y2Ba | |
|
|||||
一个gydF4y2Ba | 点(幅)gydF4y2Ba | .74点(03)gydF4y2Ba | .80(幅)gydF4y2Ba | 点(幅)gydF4y2Ba | |
BgydF4y2Ba | 点(幅)gydF4y2Ba | .76(幅)gydF4y2Ba | .79(幅)gydF4y2Ba | 点(幅)gydF4y2Ba | |
CgydF4y2Ba | .85(幅)gydF4y2Ba | .76(幅)gydF4y2Ba | 尾数就(幅)gydF4y2Ba | 点(幅)gydF4y2Ba | |
|
|||||
一个gydF4y2Ba | .85(幅)gydF4y2Ba | .79 (02)gydF4y2Ba | 点(幅)gydF4y2Ba | .85(幅)gydF4y2Ba | |
BgydF4y2Ba | .86(幅)gydF4y2Ba | 尾数就(幅)gydF4y2Ba | .82(幅)gydF4y2Ba | .85(幅)gydF4y2Ba | |
CgydF4y2Ba | .86(幅)gydF4y2Ba | 尾数就(幅)gydF4y2Ba | .82(幅)gydF4y2Ba | .86(幅)gydF4y2Ba |
一个gydF4y2Ba支持向量机:支持向量机。gydF4y2Ba
bgydF4y2BaDT:决策树。gydF4y2Ba
cgydF4y2Ba随机森林。gydF4y2Ba
dgydF4y2BaLR:逻辑回归。gydF4y2Ba
egydF4y2Ba答:n-gram特征。gydF4y2Ba
fgydF4y2BaB: n-gram特征+领域知识特征。gydF4y2Ba
ggydF4y2BaC: n-gram特征+领域知识特征+理论驱动特征。gydF4y2Ba
我们向12486位微博博主(一些微博博主有多条评论)发送了直接信息,这些人被机器学习模型识别为在24727条评论中表达了自杀的想法和行为。共有34.58%(4318/24,727)的个体完成了评估方案,有效样本1403个(平均年龄21.66 [SD 3.26]岁)。女性明显多于男性(χgydF4y2Ba2gydF4y2Ba1gydF4y2Ba= 647.33,gydF4y2Ba
在自杀风险方面,大多数受访者(1259/1403,89.73%)认为他们死了或以某种方式伤害自己会更好。其中近一半(699/1403,49.82%)有自杀计划,6.34%(89/1403)表示有具体的自杀计划,43.48%(610/1403)表示有模糊的自杀计划。在1403名参与者中,545人(38.85%)之前曾试图自杀。PHQ-9的平均得分为17.40 (SD为5.98),代表中度抑郁症状。三分之二的参与者(924/1403,65.86%)从未接受过任何形式的心理治疗。略超过一半(725/1403,51.67%)没有向任何人寻求帮助,12.19%(171/1403)曾向专业人士(如精神科医生、治疗师或全科医生)寻求帮助,36.14%(507/1403)曾向周围的人(如家人和朋友)寻求帮助。在曾寻求过帮助的受访者中,48.33%(678/1403)认为前者的帮助效果为2.60 (SD 1.43), 77.00%(522/678)认为前者的帮助对自己毫无用处。gydF4y2Ba
在李克特7分制量表中,近70%(968/ 1403,69.00%)的参与者认为通过使用直接信息传递的主动帮助是可以接受的(4分制或以上)。所有参与者的平均得分为4.35 (SD为1.81)。gydF4y2Ba
2017年7月3日至2018年7月3日期间,微博用户登录研究网站查看预防信息1.23万次。共有2321名用户至少回复了一次直接邮件。gydF4y2Ba
参与者的人口统计学特征。gydF4y2Ba
特征gydF4y2Ba | 值,n (%)gydF4y2Ba | |
|
||
男性gydF4y2Ba | 225 (16.04)gydF4y2Ba | |
女gydF4y2Ba | 1178 (83.96)gydF4y2Ba | |
|
||
初中及以下学历gydF4y2Ba | 82 (5.84)gydF4y2Ba | |
高中gydF4y2Ba | 272 (19.39)gydF4y2Ba | |
大学gydF4y2Ba | 1006 (71.71)gydF4y2Ba | |
本科或以上学历gydF4y2Ba | 43 (3.06)gydF4y2Ba | |
|
||
使用gydF4y2Ba | 472 (33.64)gydF4y2Ba | |
失业gydF4y2Ba | 229 (16.32)gydF4y2Ba | |
学生gydF4y2Ba | 603 (42.98)gydF4y2Ba | |
|
||
单身或离婚gydF4y2Ba | 1342 (95.65)gydF4y2Ba | |
结婚了gydF4y2Ba | 61 (4.35)gydF4y2Ba |
2017年7月3日- 2018年7月3日与辅导员互动的微博用户数。gydF4y2Ba
微博用户与咨询师之间的互动。gydF4y2Ba
的相互作用gydF4y2Ba | 值,n (%)gydF4y2Ba | |
|
||
≤10gydF4y2Ba | 2043 (90.12)gydF4y2Ba | |
11-30gydF4y2Ba | 118 (5.21)gydF4y2Ba | |
31-50gydF4y2Ba | 46 (2.03)gydF4y2Ba | |
51 - 100gydF4y2Ba | 60 (2.65)gydF4y2Ba | |
>100gydF4y2Ba | 54 (2.38)gydF4y2Ba | |
|
||
≤5gydF4y2Ba | 2246 (96.77)gydF4y2Ba | |
6 - 10gydF4y2Ba | 48 (2.07)gydF4y2Ba | |
> 10gydF4y2Ba | 27日(1.16)gydF4y2Ba |
编程前后语言使用频率的变化。gydF4y2Ba
类别gydF4y2Ba | 例子gydF4y2Ba | 预编程,% (SD)gydF4y2Ba | 项目后,% (SD)gydF4y2Ba |
|
|
Death-oriented的话gydF4y2Ba | / /将自杀gydF4y2Ba | 0.37 (0.01)gydF4y2Ba | 0.31 (0.01)gydF4y2Ba | 2.21gydF4y2Ba | 03gydF4y2Ba |
面向未来的单词gydF4y2Ba | 后/不久的未来gydF4y2Ba | 0.34 (0.01)gydF4y2Ba | 0.34 (0.01)gydF4y2Ba | -2.29gydF4y2Ba | 02gydF4y2Ba |
最后,我们使用SCLIWC检测回复了直接消息的2321名社交媒体用户的语言变化。通过追踪这些微博用户的账号,我们比较了他们接受咨询师服务前后一个月的微博内容。删除一个月内未完成与咨询师互动的用户后,微博用户总数为2031人。如gydF4y2Ba
在我们的研究中,我们首先识别了一个自杀的微博博主的新浪微博账号周围形成的微博群,这是一种有效的识别高危人群的方法。然后,我们主动推送直接信息,邀请所有被机器学习模型识别为有自杀想法和行为的微博博主参与我们的研究。我们的研究结果提供了一些初步的证据,表明自动识别自杀想法和行为以及积极的自杀预防是可以接受的和有帮助的。gydF4y2Ba
对于自杀意念的侦测,回忆可以说比精确度更重要。机器学习模型的结果表明,在一般情况下,结合理论相关特征和基于领域知识的特征可以提高检测自杀意念模型的查全率、f -度量和准确性。最佳结果分别是0.88,0.85,0.85和0.86的精度,召回,f -度量和准确性,这证明了模型在识别自杀帖子的实用性。除了多资源和基于理论的特征选择[gydF4y2Ba
在这项研究中,大多数完成问卷的人都是拥有大学学位的单身女性(在职或在校学生)。这与之前的一项研究一致,该研究表明,与男性相比,女性更有可能向卫生专业人员谈论自杀想法并使用卫生服务[gydF4y2Ba
在2017年7月3日至2018年7月3日期间,6.38%的评论被确认表达了自杀的想法和行为。1403名有自杀倾向的参与者的自我报告证明了机器学习模型的实用性。调查自述结果显示,自杀意念、自杀计划和过去自杀企图的比例分别为89.73%、49.82%和38.85%。这远远高于一项荟萃分析研究的结果,该研究显示,在中国普通人群中,自杀意念和过去自杀企图的比例分别为3.9%和0.8% [gydF4y2Ba
尽管自杀意念率很高,但65.86%完成问卷的参与者从未接受过任何形式的心理治疗。此外,51.67%的人没有就自杀问题向任何人寻求帮助。这与早期的研究一致[gydF4y2Ba
本研究为PSPO的疗效提供了一些初步证据。消除自杀念头可能是一个漫长的过程,但自杀危机管理可以作为高危人群的“情感心肺复苏”。我们向12486名不同的社交媒体用户发送了24727条直接信息,其中5542人(44.39%)做出了回应。其中,4318人完成了评估协议,2321人回复了直接信息。平均每月有234.08人(SD 88.70人)与辅导员互动,约90%的微博用户回复不到10次,近97%的微博用户与辅导员互动时间不到5天。这些结果表明,与传统的被动方法相比,PSPO可能在很大程度上扩大了那些以前从未寻求过帮助的人的自杀预防潜力。此外,我们网站上的预防信息被浏览了1.23万次。最后,在与咨询师互动后,有自杀念头的微博博主似乎显著改变了他们在社交媒体上使用的语言。特别是,在接受危机管理一个月后,与接受危机管理一个月前相比,死亡相关词汇的出现频率明显减少。一个可能的原因可能是,微博博主感受到了咨询师的关心、社会支持和同理心。 Another possible reason is that these users started to seek help after the consultation. At the same time, the frequency of future-oriented words increased significantly, although it was a slight change. This may be due to the relatively small number of future words in the overall vocabulary used. Nevertheless, it may also signal that the users had less suicide ideation and became more willing to accept support than before.
在本研究中,我们只关注了一个微博群。未来的研究需要确定我们的机器学习模型是否可以应用到其他类似的自杀群体和其他社交媒体平台,如学校公告板,在线自杀群体,或在线自杀想法和行为自助群体。由于我们的自杀想法和行为检测模型还处于发展的早期阶段,所以我们只建立了一个二元分类模型,并且主要关注于寻找自杀候选对象进行初级危机管理。未来可以采用和调整多类分类,为不同的社交媒体用户定制自杀预防。此外,为了检测自杀意念,我们主要关注从帖子中提取的文本特征,尽管社交媒体上的其他行为,如与其他用户的互动和发帖频率和次数,也可能是有效的预测因素。研究这些潜在因素可能为构建基于社交媒体的更有效的自杀意念检测模型提供额外的见解和指导。gydF4y2Ba
略多于三分之一(34.58%)的用户完成了直接信息中提供的问卷。考虑到课题的敏感性,回应率相对较低是可以理解的,尽管它高于早期研究发现的回应率(接近10%)[gydF4y2Ba
我们只向有自杀念头和自杀行为的微博用户提供最基本的危机管理信息。需要更多标准化和系统的紧急干预方案、心理健康资源和专业转诊,以确保在未来的研究中合理保留。虽然PSPO提供了一个纵向研究的机会,但各种基于网络的自杀预防和干预方法(包括PSPO)的有效性应加以检验,因为在自杀干预中,跟进是至关重要的[gydF4y2Ba
最后,由于这是一个初步的研究,我们主要用未来导向词频的变化来证明PSPO的有效性。我们的有效性证据应该谨慎解读,因为未来导向词与自杀风险降低之间的关系还需要进一步验证。未来的研究应该考虑使用自杀想法和行为减少的直接指标来证明这种改善。此外,有一种可能的结果反映了回归均值。在研究设计阶段(例如,使用随机对照试验,在不同时间点对实际行为而不仅仅是意图或态度进行多次试验)和分析阶段(例如,使用协方差分析)有一些策略是可取的,以减少回归均值[gydF4y2Ba
本文将PSPO作为一种主动的自杀预防方法,用于识别和预防社交媒体用户(尤其是年轻人)的自杀事件。结果表明,PSPO在识别自杀风险人群和提供有效的危机管理方面是可行的,高危人群的识别是自动和及时的。危机管理也具有前瞻性、可接受性和低成本的特点。我们的研究可能是对现有预防方案的有益补充,自杀危机管理可能提高公众对自杀风险相关求助的意识,从而改善人群的福祉。这种方法可以缓解人口众多而心理服务薄弱的问题,并有助于改善中国等发展中大国不完善的自杀预防系统。gydF4y2Ba
直接发送给有自杀想法和行为的用户。gydF4y2Ba
决策树gydF4y2Ba
网上主动预防自杀gydF4y2Ba
简体汉语语言查询与字数统计gydF4y2Ba
9项患者健康问卷gydF4y2Ba
随机森林gydF4y2Ba
支持向量机gydF4y2Ba
感谢国家基础研究规划项目(2014CB744600)、中国社会科学基金(Y8JJ183010)、国家社会科学基金(16AZD058)和香港特别行政区研究资助局(协同研究基金,项目编号:C1031-18G)的大力支持。发起人在研究设计中没有任何作用;数据的收集、分析和解释;在写报告时;或者决定将论文提交发表。gydF4y2Ba
没有宣布。gydF4y2Ba