发表在gydF4y2Ba在gydF4y2Ba第22卷gydF4y2Ba7号gydF4y2Ba(2020)gydF4y2Ba: 7月gydF4y2Ba

本文的预印本(早期版本)可在gydF4y2Bahttps://preprints.www.mybigtv.com/preprint/17758gydF4y2Ba,首次出版gydF4y2Ba。gydF4y2Ba
社交媒体上自杀意念的检测:多模态、关系和行为分析gydF4y2Ba

社交媒体上自杀意念的检测:多模态、关系和行为分析gydF4y2Ba

社交媒体上自杀意念的检测:多模态、关系和行为分析gydF4y2Ba

原始论文gydF4y2Ba

1gydF4y2Ba西班牙巴塞罗那庞培法布拉大学信息与通信技术系gydF4y2Ba

2gydF4y2BaDía青少年医院,心理健康服务中心,Corporació Sanitària公园协会Taulí,西班牙,萨瓦德尔gydF4y2Ba

3.gydF4y2Ba西班牙巴塞罗那Autònoma巴塞罗那大学Psicología Clínica与Salud系gydF4y2Ba

4gydF4y2Ba西班牙巴塞罗那庞培法布拉大学传播系gydF4y2Ba

5gydF4y2Ba西班牙贝拉特拉(巴塞罗那),巴塞罗那大学Autònoma计算机视觉中心gydF4y2Ba

6gydF4y2Ba视觉标签服务,贝拉特拉(巴塞罗那),西班牙gydF4y2Ba

通讯作者:gydF4y2Ba

戴安娜Ramírez-Cifuentes理学硕士gydF4y2Ba

信息与通信技术系gydF4y2Ba

庞培法布拉大学gydF4y2Ba

Tànger, 122-140gydF4y2Ba

巴塞罗那,08018年gydF4y2Ba

西班牙gydF4y2Ba

电话:34 643294184gydF4y2Ba

电子邮件:gydF4y2Badiana.ramirez@upf.edugydF4y2Ba


背景:gydF4y2Ba自杀风险评估通常包括医生和病人之间的互动。然而,由于进入精神保健设施的机会有限,相当数量的精神障碍患者没有得到治疗;临床医生人数减少;缺乏意识;以及围绕精神障碍的耻辱、忽视和歧视。相比之下,互联网接入和社交媒体的使用显著增加,为专家和患者提供了一种沟通手段,可能有助于开发检测社交媒体用户心理健康问题的方法。gydF4y2Ba

摘要目的:gydF4y2Ba本文旨在描述一种在社交媒体上对西班牙语用户进行自杀风险评估的方法。我们旨在探索从多个社交平台提取的行为、关系和多模态数据,并开发机器学习模型来检测处于风险中的用户。gydF4y2Ba

方法:gydF4y2Ba我们根据用户的写作、发布模式、与其他用户的关系以及发布的图像来描述用户。我们还评估了统计和深度学习方法来处理多模态数据,以检测有自杀意念迹象的用户(自杀意念风险组)。我们的方法在由临床医生注释的252个用户的数据集上进行了评估。为了评估我们的模型的性能,我们区分了两个控制组:使用自杀相关词汇的用户(重点控制组)和一般随机用户(一般控制组)。gydF4y2Ba

结果:gydF4y2Ba我们发现,与自杀意念风险组相比,每个对照组的文本和行为属性之间存在显著的统计差异。在95% CI下,当比较自杀意念风险组和重点对照组时,朋友的数量(gydF4y2BaPgydF4y2Ba=.04)和推文长度中位数(gydF4y2BaPgydF4y2Ba=.04),差异有统计学意义。控制组用户的好友中位数(578.5)高于风险组用户(372.0)。同样,专注控制用户的推文长度中位数更高,有16个词,而有自杀意念风险的用户只有13个词。我们的研究结果还表明,文本、视觉、关系和行为数据的组合优于单独使用每种情态的准确性。我们定义了基于文本的基线模型,该模型基于词袋和词嵌入,我们的模型表现得更好,在区分有风险的用户和两种类型的控制用户时,准确率提高了8%。gydF4y2Ba

结论:gydF4y2Ba所分析的属性类型对于检测处于风险中的用户非常重要,并且它们的组合优于通用的、完全基于文本的基线模型提供的结果。在评估了基于图像的预测模型的贡献后,我们认为可以通过基于文本和关系特征的模型来改进我们的结果。这些方法可以扩展并应用于与其他精神障碍相关的不同用例。gydF4y2Ba

医学与互联网学报,2020;22(7):e17758gydF4y2Ba

doi: 10.2196/17758gydF4y2Ba

关键字gydF4y2Ba



背景gydF4y2Ba

精神障碍是世界范围内严重的健康问题。根据世界卫生组织提供的死亡率数据,因自杀而死亡的人数相当于每40秒就有一人死亡[gydF4y2Ba1gydF4y2Ba]。考虑到这些疾病的体征和症状已经被证明可以在社交媒体上追踪,科学家们已经开始致力于开发自动化方法来检测这些疾病的体征和症状[gydF4y2Ba2gydF4y2Ba-gydF4y2Ba5gydF4y2Ba]通过强调早期发现的重要性[gydF4y2Ba6gydF4y2Ba,gydF4y2Ba7gydF4y2Ba]。gydF4y2Ba

在社交媒体中检测精神障碍的最新方法包括使用机器学习技术,主要基于从帖子中提取的文本特征[gydF4y2Ba8gydF4y2Ba-gydF4y2Ba11gydF4y2Ba]。这些模型需要事先获取从选定的社交平台提取的带注释的数据。将此视为分类任务,操作敏感数据[gydF4y2Ba12gydF4y2Ba],需要适当的标注过程才能获得可靠的数据集。这已经成为主要的挑战之一,因为诊断精神障碍涉及到专业和经验丰富的临床医生的干预,他们遵循严格的筛查程序[gydF4y2Ba11gydF4y2Ba]。gydF4y2Ba

用于分析与自杀相关的用户生成数据的方法侧重于跟踪帖子层面的社交网络,gydF4y2Ba这是gydF4y2Ba,微博[gydF4y2Ba13gydF4y2Ba,gydF4y2Ba14gydF4y2Ba],或者在用户层面,gydF4y2Ba这是gydF4y2Ba,他们的推文或帖子的样本[gydF4y2Ba15gydF4y2Ba]。后者与风险评估更相关,因为可以从单个用户那里探索更多数据。就提取和探索的信息类型而言,最先进的方法对帖子中包含的文本信息进行了详尽的分析。这已被证明与筛选和风险评估工作有关[gydF4y2Ba16gydF4y2Ba]。所采用的方法通常考虑词袋(BoW)模型、主题模型、词汇、情感分析工具以及可读性和语法分析特征[gydF4y2Ba5gydF4y2Ba,gydF4y2Ba15gydF4y2Ba,gydF4y2Ba17gydF4y2Ba]。深度学习方法的最新工作包括探索序列模型,编码术语的向量表示,称为词嵌入[gydF4y2Ba3.gydF4y2Ba,gydF4y2Ba11gydF4y2Ba,gydF4y2Ba15gydF4y2Ba]。gydF4y2Ba

有几种方法可以分析包含行为和关系信息的特征。Colombo等[gydF4y2Ba18gydF4y2Ba]基于对推文转发的评估,研究了Twitter上有自杀意念的用户的连通性和沟通,而De Choudhury等人的研究[gydF4y2Ba16gydF4y2Ba在Twitter上定义了一个以自我为中心的社交图谱来检测抑郁症。然而,这些研究并没有评估关联元素与基于图像的数据相结合的性能。gydF4y2Ba

关于利用社交网络上分享的帖子中的视觉信息来解决精神障碍问题,最接近我们目标的方法是人格预测方法[gydF4y2Ba19gydF4y2Ba],最近还有一些针对自残、抑郁和焦虑的方法[gydF4y2Ba20.gydF4y2Ba-gydF4y2Ba22gydF4y2Ba]。我们认为,我们的研究是第一个基于图像的方法在用户层面上评估社交媒体上的自杀风险。gydF4y2Ba

当我们提到与自杀相关的集合时,就我们所知,以前没有出版物报道过在Twitter上建立的与自杀相关的数据集的生成,其中注释过程涉及专家临床医生根据两种类型的控制组的自杀想法的存在来标记推文。此外,我们的注释是在处理和分析了一年内的帖子序列之后在用户级别执行的。这使我们能够探索时间的变化,因为它已被证明对行为分析很有用[gydF4y2Ba23gydF4y2Ba]以及评估抑郁症的早期风险检测方法[gydF4y2Ba7gydF4y2Ba,gydF4y2Ba24gydF4y2Ba]。gydF4y2Ba

目标gydF4y2Ba

本研究以自杀风险评估为例,探讨了社交媒体上心理健康问题的检测。我们的主要贡献如下:(1)我们定义了一种方法来生成可靠的Twitter自杀风险评估数据集,这也是第一个专门用于西班牙语帖子的用户级数据集;(2)我们提出了一种获取与特定主题相关的用户推文子集的方法,在本例中,gydF4y2Ba自杀意念gydF4y2Ba;(3)我们建立的模型不仅探讨了关系和行为因素的影响,还探讨了专家在咨询过程中确定的因素的影响,这些因素已被映射到社会网络;(4)建立了基于图像的自杀意念预测模型;(5)我们将前面的元素整合到一种结合多模态数据的方法中,建立了利用跨平台信息(Reddit、Instagram和Twitter)检测心理健康问题的预测模型;(6)我们通过考虑社交媒体环境中的两种不同类型的控制组,改进了心理健康问题预测模型的评估过程:发布可能不使用与精神状况相关术语的用户(一般控制案例)和使用与精神障碍相关术语的用户(重点控制组)。gydF4y2Ba


数据收集gydF4y2Ba

在本节中,我们描述了为自杀风险评估生成可靠Twitter数据集的方法。我们选择Twitter作为我们的主要数据源,因为它已被证明适合于分析社交媒体上的精神障碍[gydF4y2Ba3.gydF4y2Ba,gydF4y2Ba13gydF4y2Ba,gydF4y2Ba18gydF4y2Ba,gydF4y2Ba25gydF4y2Ba-gydF4y2Ba27gydF4y2Ba,包括自杀意念。我们还强调了该平台为我们的研究提供的以下方面:(1)选择多语言职位的可能性;(2)关系因素和行为因素的可得性;(3)提供了一组按时间顺序排列的来自每个用户的帖子,这使我们能够对涉及自杀意念的数据进行累积分析。gydF4y2Ba

结合Reddit和Twitter收集自杀相关数据gydF4y2Ba

在开始在Twitter上爬行之前,我们详细列出了一个与自杀相关的句子列表,建立了一个第一个过滤方法,以获取来自处于危险中的用户的推文。在此过程中,我们首先收集了Reddit自杀观察论坛上发布的500个帖子标题的样本[gydF4y2Ba28gydF4y2Ba]。这些帖子大多是有自杀想法的用户写的,所以它们的标题可以被认为是与自杀有关的句子。gydF4y2Ba

这些短语随后被翻译成西班牙语,并由临床心理学家进行审查。一些句子被临床医生添加、丢弃和/或改编。经过专家分析,我们保留了454个短语。然后,基于它们与自杀风险因素的相关性和联系[gydF4y2Ba29gydF4y2Ba],从中选出110个短语作为Twitter上的搜索词。从2017年12月21日到2018年12月21日,共提取了98619条包含这些短语的推文。这些推文对应于81,572个Twitter用户,其中9559个用户有不止一条与搜索条件匹配的推文。同时,对于所有用户,我们提取了他们在同一搜索周期内发布的所有tweets。gydF4y2Ba

两级标注流程gydF4y2Ba
第一级gydF4y2Ba

总共进行了2个标签阶段来识别有自杀意念的使用者。由于我们的目的是遵循临床医生完成的手动标记过程,我们从至少有两条推文与我们的搜索短语匹配的用户中随机选择了1200个用户样本。用户名匿名化,并定义了3个标签用于标记目的:(1)gydF4y2Ba控制- - - - - -gydF4y2Ba定义推特上似乎没有表现出自杀意念的用户、没有提及自身情况的用户、以及报道自杀新闻或观点的用户;(2)gydF4y2Ba自杀意念风险-gydF4y2Ba给那些从文字判断似乎有自杀意念迹象的用户贴上标签;和(3)gydF4y2Ba怀疑gydF4y2Ba——专门针对心理学家不确定是否将用户归为其他类别的案例。在第一个标记阶段,要求专门研究该主题的临床医生仅根据包含自杀相关关键词的推文对这三个类别中的用户进行分类。标签处理后,73.8%(885/1200)的用户被归为对照病例,9.6%(115/1200)的用户被归为自杀意念危险病例,16.7%(200/1200)的用户被归为可疑病例。gydF4y2Ba

第二级:短配置文件版本gydF4y2Ba

对被标记为自杀意念风险案例的用户进行第二次标记过程。我们分析了他们收集的更多推文,以确认他们的标签。注释者注意到,样本中有大量与自杀意念无关的推文,甚至有时没有发现与自杀有关的推文。为了解决这个问题,我们在推文级别开发了一个分类器,以区分包含风险迹象的推文与那些与自杀完全无关的推文。因此,我们可以为第二个注释者提供一个用户简介的总结版本,我们称之为简短简介版本(SPV),其中主要包含与自杀及其风险因素相关的推文。gydF4y2Ba

我们建立了一个二元分类器来区分两个类别:(1)gydF4y2Ba自杀意念相关的推文gydF4y2Ba和(2)gydF4y2Ba控制推gydF4y2Ba。为了训练模型,我们选择了gydF4y2Ba自杀推gydF4y2Ba对标记为的用户的tweet进行分类gydF4y2Ba自杀意念风险gydF4y2Ba临床医生评估了病例(513条推文)和346个短语。为gydF4y2Ba控制推gydF4y2Ba类中,我们使用Twitter的Sample tweets应用程序编程接口(API) [gydF4y2Ba30.gydF4y2Ba]。建立了1 ~ 5克的BoW模型,经主成分分析和logistic回归分析,F1=0.90,精密度(Pr)=0.91,召回率(R)=0.89,并进行了10倍交叉验证。这被认为是我们的gydF4y2Ba短轮廓版本分类器gydF4y2Ba(pvc)。gydF4y2Ba

SPVC应用于所有标记为的用户的个人资料的每条推文gydF4y2Ba自杀意念风险gydF4y2Ba对于每个用户,我们选择了前15名gydF4y2Ba自杀相关微博gydF4y2BaSPVC给出的预测概率值最高。我们将这些推文作为样本,由另外两个注释者进行评估:一个专业的临床医生和一个非专业的注释者。第二个注释者被给予有关自杀风险因素的详细说明和信息。这个阶段的注释者被要求将用户分为两类:(1)gydF4y2Ba自杀意念风险gydF4y2Ba或(2)gydF4y2Ba控制gydF4y2Ba,现在有了关于每个用户的更多信息。一旦第二次注释过程完成,我们只保留两个注释者都同意的积极案例(n=84),相当于89%(84/94)在第二阶段被至少一个注释者标记为自杀意念的所有案例。因此,我们确保用户标记为gydF4y2Ba自杀意念风险gydF4y2Ba在不同阶段由3位注释者同意进行分类。gydF4y2Ba

我们定义了2个不同的对照组,其大小与gydF4y2Ba自杀意念风险gydF4y2Ba类:gydF4y2Ba

  • 重点控制组gydF4y2Ba:在非自杀意念风险情境下撰写自杀相关关键词的用户,即将自杀、新闻报道和相关信息琐屑化的用户;或者用户只是向处于危险中的人表达他们的支持或意见。识别这些用户对分类系统来说是一个挑战,但却是减少误报的关键。这些用户是在第一次注释过程中从标记为控制用例的用户中随机选择的。gydF4y2Ba
  • 一般对照组gydF4y2Ba:一组Twitter用户,他们不一定会使用与自杀相关的词汇。这些用户是使用Sample Tweets API [gydF4y2Ba30.gydF4y2Ba],并像对其他组所做的那样匿名化。gydF4y2Ba

对于两个控制组,遵循第二个注释过程,以丢弃这些样本中可能存在的用户风险案例。gydF4y2Ba

结合多模态数据检测自杀风险gydF4y2Ba

我们提出了一种给定用户概况的方法:(1)它使用基于文本的模型,前面称为SPVC,它选择与自杀意念相关的相关推文子集。SPVC为其提供超过给定阈值的分数的推文集保留在SPV本身中;(2)主要从输出的SPV中,从推文的内容和元数据中提取出一组关系、文本、行为、词汇、统计、自杀意念相关和图像相关的特征;(3)构建并评估这些特征组合所产生的不同预测模型。我们的特征被分成3个不同的组:(1)gydF4y2BaBoW或n图和词嵌入gydF4y2Ba作为文本特征的表征;(2)一组特征称为gydF4y2Ba社会网络和心理(gydF4y2BaSNPSY)特性gydF4y2Ba包含一组关系、行为、词汇、情感分析和统计特征,以及一组试图将某些体征和症状映射到社交媒体背景的特征,这些特征通常是临床医生在筛查时考虑的;(3) angydF4y2Ba基于图像的分数gydF4y2Ba。gydF4y2Ba

功能定义gydF4y2Ba
基于文本的通用特性gydF4y2Ba
一袋单词和n - gramgydF4y2Ba

这些特征已被用于解决类似的任务,如抑郁症检测和饮食失调筛查[gydF4y2Ba7gydF4y2Ba,gydF4y2Ba31gydF4y2Ba]。这些模型基于所分析文档上的频率表示术语或术语序列(n-gram)。在我们的示例中,每个用户都由一个文档表示,该文档由所有tweet的文本拼接而成。之后,我们使用了gydF4y2BaScikit-learngydF4y2Ba[gydF4y2Ba32gydF4y2BaPython库:gydF4y2BaTfIdfVectorizergydF4y2Ba生成gydF4y2Batf.idfgydF4y2Ba在单词水平上表示1到5克。一组西班牙语停顿词被认为构建了这种表征[gydF4y2Ba33gydF4y2Ba]。这些特性在后面的小节中称为BoW特性。我们还使用了gydF4y2BaekphrasisgydF4y2Ba[gydF4y2Ba34gydF4y2Ba]作为文本预处理工具,以取代通用的标签元素,如金钱、电话号码、数字、标签和表情符号。我们还删除了出现在不到5%的文档中的n个图,以减少特征空间。这样做是考虑到功能的数量是由用户所有作品的词汇量大小决定的,在Twitter上,我们发现术语拼写错误或拉长的情况(即,gydF4y2Ba嘿gydF4y2Ba而不是gydF4y2Ba你好gydF4y2Ba);因此,我们避免了同一术语的多个表示,假设每个拼写错误和延伸都是不同的,并且不太可能在大多数文档中重复。gydF4y2Ba

字嵌入gydF4y2Ba

词嵌入是文本术语作为实数向量的表示。语义相关的词在向量空间上具有相似的表示。最近大多数使用深度学习技术处理文本特征的预测模型都使用词嵌入来表示术语。这些表示的序列作为训练预测模型的输入。这些类型的表述最近被用于最先进的自杀风险评估方法[gydF4y2Ba3.gydF4y2Ba,gydF4y2Ba11gydF4y2Ba]。我们使用了之前在一个包含200万条西班牙语推文的数据集上学习到的词嵌入[gydF4y2Ba35gydF4y2Ba]。gydF4y2Ba

社会网络与心理特征gydF4y2Ba

它们由一组基于通用词汇的特征组成[gydF4y2Ba36gydF4y2Ba],从用户写作中测量的统计数据,临床医生对用户行为感兴趣的信息,用户的社交网络(关系特征)[gydF4y2Ba16gydF4y2Ba]和n-grams词汇,其中包括涉及自杀意念或自杀风险因素的术语(我们将这些特征称为自杀相关词汇特征)。下面的小节将描述每种类型的特性。gydF4y2Ba

行为特征gydF4y2Ba

这些特征基于从tweet的元数据中提取的信息。在这里,我们根据用户在特定时间段内的活动来衡量他们的行为,这些时间段是在不同的粒度级别上定义的。详细介绍了这些特性gydF4y2Ba表1gydF4y2Ba。gydF4y2Ba

睡眠时间推文比率(STTR)和白天推文比率(DTTR)功能的目的是识别对照用户和处于风险中的用户在一天中发布的时间段之间的差异。考虑到我们的数据收集是由语言而不是由位置划分的,为tweet提供的发布时间是协调的通用时间,而不是用户所在位置的时间,并且从我们的数据中没有找到足够的信息来自动识别所有用户的位置,我们定义了一个方法来解决这个问题。如式1所示,一天被划分为8个固定时段,每个时段3小时。之后,我们假设一个普通用户至少有大约6小时的睡眠时间,并且在这6小时内,与一天中的其他时间相比,创建的推文数量会更少,因此我们计算每个3小时时间段内创建的推文数量(t),用于计算用户的SPV的所有推文。接下来,对于每个用户,我们计算每对连续时间段内的tweet数之和,并选择所有对获得的最小分数。我们还假设第一个和最后一个槽是连续的。最后,根据该用户完整个人资料的推文总数(T)对该值进行归一化,将该特征视为STTR:gydF4y2Ba

DTTR由1与睡眠时间比之差给出,即DTTR=1−STTR。重要的是要记住,对于引用更大粒度的度量(如工作日、周末和月份),时差的影响不如基于日周期的特征那么大。gydF4y2Ba

微博数据gydF4y2Ba

该组是指5类特征,对应于从用户tweets中计算出的统计度量。我们考虑了创建的tweet数量及其长度,以及每个用户在SPV中保留的tweet数量与发布的tweet总数的关系等元素。中描述了这些特性gydF4y2Ba表2gydF4y2Ba。gydF4y2Ba

关系的特性gydF4y2Ba

这些是关于用户之间的关系和交互的信息特性。用户转发和收藏的次数等因素可以让我们了解他们获得的社会支持,以及关注者和用户的数量,这些都是之前用于抑郁症筛查的因素[gydF4y2Ba16gydF4y2Ba]。gydF4y2Ba表3gydF4y2Ba描述为我们的评估提取的关系特征。gydF4y2Ba

表1。行为特征的描述。gydF4y2Ba
功能gydF4y2Ba 描述gydF4y2Ba 源gydF4y2Ba
工作周推文计数比率gydF4y2Ba 工作日(周一至周五)的推文总数,按推文总数归一化gydF4y2Ba 特殊目的载体gydF4y2Ba一个gydF4y2Ba微博gydF4y2Ba
周末推文计数比gydF4y2Ba 周末(周六和周日)的推文总数,按推文总数归一化gydF4y2Ba SPV推gydF4y2Ba
推文间隔时间中值gydF4y2Ba 每条tweet发布之间的时间中位数(以秒为单位)gydF4y2Ba SPV推gydF4y2Ba
睡眠时间推文比率gydF4y2Ba 在推断用户睡眠期间发布的tweet的比率gydF4y2Ba 完整的个人资料推文gydF4y2Ba
日间推文比率gydF4y2Ba 在用户通常清醒的时间段内发布的tweet的比率gydF4y2Ba 完整的个人资料推文gydF4y2Ba
每个季度的规范化tweet计数(4个功能)gydF4y2Ba 用户在一年中每个季度发布的推文数量,用该用户在一年中产生的推文总量归一化gydF4y2Ba SPV推gydF4y2Ba

一个gydF4y2BaSPV:短配置版本。gydF4y2Ba

表2。基于tweet统计的特征描述。gydF4y2Ba
功能gydF4y2Ba 描述gydF4y2Ba 源gydF4y2Ba
与自杀相关的推文比率gydF4y2Ba 由SPVC保留的推文比率gydF4y2Ba一个gydF4y2Ba在所有的推特中gydF4y2Ba 特殊目的载体gydF4y2BabgydF4y2Ba以及完整的推文gydF4y2Ba
SPVC得分中位数gydF4y2Ba 应用SPVC后,作为SPV一部分的推文获得的分数的中位数gydF4y2Ba SPV推gydF4y2Ba
推文长度中位数gydF4y2Ba 所有用户tweet的中位数长度(单词级别)gydF4y2Ba SPV推gydF4y2Ba
SPV推文的数量gydF4y2Ba 推文数量gydF4y2Ba SPV推gydF4y2Ba
用户推文数gydF4y2Ba 自创建帐户以来,用户发布的tweet数gydF4y2Ba 推特的元数据gydF4y2Ba

一个gydF4y2Ba短配置文件版本分类器。gydF4y2Ba

bgydF4y2BaSPV:短配置版本。gydF4y2Ba

表3。关系特征的描述。gydF4y2Ba
功能gydF4y2Ba 描述gydF4y2Ba 源gydF4y2Ba
粉丝数量gydF4y2Ba 关注者数量gydF4y2Ba 推特的元数据gydF4y2Ba
朋友的数量gydF4y2Ba 用户跟随的帐号数gydF4y2Ba 推特的元数据gydF4y2Ba
最喜欢给gydF4y2Ba 用户给出的收藏夹总数gydF4y2Ba 推特的元数据gydF4y2Ba
最爱数中值gydF4y2Ba 用户收到的收藏夹的中位数gydF4y2Ba 特殊目的载体gydF4y2Ba一个gydF4y2Ba微博gydF4y2Ba
中位数转发数gydF4y2Ba 用户收到的转发的中位数gydF4y2Ba SPV推gydF4y2Ba

一个gydF4y2BaSPV:短配置版本。gydF4y2Ba

词汇和自杀风险因素词汇gydF4y2Ba

词汇的使用已被证明在筛查精神障碍的任务中是成功的[gydF4y2Ba9gydF4y2Ba]。对于我们的方法,我们计算了2007年西班牙语词典中属于语言调查和单词计数(LIWC)所有类别的单词的频率[gydF4y2Ba36gydF4y2Ba,gydF4y2Ba37gydF4y2Ba由用户所写文章的大小(按字数计算)规范化。重要的是要记住,LIWC还包含识别语法元素的类别,如动词、名词、副词和代词等。在这本词典中,还增加了一组其他类别,包括词汇和最多3克的短语,这些短语可以映射到与自杀相关的术语和风险因素,如自杀方法;自残用语;明确的自杀意念参考;自我厌恶的规定;可能暗示轻蔑、失眠和恐惧的话;可能会提到以前的自杀企图,经历过种族或性别歧视,饮食失调,药物滥用,欺凌,缺乏社会支持,家庭和金钱问题,以及可能暗示遭受过某种歧视或虐待的词汇,亲近的人死于自杀,甚至是关于缺乏精神信仰的词汇,因为宗教被认为是筛选任务的保护因素[qh]gydF4y2Ba29gydF4y2Ba]。为这些类别选择的术语和短语是基于在临床医生评估的第一次标记过程中,在标记为自杀相关的tweet样本中看到的手动映射常见术语和短语。这些特征是使用SPV计算的。gydF4y2Ba

情绪分析gydF4y2Ba

我们根据其极性为每条tweet获得了一个分数。为此,我们使用gydF4y2Basenti-pygydF4y2Ba[gydF4y2Ba38gydF4y2Ba],接受了来自不同来源(包括Twitter)的西班牙语文本的培训。它是基于BoW模型和中间特征选择过程。为了获得每个用户的分数,我们计算了来自SPV的所有tweet的分数的中位数。gydF4y2Ba

基于图像的特征gydF4y2Ba

我们采用了Rodriguez等人在研究中提出的方法[gydF4y2Ba39gydF4y2Ba],其中提出了一种在OCEAN模型下推断人格的方法。从这个意义上说,我们创建了一个分类器,该分类器使用Twitter数据收集过程中使用的短语和关键字的子集来训练从Instagram提取的图像。这些图像被认为与自杀有关,而一组不相关的图像被认为是我们的对照病例。之后,将第一个模型应用于从我们数据集的用户推文中提取的每个图像。为了创建这个模型,我们使用了9万张图片用于训练,6万张图片用于验证。要获得每个用户的单个分数(gydF4y2Ba图片用户评分gydF4y2Ba),每个用户的图像的个人得分的平均值被认为是用户的总得分。gydF4y2Ba

为了定义图像分类器,我们使用卷积神经网络(CNN) [gydF4y2Ba40gydF4y2Ba因为cnn特别适合图像数据。这种类型的网络有几种变体,但最流行的是基于He等人引入的残差网络[gydF4y2Ba41gydF4y2Ba]。他们使用层之间的跳过连接,迫使梯度直接在卷积块之间流动。这使得反向传播在深度体系结构中更加有效。gydF4y2Ba

训练过程通过梯度下降最小化交叉熵损失函数来完成。训练cnn时的问题是,它们需要许多图像(通常在数百万的范围内)才能成功地为最终的分类器提取相关特征。由于大多数时候数据集不是很大,网络通常在大数据集上进行训练(例如,ImageNet [gydF4y2Ba42gydF4y2Ba]),然后对目标数据集进行微调。微调是指使用已经训练好的模型并对其进行再训练以适应新分布的过程。这要快得多,因为模型中的权重不是随机初始化的,而且通常可以跳过较浅层的训练,因为它们专注于检测角和边,因此模型收敛得更快。请注意,在网络中充当分类器的全连接层必须从头开始训练,因为数据集之间的目标类是不同的。gydF4y2Ba

在我们的实验中,我们使用了101层ResneXt [gydF4y2Ba43gydF4y2Ba],这是一种使用分组卷积的残差架构。这个特殊的体系结构使用大小为32、维度为8的卷积组,并在最后使用一个完全连接的层来执行实际的分类。CNN的输出是一个矢量,其中包含每个类的分数;在我们的例子中,只有2个类。这个网络是在ImageNet上训练的,我们在Instagram上对它进行了微调。我们使用随机梯度下降和热重启训练了8个epoch [gydF4y2Ba44gydF4y2Ba在2 GTX 1080 Ti上使用动量为0.99的Nesterov,其权重衰减为0.001,学习率为0.0001。我们使用dropout(50%)来避免训练阶段的过拟合。gydF4y2Ba

分类任务gydF4y2Ba

由于我们想要评估使用两种不同类型控制组的模型的性能变化,一组由使用与自杀相关词汇的用户组成(集中控制),另一组可能根本不使用这些术语的用户(一般控制),我们创建了实验来比较(1)有风险的用户与集中控制的用户(任务1)和(2)有风险的用户与一般控制的用户(任务2)。这些被选为我们的2个监督预测任务。我们的预测模型的实例和它们的特征之前是根据结合多模态数据检测自杀风险一节中描述的过程定义的。gydF4y2Ba

基线gydF4y2Ba

我们完全基于通用文本表示定义了基线2模型。这些模型是使用先前从用户提取的特征和表示生成的:(1)完整的个人资料和(2)他们的SPV。第一个是用1到5克训练的BoW模型,第二个是由CNN架构定义的深度学习模型组成,该模型已被证明是成功的文本分类[gydF4y2Ba45gydF4y2Ba并被用于Reddit用户自杀风险评估的类似任务中。gydF4y2Ba11gydF4y2Ba]。gydF4y2Ba

我们采用了Shing等[gydF4y2Ba11gydF4y2Ba来定义我们的用户级实例。因此,给定一个由一组连续帖子表示的用户,我们将所有这些帖子连接起来,并将每个帖子表示为单词的连接,其中每个单词由向量表示(单词嵌入),如gydF4y2Ba功能定义gydF4y2Ba部分。在Coppersmith等人的研究中[gydF4y2Ba3.gydF4y2Ba由于它在类似的任务上已经被证明是成功的,我们使用了一组之前在Twitter上学习到的词嵌入[gydF4y2Ba35gydF4y2Ba为我们的嵌入层定义起始权重,并执行进一步的微调,以在训练集上学习,并使表征适应任务域。gydF4y2Ba

我们认为前面描述的两个模型是为任务创建通用的和专门的基于文本的模型的最先进的方法,因为分析定义的附加特征类型的贡献是我们工作的目的之一。因此,我们定义了4个基线模型。基线1和基线3分别对应于在完整配置文件tweet样本和SPV上生成的BoW模型。基线2和基线4对应于基于相同数据样本(完整配置文件和SPV)构建的深度学习模型。gydF4y2Ba

分类器gydF4y2Ba

为了评估所定义的特征类型的个人贡献,以及它们对分类/检测任务的组合,我们考虑了4种类型的分类算法和一个深度学习模型。我们评估了随机森林、多层感知器、逻辑回归和支持向量机作为分类器的性能。对于每种特征组合方法,使用gydF4y2BaScikit-learngydF4y2Ba[gydF4y2Ba32gydF4y2Ba库的实现,用网格搜索最佳参数。我们使用CNN架构来嵌入模型。gydF4y2Ba

特征组合方法gydF4y2Ba

我们评估了几种结合我们定义的3种主要特征类型的方法:通用的基于文本的特征、snp特征和基于图像的特征(gydF4y2Ba图像用户评分gydF4y2Ba).可以看出在gydF4y2Ba表4gydF4y2Ba,我们首先使用对应的所有特征生成单独的模型gydF4y2Ba弓模型,gydF4y2Ba的gydF4y2Ba嵌入的模型gydF4y2Ba和gydF4y2BaSNPSY模型,gydF4y2Ba其特征主要来自于用户的SPV,如gydF4y2Ba表1gydF4y2Ba-gydF4y2Ba3.gydF4y2Ba。之后,我们探索了使用BoW模型来表示基于文本的特征的不同特征类型的组合。我们的第一种方法包括将BoW特性与SNPSY特性结合起来。在这种情况下,考虑到大量的BoW特征及其稀疏性,我们选择使用BoW模型预测的概率作为单个特征的值,表示为gydF4y2BaBoW输出特性,gydF4y2Ba添加到SNPSY的特性集。这在gydF4y2Ba表4gydF4y2Ba随着gydF4y2Ba弓+ SNPSY模型gydF4y2Ba。随后,我们对BoW特征与图像特征的结合进行了评估。对于本例,我们简单地向BoW添加了特性集gydF4y2Ba图像用户评分gydF4y2Ba作为另一属性;描述了这个组合gydF4y2Ba图片+弓模型gydF4y2Ba。之后,为了将SNPSY特征与图像特征结合起来,我们使用了gydF4y2Ba图像用户评分gydF4y2Ba作为SNPSY特性集之外的一个新特性,它是gydF4y2Ba图片+ SNPSY模型gydF4y2Ba。gydF4y2Ba

最后,为了结合这三种特征类型,我们定义了两种方法。第一种方法是集成模型,我们考虑BoW模型的输出(预测概率分数)(gydF4y2Ba(输出特性)gydF4y2Ba和SNPSY模型(gydF4y2BaSNPSY输出特性gydF4y2Ba)以及gydF4y2Ba图像用户评分gydF4y2Ba。这种方法对应于gydF4y2Ba图像+BoW+SNPSY模型gydF4y2Ba基于3个独立模型及其所有特征的组合,具有3个属性。第二种方法包括使用SNPSY类型的所有特征作为属性gydF4y2Ba弓形输出特性gydF4y2Ba和gydF4y2Ba图像用户评分;gydF4y2Ba的定义是什么gydF4y2Ba图像+BoW+SNPSY模型gydF4y2Ba有必要回忆一下,在训练阶段用于某些特征组合方法的BoW和SNPSY个体模型的预测概率分数对应于在训练集上执行交叉验证过程中测试折叠上的分类器的输出。这样做是为了避免过度拟合。gydF4y2Ba

除了所描述的组合方法之外,我们还创建了另外2个模型,我们对所有特征类型执行了特征选择过程。我们选择自杀组和对照组之间具有统计学显著差异的特征来评估它们对预测模型的贡献。我们提出了两个模型,并根据特征选择gydF4y2BaPgydF4y2Ba进行曼-惠特尼检验后得到的数值gydF4y2BaUgydF4y2Ba测试来比较每个类的样本。这是一种以前在医疗应用中使用的特征选择方法[gydF4y2Ba46gydF4y2Ba]。此外,考虑到所考虑的大特征空间,我们考虑了这种特征选择方法的效率(gydF4y2Ba表4gydF4y2Ba).这些模型被定义为gydF4y2Ba选定特征模型1gydF4y2Ba具有以下特性gydF4y2BaPgydF4y2Ba< . 05,when comparing the suicidal ideation risk and control groups; and the选定特征模型2gydF4y2Ba,在那里gydF4y2BaPgydF4y2Ba<措施。每个模型得到的特征数也给出了gydF4y2Ba表4gydF4y2Ba。gydF4y2Ba

表4。模型和功能。gydF4y2Ba
模型gydF4y2Ba 特性gydF4y2Ba 功能数量gydF4y2Ba


任务1gydF4y2Ba 任务2gydF4y2Ba
弓gydF4y2Ba一个gydF4y2Ba模型gydF4y2Ba 生成的BoW特征。我dfvectorizer with 1- to 5-gram features 24645年gydF4y2Ba 24336年gydF4y2Ba
嵌入的模型gydF4y2Ba 词嵌入表示作为基于文本的卷积神经网络模型的输入gydF4y2Ba 200gydF4y2Ba 200gydF4y2Ba
SNPSYgydF4y2BabgydF4y2Ba模型gydF4y2Ba SNPSY特征=行为+关系+tweets统计+词汇+自杀风险因素词汇+情绪分析特征gydF4y2Ba 112gydF4y2Ba 112gydF4y2Ba
弓+ SNPSY模型gydF4y2Ba BoW输出特征+ snp特征gydF4y2Ba 24757年gydF4y2Ba 24448年gydF4y2Ba
图片+弓模型gydF4y2Ba 图片用户评分+BoW功能gydF4y2Ba 24646年gydF4y2Ba 24337年gydF4y2Ba
图片+ SNPSY模型gydF4y2Ba 图片用户评分+SNPSY功能gydF4y2Ba 113gydF4y2Ba 113gydF4y2Ba
图像+BoW+SNPSY模型gydF4y2Ba 集成模型=图像用户评分+BoW输出特征+SNPSY输出特征gydF4y2Ba 24758年gydF4y2Ba 24449年gydF4y2Ba
图像+BoW+SNPSY模型gydF4y2Ba SNPSY功能+图像用户评分+BoW输出功能gydF4y2Ba 114gydF4y2Ba 114gydF4y2Ba
选定特征模型1gydF4y2Ba 从所有特性类型中选择特性gydF4y2BaPgydF4y2Ba< . 05gydF4y2Ba 5807gydF4y2Ba 14882年gydF4y2Ba
选定特征模型2gydF4y2Ba 从所有特性类型中选择特性gydF4y2BaPgydF4y2Ba<措施gydF4y2Ba 522gydF4y2Ba 3250gydF4y2Ba

一个gydF4y2Ba一大堆话。gydF4y2Ba

bgydF4y2Ba社交网络和心理特征。gydF4y2Ba

实验装置gydF4y2Ba
数据集描述gydF4y2Ba

根据数据收集部分的描述,为了评估我们的方法,我们选择了252个用户的样本,总共有1,214,474条推文和305,637张图像,从中每个用户最多选择1000张图像用于我们的实验。我们选择了一个平衡的样本,包括84名有自杀意念迹象的用户(有自杀风险的用户),84名重点控制用户和84名一般控制用户,临床医生在看到他们的帖子样本后将他们分为这些组。gydF4y2Ba表5gydF4y2Ba显示属于每个已定义组的用户的统计信息。我们可以注意到,处于风险中的用户的tweet长度中位数(以单词为单位)低于对照和一般情况。我们还看到,与其他类型的用户相比,通用控件用户生成的tweet数量更少。gydF4y2Ba

表5所示。完整的数据集标记组统计。gydF4y2Ba
描述gydF4y2Ba 自杀意念高危人群gydF4y2Ba 重点控制组gydF4y2Ba 一般对照组gydF4y2Ba
用户数量gydF4y2Ba 84gydF4y2Ba 84gydF4y2Ba 84gydF4y2Ba
推文数量gydF4y2Ba 313791年gydF4y2Ba 766437年gydF4y2Ba 134246年gydF4y2Ba
每个用户推文的中位数gydF4y2Ba 2797.5gydF4y2Ba 2984gydF4y2Ba 716gydF4y2Ba
推文长度中位数gydF4y2Ba 11gydF4y2Ba 19gydF4y2Ba 14gydF4y2Ba
图像数量gydF4y2Ba 37801年gydF4y2Ba 251830年gydF4y2Ba 16006年gydF4y2Ba
检测任务和评估框架gydF4y2Ba

我们考虑了3个不同的方面来分析:(1)定义SPV的效用,因为我们认为这将使我们能够通过消除与我们感兴趣的主题无关的推文提供的噪声来专注于我们正在分析的主题;(2)文本信息、关系信息、行为信息和基于图像的信息的个体和综合贡献;(3)使用两种不同类型控制组的模型的性能变化,一组由使用与自杀相关词汇的用户组成(集中控制),另一组可能根本不使用这些术语的普通用户组成。gydF4y2Ba

基线1和基线2模型考虑了来自用户完整个人资料的所有帖子,而我们提出的模型和组合的大多数特征都是使用SPV单独提取的,除了从用户的tweet元数据中提取的一些元素和特征,如STTR和DTTR,这需要使用来自完整个人资料的帖子。对于每个任务,所有实例的70%被保留用于训练,剩下的30%(每个类大约25个用户)作为未见的案例用于测试目的。为了保持每个类别的实例平衡,我们对这些集合使用了分层。除了这些测试集之外,我们还在标记为可疑案例的200个用户样本上评估了我们的最佳模型。这样做是为了验证,作为人类注释者,模型是否能够将大多数情况识别为可能处于危险中的用户。gydF4y2Ba

的gydF4y2BaPowerTransformergydF4y2Ba类gydF4y2Bacikit-learngydF4y2Ba使用Yeo-Johnson的[gydF4y2Ba32gydF4y2Ba]。为了选择最佳分类器,在所有算法进行评估的训练集上进行10倍交叉验证过程。之后,选择性能最好的分类器进行第二次5次交叉验证,同时进行网格搜索,为所选分类器找到最合适的参数。gydF4y2Ba

我们考虑了Pr, R, F1分数(F1),准确度,以及接收者工作特征曲线(AUC- roc)下面积得分(AUC),这是我们基于网格搜索参数优化的度量。Pr, R, F1和AUC的值对应于自杀意念风险类别,因为它是我们感兴趣的主要类别。我们报告了准确度来分析这两个类的性能。某些分类器(如cnn)得到的结果是多次运行的平均结果,因为它们可以添加随机性。gydF4y2Ba


统计分析gydF4y2Ba

我们对提取的特征进行了分析,以确定有风险的用户样本与对照组之间的显著差异。对于为分析组提取的每个特征,我们进行了独立的双样本曼-惠特尼检验gydF4y2BaUgydF4y2Ba自杀意念使用者组与不同对照组之测试。我们还进行了这个测试来比较我们的两个控制组(重点控制组和一般控制组)。考虑到我们的特征不遵循正态分布,并且大多数特征没有方差的同质性,我们进行了非参数检验。gydF4y2Ba

当比较自杀意念风险与重点对照组在SNPSY特征上的差异时,我们发现有显著差异gydF4y2BaPgydF4y2Ba<措施一个米ong the following features: overall ratio, median time between tweets, verbs, verbs conjugated in singular of the first person (“I”+verb), cognitive mechanisms, anxiety-related terms, usage of personal pronouns, usage of the pronoun “I,” negations, terms to express feelings, and coursing terms. Regarding suicide-related lexicons, the usage of suicide explicit terms, depression-related terms, self-loathing, substance abuse, self-injuries, and terms expressing lack of social support also presented an important significance (PgydF4y2Ba<措施)。对于BoW模型的特征,经过同样的测试,我们发现与gydF4y2BaPgydF4y2Ba<措施for n-grams such as我觉得,难过,自杀,哭/哭,抑郁,要死,可怕,焦虑,死,药gydF4y2Ba除其他外gydF4y2Ba。gydF4y2Ba考虑到所有使用的特征(24,758),根据这些测试,共有522个特征对于区分组具有显著性gydF4y2BaPgydF4y2Ba<措施。gydF4y2Ba表6gydF4y2Ba显示了中位数和分布重叠指数[gydF4y2Ba47gydF4y2Ba]对两组的相关特征样本进行分析。gydF4y2Ba

当重复独立的双样本曼-惠特尼gydF4y2BaUgydF4y2Ba比较自杀意念风险组与一般控制组用户在snp特征上的差异gydF4y2BaPgydF4y2Ba<措施,we found the median classifier score, the number of tweets generated, and the median time between tweets to be different among both groups (suicidal ideation risk vs generic control). We identified differences in discussion topics such as money and work, about which the generic control users seem to discuss more, whereas the members of the suicidal ideation risk group use terms more related to health and biological aspects. As in the previous case, the use of self-references was higher in the suicidal ideation risk group. Within the significant n-grams from the BoW model, we found terms such as感觉,到死,歌,有人,哭/哭,焦虑,生活,呼吸,坏,和恐惧gydF4y2Ba。这显示在gydF4y2Ba表7gydF4y2Ba,它根据所提到的一些属性显示组分布的中值和重叠指数。再一次,考虑到使用的所有特征(24,449),3250对于区分自杀意念风险和一般对照组具有重要意义gydF4y2BaPgydF4y2Ba<措施。gydF4y2Ba

关于其他探索的特性,考虑95% CI,为gydF4y2Ba任务1gydF4y2Ba(自杀意念风险vs集中控制),朋友的数量(gydF4y2BaPgydF4y2Ba=.04)和推文长度中位数(gydF4y2BaPgydF4y2Ba=.04),差异有统计学意义。在这些情况下,集中控制用户的朋友中位数(578.5)高于处于风险中的朋友中位数(372.0)。基于SPV的推文长度中位数也是如此,有16个词的集中控制用户比有13个词的自杀意念风险用户的推文长度中位数更高。此外,STTR (gydF4y2BaPgydF4y2Ba= 0.049)和工作日计数比(gydF4y2BaPgydF4y2Ba= . 01)。在相同的CI下,为gydF4y2Ba任务2,gydF4y2Ba工作日计数比率(gydF4y2BaPgydF4y2Ba=.001), STTR (gydF4y2BaPgydF4y2Ba=.004),以及追随者的数量(gydF4y2BaPgydF4y2Ba=.05),给出的最爱总数(gydF4y2BaPgydF4y2Ba=.006),差异有统计学意义。从这个意义上说,普通控制组的用户和重点控制组的用户似乎在工作日(周一至周五)发推特的次数更多,而自杀意念风险用户的行为恰恰相反。在STTR中位数上,一般控制组用户的STTR值为0.02,而风险组用户的STTR值为0.04,这意味着与一般控制组和重点控制组用户相比,风险组用户似乎在夜间发推文的次数更多。gydF4y2Ba

根据测试,图像得分也有显著差异gydF4y2BaPgydF4y2Ba=.002for the comparison between the suicidal ideation risk and generic control groups, considering a 95% CI. Curiously, for the comparison of the image scores between the suicidal ideation risk group and the focused control group, the test scores were different, withPgydF4y2Ba= . 05。这可以解释为这样一个事实,即提供有关自杀的信息或新闻的用户使用类似的图像,这些图像描述了病情,因此仅凭图片很难发现显着差异。可以看出在gydF4y2Ba表8gydF4y2Ba对于对照组和自杀意念危险组,自杀意念危险组的中位数图像得分略高。gydF4y2Ba

最后,为了比较我们的控制组(重点控制组和一般控制组),我们进行了相同的测试(曼-惠特尼)gydF4y2BaUgydF4y2Ba测试),并发现这些组的一些特征(n=181)之间存在显著差异gydF4y2BaPgydF4y2Ba<措施。在这些特征中,我们主要发现了与自杀相关的词汇,如自杀方法、自杀明确术语、欺凌、歧视和药物滥用相关术语。我们还发现了差异(gydF4y2BaPgydF4y2Ba<.001)在其他文本、关系和行为属性中,如推文数量、朋友数量、关注者数量、中位数收藏和转发次数、总体比例、极性得分、推文之间的中位数时间和STTR等。这些差异证实了我们之前关于对照组之间差异的假设。gydF4y2Ba

表6所示。自杀意念组和焦点控制组在某些属性上的中位数和分布重叠指数差异最显著。gydF4y2Ba
属性gydF4y2Ba 自杀意念中位数gydF4y2Ba 集中控制中值gydF4y2Ba 重叠指数gydF4y2Ba
焦虑gydF4y2Ba 10.94gydF4y2Ba 0gydF4y2Ba 0.25gydF4y2Ba
追逐条款gydF4y2Ba 21.52gydF4y2Ba 7.68gydF4y2Ba 0.43gydF4y2Ba
去死(自我参照)gydF4y2Ba 5.45gydF4y2Ba 0gydF4y2Ba 0.25gydF4y2Ba
我觉得gydF4y2Ba 46.25gydF4y2Ba 6.71gydF4y2Ba 0.32gydF4y2Ba
自我厌恶gydF4y2Ba 0.03gydF4y2Ba 0gydF4y2Ba 0.35gydF4y2Ba
动词我gydF4y2Ba 22.66gydF4y2Ba 12.11gydF4y2Ba 0.41gydF4y2Ba
表7所示。自杀意念组与一般对照组在某些属性上的中位数和重叠指数差异最显著。gydF4y2Ba
属性gydF4y2Ba 自杀意念中位数gydF4y2Ba 一般控制中位数gydF4y2Ba 重叠指数gydF4y2Ba
分类器中位数得分gydF4y2Ba 0.72gydF4y2Ba 0.65gydF4y2Ba 0.46gydF4y2Ba
去死gydF4y2Ba 19.5gydF4y2Ba 0gydF4y2Ba 0.25gydF4y2Ba
用户推文数gydF4y2Ba 2076.5gydF4y2Ba 453gydF4y2Ba 0.38gydF4y2Ba
健康gydF4y2Ba 17.19gydF4y2Ba 8.18gydF4y2Ba 0.44gydF4y2Ba
工作gydF4y2Ba 35.46gydF4y2Ba 49.59gydF4y2Ba 0.44gydF4y2Ba
我gydF4y2Ba 41.32gydF4y2Ba 9.60gydF4y2Ba 0.23gydF4y2Ba
表8所示。自杀意念、集中控制和一般控制类别图像得分的中位数和重叠指数。gydF4y2Ba
属性gydF4y2Ba 集团gydF4y2Ba 中值gydF4y2Ba 重叠指数gydF4y2Ba
图像分gydF4y2Ba 自杀意念gydF4y2Ba 0.24gydF4y2Ba 0.64gydF4y2Ba
集中控制gydF4y2Ba 0.23gydF4y2Ba
自杀意念gydF4y2Ba 0.24gydF4y2Ba 0.52gydF4y2Ba
通用的控制gydF4y2Ba 0.23gydF4y2Ba

分类任务结果gydF4y2Ba

在本节中,我们报告了我们的实验结果。gydF4y2Ba表9gydF4y2Ba给出了测试集上各任务的评价度量结果。我们报告了最佳模型的结果,如gydF4y2Ba表4gydF4y2Ba,以及基线。gydF4y2Ba

表9所示。预测任务结果。gydF4y2Ba
模型gydF4y2Ba 自杀意念与重点控制组的对比gydF4y2Ba 自杀意念与一般对照组比较gydF4y2Ba

公关gydF4y2Ba一个gydF4y2Ba RgydF4y2BabgydF4y2Ba F1gydF4y2BacgydF4y2Ba 交流gydF4y2BadgydF4y2Ba AUCgydF4y2BaegydF4y2Ba 分类器gydF4y2Ba 公关gydF4y2Ba RgydF4y2Ba F1gydF4y2Ba 交流gydF4y2Ba AUCgydF4y2Ba 分类器gydF4y2Ba
弓gydF4y2BafgydF4y2Ba全模型概要文件(基线1)gydF4y2Ba 0.78gydF4y2Ba 0.81gydF4y2Ba 0.79gydF4y2Ba 0.78gydF4y2Ba 0.81gydF4y2Ba 中长期规划gydF4y2BaggydF4y2Ba 0.79gydF4y2Ba 0.85gydF4y2Ba 0.81gydF4y2Ba 0.80gydF4y2Ba 0.91gydF4y2Ba 中长期规划gydF4y2Ba
嵌入模型-完整概要文件(基线2)gydF4y2Ba 0.76gydF4y2Ba 0.81gydF4y2Ba 0.79gydF4y2Ba 0.77gydF4y2Ba 0.82gydF4y2Ba 美国有线电视新闻网gydF4y2BahgydF4y2Ba 0.78gydF4y2Ba 0.87gydF4y2Ba 0.82gydF4y2Ba 0.80gydF4y2Ba 0.84gydF4y2Ba 美国有线电视新闻网gydF4y2Ba
弓model-SPVgydF4y2Ba我gydF4y2Ba(3)基线gydF4y2Ba 0.81gydF4y2Ba 0.85gydF4y2Ba 0.83gydF4y2Ba 0.82gydF4y2Ba 0.85gydF4y2Ba LRgydF4y2BajgydF4y2Ba 0.80gydF4y2Ba 0.92gydF4y2BakgydF4y2Ba 0.86gydF4y2Ba 0.84gydF4y2Ba 0.89gydF4y2Ba 中长期规划gydF4y2Ba
嵌入模型- spv(基线4)gydF4y2Ba 0.79gydF4y2Ba 0.85gydF4y2Ba 0.82gydF4y2Ba 0.80gydF4y2Ba 0.83gydF4y2Ba 美国有线电视新闻网gydF4y2Ba 0.77gydF4y2Ba 0.87gydF4y2Ba 0.82gydF4y2Ba 0.80gydF4y2Ba 0.82gydF4y2Ba 美国有线电视新闻网gydF4y2Ba
SNPSYgydF4y2BalgydF4y2Ba模型gydF4y2Ba 0.85gydF4y2Ba 0.85gydF4y2Ba 0.85gydF4y2Ba 0.84gydF4y2Ba 0.86gydF4y2Ba 支持向量机gydF4y2Ba米gydF4y2Ba 0.85gydF4y2Ba 0.88gydF4y2Ba 0.87gydF4y2Ba 0.86gydF4y2Ba 0.94gydF4y2Ba LRgydF4y2Ba
弓+ SNPSY模型gydF4y2Ba 0.82gydF4y2Ba 0.88gydF4y2BakgydF4y2Ba 0.85gydF4y2Ba 0.84gydF4y2Ba 0.89gydF4y2Ba 射频gydF4y2BangydF4y2Ba 0.85gydF4y2Ba 0.88gydF4y2Ba 0.87gydF4y2Ba 0.86gydF4y2Ba 0.94gydF4y2Ba LRgydF4y2Ba
图片+弓模型gydF4y2Ba 0.79gydF4y2Ba 0.88gydF4y2BakgydF4y2Ba 0.84gydF4y2Ba 0.82gydF4y2Ba 0.86gydF4y2Ba 中长期规划gydF4y2Ba 0.82gydF4y2Ba 0.88gydF4y2Ba 0.85gydF4y2Ba 0.84gydF4y2Ba 0.90gydF4y2Ba LRgydF4y2Ba
图片+ SNPSY模型gydF4y2Ba 0.88gydF4y2BakgydF4y2Ba 0.85gydF4y2Ba 0.86gydF4y2BakgydF4y2Ba 0.86gydF4y2BakgydF4y2Ba 0.91gydF4y2Ba 支持向量机gydF4y2Ba 0.88gydF4y2Ba 0.88gydF4y2Ba 0.88gydF4y2BakgydF4y2Ba 0.88gydF4y2BakgydF4y2Ba 0.94gydF4y2Ba LRgydF4y2Ba
图像+BoW+SNPSY模型gydF4y2Ba 0.85gydF4y2Ba 0.85gydF4y2Ba 0.85gydF4y2Ba 0.83gydF4y2Ba 0.87gydF4y2Ba LRgydF4y2Ba 0.85gydF4y2Ba 0.92gydF4y2BakgydF4y2Ba 0.88gydF4y2BakgydF4y2Ba 0.88gydF4y2BakgydF4y2Ba 0.92gydF4y2Ba 中长期规划gydF4y2Ba
图像+BoW+SNPSY模型gydF4y2Ba 0.88gydF4y2BakgydF4y2Ba 0.81gydF4y2Ba 0.84gydF4y2Ba 0.84gydF4y2Ba 0.92gydF4y2BakgydF4y2Ba 支持向量机gydF4y2Ba 0.85gydF4y2Ba 0.88gydF4y2Ba 0.87gydF4y2Ba 0.86gydF4y2Ba 0.94gydF4y2Ba LRgydF4y2Ba
选定特征模型1 (gydF4y2BaPgydF4y2Ba< . 05)gydF4y2Ba 0.85gydF4y2Ba 0.85gydF4y2Ba 0.85gydF4y2Ba 0.84gydF4y2Ba 0.90gydF4y2Ba 中长期规划gydF4y2Ba 0.91gydF4y2BakgydF4y2Ba 0.77gydF4y2Ba 0.83gydF4y2Ba 0.84gydF4y2Ba 0.94gydF4y2Ba 支持向量机gydF4y2Ba
选定特征模型2 (gydF4y2BaPgydF4y2Ba<措施)gydF4y2Ba 0.83gydF4y2Ba 0.77gydF4y2Ba 0.80gydF4y2Ba 0.80gydF4y2Ba 0.92gydF4y2BakgydF4y2Ba 支持向量机gydF4y2Ba 0.91gydF4y2BakgydF4y2Ba 0.81gydF4y2Ba 0.86gydF4y2Ba 0.86gydF4y2Ba 0.95gydF4y2BakgydF4y2Ba 支持向量机gydF4y2Ba

一个gydF4y2Ba公关:精度。gydF4y2Ba

bgydF4y2Ba接待员:召回。gydF4y2Ba

cgydF4y2BaF1: F1得分。gydF4y2Ba

dgydF4y2BaAc:准确性。gydF4y2Ba

egydF4y2BaAUC:曲线下面积。gydF4y2Ba

fgydF4y2Ba一大堆话。gydF4y2Ba

ggydF4y2Ba多层感知器。gydF4y2Ba

hgydF4y2BaCNN:卷积神经网络。gydF4y2Ba

我gydF4y2BaSPV:短配置版本。gydF4y2Ba

jgydF4y2BaLR:逻辑回归。gydF4y2Ba

kgydF4y2Ba每个评价指标的最佳结果。gydF4y2Ba

lgydF4y2Ba社交网络和心理特征。gydF4y2Ba

米gydF4y2BaSVM:支持向量机。gydF4y2Ba

ngydF4y2Ba随机森林。gydF4y2Ba

短配置文件版本定义结果gydF4y2Ba

可以看出在gydF4y2Ba表9gydF4y2Ba, SPVC的定义作为两个预测任务的第一个过滤器是成功的。事实上,BoW模型专门在SPV(基线3和4)上训练,在这两个任务的大多数度量中都优于基线1和2。对于这些表示,与主题无关的tweet似乎引入了噪声,因为它们产生了更大的特征空间。相反,为分类器设置较高的决策阈值意味着减少BoW模型的词汇表,这可能会降低使用测试数据的模型的性能。gydF4y2Ba

对于专门在SPV上训练的CNN嵌入模型,我们可以看到task 1的模型比baseline 2的模型得到了稍好的结果,而task 2的结果差别不大。总的来说,我们观察到使用SPV对BoW模型有更好的性能。因此,评估的组合要考虑到这些基于文本的表示(BoW)。gydF4y2Ba

重要的是要记住,对于集中的控制案例,在应用决策阈值超过0.5的SPVC之后,有4个用户没有SPV,因为他们的任何tweet都获得了超过阈值的预测概率。考虑到更高的阈值,更集中的控制和一般用户可能会在训练我们的下一个分类器时丢失,这是我们为进一步的实验保留的阈值(0.5)。然而,这些结果还表明,随着阈值的上升,使用SPVC减少了具有SPV的控制用户的数量,并且SPV的定义对于丢弃那些不提供与风险用户相似的推文的用户是有用的。最初,我们发现集中控制用户比一般用户更容易被丢弃。然而,这可以通过以下事实来解释,即丢弃的控制用户可能对应于诸如报纸之类的信息帐户,我们假设这些帐户以不使用暗示个人参考或意见的术语的方式使用涉及自杀的某些术语;因此,第一个分类器可能会发现更容易丢弃。无论如何,这是一种假设,因为我们在注释之后没有进一步访问用户的写作。gydF4y2Ba

结合模型结果gydF4y2Ba

对于所提取的特征类型组合考虑的方法,我们可以看到,当这些类型相互独立评估时,每种类型都有很好的准确性,其中SNPSY模型获得了最好的结果。中报告的组合gydF4y2Ba表4gydF4y2Ba对于自杀意念风险与集中对照组相比,我们可以观察到,使用这3种特征的模型并没有显著改善SNPSY模型得到的结果。然而,对于image +BoW+SNPSY模型2,我们可以看到,与基线3和基线1相比,自杀意念患者的AUC评分分别增加了7%和11%。用德龙法得到的ROC曲线的AUC差异为gydF4y2BaPgydF4y2Ba=.04,which is statistically significant, considering a 95% CI.

对于任务2,与一般控制任务相比,Images+BoW+SNPSY组合获得了改善自杀意念基线1的结果。对于Images+BoW+SNPSY模型1,我们注意到与基线3相比准确率提高了4%,与基线1相比提高了8%。在选择特征模型2的情况下,AUC值也增加了4%。我们还注意到SNPSY模型、BoW+SNPSY模型和Images+BoW+SNPSY模型之间的测量结果相同,这意味着我们可能不会通过添加其他特征类型来提高SNPSY模型的性能。事实上,在进行Delong检验将这些模型的ROC曲线与基线1模型进行比较后,我们没有发现显著差异,这意味着它们在该任务的AUC测量方面的表现与基线没有显著差异。然而,这也意味着单独使用SNPSY特征允许我们拥有一个具有较少特征数量的模型,其性能与具有数千个特征的BoW模型一样好。gydF4y2Ba

关于图像的作用,我们可以看到,当它们单独与BoW特征或SNPSY特征结合时,F评分或AUC评分与基线3相比增加最小。作为该方法实验的一部分,有必要提到,由于少数用户(每个任务最多4个)缺少一些图像分数,因此考虑解决此问题的方法是用所有用户的平均值替换分数,除了只考虑每种特征类型的单个分数的模型;对于这种情况,删除了缺少值的实例。gydF4y2Ba

参考具有一组选定特征的模型,我们可以注意到,这些模型在F1、精度和AUC方面也优于基线1和基线2。两个任务所选择的特征模型1在F1和AUC上都优于基线3和4。值得注意的是,与基线模型和Images+BoW模型相比,这些模型考虑的特征数量减少了,因为它们试图减少使用数千个特征可能意味着的过拟合。gydF4y2Ba

值得注意的是,对于所评估的模型;我们没有为分类器定义专门的决策阈值。因此,对于未来的工作,应该考虑到这一点,因为应该最小化假阴性预测,并且应该定义一个阈值来最大化自杀意念类别的R值,而不忽略与Pr的权衡。无论如何,我们可以看到,我们的大多数模型在AUC得分方面优于基线,这意味着我们的模型能够成功区分类别。从这个意义上说,更好的决策阈值的定义只能有助于提高我们模型的性能。gydF4y2Ba

任务比较结果gydF4y2Ba

当比较这两个任务的结果时,我们看到,由模型获得的区分处于风险中的用户和一般控制用户的结果与训练过度集中的控制用户的结果并没有什么不同。然而,我们注意到,经过训练来比较处于风险中的用户和一般控制用户的模型总是具有更高的确定性水平。这可以在比较任务2模型的AUC分数时观察到,AUC分数总是更高。事实上,对于这个任务,我们可以看到,基线模型已经获得了很高的AUC分数,而其他模型并没有明显的提高。这与任务1不同,在任务1中,与基线相比,特征组合与提高模型的确定性有关。gydF4y2Ba

图1gydF4y2Ba显示了考虑到Images+BoW+SNPSY模型2的特征,每个任务与类最相关的前10个特征。相关度最高的特征由BoW模型分数和词汇等文本元素给出。有趣的是,作为tweet之间的中位数时间的行为特征与任务2相关。我们还可以注意到,对于这两个任务,自我引用是相关的,明确的自杀术语和健康相关术语的使用与任务2相关,因为通用对照用户不使用与自杀相关的术语。gydF4y2Ba

参考对生成的模型更具预测性的特征,我们考虑随机森林的特征重要性函数,该函数基于其杂质度量。从这个意义上说,我们可以看到每个特征减少杂质的程度。一个特征越能减少杂质,那么这个特征就越重要。在这种情况下,由于随机森林使用多棵树,每个特征的杂质减少在所有树上平均,以确定变量的最终重要性。基于此方法的最重要的特征,考虑到Images+BoW+SNPSY模型2的特征如图所示gydF4y2Ba图2gydF4y2Ba。对于本例,我们确认在任务2中,与工作和健康相关的术语的使用在两个类别中是不同的,如gydF4y2Ba统计分析gydF4y2Ba部分。gydF4y2Ba

对于这两种方法,我们可以看到,图像得分并没有出现在与任务更相关的特征中,这意味着文本和行为特征可能更相关。尽管如此,某些特征组合给出的分数表明,包含图像分数对这些预测任务的结果的改善微乎其微。在图像处理阶段,被激活的神经元最多的一些图像包括人们哭泣的图像和包含自杀一词的图像。gydF4y2Ba

我们也评估了gydF4y2Ba选定特征模型2gydF4y2Ba,作为我们对两个任务的AUC结果最好的模型之一,在最初标记为的200个用户的样本中gydF4y2Ba怀疑gydF4y2Ba用例。我们评估了两个模型,一个是用任务1的数据训练的(选定特征模型2 -任务1),另一个是用任务2的数据训练的(选定特征模型2 -任务2)。对于第一个模型,我们预测65%的可疑案例是积极的(风险),而对于第二个模型,我们发现73%的可疑案例是有风险的。这表明我们的模型在超过一半的可疑用户中检测到自杀意念的迹象,这与第一个注释者的标准一致。gydF4y2Ba

最后,我们求值gydF4y2Ba选择特征模型2 -任务1gydF4y2Ba通过自杀意念和一般控制用户的测试集来评估该模型对不使用自杀相关词汇的用户的性能。结果Pr=0.91, R=0.77, F1=0.83,准确率=0.84,AUC=0.95。结果表明,该模型在集中控制用户上的性能优于一般控制用户。类似地,我们评估了gydF4y2Ba选择的特征模型2 -任务2gydF4y2Ba在自杀意念和集中控制用户的测试集上得到Pr=0.83, R=0.80, F1=0.82,准确率=0.82,AUC=0.91。该模型的性能比通用控制用户差,这与区分这两种情况要困难得多的事实是一致的。gydF4y2Ba

‎gydF4y2Ba
图1所示。特征与两项任务的预测类别更相关:自杀意念风险vs集中控制(左),自杀意念风险vs一般控制(右)。gydF4y2Ba
查看此图gydF4y2Ba
‎gydF4y2Ba
图2。两项任务的预测特征:自杀意念风险vs集中控制(左),自杀意念风险vs一般控制(右)。gydF4y2Ba
查看此图gydF4y2Ba

主要研究结果gydF4y2Ba

本研究提出了一种评估社交媒体自杀风险的方法。我们从多模态数据中提取信息,建立基于统计和深度学习的预测模型。我们的模型除了考虑图像分析之外,还考虑了一组基于BoW和n-gram、词汇、关系、统计和行为信息的特征。据我们所知,这是第一个在用户层面上结合所有这些类型的特征来评估自杀风险的方法。此外,我们通过定义SPV强调了丢弃与研究主题无关的文章噪声的有用性,SPV的性能优于通过分析用户的完整概况给出的基线,并提高了准确性和F1。gydF4y2Ba

我们还比较了在不同控制组上训练的预测方法的性能,目的是使更专业的分类器能够区分处于风险中的用户和控制案例,即使讨论的主题相似。与使用自杀词汇的用户相比,使用通用对照用户在AUC-ROC方面取得了更好的结果。我们还强调了特征可解释性的重要性,考虑到临床医生可以理解的因素,并将其映射到他们的筛查实践中。我们的实验结果表明,在分析的特征类型中,存在多个可能导致风险情况检测的重要特征,其中最相关的特征是基于对文本和行为元素的识别,如自我引用、发布的推文数量以及每条推文之间的时间间隔(gydF4y2BaPgydF4y2Ba<措施)。gydF4y2Ba

基于文本的特征与我们的模型最为相关;然而,它们与基于图像的分数,以及关系和行为方面的结合,使我们能够获得优于仅基于文本的模型提供的结果的模型。gydF4y2Ba

限制gydF4y2Ba

我们的研究存在一些局限性,主要是因为这是一项观察性研究,无法获得风险评估研究中经常考虑的个人和医疗信息。基于用户的词汇和行为模式来推断其中一些方面的方法的准确性造成了限制。例如,周末推文计数比率是因为用户所在时区的发布时间和睡眠时间推文比率的差异,其中我们假设睡眠时间是用户一天中活动较少的时间段。gydF4y2Ba

考虑到Twitter上没有这类信息,因此没有对所分析用户的年龄、性别和位置进行代表性分析。然而,在我们的数据样本中存在的偏见,在这些方面,遵循类似的性别和年龄偏见自杀[gydF4y2Ba48gydF4y2Ba],因为大多数推特用户是中年男性[gydF4y2Ba14gydF4y2Ba]。除此之外,用于提取数据的词汇是从Reddit等不同来源获得的,这一事实可能意味着Reddit中使用的词汇类型带来的偏见,以及西班牙语翻译可能带来的限制,即使所使用的术语和短语经过专业临床医生的仔细检查和验证。gydF4y2Ba

最后,在Twitter上发布信息的用户的性质也有限制,因为他们可能不同于那些不选择公开个人资料的风险用户,甚至不同于那些没有Twitter帐户的风险用户。此外,不能保证被注释为有风险的用户确实有风险,因为执行注释仅仅是因为读取了几条tweet。gydF4y2Ba

可重复性和伦理问题gydF4y2Ba

对社交网络提供的数据进行分析,以发现健康问题并协助临床医生,这是一个公开的问题,并非没有争议。然而,我们提议的目的是阐明这些系统在一个特定理论应用中的真正能力:自杀风险预防。在该等系统投入使用前,须进行审慎的风险效益评估,并适当分析是否符合适用的法律架构,以及对用户私隐及公民自由的潜在威胁。[gydF4y2Ba12gydF4y2Ba,gydF4y2Ba26gydF4y2Ba,gydF4y2Ba49gydF4y2Ba]。gydF4y2Ba

关于这项工作的可重复性,我们应该尊重Twitter关于通过其API收集的数据分布的政策。考虑到在分享任何可能导致识别本研究使用者的资料方面的限制[gydF4y2Ba12gydF4y2Ba],只有我们的实验的计算特征,以及在分类器上使用的代码和参数,才能根据要求提供,并适当解释模型的用途。最后,还需要处理基于这些模型的工具被滥用的潜在情况。Guntuku等[gydF4y2Ba9gydF4y2Ba]提到了一些假设的情况,在这些情况下,雇主或保险公司可能会使用这些类型的筛查工具来损害精神障碍患者的利益;因此,针对这些应用程序的策略应该在它们发布之前定义。gydF4y2Ba

未来的工作gydF4y2Ba

通过观察基于图像的预测模型的性能,我们认为可以通过增强文本和关系特征的贡献来改进我们的结果。这可以通过探索其他文本表示方法和深入分析用户之间的网络和交互来实现。此外,我们相信这些方法可以扩展并应用于与精神障碍相关的不同用例,如抑郁、焦虑或饮食失调。gydF4y2Ba

我们相信,在这项研究中提出的方法可以演变成一个实时系统,当发现处于危险中的用户时发出警报。有必要回顾一下,在这种情况下,这种工具的想法是作为辅助临床医生的第一个过滤器,而不打算以任何方式取代他们的工作。实际上,推文的一个可读子集来自SPV,带有顶部gydF4y2BakgydF4y2Ba如果允许,根据SPVC订购的推文可以作为系统的输出,供临床医生评估并进行未来的筛查步骤。事实上,部署这种系统的法律和伦理问题应该先加以分析。然而,我们相信这种工具可以成为非侵入性干预措施发展的起点,专家和社交媒体社区成员可以为恢复和预防心理健康问题和自杀做出贡献。同样,应该为此实例定义适当的协议和过程。特别是,考虑到在这种情况下为处理个人数据设定的法律界限,应该对潜在干预的影响进行深入分析。gydF4y2Ba

致谢gydF4y2Ba

这项研究得到了西班牙经济和竞争力部Maria de Maeztu卓越项目(MDM-2015-0502)的支持。作者感谢西班牙项目TIN2015-65464-R (MINECO/FEDER)的资助。作者还感谢NVIDIA公司为本研究捐赠的Tesla K40 GPU和GTX TITAN GPU的支持。gydF4y2Ba

利益冲突gydF4y2Ba

没有宣布。gydF4y2Ba

  1. 世界卫生组织。预防自杀:全球当务之急。日内瓦:世界卫生组织;2014.gydF4y2Ba
  2. 陈晓明,陈晓明,陈晓明,等。2015 .社交媒体与社交媒体的关系研究。参考文献:第二届计算语言学与临床心理学研讨会论文集。2015,发表于:CLPsych'15;2015年6月5日;科罗拉多州丹佛市。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  3. 郭晓明,李晓明,郭晓明,等。社交媒体自然语言处理对自杀风险的筛选。Biomed Inform Insights 2018;10:11 178222618792860 [j]gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  4. De Choudhury M. Tumblr上的厌食症:表征研究。第五届数字健康国际会议论文集。美国:ACM;2015年出席:DH'15;2015年5月18 - 20日;佛罗伦萨,意大利43-50页。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  5. O'Dea B, Wan S, Batterham PJ, Calear AL, Paris C, Christensen h。互联网访谈2015年5月;2(2):183-188。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  6. 张建军,张建军,张建军,等。网络安全风险预测研究进展[j]。参见:欧洲语言跨语言评估论坛国际会议论文集。2017,提交于:CLEF'17;2017年9月11-14日;爱尔兰,都柏林,343-360页。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  7. 抑郁与语言使用研究的测试集。1 . Fuhr N, Quaresma P, gonalves T, Larsen B, Balog K, Macdonald C,等,编辑。实验IR满足多语言、多模态和交互。可汗:施普林格;2016:28-39。gydF4y2Ba
  8. 王晓东,王晓东,王晓东,等。基于数据的产后抑郁预测研究。参见:第17届ACM计算机支持的协同工作与社会计算会议论文集。美国:ACM;2014年出席:CSCW'14;2014年2月15日- 19日;马里兰州,巴尔的摩,美国,第626-638页。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  9. Guntuku SC, Yaden DB, Kern ML, Ungar LH, Eichstaedt JC。在社交媒体上检测抑郁症和精神疾病:一项综合综述。网络行为科学,2017(12);18:43-49。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  10. 李建军,李建军,李建军,李建军,李建军,李建军。利用Twitter数据预测精神疾病的发病和病程。科学通报2017;7(1):13006 [j]gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  11. 陈建军,李建军,李建军,李建军,李建军,李建军,李建军,李建军,李建军。第五届计算语言学与临床心理学研讨会论文集:从键盘到临床。:计算语言学协会;2018年发表于:CLPsych'18;2018年6月5日;新奥尔良,洛杉矶第25-36页。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  12. Chancellor S, Birnbaum M, Caine E, Silenzio V, De Choudhury M.从社交媒体推断心理健康状态的伦理紧张分类。见:《公平、问责和透明度会议论文集》。美国:ACM;2019年展会:FAT*'19;2019年1月29日至31日;GA,亚特兰大,美国第79-88页。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  13. Abboute A, Boudjeriou Y, Entringer G, az J, Bringay S, Poncelet P.挖掘Twitter预防自杀。自然语言在数据库/信息系统中的应用国际会议论文集。:斯普林格国际出版公司;2014年出席:NLDB'14;2014年6月18-20日;蒙彼利埃,法国第250-253页。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  14. Jashinsky J, Burton SH, Hanson CL, West J, Giraud-Carrier C, Barnes MD,等。在美国通过推特追踪自杀风险因素。2014年危机;35(1):51-59。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  15. zrikly A, Resnik P, Uzuner Ö, Hollingshead K. CLPsych 2019共享任务:预测Reddit帖子的自杀风险程度。第六届计算语言学与临床心理学研讨会论文集。:计算语言学协会;2019年演讲:CLPsych'19;2019年6月6日;明尼阿波利斯,明尼苏达州,第24-33页。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  16. 德乔杜里M,加蒙M,计数S,霍维茨E.社交媒体对抑郁症的预测。参见:第七届国际AAAI网络日志和社交媒体会议论文集。2013,提交于:ICWSM'13;2013年7月8-11日;波士顿,马萨诸塞州,第128-137页。gydF4y2Ba
  17. 李建军,李建军。社交媒体中自杀信息的识别。第9届国际语言资源与评价学术会议。2014,发表于:LREC'14;2014年5月26-31日;冰岛雷克雅未克,第830-835页。gydF4y2Ba
  18. [2]刘建军,刘建军,刘建军,等。推特上自杀行为的影响因素分析。计算机学报,2016(1);33(增刊1):1-3 [j]gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  19. 张建军,张建军。基于多视角的人格特征分析。参见:欧洲语言跨语言评估论坛国际会议论文集。2018,提交于:CLEF'18;2018年9月10日至14日;阿维尼翁,法国,第15-27页。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  20. 张建军,张建军,李建军,等。基于图像识别的社交网络自我伤害检测方法研究。社会科学计算机评论2019年3月18日。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  21. Reece AG, Danforth CM。Instagram上的照片揭示了抑郁症的预测标志。EPJ数据科学2017;6(1):15。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  22. Guntuku C, Preotiuc-Pietro D, Eichstaedt J, Ungar L.推特个人资料和发布的图片揭示了抑郁和焦虑。参见:2019年国际AAAI网络和社交媒体会议论文集。2019年在:ICWSM'19;2019年6月12日至14日;慕尼黑,德国,第236-246页。gydF4y2Ba
  23. Leis A, Ronzano F, Mayer MA, Furlong LI, Sanz F.西班牙语微博中的抑郁信号检测:行为和语言分析。[J]中国医学杂志,2019;27;21(6):e14199 [J]gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  24. 张建军,张建军,张建军,等。基于随机森林技术的抑郁症早期诊断研究。[J]医学互联网研究,2019,vol . 10;21(6):e12554 [J]gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  25. 季生,于春平,冯生,潘生,龙刚。基于监督学习的在线用户内容自杀意念检测。复杂性2018年9月9日;2018:1-10。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  26. hswy, Naslund JA, Brownstein JS, Hawkins JB。监测精神分裂症Twitter用户关于自杀的在线讨论:探索性研究。中华医学杂志2018年12月13日;5(4):e11483 [j]gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  27. Vioules MJ, Moulahi B, Aze J, Bringay S. Twitter数据流中自杀相关帖子的检测。计算机工程学报,2018;32(1):1-7。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  28. Reddit。自杀监视子reddit网址:gydF4y2Bahttps://www.reddit.com/r/SuicideWatch/gydF4y2Ba[2017-12-01]访问gydF4y2Ba
  29. 福勒JC。临床实践中的自杀风险评估:不完善评估的实用指南。心理治疗杂志2012年3月;49(1):81-90。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  30. Twitter开发者。实时tweet示例URL:gydF4y2Bahttps://developer.twitter.com/en/docs/tweets/sample-realtime/api-reference/get-statuses-samplegydF4y2Ba[2019-01-02]访问gydF4y2Ba
  31. Ramírez-Cifuentes D, Mayans M, Freire A.社交媒体对厌食症的早期风险检测。见:2018年国际互联网科学会议论文集。;2018年发表于:INSCI'18;2018年10月24日至26日;圣彼得堡,俄罗斯,第3-14页。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  32. Pedregosa F, Varoquaux G, Gramfort A, Michel V, Thirion B, Grisel O,等。Scikit-learn: Python中的机器学习。[J]中国科学:自然科学,2011;12 (2):825- 830 [J]gydF4y2Ba免费全文gydF4y2Ba]gydF4y2Ba
  33. Savand A. Python包索引。2014。2018.7.23 URL:gydF4y2Bahttps://pypi.org/project/stop-words/gydF4y2Ba[2019-03-05]访问gydF4y2Ba
  34. 刘建军,刘建军,刘建军,等。基于语义的深度LSTM情感分析。第11届语义评价国际研讨会论文集。2017,提交日期:SemEval'17;2017年8月3-4日;加拿大温哥华,第747-754页。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  35. 李建军,李建军,李建军,等。利用大量弱监督数据进行多语言情感分类。第26届国际互联网会议论文集。2017提交于:WWW'17;2017年4月3日- 7日;珀斯,澳大利亚,1045-1052页。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  36. Tausczik YR, Pennebaker JW。词的心理意义:LIWC与计算机文本分析方法。心理学报,2010;29(1):24-54。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  37. Ramírez-Esparza N, Pennebaker J, García F, suri R.词汇使用心理学:一个西班牙语文本分析的计算机引导程序。心理学杂志2007;24(1):85-99 [j]gydF4y2Ba免费全文gydF4y2Ba]gydF4y2Ba
  38. 霍夫曼E. GitHub。2018.senti-py URL:gydF4y2Bahttps://github.com/aylliote/senti-pygydF4y2Ba[2019-03-05]访问gydF4y2Ba
  39. Rodriguez P, Gonzàlez J, Gonfaus JM, Roca FX。整合社会网络中的视觉与语言,以识别人格特质的视觉模式。[J] .中国生物医学工程学报,2019;9(1):6-12。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  40. leun Y, Bottou L, Bengio Y, Haffner P.基于梯度学习的文档识别。电子工程学报(英文版);1998;36(11):2278-2324。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  41. 何凯,张翔,任松,孙杰。基于深度残差学习的图像识别。2016年IEEE计算机视觉与模式识别会议论文集,发表于:CVPR'16;2016年6月27日至30日;拉斯维加斯,内华达州[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  42. Krizhevsky A, Sutskever I, Hinton GE。基于深度卷积神经网络的ImageNet分类。通信ACM 2017年5月24日;60(6):84-90。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  43. 谢松,郭志强,郭志强,Dollár P,何凯。深度神经网络的残差变换。2017年IEEE计算机视觉与模式识别会议论文集,发表于:CVPR'17;2017年7月21日至26日;檀香山,HI . 1492-1500页。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  44. 李建军,李建军。随机梯度下降算法的研究进展。参见:2017年国际学习表征会议论文集。2017年发表于:ICLR'17;2017年4月24日- 26日;法国土伦gydF4y2Bahttps://openreview.net/pdf?id=Skq89ScxxgydF4y2Ba
  45. 金旸。基于卷积神经网络的句子分类。参见:2014年自然语言处理经验方法会议论文集。2014年发表于:EMNLP'14;2014年10月25-29日;卡塔尔多哈,1746-1751页。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  46. 张建军,张建军,张建军,等。基于Mann-Whitney统计检验的乳腺x线摄影诊断乳腺癌的研究进展。中华医学杂志,2015;63(1):19-31。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  47. [1]张志强,王志强,Calcagnì .一种基于重叠指数的样本间分布相似性测度方法。前沿心理杂志2019;10:10 . 89 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  48. 世界卫生组织,2019。世界上的自杀:全球健康估计gydF4y2Bahttps://www.who.int/publications-detail/suicide-in-the-worldgydF4y2Ba[2020-05-27]访问gydF4y2Ba
  49. 《伦理与自杀行为》。中华医学杂志,2001;30(4):369-382 [j]gydF4y2Ba免费全文gydF4y2Ba]gydF4y2Ba


‎gydF4y2Ba
API:gydF4y2Ba应用程序编程接口gydF4y2Ba
AUC:gydF4y2Ba面积下接收机工作特性gydF4y2Ba
AUC-ROC:gydF4y2Ba接收机工作特性曲线下的面积gydF4y2Ba
弓:gydF4y2Ba一袋话gydF4y2Ba
有线电视新闻网:gydF4y2Ba卷积神经网络gydF4y2Ba
DTTR:gydF4y2Ba日间推文比率gydF4y2Ba
LIWC:gydF4y2Ba语言探究与字数统计gydF4y2Ba
SNPSY:gydF4y2Ba社会网络和心理特征gydF4y2Ba
SPV:gydF4y2Ba短轮廓版gydF4y2Ba
pvc:gydF4y2Ba短轮廓版本分类器gydF4y2Ba
STTR:gydF4y2Ba睡眠时间推文比率gydF4y2Ba


G·艾森巴赫编辑;提交15.01.20;由M . Conway和D . Reidenberg进行同行评审;对作者13.02.20的评论;收到修订版本28.03.20;接受28.03.20;发表07.07.20gydF4y2Ba

版权gydF4y2Ba

©Diana Ramírez-Cifuentes, Ana Freire, Ricardo Baeza-Yates, Joaquim Puntí, Pilar Medina-Bravo, Diego Alejandro Velazquez, Josep Maria Gonfaus, Jordi Gonzàlez。原载于医学互联网研究杂志(//www.mybigtv.com), 07.07.2020。gydF4y2Ba

这是一篇在知识共享署名许可(https://creativecommons.org/licenses/by/4.0/)下发布的开放获取文章,该许可允许在任何媒介上不受限制地使用、分发和复制,前提是原始作品首次发表在《医学互联网研究杂志》上,并适当引用。必须包括完整的书目信息,到//www.mybigtv.com/上原始出版物的链接,以及版权和许可信息。gydF4y2Ba


Baidu
map