JMIRgydF4y2B一个 J医疗互联网服务gydF4y2B一个 医学互联网研究杂志gydF4y2B一个 1438 - 8871gydF4y2B一个 卡塔尔世界杯8强波胆分析 加拿大多伦多gydF4y2B一个 v22i11e15293gydF4y2B一个 33245287gydF4y2B一个 10.2196/15293gydF4y2B一个 原始论文gydF4y2B一个 原始论文gydF4y2B一个 阿片类药物使用者自杀倾向的检测:基于机器学习的方法gydF4y2B一个 EysenbachgydF4y2B一个 冈瑟gydF4y2B一个 杜gydF4y2B一个 景程之gydF4y2B一个 张gydF4y2B一个 LianglianggydF4y2B一个 LimgydF4y2B一个 吉尔伯特gydF4y2B一个 姚gydF4y2B一个 汉娜gydF4y2B一个 MScgydF4y2B一个 1gydF4y2B一个 https://orcid.org/0000-0002-4424-5451gydF4y2B一个 RashidiangydF4y2B一个 新浪gydF4y2B一个 MScgydF4y2B一个 1gydF4y2B一个 https://orcid.org/0000-0003-1210-2939gydF4y2B一个 越南盾gydF4y2B一个 鑫gydF4y2B一个 MScgydF4y2B一个 1gydF4y2B一个 https://orcid.org/0000-0002-0125-3419gydF4y2B一个 DuanmugydF4y2B一个 弘益gydF4y2B一个 二元同步通信gydF4y2B一个 1gydF4y2B一个 https://orcid.org/0000-0002-5707-0515gydF4y2B一个 罗森塔尔gydF4y2B一个 理查德·NgydF4y2B一个 医学博士gydF4y2B一个 2gydF4y2B一个 https://orcid.org/0000-0002-6011-809XgydF4y2B一个 王gydF4y2B一个 一位曾经担任科技部高级官员gydF4y2B一个 博士学位gydF4y2B一个 1gydF4y2B一个
石溪大学gydF4y2B一个 计算机科学gydF4y2B一个 纽约州斯托尼布鲁克,11794年gydF4y2B一个 美国gydF4y2B一个 1 631 632 2594gydF4y2B一个 fusheng.wang@stonybrook.edugydF4y2B一个
https://orcid.org/0000-0002-9369-9361gydF4y2B一个
石溪大学gydF4y2B一个 纽约石溪gydF4y2B一个 美国gydF4y2B一个 石溪大学复兴医学院gydF4y2B一个 纽约石溪gydF4y2B一个 美国gydF4y2B一个 通讯作者:王福生gydF4y2B一个 fusheng.wang@stonybrook.edugydF4y2B一个 11gydF4y2B一个 2020gydF4y2B一个 27gydF4y2B一个 11gydF4y2B一个 2020gydF4y2B一个 22gydF4y2B一个 11gydF4y2B一个 e15293gydF4y2B一个 28gydF4y2B一个 6gydF4y2B一个 2019gydF4y2B一个 18gydF4y2B一个 12gydF4y2B一个 2019gydF4y2B一个 14gydF4y2B一个 6gydF4y2B一个 2020gydF4y2B一个 15gydF4y2B一个 9gydF4y2B一个 2020gydF4y2B一个 ©Hannah Yao, Sina Rashidian, Dong Xinyu, Hongyi端木,Richard N Rosenthal,王福生。最初发表于《医疗互联网研究杂志》(//www.mybigtv.com), 2020年11月27日。gydF4y2B一个 2020gydF4y2B一个

这是一篇开放获取的文章,根据创作共用署名许可(https://creativecommons.org/licenses/by/4.0/)的条款发布,允许在任何媒介上无限制地使用、分发和复制,前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。gydF4y2B一个

背景gydF4y2B一个

近年来,自杀率和吸毒过量率都在上升。许多与阿片类药物使用障碍作斗争的人容易产生自杀意念;这通常会导致用药过量。然而,这些致命的过量服用很难归类为有意或无意。故意过量服用很难被发现,部分原因是缺乏预测因素和社会污名,导致个人不愿寻求帮助。这些人可能会转而使用网络手段来表达他们的担忧。gydF4y2B一个

客观的gydF4y2B一个

这项研究旨在利用机器学习方法提取Reddit上阿片类药物使用者的自杀帖子。模型的性能是数据纯度的衍生品,结果将帮助我们更好地理解这些用户的基本原理,为阿片类药物流行的一部分提供新的见解。gydF4y2B一个

方法gydF4y2B一个

2017年6月至2018年6月间Reddit上的帖子收集自gydF4y2B一个 r / suicidewatchgydF4y2B一个,gydF4y2B一个 r /抑郁gydF4y2B一个,一组阿片类相关的reddit子版块,以及一组对照子版块。我们首先对自杀语言和非自杀语言进行了分类,然后对使用阿片类药物的用户和不使用阿片类药物的用户进行了分类。使用子reddit名称作为标签和语义输入的组合,训练了几种传统的基线和神经网络文本分类器。然后,我们试图提取属于自杀意念和阿片类药物滥用交集的样本外数据。使用Amazon Mechanical Turk为样本外数据提供标签。gydF4y2B一个

结果gydF4y2B一个

对于至少一种输入组合,所有模型的分类结果至少为90%;卷积神经网络是最优的分类器gydF4y2B一个 FgydF4y2B一个1gydF4y2B一个得分96.6%。在预测包含自杀意念和阿片类药物成瘾迹象的帖子的样本外数据时,神经网络分类器产生了更多的假阳性,而传统方法产生了更多的假阴性,这对于预测自杀情绪不太理想。gydF4y2B一个

结论gydF4y2B一个

阿片类药物滥用与意外过量和自杀风险有关。像Reddit这样的社交媒体平台包含元数据,可以帮助机器学习,并提供个人层面上无法从其他地方获得的信息。我们证明了使用神经网络作为工具来预测样本外目标是可能的,该模型是由我们希望在样本外目标中区分的特征标记的数据集构建的。gydF4y2B一个

阿片类药物流行病gydF4y2B一个 opioid-related障碍gydF4y2B一个 自杀gydF4y2B一个 社交媒体gydF4y2B一个 机器学习gydF4y2B一个 深度学习gydF4y2B一个 自然语言处理gydF4y2B一个
简介gydF4y2B一个 背景gydF4y2B一个

目前阿片类药物危机的特点是,阿片类药物过量导致的死亡人数不断增加;这一数字增长到如此程度,以至于2017年美国卫生与公众服务部宣布进入公共卫生紧急状态[gydF4y2B一个 1gydF4y2B一个].2016年,美国疾病控制和预防中心报告称,阿片类药物过量导致4.2万人死亡,包括处方和非处方阿片类药物,包括故意(自杀)和意外(意外)死亡[gydF4y2B一个 2gydF4y2B一个].自2008年以来,自杀一直是美国第十大死亡原因。2016年,自杀成为10至34岁人群死亡的第二大原因[gydF4y2B一个 3.gydF4y2B一个].美国自杀预防基金会估计,每年有44,965名美国人死于自杀,每发生一起自杀,就有25人企图自杀。由于与自杀有关的耻辱,这些数字可能被低估了。gydF4y2B一个 4gydF4y2B一个].gydF4y2B一个

动机gydF4y2B一个

患有慢性疼痛和精神健康状况不佳的人往往有自杀的风险;然而,目前大多数阿片类药物过量预防方法既没有评估自杀风险,也没有根据个人情况量身定制预防方法[gydF4y2B一个 2gydF4y2B一个,gydF4y2B一个 5gydF4y2B一个,gydF4y2B一个 6gydF4y2B一个].进一步阻碍自杀筛查的实施是缺乏有关过量死亡的可用数据,通常被归类为gydF4y2B一个 待定gydF4y2B一个因为无法证实死亡是自杀。例如,如果发现死者身边有一支注射器,则很难确定这是故意致命剂量还是意外死亡(并且没有过量服用的意图),因为注射给药的途径很危险[gydF4y2B一个 6gydF4y2B一个].gydF4y2B一个

阿片类药物使用障碍(OUD)的个体由于疾病的性质是过量的候选人。这项研究特别关注自杀意念或意图的个人与高可能性的OUD或至少阿片类药物滥用。《精神障碍诊断与统计手册》将OUD定义为导致临床显著损害或痛苦的阿片类药物使用问题模式[gydF4y2B一个 7gydF4y2B一个];约有250多万人受OUD影响[gydF4y2B一个 8gydF4y2B一个].诊断标准包括长时间服用大量阿片类药物,控制阿片类药物使用的努力不成功,在阿片类药物相关活动或恢复所需的活动中投入大量时间,日常生活功能受损,尽管知道后果仍继续使用,剂量耐受性,以及不可避免的戒断[gydF4y2B一个 7gydF4y2B一个].gydF4y2B一个

的gydF4y2B一个 新英格兰医学杂志gydF4y2B一个提出了反复暴露于成瘾诱导的使用和戒断周期以及情绪波动的OUD患者的自杀意图是模糊的[gydF4y2B一个 2gydF4y2B一个].最终,这种长时间的接触会导致对危险和冲动行为的脱敏,从而导致死亡。虽然个人意识到后果,但相应的重量是静音的,没有相关的有意识的自杀意图[gydF4y2B一个 9gydF4y2B一个].这方面的OUD可导致阿片类药物过量死亡,但可能没有明确考虑其对过量的贡献。即使在没有OUD的情况下,经历严重抑郁发作、自杀意念或其他使用和精神障碍的人也可能滥用阿片类药物,这表明阿片类药物滥用和精神病理状况是自我延续和循环的行为[gydF4y2B一个 10gydF4y2B一个].gydF4y2B一个

自杀风险的相关预测因素包括慢性疼痛伴抑郁[gydF4y2B一个 11gydF4y2B一个,gydF4y2B一个 12gydF4y2B一个].有抑郁症史的个体也有较高的平均每日剂量,并且更坚持长期阿片类药物治疗慢性疼痛[gydF4y2B一个 12gydF4y2B一个],这是OUD的特征。慢性疼痛和抑郁也可能导致自杀念头,即使是在原本健康的个体中[gydF4y2B一个 13gydF4y2B一个],被动和主动自杀意念都与精神疾病、以前的自杀企图和慢性疼痛有关[gydF4y2B一个 11gydF4y2B一个,gydF4y2B一个 13gydF4y2B一个].一些人认为,阿片类药物滥用主要表现为一种应对身体和精神疼痛的适应不良策略,而不仅仅是生物学上的[gydF4y2B一个 14gydF4y2B一个,gydF4y2B一个 15gydF4y2B一个].然后,即使没有有意识的自杀意图,心理健康状况不佳会导致服用阿片类药物的个体采取“我不介意死”的心态,他们的行为会变得更加鲁莽,导致服用过量的可能性更高。鉴于这些相关性,认真考虑阿片类药物使用者的自杀风险并不是不合理的。gydF4y2B一个

那些经历过归属受挫的OUD患者可能不愿意与现实生活中的人讨论他们的担忧,因为社会耻辱[gydF4y2B一个 16gydF4y2B一个].相反,他们可能会转向基于网络的讨论方式,与那些比卫生专业人员更有可能了解他们的人联系并寻求他们的支持[gydF4y2B一个 17gydF4y2B一个].大多数基于社交媒体的阿片类药物研究都是在Twitter上进行的。然而,Twitter被限制在280个字符,这可能无法为努力奋斗的个人提供足够的空间来彻底表达自己,而且由于缺乏监控和主题的混杂,它可能会非常嘈杂[gydF4y2B一个 18gydF4y2B一个-gydF4y2B一个 22gydF4y2B一个].gydF4y2B一个

相比之下,Reddit是一个基于论坛的社交媒体平台,可以讨论许多话题。每个主题都有自己的主题gydF4y2B一个 subredditgydF4y2B一个对于特定主题的内容,文本帖子的字符限制为40,000个。用户可以直接与原始帖子互动,也可以通过在原始帖子下方评论与其他用户互动。根据Reddit的统计页面,它目前是美国访问量第五大的网站,每月有超过3.3亿的活跃用户和13.8万个活跃社区[gydF4y2B一个 23gydF4y2B一个].在无法获得线下支持的情况下,人们越来越多地使用心理健康版块作为一种基于网络的支持手段。由于Reddit还提供了现实生活中无法提供的匿名功能,因此围绕耻辱性话题的自我披露越来越多。gydF4y2B一个 24gydF4y2B一个-gydF4y2B一个 26gydF4y2B一个].此外,由于reddits是特定类别的,挣扎的个人可以从那些有共同经历的人那里得到支持和理解,他们可以在评论中提供治疗因素(例如,为阿片类药物恢复或戒断的人注入希望和利他主义)[gydF4y2B一个 27gydF4y2B一个].gydF4y2B一个

我们认为自杀行为的人际心理学理论是检验自杀与OUD之间联系的动机[gydF4y2B一个 28gydF4y2B一个].简而言之,这个理论指出,一个人不会死于自杀,除非他们既有自杀的愿望,也有按照这种愿望行动的能力。根据该理论,自杀欲望源于个人的负担感和受阻的归属感(社会疏离感),并伴随着自杀的能力,这种能力是由反复暴露在痛苦和愤怒中发展而来的[gydF4y2B一个 9gydF4y2B一个].在OUD患者身上,受挫的归属感表现为内敛的折磨,他们经常破坏关系或感觉自己永远被贴上了标签gydF4y2B一个 一个瘾君子gydF4y2B一个被社会所蒙蔽,无法从周围的人那里得到理解。自杀的能力是通过积极参与类似自杀的行为而获得的,并且需要麻木固有的自我保护意识[gydF4y2B一个 28gydF4y2B一个].这适用于那些患有OUD的人,他们中的许多人都亲身经历过过量服用,或者目睹过他们的朋友因过量服用而去世,因此随着时间的推移变得脱敏。gydF4y2B一个

目标gydF4y2B一个

据我们所知,自杀和OUD的交集还没有以数据驱动的方式用机器学习方法进行分析,尽管这两个领域已经分别进行了检查,并在临床上进行了研究。我们试图结合使用子reddit和机器学习方法对样本内数据进行分类,然后对样本外数据进行预测,以检测OUD背景下的自杀意念。gydF4y2B一个

在这项研究中,我们(1)利用子reddits的结构和性质来训练分类器,目的是提取包含OUD和自杀意念的帖子,(2)比较分类的输入和模型,(3)旨在从阿片类药物环境中提取自杀风险帖子,从自杀环境中提取阿片类药物成瘾,其中gydF4y2B一个 上下文gydF4y2B一个指数据集所属的subreddit。我们还要求亚马逊土耳其机械公司(MTURK)的非专业人员对帖子样本进行注释,以获得一篇帖子是否表明有自杀想法和阿片类药物成瘾的标签。gydF4y2B一个

相关工作gydF4y2B一个

利用Reddit提供大量文本数据的能力进行社交媒体研究已经变得流行起来。其中许多关注当前的心理健康问题,如抑郁和焦虑,并试图分析帖子内容的语言特征,并采用传统方法,如N-grams,潜在狄利克雷分配主题建模,语言查询和字数统计,术语频率逆文档频率(TF-IDF)和词嵌入来提取和分析Reddit用户的情绪和精神状态[gydF4y2B一个 25gydF4y2B一个,gydF4y2B一个 27gydF4y2B一个,gydF4y2B一个 29gydF4y2B一个-gydF4y2B一个 31gydF4y2B一个].gydF4y2B一个

红迪网的子版块r/suicidewatch和r/opiates分别围绕着自杀的话题(例如,关于自杀的讨论,情况披露,情绪表达等)和阿片类药物的使用(例如,药物剂量,高剂量时的活动,戒断痛苦等)。通过对特定reddit子版块的分析,我们可以通过他们使用语言来了解reddit子版块用户的一般心态。例如,Park等人[gydF4y2B一个 29gydF4y2B一个]显示,心理健康版块和非心理健康版块的句子在结构上存在显著差异。他们揭示了Reddit的r/suicidewatch和Reddit一般心理健康版块在可读性指数上的差异,并显示第一人称单数代词的使用增加,而第一人称复数、第二人称和第三人称代词的使用减少[gydF4y2B一个 29gydF4y2B一个].库马尔等[gydF4y2B一个 32gydF4y2B一个]对r/suicidewatch进行了一项调查,以测试维特效应,特别是在备受瞩目的自杀事件发生后,发现负面情绪、愤怒、自残和自杀言论增加。他们同样报告说,第一人称单数代词的使用增加了,词汇多样性减少了,帖子变长了,面向未来的单词变少了,面向过去的单词变多了。gydF4y2B一个 32gydF4y2B一个].r/suicidewatch的另一项分析提取了反复出现的讨论主题,然后将结果与领域专家定义的自杀风险因素进行了比较;研究发现,r/suicidewatch能够捕捉到不太为人所知的风险因素的维度,如对学业失败、拥有枪支、滥用毒品、财务问题、已故朋友和家庭虐待的担忧[gydF4y2B一个 33gydF4y2B一个].对r/阿片类药物的分析产生了讨论的主要主题和特征,特别是对于阿片类药物使用者,例如阿片类药物戒断和阿片类药物摄入常规[gydF4y2B一个 34gydF4y2B一个].gydF4y2B一个

这些来自r/suicidewatch的发现支持了对那些试图或完成自杀的人留下的现实生活作品的分析结果。特别是,一项对自杀诗人和非自杀诗人诗歌用词的研究发现,第一人称单数代词和交际用语(如:gydF4y2B一个 说话gydF4y2B一个),而一项针对自杀完成者的语言研究表明,与对照组相比,这些人在时间取向上存在差异[gydF4y2B一个 35gydF4y2B一个,gydF4y2B一个 36gydF4y2B一个].这个想法gydF4y2B一个 异化gydF4y2B一个自杀的人际关系理论支持第一人称代词使用增加的发现——当一个人无法与社会联系时,第一人称复数的出现gydF4y2B一个 我们gydF4y2B一个换句话说,相互作用减少了gydF4y2B一个 28gydF4y2B一个,gydF4y2B一个 37gydF4y2B一个].gydF4y2B一个

神经网络已被证明在自然语言处理中取得了优异的效果。与传统方法不同,gydF4y2B一个 从头开始学习文本gydF4y2B一个在文字或措辞层面上,不需要了解情感;高级目标可作为输入[gydF4y2B一个 38gydF4y2B一个,gydF4y2B一个 39gydF4y2B一个].这在这种情况下尤其有价值,因为与毒品有关的词汇通常是俚语,而与兴奋或陶醉有关的表达可能会被错误地归类为消极的,因为它们不是由于情感词汇无法学习领域特异性。gydF4y2B一个 40gydF4y2B一个].此外,不需要穷尽特征工程,因为权重可以学习[gydF4y2B一个 41gydF4y2B一个].gydF4y2B一个

金允[gydF4y2B一个 42gydF4y2B一个]展示了简单卷积神经网络(CNN)在多数据集句子分类中的1层卷积能力,发现简单CNN的性能与传统方法相当[gydF4y2B一个 42gydF4y2B一个].Orabi等[gydF4y2B一个 43gydF4y2B一个)使用CNN和循环神经网络(RNN)对推特数据进行抑郁预测,结果表明CNN比RNN表现更好。庄臣及张[gydF4y2B一个 44gydF4y2B一个]成功地使用单词序列与CNN对文档进行分类,而Kim和Orabi只对短的句子长度的文本进行分类[gydF4y2B一个 44gydF4y2B一个].辛格等[gydF4y2B一个 45gydF4y2B一个]比较了nn,发现CNN在速度和准确性方面表现最好。因此,为了提高速度和性能,我们使用了简单的CNN架构。gydF4y2B一个

方法gydF4y2B一个 数据收集gydF4y2B一个

本研究中使用的社交媒体平台是Reddit。我们关注了reddit版块r/suicidewatch和r/depression和阿片类药物相关论坛;同时,一个对照组被用来模拟健康、正常的语言。reddit的subreddit r/suicidewatch充当了一个gydF4y2B一个 底网gydF4y2B一个,这样,如果用户表示有自杀倾向,他们通常会被引导到r/suicidewatch寻求帮助。reddit版块有政策禁止恶意攻击和阻止激进主义(例如,反复发布热线),支持直接的同行支持,这使这个论坛具有可信度[gydF4y2B一个 46gydF4y2B一个].抑郁在令人生畏方面是相似的gydF4y2B一个 空的鼓励gydF4y2B一个(即gydF4y2B一个 别担心,会好起来的gydF4y2B一个).这些特点说明了这些讨论区的严肃性,并证实了数据的可靠性。然而,与这些看板不同的是,r/joke几乎没有规则,只是规定不得进行人身攻击,并声明讨论必须轻松愉快,彬彬有礼;同时,r/showerthoughts只是要求原创内容。阿片类药物相关论坛上的帖子被认为是那些与阿片类药物滥用作斗争并在网络上寻求理解的人的代表;我们的假设是基于这样一个事实,即在社交媒体上发布阿片类药物的行为表明,这些药物在一个人的生活中占据了足够的主导地位。如果论坛相对活跃,并且论坛的焦点药物经常在reddit最活跃的阿片类药物版块r/opiates中讨论,则选择所有与阿片类药物相关的论坛。数据是从Reddit上使用pushshift收集的。io Python应用程序编程接口[gydF4y2Ba 47gydF4y2B一个]和Reddit的Python Reddit API包装器(PRAW) [gydF4y2B一个 48gydF4y2B一个].2017年6月至2018年6月期间提交的id是通过推送shift获得的。然后传递给PRAW, PRAW检索实际提交。提交由ID、作者、标题和主体文本/内容组成。gydF4y2B一个

我们使用来自r/suicidewatch的帖子来表示自杀语言,并使用与阿片类药物相关的reddits集合来建模阿片类药物使用者的语言(在本研究中称为r/opiates或gydF4y2B一个 鸦片的数据gydF4y2B一个).我们假设来自r/suicidewatch的所有帖子都有自杀倾向,并且r/depression的语言与r/suicidewatch的语言最相似[gydF4y2B一个 49gydF4y2B一个].基于Shen等人的一项研究,几个对照子reddit被用于语言比较[gydF4y2B一个 50gydF4y2B一个来检测Reddit上的焦虑,这意味着看板本身也可以被用作标签。这组不同的看板旨在抵消在表达负面情绪和特定主题词汇时常见的过度使用第一人称代词的影响[gydF4y2B一个 51gydF4y2B一个,gydF4y2B一个 52gydF4y2B一个].我们假设这些控制版块的大部分帖子都是gydF4y2B一个 心理健康gydF4y2B一个,这意味着帖子内容(对用户本身只字未提)并不能反映抑郁症和自杀意念等精神障碍。除了从Shen等人使用的看板中选择的看板外[gydF4y2B一个 50gydF4y2B一个],我们包括r/careerguidance和r/personalfinance,以解释r/suicidewatch中可能经历的财务压力源,我们包括r/offmychest,以解释阿片类药物使用者潜在的更粗暴和更亵渎的语言,这表明强烈的负面情绪,但不太可能表明自杀倾向。某些特定reddit子版块的帖子示例显示在gydF4y2B一个 表1gydF4y2B一个,数据组及其子版块列表如下:gydF4y2B一个

抑郁症gydF4y2B一个:抑郁症。gydF4y2B一个

SuicidewatchgydF4y2B一个: suicidewatch。gydF4y2B一个

控制gydF4y2B一个: askdocs, askscience,书籍,职业指导,健身,节俭,笑话,生活提示,offmychest,育儿,个人财务,生产力,随机善良,人际关系,淋浴的想法,零售故事,reddit的理论,健康的文章,写作,你应该知道。gydF4y2B一个

鸦片gydF4y2B一个苯二氮平类药物,苯并康复,海洛因,美沙酮,阿片类药物,阿片类药物康复,戒掉克拉托姆,亚博酮。gydF4y2B一个

来自属于数据组的reddit子版块的示例帖子。gydF4y2B一个

Subreddit集团gydF4y2B一个 标题gydF4y2B一个 正文gydF4y2B一个
控制gydF4y2B一个(r / showerthoughts)gydF4y2B一个 随着年龄的增长,人们越来越不能接受在公共场合哭泣,尽管这样做的理由越来越合理gydF4y2B一个 孩子们就是不明白gydF4y2B一个
阿片类药物相关的gydF4y2B一个(r /鸦片)gydF4y2B一个 幸福就是生病一周后,来一针海洛因。<3gydF4y2B一个 你也要知道,你的钱不仅够第二天早上用,而且至少还够你再花几天来想接下来要做什么!gydF4y2B一个
抑郁症gydF4y2B一个 我不会自杀,但我不介意死gydF4y2B一个 有这么多乱七八糟的事。我觉得我没有让我在乎的人感到骄傲,他们跟我说话的唯一原因是出于同情。我不会结束自己的生命,但如果一辆车撞了我,我就得了绝症,或者有什么东西砸到我。我不会因为离开而难过gydF4y2B一个
SuicideWatchgydF4y2B一个 我在等待结束自己生命的勇气gydF4y2B一个 我觉得我很快就会做出认真的尝试,我对此很满意。在过去的几个月里,我的冲动行为变得更糟了,其中一些方式包括伤害身体。9月,我冲动地从一个朋友的窗户里跳了下去,伤了自己,现在我多年来第一次随意割伤自己。我周围的人都不知道每天穿着自己的皮肤醒来有多累。在我自己的脑子里。我受够了胃痛,内疚,哭泣和失望。有些夜晚,我只祈祷我能有勇气结束这一切。世界各地的人都死了,我什么时候走都无所谓gydF4y2Ba
特征矩阵构造gydF4y2B一个

我们保持了语言的高级结构,只去掉了小写字母和url [gydF4y2B一个 42gydF4y2B一个].文本没有词源化,所有的停顿词和脏话都被保留了下来。除了句号、逗号、感叹号、问号和撇号外,所有标点符号都被删除了。我们试图利用词序来进行文本分类[gydF4y2B一个 44gydF4y2B一个].由于一篇文章的标题可以很好地代表文章的内容,所以每篇文章的标题都加在正文之前。标题和正文内容的结合构成神经网络输入。所有的帖子要么是零填充,要么被截断为1500字的长度,因为我们希望尽可能使用整篇文章。每个帖子(标题+正文文本)都经过预处理、标记化和编码,保留单词序列,因此表示为单词向量。我们还只使用超过1000字的帖子重新进行分类,以表明不同的内容长度不会影响性能。gydF4y2B一个 文本框1gydF4y2B一个显示每个文本处理阶段的示例。gydF4y2B一个

文本处理阶段的示例。gydF4y2B一个

未加工的文本gydF4y2B一个

的问题。什么非处方药对过量用药最有效?我受够了日复一日的苦差事。我是生活中的失败者,准备离开……gydF4y2B一个

处理文本gydF4y2B一个

的问题。最好的非处方药是什么?我受够了日复一日的苦差事。我是生活中的失败者,准备离开了…gydF4y2B一个

标记化的gydF4y2B一个

|问题|。|什么是| |最好| otc |医疗|到| od | | ?|我是|所以|比| |天|到|天|磨|。|我|一个|失败|在|生活|和|准备|到|检查|出|。|。|。|gydF4y2Ba

由于连续文本数据不能用于训练机器学习模型,有几种技术可以将这些数据转换为数值:gydF4y2B一个

TF-IDF:术语频率逆文档频率表示文档中某个单词相对于其在其他文档中的频率有多重要。我们使用100维TF-IDF从样本中的uniggram和biggram [gydF4y2B一个 53gydF4y2B一个].gydF4y2B一个

词嵌入:这是一组用于将文本数据转换为向量空间的方法和语言模型。我们利用了3种方法,包括Gensim Word2Vec模型用于单词表示的全局向量(GloVe),它要求在大量数据的基础上预先训练嵌入,以及一个更简单的单词到ID映射版本,这在运行时执行[gydF4y2B一个 54gydF4y2B一个,gydF4y2B一个 55gydF4y2B一个].gydF4y2B一个

字符嵌入:由于字典之外的单词都在预训练的单词嵌入中映射到随机向量,或者俚语中最轻微的变化最终都可能将单词映射到不同的向量,添加字符嵌入也显示出对训练机器学习模型的改进。gydF4y2B一个

在本研究中,我们利用这些知识表示方法的不同组合来评估分类性能是否通过减轻词汇量问题来改善额外信息。gydF4y2B一个 多媒体附件1gydF4y2B一个显示组合的完整列表。gydF4y2B一个

模型gydF4y2B一个

我们主要关注的是CNN文本分类器。此外,我们实现了几个传统和深度学习模型作为CNN的基线。详情如下。gydF4y2B一个

经典的基线gydF4y2B一个

我们采用了知名的传统机器学习方法作为基线,包括逻辑回归(LR)、随机森林(RF)和支持向量机(svm)。实现使用Python语言,并基于scikit-learn工具包[gydF4y2B一个 53gydF4y2B一个].gydF4y2B一个

神经网络基线gydF4y2B一个

我们实现了FastText (FAST), RNN和基于注意力的双向RNN (ATTENTION)在他们的原始架构中进行比较[gydF4y2B一个 56gydF4y2B一个-gydF4y2B一个 58gydF4y2B一个].FAST使用浅神经网络和由n-grams袋构造的词表示,这些词表示被平均为文本表示并输入到线性分类器。RNN考虑历史信息,并允许将以前的输出作为输入重用,从而跨时间共享权重。ATTENTION建立在RNN的基础上,通过引入能力gydF4y2B一个 参加gydF4y2B一个具体的子输入,而不是所有可用的信息,从而改善每一步的决策。gydF4y2B一个

CNN模型gydF4y2B一个

我们基于Kim Yoon的CNN架构实现了一个CNN,并使用Python中的Keras NN库[gydF4y2B一个 59gydF4y2B一个].这个实现与Kim的实现之间的主要区别是使用了随机初始化而不是word2vec,因为两者执行相同,使用了最大池化而不是全局池化,使用了3和8的过滤器大小而不是3、4和5。8的过滤器大小被证明对较长的文档更有效,并且可以一次滑过8个单词的窗口大小[gydF4y2B一个 60gydF4y2B一个].每个卷积层后面的激活层是校正线性单元,f(x)=max(0,x),它在输入和特征映射之间映射非负。在将附加信息、领域知识特征和character2vec (char2vec)集成到原始CNN系统方面,我们简单地使用了拼接。由于char2vec特征矩阵与词嵌入特征大小相同,逻辑意义相似,我们将它们在主卷积部分之前拼接在一起。领域知识特征是一个表示从语言学角度提取的信息的大向量,在最终的全连通层部分之前进行拼接。我们使用的批处理大小为512,epoch计数为6,嵌入层是在训练时学习的。嵌入层的降差为0.5以防止过拟合,尺寸大小为100。损失用交叉熵计算。gydF4y2Ba 图1gydF4y2B一个展示了我们的CNN架构。gydF4y2B一个

卷积神经网络体系结构概述。gydF4y2B一个

分类与预测gydF4y2B一个

我们的假设是从直觉的角度出发的。我们考虑了两种情况:(1)在阿片类药物数据集中存在自杀情绪的帖子,(2)在自杀观察数据集中存在阿片类药物成瘾的帖子。我们试图提取包含自杀情绪和阿片类药物滥用的帖子。这两种情况被称为gydF4y2B一个 C1gydF4y2B一个而且gydF4y2B一个 C2gydF4y2B一个并由它们各自的模型表示。gydF4y2B一个

案例1 (C1)是一个模型,它将使用来自r/suicidewatch和控制子reddits的积极语言的数据进行训练,它将学习区分自杀语言和积极语言。由于r/阿片类药物包含复杂的情绪,如果我们将r/阿片类药物的样本外数据输入C1,那么C1应该能够在自杀风险帖子和非自杀风险帖子之间进行分类。来自r/阿片类药物的帖子被归类为gydF4y2B一个 自杀gydF4y2B一个就会同时包含自杀倾向和自杀倾向。此外,我们对预测为的岗位质量进行了粗略的评估gydF4y2B一个 自杀gydF4y2B一个从预测中构造一个词。gydF4y2B一个

案例2 (C2)是一个基于r/抑郁症和r/阿片类药物数据训练的模型。reddit上的r/depression和可用的r/suicidewatch最相似。C2将学会区分含有吸毒成瘾和没有吸毒成瘾的帖子。如果我们将r/suicidewatch中的样本外数据输入C2,那么C2应该能够在含有阿片类药物使用和非阿片类药物使用的帖子之间进行分类。来自r/suicidewatch的帖子被归类为使用阿片类药物,将同时包含自杀性和OUD方面。gydF4y2B一个

为了分类,数据集以8:2的比例进行训练和测试。训练数据再次以8:2的比例进行分割,用于训练和训练验证。为了评估预测能力,我们从r/opiates和r/suicidewatch中分别抽取了500个帖子进行注释。为了加强样本质量的下限并减少帖子之间的差异,我们只从30到500字的帖子中进行抽样。由于类别平衡是在500个样本中考虑的问题,如果其中包含感兴趣的关键字或关键短语,则500个帖子中最多选择250个。因此,在整个数据集上使用8:2的训练/测试分割进行样本内测试,然后从属于测试分割的20%的帖子中提取500个样本进行样本外测试。gydF4y2B一个 表2gydF4y2B一个总结了C1和C2程序,并在gydF4y2B一个 多媒体附件2gydF4y2B一个,它演示了C1的工作流。gydF4y2B一个

两种情况下的两种模型的总结。gydF4y2B一个

情况下gydF4y2B一个 C1gydF4y2B一个 C2gydF4y2B一个
培训和分类gydF4y2B一个
目标gydF4y2B一个 区分自杀式语言和非自杀式语言;预测阿片类药物使用者的自杀倾向gydF4y2B一个 区分阿片类药物使用和抑郁但非阿片类药物使用的语言;预测自杀倾向人群中阿片类药物的使用情况gydF4y2B一个
数据集gydF4y2B一个 来自r/suicidewatch和control版块的51366条帖子gydF4y2B一个 来自阿片类药物相关版块和r/depression的帖子有59,940个gydF4y2B一个
词汇量的大小gydF4y2B一个 70082年gydF4y2B一个 64078年gydF4y2B一个
培训gydF4y2B一个 在r/suicidewatch和control子reddits的数据上进行训练和验证gydF4y2B一个 训练和验证来自阿片类相关reddit和r/抑郁症的数据gydF4y2B一个
样本外数据预测gydF4y2B一个
预计在gydF4y2B一个 数据来自r/opiatesgydF4y2B一个 数据来自r/suicidewatchgydF4y2B一个
预测目标gydF4y2B一个 预测含有自杀风险的帖子在r/鸦片gydF4y2B一个 在r/suicidewatch中预测含有阿片类药物滥用的帖子gydF4y2B一个
30 - 500字的帖子预测数据总数gydF4y2B一个 来自r/opiates的23,740个帖子gydF4y2B一个 来自r/suicidewatch的21719个帖子gydF4y2B一个
从包含这些关键字的MTURK预测数据中抽取最大250个样本gydF4y2B一个一个gydF4y2B一个 自杀,自杀,自杀,自杀,想死,想做,想吸毒过量gydF4y2B一个 苯二氮平类,苯并类,可卡因,可待因,芬太尼,海洛因,氢可定,氢可酮,氢吗啡酮,氢吗啡酮,氢吗啡酮,克瑞托姆,美沙酮,吗啡,麻醉品,麻醉品,阿片类药物,阿片类药物,羟考酮,奥施康定,oxycotin, oxycotton, oxymorphone, subboxonegydF4y2B一个
包含关键字的样本计数gydF4y2B一个 234gydF4y2B一个 231gydF4y2B一个

一个gydF4y2B一个MTURK:亚马逊土耳其机器人。gydF4y2B一个

亚马逊土耳其机器人的注释gydF4y2B一个

样本帖子由MTURK的众包工作人员注释[gydF4y2B一个 61gydF4y2B一个].每个帖子由3名工作人员标注,最后的标签由多数决定。gydF4y2B一个

对于C1, MTURK任务的标题是“自杀情绪检测”。描述是“使用者可能有自杀或故意服用过量的风险?”,有两个选项:“有,有自杀风险”和“没有自杀风险”。包含任务关键字gydF4y2B一个 抑郁,药物滥用,药物,精神,精神健康,鸦片,过量,自杀,自杀意念,自杀监视,gydF4y2B一个和文本。符合条件的MTURK员工必须拥有硕士学位,每个注释可获得0.04美元的奖励。我们不要求其他资格。假设一般人缺乏心理健康和药物滥用的经验[gydF4y2B一个 62gydF4y2B一个],我们定义了r/阿片类药物的常见俚语(例如PAWS代表急性后戒断综合征),并基于此提供了简单的说明gydF4y2B一个 自杀的线索gydF4y2B一个作者Edwin Shneidman,他是美国自杀学协会的创始人,并在该领域打下了基础[gydF4y2B一个 63gydF4y2B一个].gydF4y2B一个

对于C2, MTURK任务的标题是“有自杀倾向的人中的阿片类药物成瘾”。描述是“这篇文章暗示了阿片类药物成瘾吗?”有两个选项:“是,意味着阿片类药物成瘾”和“没有阿片类药物成瘾”。任务关键字和资质与C1 MTURK任务相同。我们在说明书中提供了阿片类药物的名称列表。gydF4y2B一个

结果gydF4y2B一个 模型的比较和特征矩阵的影响gydF4y2B一个

计算的指标包括准确性、精密度、召回率、gydF4y2B一个 FgydF4y2B一个1gydF4y2B一个分数和曲线下的面积。完整的结果可以在gydF4y2B一个 多媒体附件1gydF4y2B一个.gydF4y2B一个 表3gydF4y2B一个提供了CNN与传统基线比较结果的子集gydF4y2B一个 FgydF4y2B一个1gydF4y2B一个在分类器训练中得分。gydF4y2B一个 表4gydF4y2B一个提供比较nn的结果。在这一阶段结束时,模型已经训练完毕,可以用于样本外数据的预测。gydF4y2B一个

FgydF4y2B一个1gydF4y2B一个 对给定的不同输入组合进行分类所取得的分数。gydF4y2B一个

模型gydF4y2B一个 LRgydF4y2B一个一个gydF4y2B一个 射频gydF4y2B一个bgydF4y2B一个 支持向量机gydF4y2B一个cgydF4y2B一个 美国有线电视新闻网gydF4y2B一个dgydF4y2B一个
C1: r/自杀观察组与阳性对照组gydF4y2B一个
TF-IDFgydF4y2B一个egydF4y2B一个 0.902gydF4y2B一个 0.904gydF4y2B一个 0.915gydF4y2B一个 0.685gydF4y2B一个
word2vecgydF4y2B一个 0.928gydF4y2B一个 0.927gydF4y2B一个fgydF4y2B一个 0.943gydF4y2B一个 0.961gydF4y2B一个
TF-IDF + w2vecgydF4y2B一个 0.940gydF4y2B一个 0.921gydF4y2B一个 0.941gydF4y2B一个 0.963gydF4y2B一个
TF-IDF +手套gydF4y2B一个 0.927gydF4y2B一个 0.829gydF4y2B一个 0.886gydF4y2B一个 0.923gydF4y2B一个
TF-IDF + word2vec + char2vecgydF4y2B一个 0.914gydF4y2B一个 0.790gydF4y2B一个 0.856gydF4y2B一个 0.962gydF4y2B一个
C2: r/抑郁症和r/阿片类药物gydF4y2B一个
TF-IDFgydF4y2B一个 0.889gydF4y2B一个 0.800gydF4y2B一个 0.811gydF4y2B一个 0.729gydF4y2B一个
word2vecgydF4y2B一个 0.852gydF4y2B一个 0.846gydF4y2B一个 0.881gydF4y2B一个 0.961gydF4y2B一个
TF-IDF + w2vecgydF4y2B一个 0.894gydF4y2B一个 0.815gydF4y2B一个 0.880gydF4y2B一个 0.965gydF4y2B一个
TF-IDF +手套gydF4y2B一个 0.860gydF4y2B一个 0.494gydF4y2B一个 0.765gydF4y2B一个 0.814gydF4y2B一个
TF-IDF + word2vec + char2vecgydF4y2B一个 0.858gydF4y2B一个 0.581gydF4y2B一个 0.741gydF4y2B一个 0.966gydF4y2B一个

一个gydF4y2B一个逻辑回归。gydF4y2B一个

bgydF4y2B一个RF:随机森林。gydF4y2B一个

cgydF4y2B一个支持向量机:支持向量机。gydF4y2B一个

dgydF4y2B一个CNN:卷积神经网络。gydF4y2B一个

egydF4y2B一个TF-IDF:术语频率逆文档频率。gydF4y2B一个

fgydF4y2B一个该模型获得的最佳结果用斜体表示。gydF4y2B一个

文本分类神经网络基线与词嵌入和卷积神经网络的比较。gydF4y2B一个

模型gydF4y2B一个 快gydF4y2B一个一个gydF4y2B一个 RNNgydF4y2B一个bgydF4y2B一个 注意gydF4y2B一个cgydF4y2B一个 美国有线电视新闻网gydF4y2B一个dgydF4y2B一个
C1: r/自杀观察组与阳性对照组gydF4y2B一个
精度gydF4y2B一个 0.950gydF4y2B一个 0.944gydF4y2B一个 0.939gydF4y2B一个 0.954gydF4y2B一个egydF4y2B一个
精度gydF4y2B一个 0.958gydF4y2B一个 0.953gydF4y2B一个 0.934gydF4y2B一个 0.968gydF4y2B一个
回忆gydF4y2B一个 0.957gydF4y2B一个 0.951gydF4y2B一个 0.965gydF4y2B一个 0.953gydF4y2B一个
FgydF4y2B一个1gydF4y2B一个分数gydF4y2B一个 0.957gydF4y2B一个 0.952gydF4y2B一个 0.949gydF4y2B一个 0.961gydF4y2B一个
C2: r/抑郁症和r/阿片类药物gydF4y2B一个
精度gydF4y2B一个 0.971gydF4y2B一个 0.957gydF4y2B一个 0.969gydF4y2B一个 0.971gydF4y2B一个
精度gydF4y2B一个 0.964gydF4y2B一个 0.964gydF4y2B一个 0.967gydF4y2B一个 0.970gydF4y2B一个
回忆gydF4y2B一个 0.958gydF4y2B一个 0.923gydF4y2B一个 0.951gydF4y2B一个 0.962gydF4y2B一个
FgydF4y2B一个1gydF4y2B一个分数gydF4y2B一个 0.961gydF4y2B一个 0.943gydF4y2B一个 0.959gydF4y2B一个 0.966gydF4y2B一个

一个gydF4y2B一个快速:FastText。gydF4y2B一个

bgydF4y2B一个RNN:循环神经网络。gydF4y2B一个

cgydF4y2B一个ATTENTION:基于注意的双向循环神经网络。gydF4y2B一个

dgydF4y2B一个CNN:卷积神经网络。gydF4y2B一个

egydF4y2B一个每个模型的最佳分数用斜体表示。gydF4y2B一个

从gydF4y2B一个 表3gydF4y2B一个,我们可以观察到word2vec对CNN的性能有贡献。另一个有趣的观察是,当使用预训练的GloVe作为输入时,所有模型的分类性能都会受到影响。这可能是由于使用特定的reddits作为类别引入的本地信息。GloVe和字符嵌入的引入阻碍了RF的性能,这意味着RF在学习隐含语义特征方面比LR和SVM更困难。相比之下,神经网络在基于语义的输入方面表现良好。gydF4y2B一个

图2gydF4y2B一个提供了神经网络从零开始训练的词嵌入的可视化。从浅紫色到热粉色的颜色强度和阴影表示对相应单词的强调程度增加。CNN, RNN和ATTENTION共享许多重要的单词,而FastText似乎专注于不同的单词,因为它的n -grams袋方法,但仍然取得了很高的分类性能。gydF4y2B一个

通过神经网络模型对自杀文本和非自杀文本进行分类,从从头学习的结果词嵌入中确定单词重要性的可视化。CNN:卷积神经网络;LSTN:长短期记忆;RNN:循环神经网络。gydF4y2B一个

使用MTURK注释评估预测gydF4y2B一个

对于预测,我们使用带有word2vec输入和神经网络的传统基线。为了评估预测性能,使用MTURK来获得每篇文章有3个注释的标签。在阿片类药物数据中,C1预测自杀倾向。注释工作由25名独立的工作人员完成,平均每个帖子花费4分钟。3个标注的两两一致性分别为0.632、0.628和0.644。在500个帖子中,总共有120个被判定有自杀风险。C2预测自杀帖子中的阿片类药物成瘾。注释由92名独立工作者完成,平均11.3分钟(C1: SD 6.667分钟;C2: SD 14.633分钟)花在每个帖子上。注释之间的两两一致性分别为0.524、0.604和0.544。 In total, 261 out of 500 posts were ruled as 是的,暗示阿片类药物成瘾gydF4y2B一个.gydF4y2B一个 表5gydF4y2B一个显示了使用多数规则MTURK注释作为ground truth的模型性能。gydF4y2B一个 表5gydF4y2B一个还显示了取决于数据集中标签比例的性能差异。为了构造一个包含500行具有一定比例自杀风险帖子的数据集,我们使用sckit-learn with replace作为true进行抽样。gydF4y2B一个

使用亚马逊Mechanical Turk标签进行模型预测的计数和准确性。gydF4y2B一个

模型gydF4y2B一个 LRgydF4y2B一个一个gydF4y2B一个 射频gydF4y2B一个bgydF4y2B一个 支持向量机gydF4y2B一个cgydF4y2B一个 快gydF4y2B一个dgydF4y2B一个 RNNgydF4y2B一个egydF4y2B一个 注意gydF4y2B一个fgydF4y2B一个 美国有线电视新闻网gydF4y2B一个ggydF4y2B一个
C1的计数和准确性(预测阿片类药物数据中的自杀风险)gydF4y2B一个
自杀风险的预测数字gydF4y2B一个 24gydF4y2B一个 12gydF4y2B一个 11gydF4y2B一个 97gydF4y2B一个 93gydF4y2B一个 98gydF4y2B一个 103gydF4y2B一个
所有的数据gydF4y2B一个 0.768gydF4y2B一个 0.750gydF4y2B一个 0.744gydF4y2B一个 0.59gydF4y2B一个 0.608gydF4y2B一个 0.576gydF4y2B一个 0.536gydF4y2B一个
仅限自杀风险gydF4y2B一个 0.2gydF4y2B一个 0.1gydF4y2B一个 0.092gydF4y2B一个 0.783gydF4y2B一个 0.791gydF4y2B一个 0.75gydF4y2B一个 0.833gydF4y2B一个
非自杀风险gydF4y2B一个 0.947gydF4y2B一个 0.959gydF4y2B一个 0.963gydF4y2B一个 0.529gydF4y2B一个 0.55gydF4y2B一个 0.521gydF4y2B一个 0.432gydF4y2B一个
C2的计数和准确性(在自杀监测数据中预测阿片类药物成瘾)gydF4y2B一个
阿片类药物成瘾的预测数量gydF4y2B一个 88gydF4y2B一个 92gydF4y2B一个 105gydF4y2B一个 92gydF4y2B一个 158gydF4y2B一个 110gydF4y2B一个 127gydF4y2B一个
所有的数据gydF4y2B一个 0.524gydF4y2B一个 0.518gydF4y2B一个 0.538gydF4y2B一个 0.54gydF4y2B一个 0.588gydF4y2B一个 0.552gydF4y2B一个 0.562gydF4y2B一个
阿片类药物成瘾gydF4y2B一个 0.230gydF4y2B一个 0.237gydF4y2B一个 0.273gydF4y2B一个 0.251gydF4y2B一个 0.414gydF4y2B一个 0.295gydF4y2B一个 0.334gydF4y2B一个
非阿片类成瘾gydF4y2B一个 0.892gydF4y2B一个 0.869gydF4y2B一个 0.869gydF4y2B一个 0.9gydF4y2B一个 0.806gydF4y2B一个 0.874gydF4y2B一个 0.847gydF4y2B一个

一个gydF4y2B一个逻辑回归。gydF4y2B一个

bgydF4y2B一个RF:随机森林。gydF4y2B一个

cgydF4y2B一个支持向量机:支持向量机。gydF4y2B一个

dgydF4y2B一个快速:FastText。gydF4y2B一个

egydF4y2B一个RNN:循环神经网络。gydF4y2B一个

fgydF4y2B一个ATTENTION:基于注意的双向循环神经网络。gydF4y2B一个

ggydF4y2B一个CNN:卷积神经网络。gydF4y2B一个

关于C1的观察:在阿片类药物成瘾的背景下检测自杀意念gydF4y2B一个

对于C1和C2,我们注意到,当每个标签的帖子比例改变时,模型指标发生了巨大变化。对于C1,当有自杀和非自杀标签的帖子混合时,传统基线表现更好,因为nn产生了大量的假阳性。然而,当只检查自杀帖子时,nn获得了更好的准确性。因此,根据领域和数据集的不同,最好使用在极端情况下更好的模型,或者保持在相对较少的可变范围内。对于我们在样本外的阿片类药物数据中预测自杀风险的情况,宁可在安全方面犯错,也不要错过有自杀风险的人。如果样本包含很多有自杀风险的帖子,CNN将是一个不错的选择。在预测自杀风险的帖子时,基线的预测能力并不理想,因为假阴性在现实生活中代价高昂。gydF4y2Ba

鉴于模型倾向于预测C1的极端情况,我们推测模型将很好地作为集成模型的弱学习者。我们使用scikit-learn的AdaBoost分类器和LR、SVM、RNN和CNN作为弱学习器探索了一个简单的集成模型。我们使用mturk标记的大小为500的数据作为ground truth,使用弱学习器的概率预测作为输入数据。数据按8:2的比例分成训练集和测试集。AdaBoost以不同的数据洗牌和随机状态运行5次,取平均准确率。gydF4y2B一个

在gydF4y2B一个 图3gydF4y2B一个,上图说明了当我们将C1中阿片类药物数据中自杀风险标签的百分比从10%增加到90%时,所选模型的性能。折线图显示了AdaBoost在这些模型作为弱学习器时的性能。AdaBoost在各自的区间内分别实现了0.89、0.84、0.82、0.8、0.8、0.86、0.9、0.91和0.94的精度。下面这张图gydF4y2B一个 图3gydF4y2B一个在每个步骤中显示模型贡献。从图中可以看出,结合在极端情况下预测的模型可以得到一个更健壮的分类器。这是一种有利的方法,因为集成模型现在拥有关于样本外数据的知识,而弱学习器模型不具备这些知识。gydF4y2B一个

顶部柱状图显示了C1中预测性能随数据类别比率的变化。叠加线图显示了在AdaBoost中使用四种模型作为弱学习器所获得的准确性。下面的图表显示了弱学习者的贡献。gydF4y2B一个

图4gydF4y2B一个显示C1在更细颗粒水平上的并行预测性能;每个标签的50%被采样用于视觉。每一行代表一篇文章。定gydF4y2B一个 xgydF4y2B一个-axis列出了模型,以及一条直线与gydF4y2B一个 ygydF4y2B一个模型的-轴为模型的预测得分。深色的线被mturk标记为自杀风险的指示(y轴为0),而浅色的线不表示自杀风险(y轴为1)。gydF4y2B一个

对单个帖子的模型预测用一条线表示。接近于1的预测表示没有预测到自杀语言,接近于0的预测表示有预测到自杀语言。个别帖子的颜色编码由他们的MTURK标签。ATTENTION:基于注意的双向循环神经网络;CNN:卷积神经网络;FAST_TEXT: FastText;LR: logistic回归:RF:随机森林;RNN:循环神经网络;支持向量机:支持向量机。gydF4y2Ba

关于C2的观察:在自杀意念的背景下检测阿片类药物滥用gydF4y2B一个

我们对C2的假设是,在使用r/抑郁组与阿片类药物组的数据进行训练后,模型将能够检测出与药物成瘾作斗争的个体使用的短语。尽管这些模型在分类r/抑郁症与阿片类药物数据方面都取得了良好的结果,但它们未能根据MTURK标签提取含有阿片类药物的帖子。一种可能的解释是,用户在不同的上下文中表达自己的方式不同。另一种可能性是,r/suicidewatch中的语言语义放弃了在阿片类药物中发现的特征,例如关于戒除或复发的细节占据了任何阿片类药物上下文帖子的大部分空间。例如,r/suicidewatch上的一篇文章可能会在一个关于过量的句子中简单地提到几个关键词,如“hydros”或“benzos”,而文章的其余部分则专注于个人斗争。另一方面,如果来自r/opiates的用户发帖说想在r/opiates康复中自杀,他们会表达对药物的情绪,因为他们知道他们的观众会理解。有可能用户在潜意识中假设r/suicidewatch的观众对阿片类药物成瘾知之甚少,因此忽略了阿片类药物成瘾对他们生活的影响。因此,阅读整篇文章的MTURK工作人员可能会观察到用户很容易获得阿片类药物,并且对药物混合有经验;然而,模型可能无法捕捉到这些含义,因为这些确切的表达式并没有出现在它所训练的数据中。gydF4y2Ba

根据我们关于C2语言使用的新假设,我们重新评估了C2的预测。我们没有使用mturk确定的标签,而是构建了一组启发式标签,这样,如果一个帖子包含来自C2关键字的任何单词,则该帖子暗示阿片类药物成瘾gydF4y2B一个 表2gydF4y2B一个这与阿片类药物成瘾无关。研究结果显示在gydF4y2B一个 表6gydF4y2B一个.尽管总体表现不理想,但所有分数都有所提高,这支持了我们的假设,即特定词语的存在是重要的,MTURK工作者的定向注意力可能与模型不同。gydF4y2B一个

启发式标签的模型预测精度由关键字的存在性决定。gydF4y2B一个

模型gydF4y2B一个 LRgydF4y2B一个一个gydF4y2B一个 射频gydF4y2B一个bgydF4y2B一个 支持向量机gydF4y2B一个cgydF4y2B一个 快gydF4y2B一个dgydF4y2B一个 RNNgydF4y2B一个egydF4y2B一个 注意gydF4y2B一个fgydF4y2B一个 美国有线电视新闻网gydF4y2B一个ggydF4y2B一个
所有的数据gydF4y2B一个 0.606gydF4y2B一个 0.588gydF4y2B一个 0.648gydF4y2B一个 0.666gydF4y2B一个 0.774gydF4y2B一个 0.69gydF4y2B一个 0.712gydF4y2B一个
阿片类药物成瘾gydF4y2B一个 0.264gydF4y2B一个 0.26gydF4y2B一个 0.347gydF4y2B一个 0.338gydF4y2B一个 0.56gydF4y2B一个 0.403gydF4y2B一个 0.463gydF4y2B一个
非阿片类成瘾gydF4y2B一个 0.9gydF4y2B一个 0.87gydF4y2B一个 0.907gydF4y2B一个 0.948gydF4y2B一个 0.926gydF4y2B一个 0.937gydF4y2B一个 0.926gydF4y2B一个

一个gydF4y2B一个逻辑回归。gydF4y2B一个

bgydF4y2B一个RF:随机森林。gydF4y2B一个

cgydF4y2B一个支持向量机:支持向量机。gydF4y2B一个

dgydF4y2B一个快速:FastText。gydF4y2B一个

egydF4y2B一个RNN:循环神经网络。gydF4y2B一个

fgydF4y2B一个ATTENTION:基于注意的双向循环神经网络。gydF4y2B一个

ggydF4y2B一个CNN:卷积神经网络。gydF4y2B一个

阿片类药物数据中预测自杀帖子的内容概述gydF4y2B一个

我们从预测为的帖子中构造了一个bigram word2vecgydF4y2B一个 自杀gydF4y2B一个在整个阿片类数据集中(阿片类数据:n=23,740,如图gydF4y2B一个 表3gydF4y2B一个),以全面评估这些职位的质素。然后,我们为每个模型查询了与“自杀”最相似的前15个单词,因为它更有可能出现在第一人称代词中,而不是词根“自杀”的其他衍生词。gydF4y2B一个 表7gydF4y2B一个总结结果从最相似到最不相似的词。gydF4y2B一个

在阿片类药物数据子集中,与自杀最相似的单词被预测属于自杀类别。gydF4y2B一个

模型gydF4y2B一个 最热门词汇gydF4y2B一个
LRgydF4y2B一个一个gydF4y2B一个 时间,死亡,缺乏,睡着,醒来,清醒,自我,他们是,因为,至少,然而,地狱,后来,群体,gydF4y2B一个状态gydF4y2B一个
射频gydF4y2B一个bgydF4y2B一个 轻松,生活,然而,打击,等待,可能,寒冷,相同,这样,由,明天,身体,不断,说,工作gydF4y2B一个
支持向量机gydF4y2B一个cgydF4y2B一个 制造,每个人,一次,药丸,没有,很快,lol,什么都没有,周围,对不起,事情,戒断,开始,精神,宽容gydF4y2B一个
快gydF4y2B一个dgydF4y2B一个 有自杀念头,抑郁,极端,情绪化,严重焦虑,存在,抑郁,易怒,失眠,严重,恶心,情绪波动,偏执,疲劳,有麻烦gydF4y2B一个
RNNgydF4y2B一个egydF4y2B一个 严重,抑郁,确诊,孤立,无法忍受,躁郁症,自杀念头,焦虑,创伤后应激障碍,酗酒,强迫症,不堪重负,易怒,嗜睡,极端gydF4y2B一个
注意gydF4y2B一个fgydF4y2B一个 诊断为抑郁,有自杀念头,社交焦虑,躁郁症,极端,瘫痪,易怒,震颤,情绪化,边缘性,严重抑郁,脑雾,存在,广交症gydF4y2B一个
美国有线电视新闻网gydF4y2B一个ggydF4y2B一个 偏执,不快乐,抑郁,孤立,冷漠,易怒,酗酒,有自杀念头,创伤,严重,确诊,脑雾,焦虑,躁狂,没有感情gydF4y2B一个

一个gydF4y2B一个逻辑回归。gydF4y2B一个

bgydF4y2B一个RF:随机森林。gydF4y2B一个

cgydF4y2B一个支持向量机:支持向量机。gydF4y2B一个

dgydF4y2B一个快速:FastText。gydF4y2B一个

egydF4y2B一个RNN:循环神经网络。gydF4y2B一个

fgydF4y2B一个ATTENTION:基于注意的双向循环神经网络。gydF4y2B一个

ggydF4y2B一个CNN:卷积神经网络。gydF4y2B一个

讨论gydF4y2B一个 概述gydF4y2B一个

本研究的目标是利用来自Reddit的结构和数据来构建模型,最终预测阿片类药物使用者的(C1)自杀语言和有自杀想法的个体的(C2)阿片类药物使用。我们评估了几个具有语义输入和知名NN文本分类器组合的模型,以评估它们分类和预测样本外数据的能力,以提取包含自杀意念和阿片类药物滥用的帖子。然后使用MTURK对样本外数据提供启发式的基础真理。gydF4y2B一个

限制gydF4y2B一个

由于数据量大,我们假设reddit下的所有帖子都反映了reddit的官方目的(例如,恢复阿片类药物用户在r/opiatesrecovery中发布的帖子),并且由于大多数内容的庞大容量,偏差被抵消了。人工回顾阿片类药物版块(C1)中预测的自杀倾向发现,许多案例被错误地预测为自杀,因为使用者正在经历极端的戒断,因复发而愤怒,甚至由于无法使用阿片类药物作为应对机制而引起的清醒而愤怒。将r/offmychest纳入对照版块是为了抵消这种强烈的负面情绪,这种情绪可能并不意味着自杀。一篇自杀帖子也可能被预测为非自杀性的,因为它使用了平静的辞职语言,或者因为用户是在自我反思或分享过去的经历。gydF4y2B一个

对r/suicidewatch (C2)中阿片类药物使用预测的人工回顾发现,糟糕的预测可能是由于阿片类药物reddits中出现的情绪混合造成的。由于阿片类药物组包括活跃使用者和恢复期/戒断期使用者(即r/阿片类药物vs r/阿片类药物恢复期),语言变化可能是极端的,从愤怒(即,gydF4y2B一个 我的经销商****晚了gydF4y2B一个)到负(即,gydF4y2B一个 除了海洛因,我找不到幸福gydF4y2B一个(使)高兴gydF4y2B一个 我已经戒了70天了!gydF4y2B一个).所有这些帖子都被贴上了相同的标签gydF4y2B一个 鸦片gydF4y2B一个他们按照阿片类语言分组。因此,需要药物特异性词语的存在来预测阿片类药物的使用。gydF4y2B一个

MTURK局限性gydF4y2B一个

我们试图通过提供简短的背景和说明来克服MTURK的限制。无论如何,局限性包括缺乏领域知识,自杀意念或药物滥用的经验,以及解释的主观性。注释也可能存在粗心大意的问题,因为有些帖子比较长,并不是所有的帖子都被彻底阅读了。此外,我们提供了一篇脱离用户生活背景的文章;很难确定这篇文章在现实中有多令人震惊,因为我们无法知道用户后来发生了什么。也没有办法控制有多少用户和哪些用户参与评估——许多不同的工作者的参与可能会在注释一致性方面引入随机变化。手工审查了几篇意见不一致的文章,表明缺乏领域专业知识会使注释变得困难;例如,一篇帖子被不同意提到是gydF4y2Ba 厌倦了醒来gydF4y2B一个,在gydF4y2B一个 撤军gydF4y2B一个,的确如此gydF4y2B一个 结束这一切更容易gydF4y2B一个,但也提到gydF4y2B一个 想要清醒gydF4y2B一个.一个MTURK工人可能认为这个职位是有希望的,而另一个工人可能认为这个职位处于放弃的边缘。尽管有这些限制,这些注释提供了深入了解公众对涉及阿片类药物成瘾时被认为是自杀的看法。gydF4y2B一个

的见解gydF4y2B一个

对阿片类药物和其他药物成瘾者进行的研究表明,阿片类药物成瘾往往与其他心理障碍,如人格障碍或创伤,并存[gydF4y2B一个 64gydF4y2B一个,gydF4y2B一个 65gydF4y2B一个].我们在最相关的单词的简单概述中观察到这一点gydF4y2B一个 自杀。gydF4y2B一个在nn中,提取了一些人格障碍术语和精神疾病,如gydF4y2B一个 创伤后应激障碍gydF4y2B一个(创伤后应激障碍),gydF4y2B一个 边缘,双gydF4y2B一个,gydF4y2B一个 迦得gydF4y2B一个(一般焦虑障碍)。戒断的特征也被捕捉到:gydF4y2B一个 易怒,失眠,恶心gydF4y2B一个.我们可以推测,人格障碍患者进入戒断期比其他人群有更高的自杀企图风险。gydF4y2B一个

未来的发展方向gydF4y2B一个

使用Reddit元数据有许多可能的方向。对于r/阿片类等混合情绪的reddit子版块,可以先使用粗粒分类,根据上下文丢弃过于积极或消极的帖子。考虑到Reddit的互动性,对评论的分析可能会显示那些挣扎的同伴提供了什么样的支持。Reddit的同伴方面很有吸引力,并且整合了非评判性的同伴支持可能有助于恢复OUD用户,使他们更愿意依赖现实生活中的帮助。这是减少OUD带来的频繁社交孤立的第一步。gydF4y2B一个

总的来说,对Reddit数据限制的探索提供了许多可能的研究领域,考虑到活跃的Reddit子版块的数量。在r/ opates的所有帖子中,我们发现了少数几个成功戒掉阿片类药物使用多年的用户,并返回传递完全康复的希望。这样的人可以被视为gydF4y2B一个 成功的故事。gydF4y2B一个研究这些人与那些以悲剧告终的人之间的差异是特别有趣的,因为OUD的恢复是困难的,而且容易复发[gydF4y2B一个 66gydF4y2B一个].人们也可以考虑自杀意念、OUD和慢性疼痛之间的相互作用,特别是因为许多OUD病例始于个人或亲密的人的处方药[gydF4y2B一个 10gydF4y2B一个].另一个焦点是影响OUD个体行为的可能性;一项基于用户搜索的针对医疗保健的行为广告的研究表明,由输入搜索词决定的行为可以预测个人是否会受到目标广告的影响而采取行动,例如访问医疗保健提供者[gydF4y2B一个 67gydF4y2B一个].因此,网络行为与现实生活行为的联系可能比预期的更紧密,有针对性的广告可能会鼓励处于戒断期并与复发作斗争的OUD患者寻求帮助。gydF4y2B一个

在纯自杀标记的帖子中,神经网络的准确率很高,但在混合数据集时表现很差,这引发了一个问题,即哪些语义维度实际上被捕获了。虽然我们在这个实验中使用神经网络作为一个黑盒,但未来的研究可能希望直接关注潜在的语义维度,这可能有助于参数调优和泛化。特别是,通过检查nn从零开始训练的词嵌入来帮助预测样本外数据,提取可能在文本数据域上泛化的确切特征将非常有趣[gydF4y2B一个 68gydF4y2B一个].gydF4y2B一个

我们专注于在OUD的背景下提取表明自杀意念的帖子,并没有对提取的帖子进行过多的分析。许多研究调查了自杀个体的内容,但在特定背景下进行的研究要少得多,可能是由于缺乏可用的数据。尽管这项研究存在局限性,但收集的预测能够揭示阿片类药物使用者的自杀想法。在帮助这些人从OUD中恢复时,重要的是要考虑从个人层面开始[gydF4y2B一个 69gydF4y2B一个].专业人员和患者之间的沟通很重要,个人故事能够通过解构污名障碍来减少污名[gydF4y2B一个 70gydF4y2B一个].由于这些帖子可能是原始和诚实的,它们可以让临床专业人员更加熟悉这些人的心态。减少对患者的耻辱感可以使患者获得权力,这从长远来看是必要的[gydF4y2B一个 66gydF4y2B一个,gydF4y2B一个 71gydF4y2B一个].考虑一篇关于自杀风险的文章,总结如下:gydF4y2B一个

只要有东西不见了,或者出了什么差错,你他妈就是每个人第一个怀疑有错的人,一定是那个该死的瘾君子,对吧?我也许是个瘾君子,但我从没做过小偷。gydF4y2B一个

倡导理解和帮助那些与阿片类药物成瘾作斗争的人很容易;然而,很难认识到他们自己的行为会如何影响阿片类药物成瘾者。我们认为,作为第一步,具体的案例是必不可少的,自杀风险评估应该在个人层面上进行。我们的研究试图通过帮助那些患有OUD的人获得理解来帮助预防自杀-我们的目标不是取代使用预测模型的风险评估[gydF4y2B一个 72gydF4y2B一个].应用从提取的帖子中收集到的见解可以帮助减少耻辱感,并澄清关于药物滥用和自杀意念的错误假设。gydF4y2B一个

结论gydF4y2B一个

本文的目标是利用来自Reddit的大数据来检测阿片类药物使用者的自杀倾向。Reddit的结构为数据集提供了类别,而社交媒体设置可以提供在其他地方可能无法获得的案例细节。这项研究可以作为使用社交媒体网站属性来辅助机器学习方法的概念证明,也可以作为神经网络抽象文本数据并在独立领域执行的可行性研究方向的证明。与高性能基线模型的比较表明,在运行样本外数据时,缺乏硬编码特征可能会使模型具有更高的灵活性和准确性。gydF4y2B一个

使用不同模型输入组合的分类指标。gydF4y2B一个

C1的工作流程说明。gydF4y2B一个

缩写gydF4y2B一个 APIgydF4y2B一个

应用编程接口gydF4y2B一个

注意gydF4y2B一个

基于注意的双向循环神经网络gydF4y2B一个

美国有线电视新闻网gydF4y2B一个

卷积神经网络gydF4y2B一个

快gydF4y2B一个

FastTextgydF4y2B一个

手套gydF4y2B一个

字表示的全局向量gydF4y2B一个

LRgydF4y2B一个

逻辑回归gydF4y2B一个

MTURKgydF4y2B一个

亚马逊土耳其机器人gydF4y2B一个

神经网络gydF4y2B一个

神经网络gydF4y2B一个

乌得琴gydF4y2B一个

阿片类药物使用障碍gydF4y2B一个

PRAWgydF4y2B一个

Python Reddit API包装器gydF4y2B一个

射频gydF4y2B一个

随机森林gydF4y2B一个

RNNgydF4y2B一个

循环神经网络gydF4y2B一个

支持向量机gydF4y2B一个

支持向量机gydF4y2B一个

TF-IDFgydF4y2B一个

术语频率-逆文档频率gydF4y2B一个

这项工作得到了美国国家科学基金会ACI 1443054和美国国家科学基金会IIS 1350885的部分支持。gydF4y2B一个

没有宣布。gydF4y2B一个

什么是美国阿片类药物流行?gydF4y2B一个 美国卫生与公众服务部(HHS)gydF4y2B一个 2020-11-10gydF4y2B一个 https://www.hhs.gov/opioids/about-the-epidemic/index.htmlgydF4y2B一个 OquendogydF4y2B一个 妈gydF4y2B一个 VolkowgydF4y2B一个 NDgydF4y2B一个 自杀:阿片类药物过量死亡的无声因素gydF4y2B一个 N英语J医学gydF4y2B一个 2018gydF4y2B一个 04gydF4y2B一个 26gydF4y2B一个 378gydF4y2B一个 17gydF4y2B一个 1567gydF4y2B一个 9gydF4y2B一个 10.1056 / NEJMp1801417gydF4y2B一个 29694805gydF4y2B一个 赫泽高gydF4y2B一个 HgydF4y2B一个 科廷gydF4y2B一个 年代gydF4y2B一个 华纳gydF4y2B一个 米gydF4y2B一个 1999-2017年美国自杀死亡率gydF4y2B一个 美国国家卫生统计中心数据概要gydF4y2B一个 2018gydF4y2B一个 2020-11-10gydF4y2B一个 https://www.cdc.gov/nchs/data/databriefs/db330-h.pdfgydF4y2B一个 自杀统计gydF4y2B一个 美国预防自杀基金会gydF4y2B一个 2018gydF4y2B一个 2020-11-10gydF4y2B一个 https://afsp.org/suicide-statistics/gydF4y2B一个 诺顿gydF4y2B一个 一个gydF4y2B一个 许多阿片类药物过量可能导致自杀gydF4y2B一个 中央社报道gydF4y2B一个 2018gydF4y2B一个 04gydF4y2B一个 25gydF4y2B一个 2020-11-10gydF4y2B一个 https://www.webmd.com/mental-health/addiction/news/20180425/many-opioid-overdoses-may-be-suicidesgydF4y2B一个 MadadigydF4y2B一个 PgydF4y2B一个 PersaudgydF4y2B一个 NgydF4y2B一个 慢性疼痛患者服用过量阿片类药物自杀gydF4y2B一个 Curr Pain头痛代表gydF4y2B一个 2014gydF4y2B一个 11gydF4y2B一个 18gydF4y2B一个 11gydF4y2B一个 460gydF4y2B一个 10.1007 / s11916 - 014 - 0460 - 1gydF4y2B一个 25249422gydF4y2B一个 精神障碍诊断与统计手册第五版gydF4y2B一个 2013gydF4y2B一个 弗吉尼亚州阿灵顿gydF4y2B一个 美国精神病学协会gydF4y2B一个 阿片类药物成瘾的有效治疗gydF4y2B一个 国家药物滥用研究所gydF4y2B一个 2016gydF4y2B一个 2020-11-10gydF4y2B一个 https://www.drugabuse.gov/publications/effective-treatments-opioid-addiction/effective-treatments-opioid-addictiongydF4y2B一个 范OrdengydF4y2B一个 卡gydF4y2B一个 威特gydF4y2B一个 TKgydF4y2B一个 CukrowiczgydF4y2B一个 KCgydF4y2B一个 布雷斯韦特gydF4y2B一个 老gydF4y2B一个 塞尔比gydF4y2B一个 EAgydF4y2B一个 乔伊纳gydF4y2B一个 TEgydF4y2B一个 自杀的人际理论gydF4y2B一个 Psychol牧师gydF4y2B一个 2010gydF4y2B一个 04gydF4y2B一个 117gydF4y2B一个 2gydF4y2B一个 575gydF4y2B一个 600gydF4y2B一个 10.1037 / a0018697gydF4y2B一个 20438238gydF4y2B一个 2010-06891-010gydF4y2B一个 PMC3130348gydF4y2B一个 汉gydF4y2B一个 BgydF4y2B一个 康普顿gydF4y2B一个 WMgydF4y2B一个 布兰科gydF4y2B一个 CgydF4y2B一个 起重机gydF4y2B一个 EgydF4y2B一个 李gydF4y2B一个 JgydF4y2B一个 琼斯gydF4y2B一个 厘米gydF4y2B一个 美国成年人的处方阿片类药物使用、滥用和使用障碍:2015年全国药物使用和健康调查gydF4y2B一个 实习医生gydF4y2B一个 2017gydF4y2B一个 09gydF4y2B一个 05gydF4y2B一个 167gydF4y2B一个 5gydF4y2B一个 293gydF4y2B一个 301gydF4y2B一个 10.7326 / m17 - 0865gydF4y2B一个 28761945gydF4y2B一个 2646632gydF4y2B一个 MadadigydF4y2B一个 PgydF4y2B一个 HildebrandtgydF4y2B一个 DgydF4y2B一个 LauwersgydF4y2B一个 AEgydF4y2B一个 科伦gydF4y2B一个 GgydF4y2B一个 死亡与阿片类药物毒性相关的阿片类药物使用者特征:加拿大安大略省一项基于人群的研究gydF4y2B一个 《公共科学图书馆•综合》gydF4y2B一个 2013gydF4y2B一个 8gydF4y2B一个 4gydF4y2B一个 e60600gydF4y2B一个 10.1371 / journal.pone.0060600gydF4y2B一个 23577131gydF4y2B一个 玉米饼- d - 12 - 38629gydF4y2B一个 PMC3618438gydF4y2B一个 布莱登gydF4y2B一个 简森-巴顿gydF4y2B一个 沙利文gydF4y2B一个 医学博士gydF4y2B一个 雷gydF4y2B一个 GTgydF4y2B一个 桑德斯gydF4y2B一个 KgydF4y2B一个 美林gydF4y2B一个 JgydF4y2B一个 西尔弗伯格gydF4y2B一个 乔丹gydF4y2B一个 拉特gydF4y2B一个 厘米gydF4y2B一个 WeisnergydF4y2B一个 CgydF4y2B一个 Banta-GreengydF4y2B一个 CgydF4y2B一个 坎贝尔gydF4y2B一个 CgydF4y2B一个 冯KorffgydF4y2B一个 米gydF4y2B一个 长期阿片类药物治疗有抑郁症史的非癌性疼痛的趋势gydF4y2B一个 Gen Hosp精神病学gydF4y2B一个 2009gydF4y2B一个 31gydF4y2B一个 6gydF4y2B一个 564gydF4y2B一个 70gydF4y2B一个 10.1016 / j.genhosppsych.2009.07.003gydF4y2B一个 19892215gydF4y2B一个 s0163 - 8343 (09) 00137 - 6gydF4y2B一个 PMC2774904gydF4y2B一个 胡利gydF4y2B一个 JMgydF4y2B一个 富兰克林gydF4y2B一个 JCgydF4y2B一个 诺gydF4y2B一个 可gydF4y2B一个 慢性疼痛和自杀:了解关联gydF4y2B一个 Curr Pain头痛代表gydF4y2B一个 2014gydF4y2B一个 18gydF4y2B一个 8gydF4y2B一个 435gydF4y2B一个 10.1007 / s11916 - 014 - 0435 - 2gydF4y2B一个 24916035gydF4y2B一个 Hendy说gydF4y2B一个 嗯gydF4y2B一个 黑色的gydF4y2B一个 PgydF4y2B一个 可以gydF4y2B一个 上海gydF4y2B一个 FleischutgydF4y2B一个 一个gydF4y2B一个 AksengydF4y2B一个 DgydF4y2B一个 阿片类药物滥用是美国成年人应对生活压力的不良反应gydF4y2B一个 J毒品问题gydF4y2B一个 2018gydF4y2B一个 07gydF4y2B一个 5gydF4y2B一个 48gydF4y2B一个 4gydF4y2B一个 560gydF4y2B一个 71gydF4y2B一个 10.1177 / 0022042618783454gydF4y2B一个 SinhagydF4y2B一个 RgydF4y2B一个 慢性压力,吸毒,易上瘾gydF4y2B一个 Ann N Y学院科学gydF4y2B一个 2008gydF4y2B一个 10gydF4y2B一个 1141gydF4y2B一个 105gydF4y2B一个 30.gydF4y2B一个 10.1196 / annals.1441.030gydF4y2B一个 18991954gydF4y2B一个 NYAS1141030gydF4y2B一个 PMC2732004gydF4y2B一个 桑托斯gydF4y2B一个 DSgydF4y2B一个 安德雷德gydF4y2B一个 DTgydF4y2B一个 王ydF4y2B一个 HgydF4y2B一个 RonzanigydF4y2B一个 TgydF4y2B一个 科里根gydF4y2B一个 PgydF4y2B一个 吸毒污名化作为排斥合法化机制gydF4y2B一个 2018gydF4y2B一个 瑞士gydF4y2B一个 施普林格gydF4y2B一个 15gydF4y2B一个 25gydF4y2B一个 汤森gydF4y2B一个 lgydF4y2B一个 传动装置gydF4y2B一个 再保险gydF4y2B一个 PolyanskayagydF4y2B一个 OgydF4y2B一个 健康信仰和污名化对选择网络支持团体而非正式心理健康服务的影响gydF4y2B一个 Psychiatr服务公司gydF4y2B一个 2012gydF4y2B一个 04gydF4y2B一个 63gydF4y2B一个 4gydF4y2B一个 370gydF4y2B一个 6gydF4y2B一个 10.1176 / appi.ps.201100196gydF4y2B一个 22337006gydF4y2B一个 麦基gydF4y2B一个 TKgydF4y2B一个 KalyanamgydF4y2B一个 JgydF4y2B一个 KatsukigydF4y2B一个 TgydF4y2B一个 LanckrietgydF4y2B一个 GgydF4y2B一个 基于推特的处方阿片类药物非法在线销售检测gydF4y2B一个 公共卫生gydF4y2B一个 2017gydF4y2B一个 12gydF4y2B一个 107gydF4y2B一个 12gydF4y2B一个 1910gydF4y2B一个 5gydF4y2B一个 10.2105 / AJPH.2017.303994gydF4y2B一个 29048960gydF4y2B一个 PMC5678375gydF4y2B一个 KalyanamgydF4y2B一个 JgydF4y2B一个 KatsukigydF4y2B一个 TgydF4y2B一个 LanckrietgydF4y2B一个 GgydF4y2B一个 麦基gydF4y2B一个 TKgydF4y2B一个 使用无监督机器学习探索推特圈中处方药的非医疗使用和多种药物滥用的趋势gydF4y2B一个 瘾君子BehavgydF4y2B一个 2017gydF4y2B一个 02gydF4y2B一个 65gydF4y2B一个 289gydF4y2B一个 95gydF4y2B一个 10.1016 / j.addbeh.2016.08.019gydF4y2B一个 27568339gydF4y2B一个 s0306 - 4603 (16) 30299 - 4gydF4y2B一个 陈gydF4y2B一个 BgydF4y2B一个 洛佩兹gydF4y2B一个 一个gydF4y2B一个 SarkargydF4y2B一个 UgydF4y2B一个 煤矿里的金丝雀推特:社交媒体揭示了公众对阿片类药物非医疗使用的看法gydF4y2B一个 《公共科学图书馆•综合》gydF4y2B一个 2015gydF4y2B一个 10gydF4y2B一个 8gydF4y2B一个 e0135072gydF4y2B一个 10.1371 / journal.pone.0135072gydF4y2B一个 26252774gydF4y2B一个 玉米饼- d - 14 - 56862gydF4y2B一个 PMC4529203gydF4y2B一个 O 'DeagydF4y2B一个 BgydF4y2B一个 王ydF4y2B一个 年代gydF4y2B一个 BatterhamgydF4y2B一个 PJgydF4y2B一个 CaleargydF4y2B一个 艾尔gydF4y2B一个 巴黎gydF4y2B一个 CgydF4y2B一个 克里斯坦森gydF4y2B一个 HgydF4y2B一个 在Twitter上检测自杀倾向gydF4y2B一个 互联网间歇雨刷gydF4y2B一个 2015gydF4y2B一个 05gydF4y2B一个 2gydF4y2B一个 2gydF4y2B一个 183gydF4y2B一个 8gydF4y2B一个 10.1016 / j.invent.2015.03.005gydF4y2B一个 O 'DeagydF4y2B一个 BgydF4y2B一个 拉森gydF4y2B一个 我gydF4y2B一个 BatterhamgydF4y2B一个 PJgydF4y2B一个 CaleargydF4y2B一个 艾尔gydF4y2B一个 克里斯坦森gydF4y2B一个 HgydF4y2B一个 与自杀相关的推特帖子的语言分析gydF4y2B一个 危机gydF4y2B一个 2017gydF4y2B一个 09gydF4y2B一个 38gydF4y2B一个 5gydF4y2B一个 319gydF4y2B一个 29gydF4y2B一个 10.1027 / 0227 - 5910 / a000443gydF4y2B一个 28228065gydF4y2B一个 Reddit的数字gydF4y2B一个 2020-11-10gydF4y2B一个 https://www.redditinc.com/pressgydF4y2B一个 约翰逊gydF4y2B一个 GJgydF4y2B一个 安布罗斯gydF4y2B一个 PJgydF4y2B一个 Neo-tribesgydF4y2B一个 Commun ACMgydF4y2B一个 2006gydF4y2B一个 01gydF4y2B一个 1gydF4y2B一个 49gydF4y2B一个 1gydF4y2B一个 107gydF4y2B一个 13gydF4y2B一个 10.1145/1107458.1107463gydF4y2B一个 ChoudhurygydF4y2B一个 医学博士gydF4y2B一个 德gydF4y2B一个 年代gydF4y2B一个 Reddit上的心理健康论述:自我表露,社会支持和匿名gydF4y2B一个 第八届网络日志和社交媒体国际会议gydF4y2B一个 2014gydF4y2B一个 WSM的14gydF4y2B一个 2014年8月5日至8日gydF4y2B一个 帕洛阿尔托,加州gydF4y2B一个 DeAndreagydF4y2B一个 直流gydF4y2B一个 安东尼gydF4y2B一个 JCgydF4y2B一个 美国心理健康问题的在线同伴支持:2004-2010gydF4y2B一个 Psychol地中海gydF4y2B一个 2013gydF4y2B一个 11gydF4y2B一个 43gydF4y2B一个 11gydF4y2B一个 2277gydF4y2B一个 88gydF4y2B一个 10.1017 / S0033291713000172gydF4y2B一个 23410539gydF4y2B一个 S0033291713000172gydF4y2B一个 PMC4327823gydF4y2B一个 达gydF4y2B一个 基于“增大化现实”技术gydF4y2B一个 OpticangydF4y2B一个 基于“增大化现实”技术gydF4y2B一个 SowlesgydF4y2B一个 SJgydF4y2B一个 克劳斯gydF4y2B一个 乔丹gydF4y2B一个 Escobar李gydF4y2B一个 KgydF4y2B一个 Cavazos-RehggydF4y2B一个 巴勒斯坦权力机构gydF4y2B一个 在线社交网络从阿片类药物使用障碍中恢复:对社区互动的研究gydF4y2B一个 依赖毒品和酒精gydF4y2B一个 2017gydF4y2B一个 12gydF4y2B一个 1gydF4y2B一个 181gydF4y2B一个 5gydF4y2B一个 10gydF4y2B一个 10.1016 / j.drugalcdep.2017.09.010gydF4y2B一个 29024875gydF4y2B一个 s0376 - 8716 (17) 30491 - xgydF4y2B一个 PMC5683917gydF4y2B一个 里贝罗gydF4y2B一个 JDgydF4y2B一个 乔伊纳gydF4y2B一个 TEgydF4y2B一个 自杀行为的人际心理理论:现状与未来方向gydF4y2B一个 临床精神科gydF4y2B一个 2009gydF4y2B一个 12gydF4y2B一个 65gydF4y2B一个 12gydF4y2B一个 1291gydF4y2B一个 9gydF4y2B一个 10.1002 / jclp.20621gydF4y2B一个 19827114gydF4y2B一个 公园gydF4y2B一个 一个gydF4y2B一个 康威gydF4y2B一个 米gydF4y2B一个 利用reddit来了解精神健康障碍患者所经历的书面沟通挑战:分析来自精神健康社区的文本gydF4y2B一个 J医疗互联网服务gydF4y2B一个 2018gydF4y2B一个 04gydF4y2B一个 10gydF4y2B一个 20.gydF4y2B一个 4gydF4y2B一个 e121gydF4y2B一个 10.2196 / jmir.8219gydF4y2B一个 29636316gydF4y2B一个 v20i4e121gydF4y2B一个 PMC5915669gydF4y2B一个 霁gydF4y2B一个 年代gydF4y2B一个 余gydF4y2B一个 CPgydF4y2B一个 冯gydF4y2B一个 年代gydF4y2B一个 锅gydF4y2B一个 年代gydF4y2B一个 长gydF4y2B一个 GgydF4y2B一个 在线用户内容中自杀意念检测的监督学习gydF4y2B一个 复杂性gydF4y2B一个 2018gydF4y2B一个 09gydF4y2B一个 9gydF4y2B一个 2018gydF4y2B一个 1gydF4y2B一个 10gydF4y2B一个 10.1155 / 2018/6157249gydF4y2B一个 沙玛gydF4y2B一个 EgydF4y2B一个 ChoudhurygydF4y2B一个 米gydF4y2B一个 心理健康支持与在线社区语言适应的关系gydF4y2B一个 计算机系统中人为因素的CHI会议gydF4y2B一个 2018gydF4y2B一个 气的18gydF4y2B一个 2018年4月14日至16日gydF4y2B一个 加拿大蒙特利尔QCgydF4y2B一个 10.1145/3173574.3174215gydF4y2B一个 库马尔gydF4y2B一个 米gydF4y2B一个 DredzegydF4y2B一个 米gydF4y2B一个 铜匠gydF4y2B一个 GgydF4y2B一个 德gydF4y2B一个 厘米gydF4y2B一个 检测名人自杀后社交媒体上自杀内容的变化gydF4y2B一个 ACM超文本和社交媒体会议gydF4y2B一个 2015gydF4y2B一个 ACM的15gydF4y2B一个 2015年9月20-22日gydF4y2B一个 古兹利尤特,北塞浦路斯gydF4y2B一个 10.1145/2700171.2791026gydF4y2B一个 格兰特gydF4y2B一个 RNgydF4y2B一个 KuchergydF4y2B一个 DgydF4y2B一个 利昂gydF4y2B一个 我gydF4y2B一个 基梅尔gydF4y2B一个 摩根富林明gydF4y2B一个 RaicugydF4y2B一个 DSgydF4y2B一个 FodehgydF4y2B一个 SJgydF4y2B一个 从网上自杀意念中自动提取非正式话题gydF4y2B一个 BMC生物信息学gydF4y2B一个 2018gydF4y2B一个 06gydF4y2B一个 13gydF4y2B一个 19gydF4y2B一个 5 8gydF4y2B一个 211gydF4y2B一个 10.1186 / s12859 - 018 - 2197 - zgydF4y2B一个 29897319gydF4y2B一个 10.1186 / s12859 - 018 - 2197 - zgydF4y2B一个 PMC5998765gydF4y2B一个 PandrekargydF4y2B一个 年代gydF4y2B一个 程ydF4y2B一个 XgydF4y2B一个 GopalkrishnagydF4y2B一个 GgydF4y2B一个 斯利瓦斯塔瓦gydF4y2B一个 一个gydF4y2B一个 沙尔茨gydF4y2B一个 米gydF4y2B一个 沙尔茨gydF4y2B一个 JHgydF4y2B一个 王gydF4y2B一个 FgydF4y2B一个 基于社交媒体的阿片类药物流行分析使用redditgydF4y2B一个 AMIA年度诉讼程序gydF4y2B一个 2018gydF4y2B一个 2018gydF4y2B一个 867gydF4y2B一个 876gydF4y2B一个 30815129gydF4y2B一个 PMC6371364gydF4y2B一个 StirmangydF4y2B一个 西南gydF4y2B一个 PennebakergydF4y2B一个 JWgydF4y2B一个 自杀诗人和非自杀诗人诗歌中的用词gydF4y2B一个 Psychosom地中海gydF4y2B一个 2001gydF4y2B一个 63gydF4y2B一个 4gydF4y2B一个 517gydF4y2B一个 22gydF4y2B一个 10.1097 / 00006842-200107000-00001gydF4y2B一个 11485104gydF4y2B一个 HandelmangydF4y2B一个 LDgydF4y2B一个 莱斯特gydF4y2B一个 DgydF4y2B一个 自杀未遂者和完成者遗书的内容gydF4y2B一个 危机gydF4y2B一个 2007gydF4y2B一个 28gydF4y2B一个 2gydF4y2B一个 102gydF4y2B一个 4gydF4y2B一个 10.1027 / 0227 - 5910.28.2.102gydF4y2B一个 17722692gydF4y2B一个 LitvinovagydF4y2B一个 助教gydF4y2B一个 SeredingydF4y2B一个 光伏gydF4y2B一个 LitvinovagydF4y2B一个 办公自动化gydF4y2B一个 RomanchenkogydF4y2B一个 机汇gydF4y2B一个 基于个体网络文本定量分析的自杀倾向识别gydF4y2B一个 半胱氨酸gydF4y2B一个 2017gydF4y2B一个 06gydF4y2B一个 30.gydF4y2B一个 21gydF4y2B一个 2gydF4y2B一个 243gydF4y2B一个 52gydF4y2B一个 10.13053 /半胱氨酸- 21 - 2 - 2721gydF4y2B一个 张gydF4y2B一个 XgydF4y2B一个 勒存gydF4y2B一个 YgydF4y2B一个 从头开始理解文本gydF4y2B一个 arXivgydF4y2B一个 预印本于2016年4月4日在线发布gydF4y2B一个 CollobertgydF4y2B一个 RgydF4y2B一个 韦斯顿gydF4y2B一个 JgydF4y2B一个 BottougydF4y2B一个 lgydF4y2B一个 KarlengydF4y2B一个 米gydF4y2B一个 KavukcuoglugydF4y2B一个 KgydF4y2B一个 KuksagydF4y2B一个 PgydF4y2B一个 自然语言处理(几乎)从零开始gydF4y2B一个 J Mach Learn ResgydF4y2B一个 2011gydF4y2B一个 12gydF4y2B一个 2493gydF4y2B一个 537gydF4y2B一个 DaniulaitytegydF4y2B一个 RgydF4y2B一个 程ydF4y2B一个 lgydF4y2B一个 拉米gydF4y2B一个 FRgydF4y2B一个 卡尔森gydF4y2B一个 RGgydF4y2B一个 ThirunarayangydF4y2B一个 KgydF4y2B一个 ShethgydF4y2B一个 一个gydF4y2B一个 “什么时候‘坏’是‘好’:识别与毒品相关的推文中的个人交流和情绪gydF4y2B一个 JMIR公共卫生监测gydF4y2B一个 2016gydF4y2B一个 10gydF4y2B一个 24gydF4y2B一个 2gydF4y2B一个 2gydF4y2B一个 e162gydF4y2B一个 10.2196 / publichealth.6327gydF4y2B一个 27777215gydF4y2B一个 v2i2e162gydF4y2B一个 PMC5099500gydF4y2B一个 侯赛尼gydF4y2B一个 办公自动化gydF4y2B一个 BuddhithagydF4y2B一个 PgydF4y2B一个 侯赛尼gydF4y2B一个 OMgydF4y2B一个 InkpengydF4y2B一个 DgydF4y2B一个 基于深度学习的推特用户抑郁检测gydF4y2B一个 第五届计算语言学与临床心理学研讨会:从键盘到临床gydF4y2B一个 2018gydF4y2B一个 CLCP的18gydF4y2B一个 2018年6月5日至7日gydF4y2B一个 新奥尔良,洛杉矶gydF4y2B一个 88gydF4y2B一个 97gydF4y2B一个 10.18653 / v1 / w18 - 0609gydF4y2B一个 金gydF4y2B一个 YgydF4y2B一个 基于卷积神经网络的句子分类gydF4y2B一个 2014年自然语言处理经验方法会议gydF4y2B一个 2014gydF4y2B一个 NLP的14gydF4y2B一个 2014年10月23日至26日gydF4y2B一个 卡塔尔多哈gydF4y2B一个 10.3115 / v1 / d14 - 1181gydF4y2B一个 侯赛尼gydF4y2B一个 办公自动化gydF4y2B一个 BuddhithagydF4y2B一个 PgydF4y2B一个 侯赛尼gydF4y2B一个 OMgydF4y2B一个 InkpengydF4y2B一个 DgydF4y2B一个 基于深度学习的推特用户抑郁检测gydF4y2B一个 第五届计算语言学与临床心理学研讨会:从键盘到临床gydF4y2B一个 2018gydF4y2B一个 CLCP的18gydF4y2B一个 2018年6月2日至7日gydF4y2B一个 新奥尔良,洛杉矶gydF4y2B一个 88gydF4y2B一个 97gydF4y2B一个 10.18653 / v1 / w18 - 0609gydF4y2B一个 约翰逊gydF4y2B一个 RgydF4y2B一个 张gydF4y2B一个 TgydF4y2B一个 基于卷积神经网络的文本分类中词序的有效使用gydF4y2B一个 2015年计算语言学协会北美分会会议:人类语言技术gydF4y2B一个 2015gydF4y2B一个 停止的15gydF4y2B一个 2015年8月5日至8日gydF4y2B一个 科罗拉多州丹佛市gydF4y2B一个 103gydF4y2B一个 112gydF4y2B一个 10.3115 / v1 / n15 - 1011gydF4y2B一个 辛格gydF4y2B一个 DgydF4y2B一个 王gydF4y2B一个 一个gydF4y2B一个 通过推特检测抑郁症gydF4y2B一个 斯坦福大学gydF4y2B一个 2016gydF4y2B一个 2020-11-10gydF4y2B一个 https://web.stanford.edu/class/archive/cs/cs224n/cs224n.1184/reports/6879557.pdfgydF4y2B一个 自杀观察:为有自杀念头的人提供同伴支持gydF4y2B一个 RedditgydF4y2B一个 2020-11-10gydF4y2B一个 https://www.reddit.com/r/SuicideWatch/gydF4y2B一个 费利克斯gydF4y2B一个 JgydF4y2B一个 Pushshift Reddit APIgydF4y2B一个 GitHubgydF4y2B一个 2017gydF4y2B一个 2020-11-10gydF4y2B一个 https://github.com/pushshift/apigydF4y2B一个 MellorgydF4y2B一个 TgydF4y2B一个 央行gydF4y2B一个 BgydF4y2B一个 PRAW: Python Reddit API包装器gydF4y2B一个 GitHubgydF4y2B一个 2020-11-10gydF4y2B一个 https://github.com/praw-devgydF4y2B一个 AladağgydF4y2B一个 AEgydF4y2B一个 MuderrisoglugydF4y2B一个 年代gydF4y2B一个 AkbasgydF4y2B一个 注gydF4y2B一个 ZahmacioglugydF4y2B一个 OgydF4y2B一个 利亚gydF4y2B一个 何gydF4y2B一个 检测论坛上的自杀意念:概念验证研究gydF4y2B一个 J医疗互联网服务gydF4y2B一个 2018gydF4y2B一个 06gydF4y2B一个 21gydF4y2B一个 20.gydF4y2B一个 6gydF4y2B一个 e215gydF4y2B一个 10.2196 / jmir.9840gydF4y2B一个 29929945gydF4y2B一个 v20i6e215gydF4y2B一个 PMC6035349gydF4y2B一个 沈gydF4y2B一个 JgydF4y2B一个 RudziczgydF4y2B一个 FgydF4y2B一个 通过Reddit检测焦虑gydF4y2B一个 第四届计算语言学与临床心理学工作坊-从语言信号到临床现实gydF4y2B一个 2017gydF4y2B一个 CLCP的17gydF4y2B一个 2017年8月3日至8日gydF4y2B一个 温哥华公元前gydF4y2B一个 10.18653 / v1 / w17 - 3107gydF4y2B一个 沈gydF4y2B一个 JgydF4y2B一个 RudziczgydF4y2B一个 FgydF4y2B一个 通过Reddit检测焦虑gydF4y2B一个 第四届计算语言学与临床心理学工作坊-从语言信号到临床现实gydF4y2B一个 2017gydF4y2B一个 CLCP的17gydF4y2B一个 2017年8月5日至8日gydF4y2B一个 温哥华公元前gydF4y2B一个 10.18653 / v1 / w17 - 3107gydF4y2B一个 NerbonnegydF4y2B一个 JgydF4y2B一个 代词的秘密生活。我们的话语是如何表达我们的gydF4y2B一个 文学语言计算gydF4y2B一个 2013gydF4y2B一个 02gydF4y2B一个 6gydF4y2B一个 29gydF4y2B一个 1gydF4y2B一个 139gydF4y2B一个 42gydF4y2B一个 10.1093 /公司/ fqt006gydF4y2B一个 PedregosagydF4y2B一个 FgydF4y2B一个 VaroquauxgydF4y2B一个 GgydF4y2B一个 GramfortgydF4y2B一个 一个gydF4y2B一个 Scikit-learn: python中的机器学习gydF4y2B一个 J Mach Learn ResgydF4y2B一个 2011gydF4y2B一个 12gydF4y2B一个 2825gydF4y2B一个 30.gydF4y2B一个 10.1016 / j.patcog.2011.04.006gydF4y2B一个 RehurekgydF4y2B一个 RgydF4y2B一个 索伊卡gydF4y2B一个 PgydF4y2B一个 大型语料库主题建模软件框架gydF4y2B一个 关于NLP框架的新挑战的LREC研讨会gydF4y2B一个 2010gydF4y2B一个 NLP的10gydF4y2B一个 2010年4月2日至9日gydF4y2B一个 马耳他瓦莱塔,gydF4y2B一个 彭宁顿gydF4y2B一个 JgydF4y2B一个 SochergydF4y2B一个 RgydF4y2B一个 曼宁gydF4y2B一个 CgydF4y2B一个 手套:字表示的全局向量gydF4y2B一个 自然语言处理经验方法会议gydF4y2B一个 2014gydF4y2B一个 EMNLP的14gydF4y2B一个 2014年10月25日至29日gydF4y2B一个 卡塔尔多哈gydF4y2B一个 10.3115 / v1 / d14 - 1162gydF4y2B一个 JoulingydF4y2B一个 一个gydF4y2B一个 坟墓gydF4y2B一个 EgydF4y2B一个 BojanowskigydF4y2B一个 PgydF4y2B一个 MikolovgydF4y2B一个 TgydF4y2B一个 高效文本分类的技巧包gydF4y2B一个 第15届计算语言学协会欧洲分会会议gydF4y2B一个 2017gydF4y2B一个 ACL的17gydF4y2B一个 2017年4月3日至7日gydF4y2B一个 瓦伦西亚,西班牙gydF4y2B一个 10.18653 / v1 / e17 - 2068gydF4y2B一个 刘gydF4y2B一个 PgydF4y2B一个 邱gydF4y2B一个 XgydF4y2B一个 黄gydF4y2B一个 XgydF4y2B一个 基于多任务学习的循环神经网络文本分类gydF4y2B一个 第二十五届国际人工智能联合会议gydF4y2B一个 2016gydF4y2B一个 CAI的16gydF4y2B一个 2016年4月7日至9日gydF4y2B一个 美国纽约gydF4y2B一个 10.5555/3060832.3061023gydF4y2B一个 RaffelgydF4y2B一个 CgydF4y2B一个 埃利斯gydF4y2B一个 DgydF4y2B一个 带有注意力的前馈网络可以解决一些长期记忆问题gydF4y2B一个 arXivgydF4y2B一个 预印本于2015年12月29日在线发布。gydF4y2B一个 RakhlingydF4y2B一个 一个gydF4y2B一个 基于卷积神经网络的句子分类gydF4y2B一个 GitHubgydF4y2B一个 2016gydF4y2B一个 2020-11-10gydF4y2B一个 https://github.com/alexander-rakhlin/CNN-for-Sentence-Classification-in-KerasgydF4y2B一个 张gydF4y2B一个 YgydF4y2B一个 华莱士gydF4y2B一个 BgydF4y2B一个 用于句子分类的卷积神经网络(和从业者指南)的敏感性分析gydF4y2B一个 第八届自然语言处理国际联合会议gydF4y2B一个 2017gydF4y2B一个 NLP的17gydF4y2B一个 2017年11月4日至9日gydF4y2B一个 台北,台湾gydF4y2B一个 亚马逊土耳其机器人gydF4y2B一个 2020-11-10gydF4y2B一个 https://www.mturk.com/gydF4y2B一个 通gydF4y2B一个 lgydF4y2B一个 程gydF4y2B一个 问gydF4y2B一个 HomangydF4y2B一个 CgydF4y2B一个 SilenziogydF4y2B一个 VgydF4y2B一个 学习社交媒体上自杀相关信息的各种标签策略:一项实验研究gydF4y2B一个 arXivgydF4y2B一个 预印本于2017年1月30日在线发布gydF4y2B一个 ShneidmangydF4y2B一个 西文gydF4y2B一个 自杀是精神疾病gydF4y2B一个 神经病gydF4y2B一个 1993gydF4y2B一个 03gydF4y2B一个 181gydF4y2B一个 3.gydF4y2B一个 145gydF4y2B一个 7gydF4y2B一个 10.1097 / 00005053-199303000-00001gydF4y2B一个 8445372gydF4y2B一个 德琼gydF4y2B一个 CAgydF4y2B一个 范登布林克gydF4y2B一个 WgydF4y2B一个 HarteveldgydF4y2B一个 调频gydF4y2B一个 范德威伦gydF4y2B一个 如gydF4y2B一个 酗酒者和吸毒者的人格障碍gydF4y2B一个 压缩机精神病学gydF4y2B一个 1993gydF4y2B一个 34gydF4y2B一个 2gydF4y2B一个 87gydF4y2B一个 94gydF4y2B一个 10.1016 / 0010 - 440 x (93) 90052 - 6gydF4y2B一个 8387417gydF4y2B一个 0010 - 440 x (93) 90052 - 6gydF4y2B一个 库利gydF4y2B一个 lgydF4y2B一个 唐gydF4y2B一个 YL型gydF4y2B一个 布拉德利gydF4y2B一个 BgydF4y2B一个 CubellsgydF4y2B一个 摩根富林明gydF4y2B一个 莱斯勒gydF4y2B一个 KJgydF4y2B一个 物质使用、童年创伤经历和城市平民创伤后应激障碍gydF4y2B一个 抑制焦虑gydF4y2B一个 2010gydF4y2B一个 12gydF4y2B一个 27gydF4y2B一个 12gydF4y2B一个 1077gydF4y2B一个 86gydF4y2B一个 10.1002 / da.20751gydF4y2B一个 21049532gydF4y2B一个 PMC3051362gydF4y2B一个 利文斯顿gydF4y2B一个 JDgydF4y2B一个 米尔恩gydF4y2B一个 TgydF4y2B一个 方gydF4y2B一个 毫升gydF4y2B一个 AmarigydF4y2B一个 EgydF4y2B一个 减少与物质使用障碍相关的病耻感干预措施的有效性:一项系统综述gydF4y2B一个 上瘾gydF4y2B一个 2012gydF4y2B一个 01gydF4y2B一个 107gydF4y2B一个 1gydF4y2B一个 39gydF4y2B一个 50gydF4y2B一个 10.1111 / j.1360-0443.2011.03601.xgydF4y2B一个 21815959gydF4y2B一个 PMC3272222gydF4y2B一个 阿加瓦尔gydF4y2B一个 VgydF4y2B一个 张gydF4y2B一个 lgydF4y2B一个 朱gydF4y2B一个 JgydF4y2B一个 方gydF4y2B一个 年代gydF4y2B一个 程gydF4y2B一个 TgydF4y2B一个 在香港gydF4y2B一个 CgydF4y2B一个 沙阿gydF4y2B一个 NHgydF4y2B一个 通过网络搜索行为预测医疗保健利用的影响:数据驱动的分析gydF4y2B一个 J医疗互联网服务gydF4y2B一个 2016gydF4y2B一个 09gydF4y2B一个 21gydF4y2B一个 18gydF4y2B一个 9gydF4y2B一个 e251gydF4y2B一个 10.2196 / jmir.6240gydF4y2B一个 27655225gydF4y2B一个 v18i9e251gydF4y2B一个 PMC5052461gydF4y2B一个 胫骨gydF4y2B一个 JgydF4y2B一个 MadottogydF4y2B一个 一个gydF4y2B一个 冯gydF4y2B一个 PgydF4y2B一个 用特征向量分析解释词嵌入gydF4y2B一个 NIPS 2018音频、语音和语言研讨会的可解释性和鲁棒性gydF4y2B一个 2018gydF4y2B一个 少量的18gydF4y2B一个 2018年3月6日至10日gydF4y2B一个 加拿大蒙特利尔gydF4y2B一个 凌gydF4y2B一个 WgydF4y2B一个 处方阿片类药物成瘾和慢性疼痛:不仅仅是一种感觉gydF4y2B一个 依赖毒品和酒精gydF4y2B一个 2017gydF4y2B一个 04gydF4y2B一个 1gydF4y2B一个 173gydF4y2B一个 增刊1gydF4y2B一个 S73gydF4y2B一个 4gydF4y2B一个 10.1016 / j.drugalcdep.2016.08.643gydF4y2B一个 28363323gydF4y2B一个 s0376 - 8716 (16) 31032 - 8gydF4y2B一个 McGintygydF4y2B一个 EgydF4y2B一个 PescosolidogydF4y2B一个 BgydF4y2B一个 Kennedy-HendricksgydF4y2B一个 一个gydF4y2B一个 巴里gydF4y2B一个 CLgydF4y2B一个 对抗污名化和改善精神疾病和物质使用障碍政策的沟通战略gydF4y2B一个 Psychiatr服务公司gydF4y2B一个 2018gydF4y2B一个 02gydF4y2B一个 1gydF4y2B一个 69gydF4y2B一个 2gydF4y2B一个 136gydF4y2B一个 46gydF4y2B一个 10.1176 / appi.ps.201700076gydF4y2B一个 28967320gydF4y2B一个 PMC5794622gydF4y2B一个 凯利gydF4y2B一个 摩根富林明gydF4y2B一个 WesterhoffgydF4y2B一个 厘米gydF4y2B一个 我们如何称呼有物质相关疾病的人重要吗?对两个常用术语的随机研究gydF4y2B一个 国际禁毒政策gydF4y2B一个 2010gydF4y2B一个 05gydF4y2B一个 21gydF4y2B一个 3.gydF4y2B一个 202gydF4y2B一个 7gydF4y2B一个 10.1016 / j.drugpo.2009.10.010gydF4y2B一个 20005692gydF4y2B一个 s0955 - 3959 (09) 00154 - 6gydF4y2B一个 大gydF4y2B一个 毫米gydF4y2B一个 预测在自杀预防中的作用gydF4y2B一个 临床神经科学gydF4y2B一个 2018gydF4y2B一个 09gydF4y2B一个 20.gydF4y2B一个 3.gydF4y2B一个 197gydF4y2B一个 205gydF4y2B一个 30581289gydF4y2B一个 PMC6296389gydF4y2B一个
Baidu
map