卡塔尔世界杯8强波胆分析|卡塔尔世界杯4强波胆分析

JMIgydF4y2Ba

JMIR Med InformgydF4y2Ba

JMIR医学信息学gydF4y2Ba

2291 - 9694gydF4y2Ba

卡塔尔世界杯8强波胆分析

加拿大多伦多gydF4y2Ba

v8i7e17784gydF4y2Ba

32729840gydF4y2Ba

10.2196/17784gydF4y2Ba

原始论文gydF4y2Ba

识别和预测电子健康记录临床笔记中的故意自残:深度学习方法gydF4y2Ba

扁gydF4y2Ba

姜gydF4y2Ba

李gydF4y2Ba

方gydF4y2Ba

沙姆斯gydF4y2Ba

扎gydF4y2Ba

欧贝得gydF4y2Ba

圣战年代gydF4y2Ba

医学博士gydF4y2Ba 1gydF4y2Ba

南卡罗来纳医科大学gydF4y2Ba

坎农街135号套房405 MSC200gydF4y2Ba

查尔斯顿，南卡罗来纳州，29425gydF4y2Ba

美国gydF4y2Ba 1 8437920272gydF4y2Ba jobeid@musc.edugydF4y2Ba

https://orcid.org/0000-0002-7193-7779gydF4y2Ba

DahnegydF4y2Ba

珍妮花gydF4y2Ba

博士学位gydF4y2Ba 1gydF4y2Ba

https://orcid.org/0000-0001-7297-9420gydF4y2Ba

克里斯坦森gydF4y2Ba

肖恩gydF4y2Ba

医学博士gydF4y2Ba 1gydF4y2Ba

https://orcid.org/0000-0002-0702-1862gydF4y2Ba

霍华德gydF4y2Ba

撒母耳gydF4y2Ba

医学博士gydF4y2Ba 1gydF4y2Ba

https://orcid.org/0000-0003-1338-1300gydF4y2Ba

克劳福德gydF4y2Ba

塔米gydF4y2Ba

博士学位gydF4y2Ba 1gydF4y2Ba

https://orcid.org/0000-0003-0720-7701gydF4y2Ba

弗雷gydF4y2Ba

刘易斯JgydF4y2Ba

博士学位gydF4y2Ba 1gydF4y2Ba

https://orcid.org/0000-0001-5388-280XgydF4y2Ba

SteckergydF4y2Ba

特蕾西gydF4y2Ba

博士学位gydF4y2Ba 1gydF4y2Ba

https://orcid.org/0000-0003-1464-5195gydF4y2Ba

邦内尔gydF4y2Ba

Brian EgydF4y2Ba

博士学位gydF4y2Ba 2gydF4y2Ba

https://orcid.org/0000-0002-4964-0688gydF4y2Ba

1gydF4y2Ba 南卡罗来纳医科大学gydF4y2Ba

查尔斯顿,SCgydF4y2Ba

美国gydF4y2Ba 2gydF4y2Ba 南佛罗里达大学gydF4y2Ba

佛罗里达州坦帕的gydF4y2Ba

美国gydF4y2Ba

通讯作者:Jihad S ObeidgydF4y2Ba jobeid@musc.edugydF4y2Ba

7gydF4y2Ba 2020gydF4y2Ba

30.gydF4y2Ba 7gydF4y2Ba 2020gydF4y2Ba

8gydF4y2Ba 7gydF4y2Ba

e17784gydF4y2Ba

13gydF4y2Ba 1gydF4y2Ba 2020gydF4y2Ba 5gydF4y2Ba 3.gydF4y2Ba 2020gydF4y2Ba 25gydF4y2Ba 4gydF4y2Ba 2020gydF4y2Ba 21gydF4y2Ba 5gydF4y2Ba 2020gydF4y2Ba

©Jihad S Obeid, Jennifer Dahne, Sean Christensen, Samuel Howard, Tami Crawford, Lewis J Frey, Tracy Stecker, Brian E Bunnell。最初发表于JMIR医学信息学(http://medinform.www.mybigtv.com)， 30.07.2020。gydF4y2Ba

2020gydF4y2Ba

这是一篇开放获取的文章，根据创作共用署名许可协议(https://creativecommons.org/licenses/by/4.0/)的条款发布，允许在任何媒介上不受限制地使用、分发和复制，前提是正确引用了首次发表在JMIR医学信息学上的原创作品。必须包括完整的书目信息，http://medinform.www.mybigtv.com/上的原始出版物的链接，以及此版权和许可信息。gydF4y2Ba

背景gydF4y2Ba

自杀在美国和世界各地都是一个重要的公共卫生问题。利用现有的数据集，研究机器学习方法来识别和预测故意自残和自杀的工作已经有了重大进展。随着最近计算技术的进步，深度学习在医疗保健领域的应用正获得发展势头。gydF4y2Ba

客观的gydF4y2Ba

这项研究旨在利用深度神经网络(DNNs)在临床记录中的信息(1)提高对接受故意自残治疗的患者的识别能力(2)预测未来的自残事件。gydF4y2Ba

方法gydF4y2Ba

我们从电子健康记录(EHRs)中提取了835名故意自残的国际疾病分类(ICD)代码患者的临床文本记录，以及1670名从未有任何故意自残ICD代码的匹配对照。数据分为训练测试集和拒绝测试集。我们使用训练集测试了一些与故意自残代码相关的临床记录算法，包括几个传统的基于单词袋的模型和2个DNN模型:卷积神经网络(CNN)和长短期记忆模型。我们还评估了dnn对第一次故意自残事件前1至6个月有临床记录的患者的预测性能。最后，我们评估了使用Word2vec (W2V)预训练模型对性能的影响。gydF4y2Ba

结果gydF4y2Ba

在表型任务中，即在事件发生的同时检测临床记录中有意自残，CNN的接受者工作特征曲线(receiver operating characteristic curve, AUC)下面积为0.999,F1得分为0.985。在预测任务中，CNN的AUC为0.882,F1分数为0.769，表现最好。虽然W2V的预训练缩短了DNN的训练时间，但并没有提高性能。gydF4y2Ba

结论gydF4y2Ba

在第一项任务上的出色表现，即基于临床记录的表型，表明这种模型可以有效地用于监测电子病历中的临床文本中的故意自残。尽管在预测任务上表现平平，但仅在临床文本上使用DNN模型的结果与文献中使用结构化EHR数据中的风险因素的其他报告相比具有竞争力。gydF4y2Ba

机器学习gydF4y2Ba 深度学习gydF4y2Ba 自杀gydF4y2Ba 自杀未遂gydF4y2Ba 电子健康记录gydF4y2Ba 自然语言处理gydF4y2Ba

简介gydF4y2Ba 背景与意义gydF4y2Ba

自杀是美国人死亡的主要原因之一。平均每天有100多人死于自杀，每年造成的医疗和工作损失合计约800亿美元[gydF4y2Ba 1gydF4y2Ba，gydF4y2Ba 2gydF4y2Ba］．许多导致自杀的危险因素已经被确定并进行了深入研究。例如，自杀在男性、美国印第安人和阿拉斯加原住民、非西班牙裔和有精神疾病(如抑郁、焦虑、药物滥用)、以前受过创伤、沟通困难、决策冲动和攻击性的个体中更为常见[gydF4y2Ba 3.gydF4y2Ba，gydF4y2Ba 4gydF4y2Ba］．以前有过故意自残行为或自杀企图的人也有更高的风险[gydF4y2Ba 5gydF4y2Ba，gydF4y2Ba 6gydF4y2Ba］．尽管对各种风险因素进行了广泛的研究，但前瞻性自杀预测仍然很困难，因为传统研究的风险因素仅能预测26%的自杀企图[gydF4y2Ba 5gydF4y2Ba］．gydF4y2Ba

目前确立的自杀风险评估指南包括由合格医疗保健提供者进行的临床访谈和问卷调查[gydF4y2Ba 7gydF4y2Ba，gydF4y2Ba 8gydF4y2Ba］．然而，研究表明，这些方法在预测未来的故意自残行为或自杀方面表现不佳[gydF4y2Ba 9gydF4y2Ba-gydF4y2Ba 11gydF4y2Ba］．在故意自残和企图自杀的病人中，只有不到三分之一的人透露了这样做的想法。gydF4y2Ba 12gydF4y2Ba］．因此，目前识别高危患者的方法既困难又耗时。最近的大量研究都集中在使用先进的分析工具，如自然语言处理(NLP)和机器学习来解决这些限制。gydF4y2Ba 13gydF4y2Ba］．使用自然语言处理方法的研究主要使用基于电子健康记录的[gydF4y2Ba 14gydF4y2Ba-gydF4y2Ba 16gydF4y2Ba]以及NLP和语言驱动的预测模型[gydF4y2Ba 12gydF4y2Ba，gydF4y2Ba 17gydF4y2Ba-gydF4y2Ba 19gydF4y2Ba］．使用机器学习从住院或急诊科患者的EHR数据中预测自杀和故意自残行为的研究已经证明了不同的准确性(例如，65%-95%)[gydF4y2Ba 20.gydF4y2Ba-gydF4y2Ba 24gydF4y2Ba］．gydF4y2Ba

使用深度卷积网络进行临床文本分类对于具有特定临床体征和症状的患者在EHR中识别特定表型非常有用[gydF4y2Ba 25gydF4y2Ba，gydF4y2Ba 26gydF4y2Ba］．近年来，深度学习方法取得了重大进展，如卷积神经网络(cnn)，用于各种应用，包括文本处理和分类，计算机视觉和语音识别[gydF4y2Ba 27gydF4y2Ba］．在文本处理领域，语言模型已经有了重要的研究，这些模型经过预训练，然后用于帮助自动理解未标记数据的文本[gydF4y2Ba 28gydF4y2Ba，gydF4y2Ba 29gydF4y2Ba］．这些由此产生的习得的词向量可以反过来用于临床文本分类任务[gydF4y2Ba 25gydF4y2Ba，gydF4y2Ba 26gydF4y2Ba，gydF4y2Ba 30.gydF4y2Ba］．使用这些方法的预训练模型提供了在多维向量空间中表达的语法和语义单词相似性，具有改进基于神经网络的分类和降低计算成本的潜力[gydF4y2Ba 28gydF4y2Ba］．使用先进的分析方法，如深度学习，可以扩展这项工作，并在预测未来的故意自残，自杀企图和自杀方面提供独特的优势。gydF4y2Ba

目标gydF4y2Ba

深度学习方法已被用于使用公开数据集解决与自杀有关的主题。例如，Shing等人[gydF4y2Ba 31gydF4y2Ba]比较了不同的机器学习方法，包括支持向量机(SVM)和基于cnn的基于网络帖子的自杀风险评估模型。尽管他们展示了深度学习的实用性，但对于这个特定的用例，SVM模型的表现优于CNN模型。相反，Du等[gydF4y2Ba 32gydF4y2Ba]证明了深度学习模型在识别社交媒体数据中与自杀相关的推文方面优于传统模型(包括支持向量机)。尽管有这些例子，文献中还没有关于深度学习方法用于识别与自杀相关的临床记录(例如，用于监视目的)或使用来自电子病历的临床文本预测自杀行为的效用的报告。提高表型和预测算法的召回率和准确性，特别是通过深度学习分析技术，可以使临床医生更好地跟踪和护理有故意自残、自杀企图、自杀或任何组合风险的患者。在这项研究中，我们探索了一种深度学习方法，用于(1)与国际疾病分类(ICD)代码同步的临床文本中故意自残事件的自动检测，即表型和(2)基于ICD标记的EHR中的遭遇预测未来的自杀企图或故意自残。gydF4y2Ba

方法gydF4y2Ba 软件使用gydF4y2Ba

我们使用R版本3.6.1 (R基础统计计算)[gydF4y2Ba 33gydF4y2Ba]用于处理数据和临床文本，并为深度学习模型构建机器学习管道和Keras和TensorFlow v1.13(谷歌的开源深度神经网络框架)。gydF4y2Ba

患者人群gydF4y2Ba

这项研究由南卡罗来纳医科大学(MUSC)人体研究机构审查委员会(IRB)批准，协议号为Pro00087416。临床记录从Epic (Epic Systems Corporation) EHR系统中提取[gydF4y2Ba 34gydF4y2Ba]使用MUSC研究数据仓库(RDW)，作为研究项目的EHR数据存储库。研究人员可在获得适当的IRB批准和数据治理监督的情况下，向RDW请求数据[gydF4y2Ba 35gydF4y2Ba］．我们从美国疾病控制与预防中心(CDC)的《国家卫生统计报告》(NHSR)中定义的、年龄在20至90岁、带有自杀企图或故意自残ICD代码的成年患者的临床文本笔记中提取[gydF4y2Ba 36gydF4y2Ba］．NHSR特别包括了故意自残事件的代码(例如，T42.4X2;苯二氮卓类药物中毒，故意自残)，不包括非故意自残事件的代码(例如，T42.4X1;苯二氮卓类药物中毒，意外)。对于研究组中的每位患者，我们选择了研究期间(即2012-2019年)图表中记录的第一次故意自残。我们过滤了故意自残的24小时内的笔记。我们还提取了2012年至2019年在我们的EHR中从未有任何故意自残ICD代码的对照病例的临床文本笔记。对照组是在年龄、性别、种族和民族匹配后，从RDW中随机选择的。在处理临床记录的过程中，我们根据记录类型的比例(例如，病程记录的百分比)和记录的字数长度，将对照组与研究病例进行匹配。使用R[中的MatchIt包中的最近邻方法进行匹配。gydF4y2Ba 37gydF4y2Ba］．最终的患者群体包括835例故意自残病例和1670例对照组。gydF4y2Ba

临床的笔记gydF4y2Ba 与故意自残同时发生的笔记gydF4y2Ba

在本研究的第一部分中，我们试图自动检测基于临床文本的并发故意自残ICD代码分配。这些音符包括各种不同的音符类型;然而，大多数包括进展记录、护理计划记录、急诊科(ED)提供者记录、病史和身体记录(H&P)以及咨询记录。的表格中提供了音符类型及其相对频率的完整列表gydF4y2Ba 多媒体附件1gydF4y2Ba．超过800字的个别音符(不到所有音符的三分之一)被截断为800字。我们选择这个截止日期是为了让每个病人都能收到尽可能多的笔记。然后，属于同一病人的记录被连接成一个时间排列的字符串，每个病人产生一个记录。长度超过8000字的串联字符串(44/2505,1.76%的患者)在8000字处被截断。这允许我们将生成的令牌向量维持在计算性能的合理范围内。患者被分为训练和交叉验证组(2012-2017年)，其中661例故意自残病例和1502例对照组，以及拒绝测试组(2018-2019年)，其中174例故意自残病例和168例对照组。gydF4y2Ba

从以前的临床记录预测gydF4y2Ba

在研究的这一部分，我们试图预测未来发生的故意自残事件基于以前的临床记录在电子病历。从每个患者的指数事件(即记录在案的第一次报告的故意自残事件)前180天至30天的预测窗口收集临床文本。在这段时间内没有临床记录的患者被排除在外。临床记录从第一次约会的时间窗口到第一次约会后90天或故意自残事件发生前30天(以先到者为准)。也就是说，最大可能的预测窗口包括时间间隔长达90天的临床记录。对照组使用相同的时间窗口;然而，研究期间记录的最近一次访问被用作索引访问，而不是故意的自残事件。为了减少这部分研究中的噪音和过多的注释，我们将注释限制为以下注释类型:进展记录、ED提供者记录、H&P记录、咨询记录和出院摘要。单个笔记被截断为1500字，并将文本连接到10,000字，以捕获更广泛的临床文本集。对于研究的预测部分，患者被分为训练和交叉验证集(2012-2017年)，其中480例故意自残病例和645例对照组，以及拒绝测试集(2018-2019年)，其中106例故意自残病例和106例对照组。gydF4y2Ba

标记测试集gydF4y2Ba

手工审查了来自测试集(2018-2019年)的200条记录样本，以提供金标准标签，以便与ICD代码标签(基于CDC的NHSR)进行比较。每条记录都反映了EHR中患者同期就诊的临床记录。我们从研究组中随机选择了100人(故意自残icd)和100个对照组。此样本的并发注释中的连接字符串被导入到REDCap(研究电子数据捕获)[gydF4y2Ba 38gydF4y2Ba我们的研究团队包括3名临床心理学家、一名精神科住院医生、一名医科学生和一名儿科医生，他们可以对这些信息进行审查和标注。如果与同期就诊相关的任何临床记录中有自杀企图或故意自残，评审员被指示将笔记标记为故意自残。自杀意念本身不被认为是故意自残。100个注释的子样本由2个标签员独立标记，以估计评分者之间的信度。gydF4y2Ba

文本处理gydF4y2Ba

我们使用训练数据测试了几种机器学习算法，包括使用词嵌入(WEs)的基于深度学习的分类器和传统的基于词袋(BOW)的模型。我们对这两种类型的文本执行了必要的预处理。我们使用了量子R包[gydF4y2Ba 39gydF4y2Ba]和R中用于文本处理管道的正则表达式函数。对于传统的BOW模型，文本处理包括较低的大小写;删除标点符号、停顿词和数字;单词阻止;和标记。对于WE模型，文本处理包括小写字母、句子分割、删除标点符号、使用正则表达式用标记替换大数字和日期，以及标记化。gydF4y2Ba

词的频率gydF4y2Ba

在运行机器学习算法之前，我们检查了与故意自残事件同时发生的临床记录和故意自残事件之前超过30天的记录中词频的差异，与对照人群的临床记录进行了比较。我们进行了卡方分析，以评估在文本语料库中过度代表的关键词[gydF4y2Ba 40gydF4y2Ba］．gydF4y2Ba

Bag-of-Words−基于分类器gydF4y2Ba

对于BOW模型，使用词频作为特征，并使用词频-文档频率逆进行归一化[gydF4y2Ba 41gydF4y2Ba］．传统的文本分类模型包括naïve Bayes [gydF4y2Ba 42gydF4y2Ba];决策树分类器[gydF4y2Ba 43gydF4y2Ba]，最大深度为20;随机森林(RF) [gydF4y2Ba 44gydF4y2Ba]使用201棵树和每次分裂随机抽样作为候选变量的数量(mtry=150);支持向量机(gydF4y2Ba 45gydF4y2Ba]具有径向基核的第1类[gydF4y2Ba 46gydF4y2Ba];以及一种简单的多层感知器(MLP)人工神经网络，其输入层为64节点，隐藏层为64节点，输出节点为单节点。我们在输入层和隐藏层都使用了整流线性单元(ReLU)激活函数，并对二进制输出节点使用了sigmoid激活。MLP使用1×10的学习率进行训练gydF4y2Ba^{−4gydF4y2Ba}，批大小为32,20%的验证分为30个阶段。gydF4y2Ba

字嵌入gydF4y2Ba

我们使用Keras [gydF4y2Ba 47gydF4y2Ba]和TensorFlow版本1.13 [gydF4y2Ba 48gydF4y2Ba]用于构建和训练深度学习模型。在WE的准备工作中，将文本字符串转换为令牌序列。为了构建深度学习模型的特征，序列被预先添加了零，以匹配训练集中最长字符串的长度。我们使用Word2vec (W2V)生成预训练模型[gydF4y2Ba 28gydF4y2Ba］．W2V权重是通过对来自我们EHR数据集的80多万份临床记录样本进行预训练得出的，每个单词使用200个维度，每个方向的跳过窗口大小为5个单词，负抽样为5个。为了探索和可视化预训练的W2V模型的结果，我们使用t分布随机邻居嵌入(t-SNE)将多维词向量映射到2D空间[gydF4y2Ba 49gydF4y2Ba］．每个深度学习分类器的性能分别通过随机初始化嵌入或w2v初始化嵌入进行评估。gydF4y2Ba

深度学习模型gydF4y2Ba

我们研究了2种不同的深度神经网络(DNN)架构:一个CNN架构类似于之前发表的模型[gydF4y2Ba 26gydF4y2Ba]和长短期记忆(LSTM)模型[gydF4y2Ba 50gydF4y2Ba］．这两种架构都使用Keras中随机初始化的WE权重进行测试，或者使用预训练的W2V中的权重进行WE初始化。gydF4y2Ba

两种模型都有每个单词200维的WE。输入层的维度大小略超过令牌输入序列的最大长度，并发音符为8352个令牌，预测音符为11000个令牌。CNN体系结构包括输入层;包含一个掉落率为0.2的WE层;一个卷积层，有多个过滤器大小(3,4,5)并行，每个层有200个节点，ReLU激活，一个步幅，全局最大池化;一个合并张量，然后是一个完全连接的200节点隐藏层，ReLU激活，下降率为0.2;输出层只有一个带有sigmoid激活函数的二进制节点。LSTM体系结构包括输入层;掉落率为0.1的WE层;64节点的LSTM层; both global average pooling and global max-pooling layers with a merge tensor of the 2; a fully connected 100-node hidden layer with ReLU activation and a drop rate of 0.1; and a single sigmoid binary output node.

DNN模型使用自适应矩估计梯度下降算法[gydF4y2Ba 51gydF4y2Ba]从4×10开始，学习率逐渐下降gydF4y2Ba^{−4gydF4y2Ba}，批大小为32，验证分裂为15%，耐心为5的验证数据根据损失函数提前停止。gydF4y2Ba

培训与评估gydF4y2Ba 同时故意自残的检测gydF4y2Ba

为了自动检测基于临床文本的并发故意自残ICD代码分配，我们使用训练和交叉验证数据集(2012-2017年的索引访问)来确定表现最佳的模型和超参数。然后，我们使用表现最好的2个模型(dnn)在完整训练集上进行训练，并在拒绝测试集上进行测试(2018年至2019年进行索引访问)，其中包括200个手动审查的案例。模型使用故意自残ICD代码作为积极标签进行训练。然而，我们使用故意自残ICD代码作为积极标签和手动审查(金标准)标签来测试输出。gydF4y2Ba

未来故意自残事件的预测gydF4y2Ba

两个表现最好的模型，即dnn，被用于预测未来的故意自残事件，基于以前的临床记录。在拒绝测试集中，我们使用了一个平衡集，其中故意自残案例和对照组各有106例。DNN模型在2012年至2017年期间第一次故意自残访问之前的笔记上进行了训练，然后在2018年至2019年期间第一次故意自残访问之前的笔记上进行了测试。与之前的任务不同，之前的任务具有几乎没有变化的接近天花板的性能结果，即使在使用相同的训练和测试集时，dnn在预测任务上的性能在相同模型的不同运行之间也有所不同。这是由于TensorFlow中权重的随机初始化和训练期间epoch之间的随机洗牌。为了更精确地评估不同DNN架构的性能，我们运行每个模型50次，并检查了不同指标的平均值，并使用了StudentgydF4y2Ba tgydF4y2Ba测试(双尾)以确定性能的统计差异。gydF4y2Ba

指标gydF4y2Ba

所有实验的性能指标，包括受试者工作特征(ROC)曲线下的面积(AUC)，在R中使用插入符号[计算gydF4y2Ba 52gydF4y2Ba]和pROC [gydF4y2Ba 53gydF4y2Ba)包。我们还计算了所有模型的准确度、精密度、召回率和F1分数。gydF4y2Ba

结果gydF4y2Ba 国际疾病分类代码分析gydF4y2Ba

在人工审查期间，评分者之间的信度显示科恩kappa为0.96。以人工复查的标签为金标准，并发就诊的故意自残ICD代码的准确性为0.92，精度为0.84，召回率为1.0。因此，根据人工审查，在100例被指定为故意自残ICD代码的病例中，有16例没有表现出故意自残的病史。然而，16个中只有2个gydF4y2Ba 假阳性gydF4y2Ba在他们的临床记录中提到了故意自残。在这2人中，1人怀疑是故意自残，另一人之前承认有自杀意念，可能是故意自残。gydF4y2Ba

词频结果gydF4y2Ba

分析结果表明，关键词在与故意自残事件同时发生的临床记录中以及在故意自残事件发生前的临床记录中均有过高的代表性(gydF4y2Ba 表1gydF4y2Ba)．例如，单词gydF4y2Ba 自杀gydF4y2Ba而且gydF4y2Ba 尝试gydF4y2Ba在并发笔记中名列前茅;但是，在之前的笔记中，它们并没有进入前10名。相反，这些词gydF4y2Ba 障碍gydF4y2Ba而且gydF4y2Ba 如果gydF4y2Ba(自杀意念的缩写)在故意自残之前的笔记中名列前茅。gydF4y2Ba

表1gydF4y2Ba

将每组中排名前10位的单词与对照组进行比较，并对每组进行卡方统计。gydF4y2Ba

与ISH并发gydF4y2Ba^{a、bgydF4y2Ba}		前伊什gydF4y2Ba^cgydF4y2Ba
关键字gydF4y2Ba	卡方检验(gydF4y2Ba dfgydF4y2Ba= 1)gydF4y2Ba	关键字gydF4y2Ba	卡方检验(gydF4y2Ba dfgydF4y2Ba= 1)gydF4y2Ba
自杀gydF4y2Ba	1.3 e + 5gydF4y2Ba	障碍gydF4y2Ba	1.2 e + 4gydF4y2Ba
尝试gydF4y2Ba	8.2 e + 4gydF4y2Ba	如果gydF4y2Ba^dgydF4y2Ba	8.5 e + 3gydF4y2Ba
过量gydF4y2Ba	6.7 e + 4gydF4y2Ba	自杀gydF4y2Ba	6.0 e + 3gydF4y2Ba
如果gydF4y2Ba	6.5 e + 4gydF4y2Ba	情绪gydF4y2Ba	5.8 e + 3gydF4y2Ba
障碍gydF4y2Ba	5.2 e + 4gydF4y2Ba	使用gydF4y2Ba	4.7 e + 3gydF4y2Ba
自杀gydF4y2Ba	5.2 e + 4gydF4y2Ba	酒精gydF4y2Ba	4.6 e + 3gydF4y2Ba
精神病学gydF4y2Ba	4.0 e + 4gydF4y2Ba	这么多gydF4y2Ba^egydF4y2Ba	4.5 e + 3gydF4y2Ba
眼内压gydF4y2Ba^fgydF4y2Ba	3.6 e + 4gydF4y2Ba	安全gydF4y2Ba	4.2 e + 3gydF4y2Ba
面试gydF4y2Ba	3.5 e + 4gydF4y2Ba	面试gydF4y2Ba	3.9 e + 3gydF4y2Ba
情绪gydF4y2Ba	2.9 e + 4gydF4y2Ba	可卡因gydF4y2Ba	3.9 e + 3gydF4y2Ba

^{一个gydF4y2Ba}关键词来自ISH事件并发就诊的临床记录。gydF4y2Ba

^bgydF4y2Ba有意自残。gydF4y2Ba

^cgydF4y2Ba关键词来自首次ISH事件前就诊的临床记录。gydF4y2Ba

^dgydF4y2BaSi:自杀意念。gydF4y2Ba

^egydF4y2Ba精神病学研究所。gydF4y2Ba

^fgydF4y2Baqhs:每次就寝时间(源自拉丁语quaque hora somni)。gydF4y2Ba

预训练结果gydF4y2Ba

W2V模型成功地聚类了似乎具有相似语义上下文的单词。gydF4y2Ba 图1gydF4y2Ba显示了使用t-SNE算法简化为2维的相关单词样本的可视化。gydF4y2Ba 表2gydF4y2Ba显示语义相似的前10个单词gydF4y2Ba 尝试gydF4y2Ba与之相似的前10个词gydF4y2Ba 意念gydF4y2Ba还有它们的余弦相似度。例如，之间的余弦相似度gydF4y2Ba 尝试gydF4y2Ba而且gydF4y2Ba 自杀gydF4y2BaWE向量为0.730和之间gydF4y2Ba 意念gydF4y2Ba而且gydF4y2Ba 自杀gydF4y2Ba是0.872。该列表还显示了几个拼写错误的单词与拼写正确的单词在相似的维度空间中。gydF4y2Ba

图1gydF4y2Ba

来自Word2vec模型的相关单词样本的可视化使用t分布随机邻居嵌入简化为二维。V1 =变量1;2 V2 =变量。gydF4y2Ba

表2gydF4y2Ba

与单词attempt和ideation语义相似的单词及其在Word2vec分析中识别的200维向量空间中的余弦相似度。gydF4y2Ba

术语gydF4y2Ba		因为simgydF4y2Ba^{一个gydF4y2Ba}
尝试gydF4y2Ba
	尝试gydF4y2Ba	1.000gydF4y2Ba
	自杀gydF4y2Ba	0.730gydF4y2Ba
	过量gydF4y2Ba	0.696gydF4y2Ba
	osteoarthrithisgydF4y2Ba	0.679gydF4y2Ba
	手势gydF4y2Ba	0.643gydF4y2Ba
	sucicidegydF4y2Ba	0.625gydF4y2Ba
	benzodiaspinesgydF4y2Ba	0.619gydF4y2Ba
	有意的gydF4y2Ba	0.617gydF4y2Ba
意念gydF4y2Ba		因为simgydF4y2Ba^{一个gydF4y2Ba}
	意念gydF4y2Ba	1.000gydF4y2Ba
	自杀gydF4y2Ba	0.872gydF4y2Ba
	杀气腾腾的gydF4y2Ba	0.837gydF4y2Ba
	意念gydF4y2Ba	0.736gydF4y2Ba
	意图gydF4y2Ba	0.681gydF4y2Ba
	ideaitongydF4y2Ba	0.651gydF4y2Ba
	如果gydF4y2Ba^bgydF4y2Ba	0.648gydF4y2Ba
	sucidialgydF4y2Ba	0.619gydF4y2Ba

^{一个gydF4y2Ba}cossim:余弦相似度。gydF4y2Ba

^bgydF4y2BaSi:自杀意念。gydF4y2Ba

同时故意自残的检测gydF4y2Ba 培训和交叉验证gydF4y2Ba

表3gydF4y2Ba显示了基于2012年至2017年期间故意自残访问的训练和交叉验证数据集的同时故意自残ICD代码分配的自动检测结果。dnn的性能优于BOW分类器。CNN模特的AUC和F1得分最高。总体表现最好的是W2V WE (CNNw)的CNN, AUC为0.988,F1分数为0.928。随机初始化WE (CNNr)的CNN紧随其后，95% ci显著重叠。随机初始化WE的LSTMs (LSTMr)和W2V WE (LSTMw) auc的LSTM分别为0.982和0.975,F1得分均在0.887以上。gydF4y2Ba

在BOW模型中，RF的AUC最好(0.961)，MLP的F1分数最好(0.862)。在这些结果的基础上，我们在接下来的研究中使用了2个深度学习模型。gydF4y2Ba

表3gydF4y2Ba

2012年至2017年数据集上的训练和交叉验证指标。gydF4y2Ba

模型gydF4y2Ba	AUCgydF4y2Ba^{一个gydF4y2Ba}(95%可信区间gydF4y2Ba^bgydF4y2Ba）gydF4y2Ba	准确度(95%置信区间)gydF4y2Ba	精度gydF4y2Ba	回忆gydF4y2Ba	F1的分数gydF4y2Ba
注gydF4y2Ba^cgydF4y2Ba	0.908 (0.882 - -0.934)gydF4y2Ba	0.870 (0.839 - -0.898)gydF4y2Ba	0.734gydF4y2Ba	0.865gydF4y2Ba	0.794gydF4y2Ba
DTgydF4y2Ba^dgydF4y2Ba	0.870 (0.839 - -0.901)gydF4y2Ba	0.865 (0.833 - -0.893)gydF4y2Ba	0.715gydF4y2Ba	0.885gydF4y2Ba	0.791gydF4y2Ba
射频gydF4y2Ba^egydF4y2Ba	0.961 (0.944 - -0.978)gydF4y2Ba	0.896 (0.867 - -0.921)gydF4y2Ba	0.794gydF4y2Ba	0.865gydF4y2Ba	0.828gydF4y2Ba
支持向量机gydF4y2Ba^fgydF4y2Ba	0.947 (0.925 - -0.969)gydF4y2Ba	0.900 (0.872 - -0.924)gydF4y2Ba	0.859gydF4y2Ba	0.782gydF4y2Ba	0.819gydF4y2Ba
中长期规划gydF4y2Ba^ggydF4y2Ba	0.957 (0.938 - -0.976)gydF4y2Ba	0.917 (0.890 - -0.939)gydF4y2Ba	0.828gydF4y2Ba	0.897gydF4y2Ba	0.862gydF4y2Ba
CNNrgydF4y2Ba^hgydF4y2Ba	0.984 (0.972 - -0.995)gydF4y2Ba	0.946 (0.924 - -0.964)gydF4y2Ba	0.938gydF4y2Ba	0.872gydF4y2Ba	0.904gydF4y2Ba
CNNwgydF4y2Ba^我gydF4y2Ba	0.988 (0.977 - -0.999)gydF4y2Ba	0.959 (0.939 - -0.974)gydF4y2Ba	0.947gydF4y2Ba	0.910gydF4y2Ba	0.928gydF4y2Ba
LSTMrgydF4y2Ba^jgydF4y2Ba	0.982 (0.972 - -0.992)gydF4y2Ba	0.943 (0.920 - -0.961)gydF4y2Ba	0.919gydF4y2Ba	0.878gydF4y2Ba	0.898gydF4y2Ba
LSTMwgydF4y2Ba^kgydF4y2Ba	0.975 (0.960 - -0.990)gydF4y2Ba	0.937 (0.913 - -0.956)gydF4y2Ba	0.918gydF4y2Ba	0.859gydF4y2Ba	0.887gydF4y2Ba

^{一个gydF4y2Ba}AUC:接收机工作特性曲线下的面积。gydF4y2Ba

^bgydF4y2BaCI: AUC的95%置信区间。gydF4y2Ba

^cgydF4y2BaNB: naïve贝叶斯。gydF4y2Ba

^dgydF4y2BaDT:决策树。gydF4y2Ba

^egydF4y2BaRF:随机森林。gydF4y2Ba

^fgydF4y2Ba支持向量机:支持向量机。gydF4y2Ba

^ggydF4y2BaMLP:多层感知器。gydF4y2Ba

^hgydF4y2Ba带有随机初始化词嵌入的卷积神经网络。gydF4y2Ba

^我gydF4y2Ba卷积神经网络与Word2vec词嵌入。gydF4y2Ba

^jgydF4y2BaLSTMr:随机初始化词嵌入的长短期记忆。gydF4y2Ba

^kgydF4y2BaLSTMw:使用Word2vec词嵌入的长短期记忆。gydF4y2Ba

同时故意自残标签的检验gydF4y2Ba

在2012年至2017年的完整数据集上训练模型，然后在拒绝(2018-2019)测试集上进行测试，在检测并发故意自残ICD标签方面，产生了比上述交叉验证更好的性能(gydF4y2Ba 表4gydF4y2Ba)．表现最好的模型是CNNr, AUC为0.999,F1得分为0.985。该任务的训练历史图表明，模型在训练和验证时平滑地收敛到最小损失值(gydF4y2Ba 多媒体附件2gydF4y2Ba)．在抵抗集上测试时，添加预训练的W2V WE，即CNNw，没有任何优势。cnn的表现略优于LSTMs，但所有模型的结果都接近天花板，因此很难指出这些差异的意义。正如预期的那样，当模型在ICD标签上进行训练时，它们在预测并发ICD标签方面的表现比预测金标准标签要好(gydF4y2Ba 图2gydF4y2Ba)．值得注意的是，与ICD标签相比，在金标准标签上测试时召回率仍然很高，而精度略有下降，反映了在故意自残ICD代码分析期间实现的精度。gydF4y2Ba

表4gydF4y2Ba

使用国际疾病分类标签和金标准标签对2012年至2017年数据集进行训练和对2018年至2019年坚持测试集进行测试的指标。gydF4y2Ba

模型gydF4y2Ba			AUCgydF4y2Ba^{一个gydF4y2Ba}(95%可信区间gydF4y2Ba^bgydF4y2Ba）gydF4y2Ba		准确度(95%置信区间)gydF4y2Ba		精度gydF4y2Ba		回忆gydF4y2Ba		F1的分数gydF4y2Ba
ICDgydF4y2Ba^cgydF4y2Ba标签gydF4y2Ba
	CNNrgydF4y2Ba^dgydF4y2Ba	0.999 (0.998 - -1.000)gydF4y2Ba		0.985 (0.957 - -0.997)gydF4y2Ba		0.980gydF4y2Ba		0.990gydF4y2Ba		0.985gydF4y2Ba
	CNNwgydF4y2Ba^egydF4y2Ba	0.998 (0.996 - -1.000)gydF4y2Ba		0.970 (0.936 - -0.989)gydF4y2Ba		0.980gydF4y2Ba		0.960gydF4y2Ba		0.970gydF4y2Ba
	LSTMrgydF4y2Ba^fgydF4y2Ba	0.997 (0.991 - -1.000)gydF4y2Ba		0.980 (0.950 - -0.995)gydF4y2Ba		0.990gydF4y2Ba^dgydF4y2Ba		0.970gydF4y2Ba		0.980gydF4y2Ba
	LSTMwgydF4y2Ba^ggydF4y2Ba	0.997 (0.994 - -1.000)gydF4y2Ba		0.960 (0.923 - -0.983)gydF4y2Ba		0.989gydF4y2Ba		0.930gydF4y2Ba		0.959gydF4y2Ba
金标标签gydF4y2Ba
	CNNrgydF4y2Ba^cgydF4y2Ba	0.981 (0.966 - -0.997)gydF4y2Ba		0.915 (0.867 - -0.950)gydF4y2Ba		0.832gydF4y2Ba		1.000gydF4y2Ba		0.908gydF4y2Ba
	CNNwgydF4y2Ba^egydF4y2Ba	0.981 (0.965 - -0.997)gydF4y2Ba		0.920 (0.873 - -0.954)gydF4y2Ba		0.847gydF4y2Ba		0.988gydF4y2Ba		0.912gydF4y2Ba
	LSTMrgydF4y2Ba^fgydF4y2Ba	0.968 (0.946 - -0.989)gydF4y2Ba		0.910 (0.861 - -0.946)gydF4y2Ba		0.837gydF4y2Ba		0.976gydF4y2Ba		0.901gydF4y2Ba
	LSTMwgydF4y2Ba^ggydF4y2Ba	0.967 (0.945 - -0.989)gydF4y2Ba		0.920 (0.873 - -0.954)gydF4y2Ba		0.862gydF4y2Ba		0.964gydF4y2Ba		0.910gydF4y2Ba

^{一个gydF4y2Ba}AUC:接收机工作特性曲线下的面积。gydF4y2Ba

^bgydF4y2BaCI: AUC的95%置信区间。gydF4y2Ba

^cgydF4y2Ba国际疾病分类。gydF4y2Ba

^dgydF4y2Ba带有随机初始化词嵌入的卷积神经网络。gydF4y2Ba

^egydF4y2Ba卷积神经网络与Word2vec词嵌入。gydF4y2Ba

^fgydF4y2BaLSTMr:随机初始化词嵌入的长短期记忆。gydF4y2Ba

^ggydF4y2BaLSTMw:使用Word2vec词嵌入的长短期记忆。gydF4y2Ba

图2gydF4y2Ba

使用(1)国际疾病分类标签和(2)金标准标签在2012至2017年数据集上进行训练和在坚持测试集(2018-2019)上进行测试的受试者工作特征曲线下的面积。AUC:受试者工作特性曲线下面积;国际疾病分类;CNNr:随机初始化词嵌入卷积神经网络;CNNw:基于Word2vec词嵌入的卷积神经网络;LSTMr:随机初始化词嵌入的长短期记忆;LSTMw:采用Word2vec词嵌入的长短期记忆。gydF4y2Ba

未来故意自残事件的预测gydF4y2Ba

基于以往临床记录预测未来故意自残事件的结果显示在gydF4y2Ba 表5gydF4y2Ba．这些值是每个模型经过50个训练和测试周期后不同指标的平均值。gydF4y2Ba 图3gydF4y2Ba显示了不同模型之间的性能差异。CNNr模型表现最佳，平均AUC为0.882，标准差为0.006 (gydF4y2Ba PgydF4y2Ba<.001)，而CNNw的表现又优于LSTM模型(gydF4y2Ba PgydF4y2Ba<措施)。LSTMr与LSTMw之间无显著差异。LSTM模型的性能差异明显大于CNN模型。gydF4y2Ba 多媒体gydF4y2Ba显示每个模型的ROC曲线，突出显示平均AUC。虽然使用W2V的预训练在性能方面没有增加价值，但它确实减少了训练期间所需的epoch数，CNN平均减少了32%，LSTM减少了12%。gydF4y2Ba

表5gydF4y2Ba

模型的指标是根据2012年至2017年期间患者首次故意自残就诊前的笔记进行训练的，并对2018年至2019年期间患者首次故意自残就诊前的笔记进行测试。gydF4y2Ba

模型gydF4y2Ba	AUCgydF4y2Ba^{一个gydF4y2Ba}(95%可信区间gydF4y2Ba^bgydF4y2Ba）gydF4y2Ba	准确度(95%置信区间)gydF4y2Ba	精度gydF4y2Ba	回忆gydF4y2Ba	F1的分数gydF4y2Ba
CNNrgydF4y2Ba^cgydF4y2Ba	0.882 (0.871 - -0.891)gydF4y2Ba	0.792 (0.774 - -0.807)gydF4y2Ba	0.863gydF4y2Ba	0.694gydF4y2Ba	0.769gydF4y2Ba
CNNwgydF4y2Ba^dgydF4y2Ba	0.869 (0.858 - -0.879)gydF4y2Ba	0.782 (0.766 - -0.792)gydF4y2Ba	0.860gydF4y2Ba	0.673gydF4y2Ba	0.755gydF4y2Ba
LSTMrgydF4y2Ba^egydF4y2Ba	0.850 (0.827 - -0.877)gydF4y2Ba	0.758 (0.729 - -0.788)gydF4y2Ba	0.830gydF4y2Ba	0.656gydF4y2Ba	0.729gydF4y2Ba
LSTMwgydF4y2Ba^fgydF4y2Ba	0.846 (0.819 - -0.871)gydF4y2Ba	0.750 (0.717 - -0.778)gydF4y2Ba	0.822gydF4y2Ba	0.644gydF4y2Ba	0.720gydF4y2Ba

^{一个gydF4y2Ba}AUC:接收机工作特性曲线下的面积。gydF4y2Ba

^bgydF4y2BaCI: AUC的95%置信区间。gydF4y2Ba

^bgydF4y2Ba带有随机初始化词嵌入的卷积神经网络。gydF4y2Ba

^dgydF4y2Ba卷积神经网络与Word2vec词嵌入。gydF4y2Ba

^egydF4y2BaLSTMr:随机初始化词嵌入的长短期记忆。gydF4y2Ba

^fgydF4y2BaLSTMw:使用Word2vec词嵌入的长短期记忆。gydF4y2Ba

图3gydF4y2Ba

接受者工作特征曲线下的平均面积和95% CI，模型是根据2012年至2017年期间患者首次故意自残就诊前的笔记进行训练，并对2018年至2019年期间患者首次故意自残就诊前的笔记进行测试。表现上的差异都是显著的(gydF4y2Ba PgydF4y2Ba<.001)，除了LSTMr和LSTMw之间的差异。AUC:受试者工作特性曲线下面积;CNNr:随机初始化词嵌入卷积神经网络;CNNw:基于Word2vec词嵌入的卷积神经网络;LSTMr:随机初始化词嵌入的长短期记忆;LSTMw:采用Word2vec词嵌入的长短期记忆。gydF4y2Ba

讨论gydF4y2Ba 语义的差异gydF4y2Ba

词频分析确定了与故意自残就诊相关的临床记录中过度代表的关键词。如在gydF4y2Ba 表1gydF4y2Ba，例如gydF4y2Ba 尝试gydF4y2Ba而且gydF4y2Ba 过量gydF4y2Ba与对照组相比，在与故意自残事件同时发生的临床记录中比例过高。相反，自杀意念(用速记词表示)gydF4y2Ba 如果gydF4y2Ba)经常出现在故意自残的笔记中。这与有关构思的文献一致，构思是自杀企图和自杀完成的一个突出风险因素[gydF4y2Ba 54gydF4y2Ba］．gydF4y2Ba

W2V对我们临床记录的完整数据集进行预训练，成功地将相关单词聚在一起。它还演示了上面确定的一些重要单词的单词相似性。例如，单词gydF4y2Ba 尝试gydF4y2Ba，gydF4y2Ba 自杀gydF4y2Ba,gydF4y2Ba 过量gydF4y2Ba与高余弦相似度密切相关。该模型在将拼写错误的单词与拼写正确的单词聚类时也很有用，这可能有助于减少临床记录中拼写错误造成的噪音。gydF4y2Ba

故意自残事件的检测gydF4y2Ba

在使用2012年至2017年的数据集进行训练和测试时，深度学习模型在识别故意自残方面优于BOW模型。考虑到这一结果，我们在2012年至2017年的完整数据集上训练深度学习模型，然后使用2018年至2019年的数据集作为坚持测试集。这种数据的时间划分旨在复制真实世界的场景，在这个场景中，模型可以在历史数据上进行训练，以识别新记录中的故意自残。结果表明，我们可以准确地检测出与故意自残ICD代码同步的临床记录中的故意自残事件。更具体地说，我们表明，即使尚未提供或分配ICD代码，在与给定故意自残就诊相关的汇总临床文本上训练的模型也可用于识别并发的故意自残事件。换句话说，临床文献本身在准确识别故意自残表型方面是有用的。gydF4y2Ba

虽然关于NLP和机器学习方法在故意自残表型上的表现的文献有限，但我们的DNN分类器对带有故意自残ICD代码的并发笔记的精度高达99%，对金标准故意自残事件的精度高达86%，与以前的报道相比，特别是考虑到模型是用ICD代码作为标签进行训练的。使用混合机器学习和基于规则的NLP方法，Fernandes等[gydF4y2Ba 19gydF4y2Ba]在识别自杀企图方面的准确率达到了82.8%。另一项研究比较了ICD编码和NLP提取的自杀概念的准确性，仅使用NLP的准确率为60%，使用ICD-9编码和NLP的准确率为97%;然而，这项研究并没有区分自杀意念和故意自残[gydF4y2Ba 16gydF4y2Ba］．gydF4y2Ba

尽管基于cnn的模型在表型任务上似乎略优于基于lstm的模型，但由于所有dnn在该任务中的性能接近上限，且数据集相对较小，因此很难显示使用任何一种模型或使用W2V预训练的优势。gydF4y2Ba

尽管如此，使用这种方法训练的DNN模型可能对监视目的有用，并且可以很好地补充使用ICD代码的监视。使用故意自残ICD码作为积极标签来训练这种模型依赖于ICD码的可靠分配。幸运的是，我们机构对故意自残的ICD代码是准确的，正如人工复查图表所示，尽管假阳性率相对较高。最后，故意自残事件的准确表型为未来识别其他表型的方向铺平了道路，例如，那些有自杀意念的人与故意自残或非故意自残的人，可能有也可能没有准确的ICD代码。鉴于死亡率数据的可用性，这种精确或深入的表型是预测死亡风险的重要一步。gydF4y2Ba

基于临床文本的未来故意自残预测gydF4y2Ba

结果还显示，在指数访问前1至6个月的临床记录汇总预测了未来的故意自残事件，AUC为0.882gydF4y2Ba 表现最好gydF4y2BaCNN模型。这些结果与有关自杀企图预测模型的文献相比较有利。Walsh等人使用结构化EHR数据(包括人口统计数据、诊断代码和基于人口普查的社会经济状况)和通过NLP提取的药物数据的复杂组合[gydF4y2Ba 20.gydF4y2Ba]的最大AUC为0.84。此外，该AUC仅基于7天前的数据。随着预测窗口扩大至指数访问前6个月，AUC逐渐下降至0.81。gydF4y2Ba

在比较两种DNN架构之间的性能时，我们注意到两种CNN模型与基于lstm的模型相比具有一致且统计上显著的性能优势(gydF4y2Ba 图3gydF4y2Ba)．此外，LSTM在50次训练运行中具有相对较高的方差和不一致的性能，可以从ci中注意到。我们还注意到LSTM比CNN的计算成本更高(几乎是每epoch训练所需时间的两倍)。除了较高的计算成本外，循环神经网络在一般文本分类任务中显示出较小的优势[gydF4y2Ba 55gydF4y2Ba，gydF4y2Ba 56gydF4y2Ba］．至少在像我们这样的小数据集上，cnn被发现收敛得更平滑，并提供更好的性能。gydF4y2Ba

虽然W2V预训练聚集了相似的单词，但用W2V权重初始化WE层并没有给任何预测模型增加任何值。虽然CNNr (AUC=0.882)仅略好于CNNw (AUC=0.869)，但差异具有统计学意义。然而，LSTMr和LSTMw之间没有差异。考虑到预训练的WE在识别拼写错误和单词相似性方面的优势，这些结果是出乎意料的，并强调了检查更新、更复杂的语言模型的必要性，例如谷歌(Alphabet Inc .)来自transformer的双向编码器表示[gydF4y2Ba 29gydF4y2Ba］．gydF4y2Ba

不管模型架构如何，这些结果都是有希望的。这种预测模型可能有助于将住院患者划分为风险类别，这可能有助于出院计划。在出院后使用技术(电话、电子邮件或短信)进行随访已被证明可以降低未来企图自杀的风险[gydF4y2Ba 57gydF4y2Ba］．此外，患者可以预防性地安排一名社会工作者;被引导到可获得精神卫生服务的合作初级保健诊所;或接受心理健康转诊、远程医疗预约或家庭健康访问[gydF4y2Ba 58gydF4y2Ba］．预测模型的适当改进甚至可以使患者分层到出院后所需的护理水平，而不仅仅是简单的二元风险分类。gydF4y2Ba

限制gydF4y2Ba

为了在给定的访问期间识别有意自残的患者，我们用ICD代码训练模型。因此，它们只能执行ICD代码指定。如前所述，在手动标记过程中，有几名患者在主诉或诊断中有故意自残史，而不是自杀未遂或自残史。一个可能的解决方案是训练模型引入多个标签，包括当前和过去的故意自残，通过人工审查。然而，这将需要手动审查数百张图表，这超出了最初试点工作的范围。gydF4y2Ba

此外，虽然我们可以清楚地识别故意自残，但这仍然没有具体说明gydF4y2Ba 意图死亡gydF4y2Ba．这突出表明有必要获得自杀死亡人数的数据。有多种形式的自伤(例如，火器、尖锐物体、从高处跳下来)，ICD代码没有附带伤害自己意图的分类。因此，在这些意图不明的情况下，自伤可能反映了多种动机:传达痛苦、低杀伤力的自杀姿态、非自杀性自伤(NSSI)或死亡[gydF4y2Ba 59gydF4y2Ba］．现有的预测自伤行为的文献得出了三个值得注意的危险因素类别:自伤史、B类人格和绝望[gydF4y2Ba 60gydF4y2Ba］．在本研究中，识别自伤具有重要的预后价值，并没有将其与死亡意图区分开来。gydF4y2Ba

本研究的另一个局限性是我们的模型目前只涉及临床文献中的特征。其他临床信息可以添加到模型中，如相关的人口统计学、共病和风险因素(例如，抑郁症或药物使用的代码)。此外，就自杀预测而言，仅靠电子病历数据可能无法提供全貌。理想情况下，我们的数据应该与全州死因数据相关联，这应该会产生更好的预测能力。gydF4y2Ba

虽然深度学习模型更强大，但它们的可解释性不如一些BOW模型。例如，当使用射频模型时，可变重要性分析的结果可能会产生对重要单词的洞察。事实上，在心理健康应用中使用这两种类型的预测模型可能是有益的。这将充分利用深度学习模型的力量以及可解释模型的优势。未来的工作还应包括探索基于注意力的深度学习模型，并深入了解可解释性[gydF4y2Ba 61gydF4y2Ba]，这可能会解决这些模型在现实世界临床决策支持和临床医生采用中的效用。gydF4y2Ba

最后，本文给出的结果是基于来自一个学术医疗中心的单个EHR系统的数据，因此很难在其他环境中对我们的模型的高水平性能进行概括。未来的工作应包括与其他机构合作，以确定这些模型在其他环境中的性能。gydF4y2Ba

结论gydF4y2Ba

大多数模型在同步临床记录(即表型任务)中检测故意自残事件时表现相对较好。这很可能是由于并发笔记中的强烈信号，并与ICD代码中故意自残的高保真度有关，至少在我们的机构中是这样。当应用于基于先前临床记录的患者图表中有意自残代码分配的未来发生预测时，AUC降至0.882，召回率和精度适中。尽管如此，我们的结果与文献中报道的其他模型的结果具有竞争力。提高这些算法的精度可以使精神卫生专业人员对未来有自杀企图风险的患者进行更好的随访和预防性护理。gydF4y2Ba

多媒体附件1gydF4y2Ba

音符类型及其在数据集中的相对频率的完整列表。gydF4y2Ba

多媒体附件2gydF4y2Ba

用于表型任务的卷积神经网络模型的训练历史图。学习曲线表明，使用Adam优化器，模型平滑地收敛到训练集和验证集上的最小损失值。gydF4y2Ba

多媒体gydF4y2Ba

所有模型的50次训练和测试运行的接收器工作特征曲线的图表，突出显示每个模型的接收器工作特征曲线下的平均面积。gydF4y2Ba

缩写gydF4y2Ba

AUCgydF4y2Ba

接收机工作特性曲线下面积gydF4y2Ba

弓gydF4y2Ba

bag-of-wordsgydF4y2Ba

疾病预防控制中心gydF4y2Ba

疾病控制和预防中心gydF4y2Ba

美国有线电视新闻网gydF4y2Ba

卷积神经网络gydF4y2Ba

CNNrgydF4y2Ba

随机初始化词嵌入的CNNgydF4y2Ba

CNNwgydF4y2Ba

CNN的Word2vec词嵌入gydF4y2Ba

款gydF4y2Ba

深度神经网络gydF4y2Ba

艾德gydF4y2Ba

急诊科gydF4y2Ba

电子健康档案gydF4y2Ba

电子健康记录gydF4y2Ba

H&PgydF4y2Ba

病史和体质gydF4y2Ba

ICDgydF4y2Ba

《国际疾病分类》gydF4y2Ba

IRBgydF4y2Ba

机构检讨委员会gydF4y2Ba

LSTMgydF4y2Ba

长短期记忆gydF4y2Ba

LSTMrgydF4y2Ba

带有随机初始化词嵌入的LSTMgydF4y2Ba

LSTMwgydF4y2Ba

LSTM与Word2vec词嵌入gydF4y2Ba

中长期规划gydF4y2Ba

多层感知器gydF4y2Ba

音乐gydF4y2Ba

南卡罗来纳医科大学gydF4y2Ba

NHSRgydF4y2Ba

国家卫生统计报告gydF4y2Ba

NLPgydF4y2Ba

自然语言处理gydF4y2Ba

NSSIgydF4y2Ba

自杀性自伤gydF4y2Ba

RDWgydF4y2Ba

研究数据仓库gydF4y2Ba

线性整流函数（Rectified Linear Unit）gydF4y2Ba

线性整流函数gydF4y2Ba

射频gydF4y2Ba

随机森林gydF4y2Ba

中华民国gydF4y2Ba

接收机工作特性gydF4y2Ba

支持向量机gydF4y2Ba

t-SNEgydF4y2Ba

t分布随机邻居嵌入gydF4y2Ba

W2VgydF4y2Ba

Word2vecgydF4y2Ba

我们gydF4y2Ba

字嵌入gydF4y2Ba

该项目部分得到了美国国立卫生研究院国家转化科学推进中心的支持，资助号为UL1 TR001450，美国国家药物滥用研究所(K23 DA045766 to JD)和美国国家精神卫生研究所(K23 MH118482 to BB)。内容仅为作者的责任，并不一定代表美国国立卫生研究院的官方观点。gydF4y2Ba

JD是行为激活技术有限责任公司的共同所有人，该公司开发基于技术的抑郁症治疗方法。gydF4y2Ba

1gydF4y2Ba

KochanekgydF4y2Ba

KDgydF4y2Ba

墨菲gydF4y2Ba

年代gydF4y2Ba

徐gydF4y2Ba

JgydF4y2Ba

阿里亚斯gydF4y2Ba

EgydF4y2Ba

2016年美国死亡率gydF4y2Ba

美国国家卫生统计中心数据概要gydF4y2Ba 2017gydF4y2Ba 12gydF4y2Ba 293gydF4y2Ba 1gydF4y2Ba 8gydF4y2Ba

29319473gydF4y2Ba

2gydF4y2Ba

致命伤害数据gydF4y2Ba

疾病控制和预防中心gydF4y2Ba 2019-12-02gydF4y2Ba

https://www.cdc.gov/injury/wisqars/fatal.htmlgydF4y2Ba

3.gydF4y2Ba

预防自杀gydF4y2Ba

疾病控制和预防中心gydF4y2Ba 2019-12-02gydF4y2Ba

https://www.cdc.gov/violenceprevention/suicide/fastfact.htmlgydF4y2Ba

4gydF4y2Ba

GviongydF4y2Ba

YgydF4y2Ba

Levi-BelzgydF4y2Ba

YgydF4y2Ba

严重自杀企图:心理危险因素的系统回顾gydF4y2Ba

前精神病学gydF4y2Ba 2018gydF4y2Ba 9gydF4y2Ba 56gydF4y2Ba

10.3389 / fpsyt.2018.00056gydF4y2Ba

29563886gydF4y2Ba

PMC5845877gydF4y2Ba

5gydF4y2Ba

富兰克林gydF4y2Ba

JCgydF4y2Ba

里贝罗gydF4y2Ba

JDgydF4y2Ba

狐狸gydF4y2Ba

基米-雷克南gydF4y2Ba

宾利gydF4y2Ba

KHgydF4y2Ba

克雷曼gydF4y2Ba

新兴市场gydF4y2Ba

黄gydF4y2Ba

XgydF4y2Ba

MusacchiogydF4y2Ba

公里gydF4y2Ba

JaroszewskigydF4y2Ba

交流gydF4y2Ba

常gydF4y2Ba

英国石油公司gydF4y2Ba

诺gydF4y2Ba

可gydF4y2Ba

自杀想法和行为的危险因素:50年研究的荟萃分析gydF4y2Ba

Psychol牛gydF4y2Ba 2017gydF4y2Ba 02gydF4y2Ba 143gydF4y2Ba 2gydF4y2Ba 187gydF4y2Ba 232gydF4y2Ba

10.1037 / bul0000084gydF4y2Ba

27841450gydF4y2Ba

2016-54856-001gydF4y2Ba

6gydF4y2Ba

常ydF4y2Ba

可gydF4y2Ba

巴蒂gydF4y2Ba

HgydF4y2Ba

米德gydF4y2Ba

NgydF4y2Ba

斯托克顿gydF4y2Ba

年代gydF4y2Ba

埃文斯gydF4y2Ba

JgydF4y2Ba

奥康纳gydF4y2Ba

钢筋混凝土gydF4y2Ba

卡普尔gydF4y2Ba

NgydF4y2Ba

肯德尔gydF4y2Ba

TgydF4y2Ba

预测自残后自杀:风险因素和风险等级的系统回顾gydF4y2Ba

精神病学杂志gydF4y2Ba 2016gydF4y2Ba 10gydF4y2Ba 209gydF4y2Ba 4gydF4y2Ba 277gydF4y2Ba 83gydF4y2Ba

10.1192 / bjp.bp.115.170050gydF4y2Ba

27340111gydF4y2Ba

S000712500024511XgydF4y2Ba

7gydF4y2Ba

雅可布gydF4y2Ba

DgydF4y2Ba

BaldessarinigydF4y2Ba

RgydF4y2Ba

康威尔gydF4y2Ba

YgydF4y2Ba

福西特gydF4y2Ba

JgydF4y2Ba

霍顿gydF4y2Ba

lgydF4y2Ba

MeltzergydF4y2Ba

HgydF4y2Ba

菲gydF4y2Ba

CgydF4y2Ba

西蒙gydF4y2Ba

RgydF4y2Ba

有自杀行为的病人的评估和治疗gydF4y2Ba

自杀行为患者评估和治疗实践指南gydF4y2Ba 2010gydF4y2Ba

2020-06-10gydF4y2Ba

华盛顿特区gydF4y2Ba

美国精神病学协会实践指南指导委员会gydF4y2Ba

https://psychiatryonline.org/pb/assets/raw/sitewide/practice_guidelines/guidelines/suicide.pdfgydF4y2Ba

8gydF4y2Ba

监测报告2016 - 8岁以上自残:短期管理和预防复发(2004)NICE指南CG16和8岁以上自残:长期管理(2011)NICE指南CG133gydF4y2Ba 2016gydF4y2Ba

伦敦gydF4y2Ba

国家健康和护理卓越研究所(英国)gydF4y2Ba

9gydF4y2Ba

拉金gydF4y2Ba

CgydF4y2Ba

Di布拉西gydF4y2Ba

ZgydF4y2Ba

ArensmangydF4y2Ba

EgydF4y2Ba

重复自残的危险因素:前瞻性医院研究的系统回顾gydF4y2Ba

《公共科学图书馆•综合》gydF4y2Ba 2014gydF4y2Ba 9gydF4y2Ba 1gydF4y2Ba e84282gydF4y2Ba

10.1371 / journal.pone.0084282gydF4y2Ba

24465400gydF4y2Ba

玉米饼- d - 12 - 39886gydF4y2Ba

PMC3896350gydF4y2Ba

10gydF4y2Ba

博尔顿gydF4y2Ba

JMgydF4y2Ba

GunnellgydF4y2Ba

DgydF4y2Ba

TureckigydF4y2Ba

GgydF4y2Ba

精神疾病患者的自杀风险评估和干预gydF4y2Ba

Br医学JgydF4y2Ba 2015gydF4y2Ba 11gydF4y2Ba 9gydF4y2Ba 351gydF4y2Ba h4978gydF4y2Ba

10.1136 / bmj.h4978gydF4y2Ba

26552947gydF4y2Ba

11gydF4y2Ba

RunesongydF4y2Ba

BgydF4y2Ba

OdeberggydF4y2Ba

JgydF4y2Ba

佩特森gydF4y2Ba

一个gydF4y2Ba

EdbomgydF4y2Ba

TgydF4y2Ba

AdamssongydF4y2Ba

IJgydF4y2Ba

WaerngydF4y2Ba

米gydF4y2Ba

自杀风险评估工具:评估证据确定性的系统回顾gydF4y2Ba

《公共科学图书馆•综合》gydF4y2Ba 2017gydF4y2Ba 12gydF4y2Ba 7gydF4y2Ba e0180292gydF4y2Ba

10.1371 / journal.pone.0180292gydF4y2Ba

28723978gydF4y2Ba

玉米饼- d - 16 - 38967gydF4y2Ba

PMC5517300gydF4y2Ba

12gydF4y2Ba

保林接着gydF4y2Ba

CgydF4y2Ba

杰出的人物gydF4y2Ba

BgydF4y2Ba

汤普森gydF4y2Ba

PgydF4y2Ba

VepstasgydF4y2Ba

lgydF4y2Ba

Young-XugydF4y2Ba

YgydF4y2Ba

Goertzel写到gydF4y2Ba

BgydF4y2Ba

美国瓦茨gydF4y2Ba

BgydF4y2Ba

劣绅gydF4y2Ba

lgydF4y2Ba

麦卡利斯特gydF4y2Ba

TgydF4y2Ba

通过分析临床记录文本预测自杀风险gydF4y2Ba

《公共科学图书馆•综合》gydF4y2Ba 2014gydF4y2Ba 9gydF4y2Ba 1gydF4y2Ba e85733gydF4y2Ba

10.1371 / journal.pone.0085733gydF4y2Ba

24489669gydF4y2Ba

玉米饼- d - 13 - 32997gydF4y2Ba

PMC3904866gydF4y2Ba

13gydF4y2Ba

伯克gydF4y2Ba

助教gydF4y2Ba

安默曼gydF4y2Ba

英航gydF4y2Ba

JacobuccigydF4y2Ba

RgydF4y2Ba

机器学习在自杀和非自杀自残思想和行为研究中的应用:系统综述gydF4y2Ba

J情感失调gydF4y2Ba 2019gydF4y2Ba 02gydF4y2Ba 15gydF4y2Ba 245gydF4y2Ba 869gydF4y2Ba 84gydF4y2Ba

10.1016 / j.jad.2018.11.073gydF4y2Ba

30699872gydF4y2Ba

s0165 - 0327 (18) 31750 - 6gydF4y2Ba

14gydF4y2Ba

凯斯勒gydF4y2Ba

钢筋混凝土gydF4y2Ba

斯坦gydF4y2Ba

MBgydF4y2Ba

PetukhovagydF4y2Ba

MVgydF4y2Ba

BliesegydF4y2Ba

PgydF4y2Ba

BossartegydF4y2Ba

RMgydF4y2Ba

BrometgydF4y2Ba

EJgydF4y2Ba

富勒顿gydF4y2Ba

CSgydF4y2Ba

吉尔曼gydF4y2Ba

SEgydF4y2Ba

IvanygydF4y2Ba

CgydF4y2Ba

Lewandowski-RompsgydF4y2Ba

lgydF4y2Ba

米利根贝尔gydF4y2Ba

一个gydF4y2Ba

NaifehgydF4y2Ba

晶澳gydF4y2Ba

诺gydF4y2Ba

可gydF4y2Ba

里斯gydF4y2Ba

通过gydF4y2Ba

RosellinigydF4y2Ba

AJgydF4y2Ba

桑普森gydF4y2Ba

NAgydF4y2Ba

ZaslavskygydF4y2Ba

我gydF4y2Ba

UrsanogydF4y2Ba

RJgydF4y2Ba

陆军STARRS合作者gydF4y2Ba

在军队研究中预测门诊心理健康访问后的自杀，以评估服役人员的风险和恢复力(陆军STARRS)gydF4y2Ba

摩尔精神病学gydF4y2Ba 2017gydF4y2Ba 04gydF4y2Ba 22gydF4y2Ba 4gydF4y2Ba 544gydF4y2Ba 51gydF4y2Ba

10.1038 / mp.2016.110gydF4y2Ba

27431294gydF4y2Ba

mp2016110gydF4y2Ba

PMC5247428gydF4y2Ba

15gydF4y2Ba

钟gydF4y2Ba

问gydF4y2Ba

卡尔森gydF4y2Ba

电子战gydF4y2Ba

GelayegydF4y2Ba

BgydF4y2Ba

菲南gydF4y2Ba

年代gydF4y2Ba

AvillachgydF4y2Ba

PgydF4y2Ba

Smoller表示gydF4y2Ba

JWgydF4y2Ba

蔡gydF4y2Ba

TgydF4y2Ba

威廉姆斯gydF4y2Ba

妈gydF4y2Ba

在电子病历中筛查孕妇自杀行为:诊断代码vs自然语言处理的临床记录gydF4y2Ba

BMC Med通知Decis MakgydF4y2Ba 2018gydF4y2Ba 05gydF4y2Ba 29gydF4y2Ba 18gydF4y2Ba 1gydF4y2Ba 30.gydF4y2Ba

10.1186 / s12911 - 018 - 0617 - 7gydF4y2Ba

29843698gydF4y2Ba

10.1186 / s12911 - 018 - 0617 - 7gydF4y2Ba

PMC5975502gydF4y2Ba

16gydF4y2Ba

HaeriangydF4y2Ba

KgydF4y2Ba

SalmasiangydF4y2Ba

HgydF4y2Ba

弗里德曼gydF4y2Ba

CgydF4y2Ba

电子病历中自杀或自杀意念的识别方法gydF4y2Ba

AMIA年度诉讼程序gydF4y2Ba 2012gydF4y2Ba 2012gydF4y2Ba 1244gydF4y2Ba 53gydF4y2Ba

23304402gydF4y2Ba

PMC3540459gydF4y2Ba

17gydF4y2Ba

麦科伊gydF4y2Ba

THgydF4y2Ba

卡斯特罗gydF4y2Ba

虚拟机gydF4y2Ba

罗伯森gydF4y2Ba

我gydF4y2Ba

鲷鱼gydF4y2Ba

拉gydF4y2Ba

玻璃市gydF4y2Ba

RHgydF4y2Ba

利用自然语言处理技术改进综合医院出院后自杀和意外死亡的预测gydF4y2Ba

JAMA精神病学gydF4y2Ba 2016gydF4y2Ba 10gydF4y2Ba 1gydF4y2Ba 73gydF4y2Ba 10gydF4y2Ba 1064gydF4y2Ba 71gydF4y2Ba

10.1001 / jamapsychiatry.2016.2172gydF4y2Ba

27626235gydF4y2Ba

2548276gydF4y2Ba

18gydF4y2Ba

波动gydF4y2Ba

JgydF4y2Ba

VelupillaigydF4y2Ba

年代gydF4y2Ba

乔治gydF4y2Ba

GgydF4y2Ba

霍尔顿gydF4y2Ba

RgydF4y2Ba

KikolergydF4y2Ba

米gydF4y2Ba

迪安gydF4y2Ba

HgydF4y2Ba

费尔南德斯gydF4y2Ba

一个gydF4y2Ba

杜塔gydF4y2Ba

RgydF4y2Ba

自闭症谱系障碍青少年自杀倾向的检测:开发一种用于电子健康记录的自然语言处理方法gydF4y2Ba

AMIA年度诉讼程序gydF4y2Ba 2017gydF4y2Ba 2017gydF4y2Ba 641gydF4y2Ba 9gydF4y2Ba

29854129gydF4y2Ba

PMC5977628gydF4y2Ba

19gydF4y2Ba

费尔南德斯gydF4y2Ba

交流gydF4y2Ba

杜塔gydF4y2Ba

RgydF4y2Ba

VelupillaigydF4y2Ba

年代gydF4y2Ba

SanyalgydF4y2Ba

JgydF4y2Ba

斯图尔特gydF4y2Ba

RgydF4y2Ba

ChandrangydF4y2Ba

DgydF4y2Ba

使用自然语言处理在精神病学临床研究数据库中识别自杀意念和自杀企图gydF4y2Ba

Sci代表gydF4y2Ba 2018gydF4y2Ba 05gydF4y2Ba 9gydF4y2Ba 8gydF4y2Ba 1gydF4y2Ba 7426gydF4y2Ba

10.1038 / s41598 - 018 - 25773 - 2gydF4y2Ba

29743531gydF4y2Ba

10.1038 / s41598 - 018 - 25773 - 2gydF4y2Ba

PMC5943451gydF4y2Ba

20.gydF4y2Ba

沃尔什gydF4y2Ba

CGgydF4y2Ba

里贝罗gydF4y2Ba

JDgydF4y2Ba

富兰克林gydF4y2Ba

JCgydF4y2Ba

通过机器学习预测自杀企图的风险gydF4y2Ba

临床心理科学gydF4y2Ba 2017gydF4y2Ba 04gydF4y2Ba 11gydF4y2Ba 5gydF4y2Ba 3.gydF4y2Ba 457gydF4y2Ba 469gydF4y2Ba

10.1177 / 2167702617691560gydF4y2Ba

21gydF4y2Ba

Delgado-GomezgydF4y2Ba

DgydF4y2Ba

Baca-GarciagydF4y2Ba

EgydF4y2Ba

AguadogydF4y2Ba

DgydF4y2Ba

CourtetgydF4y2Ba

PgydF4y2Ba

Lopez-CastromangydF4y2Ba

JgydF4y2Ba

计算机化自适应测试vs .决策树:支持决策系统的开发以识别自杀行为gydF4y2Ba

J情感失调gydF4y2Ba 2016gydF4y2Ba 12gydF4y2Ba 206gydF4y2Ba 204gydF4y2Ba 9gydF4y2Ba

10.1016 / j.jad.2016.07.032gydF4y2Ba

27475891gydF4y2Ba

s0165 - 0327 (16) 30489 - xgydF4y2Ba

22gydF4y2Ba

MetzgergydF4y2Ba

米gydF4y2Ba

TvardikgydF4y2Ba

NgydF4y2Ba

GicquelgydF4y2Ba

问gydF4y2Ba

BouvrygydF4y2Ba

CgydF4y2Ba

波利特gydF4y2Ba

EgydF4y2Ba

Potinet-PagliaroligydF4y2Ba

VgydF4y2Ba

使用急诊部门电子医疗记录自动流行病学监测自杀企图:法国试点研究gydF4y2Ba

Int J方法精神病学研究gydF4y2Ba 2017gydF4y2Ba 06gydF4y2Ba 26gydF4y2Ba 2gydF4y2Ba -gydF4y2Ba

10.1002 / mpr.1522gydF4y2Ba

27634457gydF4y2Ba

PMC6877202gydF4y2Ba

23gydF4y2Ba

Lopez-CastromangydF4y2Ba

JgydF4y2Ba

Perez-RodriguezgydF4y2Ba

医学博士gydF4y2Ba

JaussentgydF4y2Ba

我gydF4y2Ba

喜悦gydF4y2Ba

AAgydF4y2Ba

Artes-RodriguezgydF4y2Ba

一个gydF4y2Ba

释放gydF4y2Ba

PgydF4y2Ba

GuillaumegydF4y2Ba

年代gydF4y2Ba

JollantgydF4y2Ba

FgydF4y2Ba

Leiva-MurillogydF4y2Ba

JMgydF4y2Ba

MalafossegydF4y2Ba

一个gydF4y2Ba

OquendogydF4y2Ba

妈gydF4y2Ba

de Prado-CumplidogydF4y2Ba

米gydF4y2Ba

Saiz-RuizgydF4y2Ba

JgydF4y2Ba

Baca-GarciagydF4y2Ba

EgydF4y2Ba

CourtetgydF4y2Ba

PgydF4y2Ba

欧洲自杀研究联盟gydF4y2Ba

区分频繁自杀未遂者的相关特征gydF4y2Ba

J精神科保留区gydF4y2Ba 2011gydF4y2Ba 05gydF4y2Ba 45gydF4y2Ba 5gydF4y2Ba 619gydF4y2Ba 25gydF4y2Ba

10.1016 / j.jpsychires.2010.09.017gydF4y2Ba

21055768gydF4y2Ba

s0022 - 3956 (10) 00284 - 0gydF4y2Ba

24gydF4y2Ba

曼恩gydF4y2Ba

JJgydF4y2Ba

埃利斯gydF4y2Ba

SPgydF4y2Ba

WaternauxgydF4y2Ba

厘米gydF4y2Ba

刘gydF4y2Ba

XgydF4y2Ba

OquendogydF4y2Ba

妈gydF4y2Ba

马龙gydF4y2Ba

公里gydF4y2Ba

布罗斯基gydF4y2Ba

废话gydF4y2Ba

哈斯gydF4y2Ba

GLgydF4y2Ba

制革匠gydF4y2Ba

DgydF4y2Ba

分类树区分自杀未遂的主要精神障碍:临床决策的模型gydF4y2Ba

临床精神病学gydF4y2Ba 2008gydF4y2Ba 01gydF4y2Ba 69gydF4y2Ba 1gydF4y2Ba 23gydF4y2Ba 31gydF4y2Ba

10.4088 / jcp.v69n0104gydF4y2Ba

18312034gydF4y2Ba

PMC3773877gydF4y2Ba

25gydF4y2Ba

特纳gydF4y2Ba

CAgydF4y2Ba

雅可布gydF4y2Ba

广告gydF4y2Ba

品牌gydF4y2Ba

CKgydF4y2Ba

欧茨gydF4y2Ba

JCgydF4y2Ba

卡门gydF4y2Ba

戴斯。莱纳姆:gydF4y2Ba

安德森gydF4y2Ba

体育gydF4y2Ba

欧贝得gydF4y2Ba

JSgydF4y2Ba

Word2Vec反演和传统文本分类器的表型狼疮gydF4y2Ba

BMC Med通知Decis MakgydF4y2Ba 2017gydF4y2Ba 08gydF4y2Ba 22gydF4y2Ba 17gydF4y2Ba 1gydF4y2Ba 126gydF4y2Ba

10.1186 / s12911 - 017 - 0518 - 1gydF4y2Ba

28830409gydF4y2Ba

10.1186 / s12911 - 017 - 0518 - 1gydF4y2Ba

PMC5568290gydF4y2Ba

26gydF4y2Ba

欧贝得gydF4y2Ba

JSgydF4y2Ba

WeedagydF4y2Ba

呃gydF4y2Ba

MatuskowitzgydF4y2Ba

AJgydF4y2Ba

盖格农gydF4y2Ba

KgydF4y2Ba

克劳福德gydF4y2Ba

TgydF4y2Ba

卡尔gydF4y2Ba

厘米gydF4y2Ba

弗雷gydF4y2Ba

LJgydF4y2Ba

急诊科临床记录中精神状态改变的自动检测:一种深度学习方法gydF4y2Ba

BMC Med通知Decis MakgydF4y2Ba 2019gydF4y2Ba 08gydF4y2Ba 19gydF4y2Ba 19gydF4y2Ba 1gydF4y2Ba 164gydF4y2Ba

10.1186 / s12911 - 019 - 0894 - 9gydF4y2Ba

31426779gydF4y2Ba

10.1186 / s12911 - 019 - 0894 - 9gydF4y2Ba

PMC6701023gydF4y2Ba

27gydF4y2Ba

勒存gydF4y2Ba

YgydF4y2Ba

BengiogydF4y2Ba

YgydF4y2Ba

辛顿gydF4y2Ba

GgydF4y2Ba

深度学习gydF4y2Ba

自然gydF4y2Ba 2015gydF4y2Ba 05gydF4y2Ba 28gydF4y2Ba 521gydF4y2Ba 7553gydF4y2Ba 436gydF4y2Ba 44gydF4y2Ba

10.1038 / nature14539gydF4y2Ba

26017442gydF4y2Ba

nature14539gydF4y2Ba

28gydF4y2Ba

MikolovgydF4y2Ba

TgydF4y2Ba

陈gydF4y2Ba

KgydF4y2Ba

柯拉gydF4y2Ba

GgydF4y2Ba

迪安gydF4y2Ba

JgydF4y2Ba

向量空间中词表示的有效估计gydF4y2Ba

arXivgydF4y2Ba 2013gydF4y2Ba 01gydF4y2Ba 16gydF4y2Ba

2018-11-20gydF4y2Ba

https://arxiv.org/pdf/1301.3781.pdfgydF4y2Ba

29gydF4y2Ba

DevlingydF4y2Ba

JgydF4y2Ba

常gydF4y2Ba

米gydF4y2Ba

李gydF4y2Ba

KgydF4y2Ba

ToutanovagydF4y2Ba

KgydF4y2Ba

BERT:深度双向转换器的预训练，用于语言理解gydF4y2Ba

arXivgydF4y2Ba 2019gydF4y2Ba 05gydF4y2Ba 24gydF4y2Ba

2020-06-10gydF4y2Ba

https://www.aclweb.org/anthology/N19-1423.pdfgydF4y2Ba

30.gydF4y2Ba

巴纳吉gydF4y2Ba

我gydF4y2Ba

MadhavangydF4y2Ba

年代gydF4y2Ba

高盛gydF4y2Ba

再保险gydF4y2Ba

鲁宾gydF4y2Ba

戴斯。莱纳姆:gydF4y2Ba

自由文本放射学报告的智能词嵌入gydF4y2Ba

AMIA年度诉讼程序gydF4y2Ba 2017gydF4y2Ba 2017gydF4y2Ba 411gydF4y2Ba 20.gydF4y2Ba

29854105gydF4y2Ba

PMC5977573gydF4y2Ba

31gydF4y2Ba

成gydF4y2Ba

HgydF4y2Ba

奈尔gydF4y2Ba

年代gydF4y2Ba

ZiriklygydF4y2Ba

一个gydF4y2Ba

FriedenberggydF4y2Ba

米gydF4y2Ba

DaumegydF4y2Ba

IHgydF4y2Ba

蕾斯尼克gydF4y2Ba

PgydF4y2Ba

通过在线发布的自杀风险的专家、众包和机器评估gydF4y2Ba

第五届计算语言学与临床心理学研讨会论文集:从键盘到临床gydF4y2Ba 2018gydF4y2Ba

CLPsych的18gydF4y2Ba

2018年6月5日gydF4y2Ba

新奥尔良，洛杉矶gydF4y2Ba

10.18653 / v1 / w18 - 0603gydF4y2Ba

32gydF4y2Ba

杜gydF4y2Ba

JgydF4y2Ba

张gydF4y2Ba

YgydF4y2Ba

罗gydF4y2Ba

JgydF4y2Ba

贾gydF4y2Ba

YgydF4y2Ba

魏gydF4y2Ba

问gydF4y2Ba

道gydF4y2Ba

CgydF4y2Ba

徐gydF4y2Ba

HgydF4y2Ba

利用深度学习从社交媒体中提取自杀的精神压力源gydF4y2Ba

BMC Med通知Decis MakgydF4y2Ba 2018gydF4y2Ba 07gydF4y2Ba 23gydF4y2Ba 18gydF4y2Ba 增刊2gydF4y2Ba 43gydF4y2Ba

10.1186 / s12911 - 018 - 0632 - 8gydF4y2Ba

30066665gydF4y2Ba

10.1186 / s12911 - 018 - 0632 - 8gydF4y2Ba

PMC6069295gydF4y2Ba

33gydF4y2Ba

R:统计计算的语言和环境gydF4y2Ba

R项目gydF4y2Ba 2019gydF4y2Ba

2019-12-27gydF4y2Ba

https://www.r-project.org/gydF4y2Ba

34gydF4y2Ba

史诗gydF4y2Ba 2019-06-05gydF4y2Ba

https://www.epic.com/gydF4y2Ba

35gydF4y2Ba

欧贝得gydF4y2Ba

JSgydF4y2Ba

BeskowgydF4y2Ba

LMgydF4y2Ba

强奸gydF4y2Ba

米gydF4y2Ba

GouripeddigydF4y2Ba

RgydF4y2Ba

黑色的gydF4y2Ba

类风湿性关节炎gydF4y2Ba

西米洛gydF4y2Ba

JJgydF4y2Ba

EmbigydF4y2Ba

PJgydF4y2Ba

翁gydF4y2Ba

CgydF4y2Ba

MarnochagydF4y2Ba

RgydF4y2Ba

BusegydF4y2Ba

简森-巴顿gydF4y2Ba

使用电子健康记录支持研究招募的实践调查gydF4y2Ba

临床翻译科学gydF4y2Ba 2017gydF4y2Ba 08gydF4y2Ba 1gydF4y2Ba 4gydF4y2Ba 246gydF4y2Ba 52gydF4y2Ba

10.1017 / cts.2017.301gydF4y2Ba

29657859gydF4y2Ba

00301gydF4y2Ba

PMC5890320gydF4y2Ba

36gydF4y2Ba

赫泽高gydF4y2Ba

HgydF4y2Ba

SchoenbaumgydF4y2Ba

米gydF4y2Ba

ClaassengydF4y2Ba

CgydF4y2Ba

克罗斯比gydF4y2Ba

一个gydF4y2Ba

荷兰gydF4y2Ba

KgydF4y2Ba

ProescholdbellgydF4y2Ba

年代gydF4y2Ba

使用国际疾病分类第十次修订临床修改(ICD-10-CM)编码数据制定非致命自杀企图和故意自残监测病例定义的问题gydF4y2Ba

Natl健康状况统计报告gydF4y2Ba 2018gydF4y2Ba 02gydF4y2Ba 108gydF4y2Ba 1gydF4y2Ba 19gydF4y2Ba

29616901gydF4y2Ba

37gydF4y2Ba

何gydF4y2Ba

德gydF4y2Ba

ImaigydF4y2Ba

KgydF4y2Ba

王gydF4y2Ba

GgydF4y2Ba

斯图尔特gydF4y2Ba

EAgydF4y2Ba

匹配作为非参数预处理，减少参数因果推理中的模型依赖gydF4y2Ba

Polit肛门gydF4y2Ba 2017gydF4y2Ba 01gydF4y2Ba 04gydF4y2Ba 15gydF4y2Ba 3.gydF4y2Ba 199gydF4y2Ba 236gydF4y2Ba

10.1093 / pan / mpl013gydF4y2Ba

38gydF4y2Ba

哈里斯gydF4y2Ba

巴勒斯坦权力机构gydF4y2Ba

泰勒gydF4y2Ba

RgydF4y2Ba

ThielkegydF4y2Ba

RgydF4y2Ba

佩恩gydF4y2Ba

JgydF4y2Ba

冈萨雷斯gydF4y2Ba

NgydF4y2Ba

康德gydF4y2Ba

詹gydF4y2Ba

研究电子数据捕获(REDCap)——一种元数据驱动的方法和工作流过程，用于提供转化研究信息学支持gydF4y2Ba

J生物医学信息gydF4y2Ba 2009gydF4y2Ba 04gydF4y2Ba 42gydF4y2Ba 2gydF4y2Ba 377gydF4y2Ba 81gydF4y2Ba

10.1016 / j.jbi.2008.08.010gydF4y2Ba

18929686gydF4y2Ba

s1532 - 0464 (08) 00122 - 6gydF4y2Ba

PMC2700030gydF4y2Ba

39gydF4y2Ba

BenoitgydF4y2Ba

KgydF4y2Ba

渡边gydF4y2Ba

KgydF4y2Ba

王gydF4y2Ba

HgydF4y2Ba

NultygydF4y2Ba

PgydF4y2Ba

欧本gydF4y2Ba

一个gydF4y2Ba

穆勒gydF4y2Ba

年代gydF4y2Ba

松尾gydF4y2Ba

一个gydF4y2Ba

quanteda:用于文本数据定量分析的R包gydF4y2Ba

J开源软件gydF4y2Ba 2018gydF4y2Ba 10gydF4y2Ba 3.gydF4y2Ba 30.gydF4y2Ba 774gydF4y2Ba

10.21105 / joss.00774gydF4y2Ba

40gydF4y2Ba

广场购物gydF4y2Ba

JgydF4y2Ba

关键性:莎士比亚《罗密欧与朱丽叶》人物话语中的词语、词性和语义范畴gydF4y2Ba

国际语料库语言学家gydF4y2Ba 2009gydF4y2Ba 14gydF4y2Ba 1gydF4y2Ba 29gydF4y2Ba 59gydF4y2Ba

10.1075 / ijcl.14.1.03culgydF4y2Ba

41gydF4y2Ba

曼宁gydF4y2Ba

CgydF4y2Ba

RaghavangydF4y2Ba

PgydF4y2Ba

SchutzegydF4y2Ba

HgydF4y2Ba

信息检索概论gydF4y2Ba 2008gydF4y2Ba

美国剑桥gydF4y2Ba

剑桥大学出版社gydF4y2Ba

42gydF4y2Ba

McCallumgydF4y2Ba

一个gydF4y2Ba

尼噶的gydF4y2Ba

KgydF4y2Ba

朴素贝叶斯文本分类的事件模型比较gydF4y2Ba

AAAI-98研讨会“文本分类学习”gydF4y2Ba 1998gydF4y2Ba

2020-06-10gydF4y2Ba

https://www.cs.cmu.edu/~knigam/papers/multinomial-aaaiws98.pdfgydF4y2Ba

43gydF4y2Ba

BreimangydF4y2Ba

lgydF4y2Ba

分类与回归树gydF4y2Ba 1984gydF4y2Ba

美国纽约gydF4y2Ba

查普曼和霍尔gydF4y2Ba

44gydF4y2Ba

BreimangydF4y2Ba

lgydF4y2Ba

随机森林gydF4y2Ba

马赫学习gydF4y2Ba 2001gydF4y2Ba 45gydF4y2Ba 1gydF4y2Ba 5-32gydF4y2Ba

10.1023 /: 1010933404324gydF4y2Ba

45gydF4y2Ba

韦斯顿gydF4y2Ba

JgydF4y2Ba

沃特金斯gydF4y2Ba

CgydF4y2Ba

多类支持向量机gydF4y2Ba

支持向量机应用gydF4y2Ba 1998gydF4y2Ba

瑞士gydF4y2Ba

施普林格国际出版gydF4y2Ba

-gydF4y2Ba

46gydF4y2Ba

约阿希姆gydF4y2Ba

TgydF4y2Ba

NedellecgydF4y2Ba

CgydF4y2Ba

RouveirolgydF4y2Ba

CgydF4y2Ba

使用支持向量机进行文本分类:使用许多相关特征进行学习gydF4y2Ba 1998gydF4y2Ba

德国海德堡gydF4y2Ba

施普林格gydF4y2Ba

EgydF4y2Ba

47gydF4y2Ba

CholletgydF4y2Ba

FgydF4y2Ba

KerasgydF4y2Ba 2018gydF4y2Ba

2018-11-20gydF4y2Ba

https://keras.io/gydF4y2Ba

48gydF4y2Ba

TensorFlowgydF4y2Ba 2018gydF4y2Ba

2018-11-20gydF4y2Ba

https://www.tensorflow.org/gydF4y2Ba

49gydF4y2Ba

范德马腾gydF4y2Ba

lgydF4y2Ba

辛顿gydF4y2Ba

GgydF4y2Ba

使用t-SNE可视化数据gydF4y2Ba

J Mach Learn ResgydF4y2Ba 2008gydF4y2Ba 9gydF4y2Ba 2579gydF4y2Ba 605gydF4y2Ba

50gydF4y2Ba

李gydF4y2Ba

JgydF4y2Ba

农gydF4y2Ba

FgydF4y2Ba

使用循环神经网络和卷积神经网络的序列短文本分类gydF4y2Ba

arXivgydF4y2Ba 2016gydF4y2Ba 03gydF4y2Ba 11gydF4y2Ba

2020-06-10gydF4y2Ba

https://www.aclweb.org/anthology/N16-1062.pdfgydF4y2Ba

51gydF4y2Ba

KingmagydF4y2Ba

DgydF4y2Ba

英航gydF4y2Ba

JgydF4y2Ba

亚当:一种随机优化的方法gydF4y2Ba

arXivgydF4y2Ba 2019gydF4y2Ba

2020-06-10gydF4y2Ba

https://arxiv.org/pdf/1412.6980.pdfgydF4y2Ba

52gydF4y2Ba

库恩gydF4y2Ba

米gydF4y2Ba

插入包gydF4y2Ba

GitHubgydF4y2Ba 2018-12-06gydF4y2Ba

http://topepo.github.io/caret/index.htmlgydF4y2Ba

53gydF4y2Ba

福西特gydF4y2Ba

TgydF4y2Ba

ROC分析的介绍gydF4y2Ba

模式识别gydF4y2Ba 2006gydF4y2Ba 06gydF4y2Ba 27gydF4y2Ba 8gydF4y2Ba 861gydF4y2Ba 74gydF4y2Ba

10.1016 / j.patrec.2005.10.010gydF4y2Ba

54gydF4y2Ba

KlonskygydF4y2Ba

艾德gydF4y2Ba

五月gydF4y2Ba

我gydF4y2Ba

SaffergydF4y2Ba

通过gydF4y2Ba

自杀，自杀企图和自杀意念gydF4y2Ba

年度临床精神病gydF4y2Ba 2016gydF4y2Ba 12gydF4y2Ba 307gydF4y2Ba 30.gydF4y2Ba

10.1146 / annurev - clinpsy - 021815 - 093204gydF4y2Ba

26772209gydF4y2Ba

55gydF4y2Ba

VugydF4y2Ba

NTgydF4y2Ba

阿德尔gydF4y2Ba

HgydF4y2Ba

古普塔gydF4y2Ba

PgydF4y2Ba

SchutzegydF4y2Ba

HgydF4y2Ba

结合递归神经网络和卷积神经网络进行关系分类gydF4y2Ba

计算语言学协会gydF4y2Ba 2016gydF4y2Ba 05gydF4y2Ba 24gydF4y2Ba

2020-06-10gydF4y2Ba

https://www.aclweb.org/anthology/N16-1065.pdfgydF4y2Ba

56gydF4y2Ba

翁ydF4y2Ba

YgydF4y2Ba

张gydF4y2Ba

WgydF4y2Ba

罗gydF4y2Ba

RgydF4y2Ba

王gydF4y2Ba

JgydF4y2Ba

使用循环卷积神经网络学习高速公路层的文本表示gydF4y2Ba

伦敦大学学院gydF4y2Ba 2016gydF4y2Ba 08gydF4y2Ba 2gydF4y2Ba

2020-06-10gydF4y2Ba

https://discovery.ucl.ac.uk/id/eprint/1526824/1/Wang_neuir2016.pdfgydF4y2Ba

57gydF4y2Ba

要求gydF4y2Ba

GgydF4y2Ba

纳德拉gydF4y2Ba

一个gydF4y2Ba

LamisgydF4y2Ba

达gydF4y2Ba

ErbutogydF4y2Ba

DgydF4y2Ba

吉拉迪gydF4y2Ba

PgydF4y2Ba

PompiligydF4y2Ba

米gydF4y2Ba

利用新技术和接触手段，在出院后照顾有自杀倾向的病人gydF4y2Ba

世界精神病学杂志gydF4y2Ba 2017gydF4y2Ba 09gydF4y2Ba 22gydF4y2Ba 7gydF4y2Ba 3.gydF4y2Ba 163gydF4y2Ba 76gydF4y2Ba

10.5498 / wjp.v7.i3.163gydF4y2Ba

29043154gydF4y2Ba

PMC5632601gydF4y2Ba

58gydF4y2Ba

萨尔gydF4y2Ba

JgydF4y2Ba

布伦纳gydF4y2Ba

lgydF4y2Ba

米利根贝尔gydF4y2Ba

我gydF4y2Ba

ColstongydF4y2Ba

乔丹gydF4y2Ba

有自杀风险的患者的评估和管理:2019年美国退伍军人事务部和美国国防部临床实践指南简介gydF4y2Ba

实习医生gydF4y2Ba 2019gydF4y2Ba 09gydF4y2Ba 3.gydF4y2Ba 171gydF4y2Ba 5gydF4y2Ba 343gydF4y2Ba 53gydF4y2Ba

10.7326 / m19 - 0687gydF4y2Ba

31450237gydF4y2Ba

2748922gydF4y2Ba

59gydF4y2Ba

付款gydF4y2Ba

NgydF4y2Ba

康普顿gydF4y2Ba

JSgydF4y2Ba

丹尼尔gydF4y2Ba

党卫军gydF4y2Ba

GoldstongydF4y2Ba

DBgydF4y2Ba

自杀姿势标签的问题:临床研究和实践的替代方案gydF4y2Ba

狄康教授gydF4y2Ba 2010gydF4y2Ba 06gydF4y2Ba 1gydF4y2Ba 41gydF4y2Ba 3.gydF4y2Ba 221gydF4y2Ba 7gydF4y2Ba

10.1037 / a0018712gydF4y2Ba

20640243gydF4y2Ba

PMC2904564gydF4y2Ba

60gydF4y2Ba

狐狸gydF4y2Ba

基米-雷克南gydF4y2Ba

富兰克林gydF4y2Ba

JCgydF4y2Ba

里贝罗gydF4y2Ba

JDgydF4y2Ba

克雷曼gydF4y2Ba

新兴市场gydF4y2Ba

宾利gydF4y2Ba

KHgydF4y2Ba

诺gydF4y2Ba

可gydF4y2Ba

非自杀性自伤危险因素的meta分析gydF4y2Ba

临床精神病RevgydF4y2Ba 2015gydF4y2Ba 12gydF4y2Ba 42gydF4y2Ba 156gydF4y2Ba 67gydF4y2Ba

10.1016 / j.cpr.2015.09.002gydF4y2Ba

26416295gydF4y2Ba

s0272 - 7358 (15) 00120 - 8gydF4y2Ba

PMC4772426gydF4y2Ba

61gydF4y2Ba

MullenbachgydF4y2Ba

JgydF4y2Ba

WiegreffegydF4y2Ba

年代gydF4y2Ba

杜克大学gydF4y2Ba

JgydF4y2Ba

太阳gydF4y2Ba

JgydF4y2Ba

爱森斯坦gydF4y2Ba

JgydF4y2Ba

从临床文本中解释医疗代码的预测gydF4y2Ba

arXivgydF4y2Ba 2018gydF4y2Ba 04gydF4y2Ba 16gydF4y2Ba

2020-06-10gydF4y2Ba

https://arxiv.org/pdf/1802.05695.pdfgydF4y2Ba