发表在第21卷第七名(2019): 7月

本文的预印本(早期版本)可在https://preprints.www.mybigtv.com/preprint/13809,首次出版
使用从全州健康信息交换中提取的数据识别需要高级抑郁症护理的患者:机器学习方法

使用从全州健康信息交换中提取的数据识别需要高级抑郁症护理的患者:机器学习方法

使用从全州健康信息交换中提取的数据识别需要高级抑郁症护理的患者:机器学习方法

原始论文

1美国印第安纳波利斯Regenstrief研究所生物医学信息学中心

2印第安纳大学费尔班克斯公共卫生学院,印第安纳波利斯,美国

3.印第安纳大学医学院,印第安纳波利斯,美国

4印第安纳大学信息与计算学院,印第安纳波利斯,美国

通讯作者:

Suranga N Kasthurirathne博士

生物医学信息学中心

Regenstrief研究所

西第十街1101号

印第安纳波利斯,IN, 46202

美国

电话:1 3173323480

电子邮件:snkasthu@iupui.edu


背景:作为世界范围内最常见的精神疾病,抑郁症对个人和社区都造成了重大的健康和经济负担。不同类型的抑郁症带来不同程度的风险。患有轻度抑郁症的人可以在没有任何帮助的情况下康复,也可以由初级保健或家庭医生进行有效管理。然而,其他形式的抑郁症要严重得多,需要经过认证的心理健康提供者的高级护理。然而,识别需要高级护理的抑郁症病例可能对初级保健提供者和医疗保健团队成员具有挑战性,他们的技能集广泛而不是深入。

摘要目的:这项研究旨在利用全面的患者层面的诊断、行为和人口统计数据,以及来自全州健康信息交换的过去的访问历史数据,来构建决策模型,能够预测在埃斯肯纳兹健康中心(印第安纳州印第安纳波利斯马里昂县的公共安全网络健康系统)就诊的患者对抑郁症高级护理的需求。

方法:从结构化数据集中提取的患者级别的诊断、行为、人口统计学和既往就诊史数据与从非结构化自由文本数据集中提取的结果变量合并,并用于训练随机森林决策模型,该模型预测了(1)总体患者人群和(2)抑郁症相关不良事件高风险患者的各个亚群对抑郁症高级护理的需求;有抑郁症病史的患者;Charlson共病指数≥1的患者;Charlson共病指数≥2的患者;以及上述3个高危人群的所有特殊患者。

结果:总患者群体包括84,317名成年(年龄≥18岁)患者。其中6992例(8.29%)患者需要抑郁症的高级护理。高风险患者组决策模型的曲线下面积(AUC)评分在86.31% ~ 94.43%之间。整个患者群体的决策模型产生了相对较低的AUC评分78.87%。用Youden J指数确定的所有决策模型的最佳敏感性和特异性方差为:敏感性=68.79% ~ 83.91%,特异性=76.03% ~ 92.18%。

结论:这项研究展示了通过结构化数据集(涵盖急性和慢性疾病、患者人口统计、行为和过去的就诊史),在(1)总体患者群体或(2)各种高危患者群体中,自动化筛查需要高级抑郁症护理的患者的能力。此外,这些结果显示出实现预防保健的巨大潜力,并且可以轻松地整合到现有的临床工作流程中,以改善获得全面卫生保健服务的机会。

中国医学网络杂志2019;21(7):e13809

doi: 10.2196/13809

关键字



背景

抑郁症是世界上最常见的精神疾病[1].它对全球多达3.5亿人的思考、感受和互动产生了负面影响。2].抑郁症对个人和社会都造成重大的健康和经济负担[3.].以前的研究表明,心理健康和医疗状况之间存在很强的共病[4].抑郁症在患有各种慢性疾病的病人中极为普遍[56].此类患者的预期寿命最多可减少10至25年[78].抑郁症也是15至44岁美国人致残的主要原因。9].2010年,美国抑郁症的医疗、药物、工作场所和自杀相关费用的增量经济负担估计为2105亿美元,比2005年增加了21.5% [10].

不同类型的抑郁症带来不同程度的风险。患有轻度抑郁症的人可以在没有任何帮助的情况下康复。其他较轻的个案可由基层护理或家庭医生有效处理[11-13].然而,其他形式的抑郁症要严重得多,需要初级护理或家庭医生提供之外的高级护理[1415].对初级保健提供者和医疗团队成员来说,识别需要高级护理的抑郁症病例可能具有挑战性,因为他们的技能范围很广,而不是很深。训练卫生保健团队成功地识别严重抑郁症患者可以解决问题,但考虑到成本、精力和时间,这是不可实现的[1617].社会的污名化和对健康问题的无知也鼓励抑郁症患者淡化他们的病情,进一步增加了检测和评估的难度[18].

许多医疗保健系统利用贝克抑郁量表等筛查工具[19]、病人健康问卷-9 (PHQ-9) [20.], phq-15 [21]、康奈尔痴呆症抑郁量表[22],以及汉密尔顿抑郁评定量表[23来评估抑郁症的严重程度。然而,这些工具并不是最佳的,因为它们(1)占用了大量的资源[24],(2)在决策时严重依赖可能不准确的患者报告结果[25],(3)仅利用临床和行为数据的一小部分进行决策。此外,传统的抑郁症筛查方法可能会增加社区和初级保健机构对抑郁症的过度诊断和过度治疗的风险[26-28]对改善心理健康没有帮助[29].最近的研究对常规筛查的益处提出了质疑[30.31]以及美国预防服务工作组的建议,即在提供工作人员协助的抑郁症管理项目的初级保健机构对成年人进行抑郁症筛查[29].

考虑到这些限制,开发基于机器学习的筛查方法更为合适,该方法能够利用更全面的患者数据集,代表患者的整体健康状况,以确定无法仅在初级保健中治疗的个人,除非为他们提供专门的高强度抑郁症治疗,否则他们的健康状况将恶化[1415].机器学习使我们能够从多个初级和二级护理数据集中学习,这些数据集可能由于认知负担而被临床医生遗漏,因此是应对这一挑战的合适解决方案。

目标

为了本研究的目的,我们将那些如果不接受初级保健以上的专门治疗,其生活质量和健康状况将会下降的个体定义为需要高级抑郁症护理的患者。在操作上,这类患者将通过评估临床数据来确定,以发现那些被转诊到经认证的精神保健提供者接受抑郁症专门治疗的患者,表明他们的疾病不能仅靠初级保健治疗。在这项研究中,我们利用从不同的结构化和非结构化数据集中获得的数据来构建决策模型,从而能够识别需要高级抑郁症护理的患者。


患者人群

我们确定了84,317名成年患者(≥18岁),他们在2011年至2016年期间在印第安纳州印第安纳波利斯的领先医疗保健提供商Eskenazi Health至少进行过一次初级保健访问。

患者子集选择

我们试图预测(1)总体患者群体和(2)不同高危患者群体对抑郁症高级护理的需求。我们选择了3个高危患者组:A组:既往诊断为抑郁症的患者,B组:Charlson共病指数的患者[32]≥1,C组:Charlson共病指数≥2。过去被诊断为抑郁症的患者被标记为高危群体,因为他们的疾病可能会根据其他健康状况重新出现或恶化。选择Charlson指数≥1和≥2的患者是因为抑郁症在患有一种或多种慢性疾病的患者中发病率较高[33以及恶化患者健康状况的能力。之所以选择≥1和≥2的阈值,是因为它们捕获的患者群体对于机器学习过程来说足够大,以及潜在实现的成本/努力。我们还确定了第四组(D组),包括a组到C组的所有独特患者。

我们训练了不同人群的模型,以捕获尽可能多的需要高级抑郁症护理的患者总数,并确定哪些患者群体最适合用于筛查需要高级护理的患者。此外,关注较少的高危患者可能更容易实施,在整个慢性护理诊所实施成本更低。通过分析84,317名过去诊断为抑郁症的独特患者(主患者列表)的诊断数据,并计算每个患者的Charlson共病指数,将A组确定为D组。

数据准备

在之前的研究中,我们提出了一种抑郁症分类方法[34]利用统一医学语言系统(UMLS)的知识术语提取异叙龙[35].该分类法是通过在Ovid Medline上进行文献搜索来确定讨论抑郁症及其治疗的出版物,然后使用Metamap [36],这是一个基于自然语言处理的工具,用于将这些摘要与UMLS mettathesaurus进行映射,UMLS mettathesaurus是一个大型、多用途、多语言的辞典,其中包含数百万个生物医学和健康相关的概念、同义词及其在199本医学词典中的关系[37].使用Web本体语言(一种广泛用于表示本体的语义Web语言)将最常出现的UMLS概念编译成术语。这些特征表现出各种各样的诊断、人口统计学和行为特征,这些特征影响了抑郁症的发作和严重程度[34].

我们从印第安纳州患者护理网络(INPC)获得了每个患者的纵向健康记录,INPC是一个全州范围内的健康信息交换网络[3839].因此,我们的数据集包括每个患者的记录,包括可能在参与INPC的任何医院系统中捕获的数据。该数据集包括广泛的患者数据,包括以结构化和非结构化形式报告的患者人口统计、诊断、行为和访问数据。所有诊断数据均以结构化国际疾病分类第九版(ICD-9)和ICD-10代码的形式获得。我们根据抑郁症术语评估了提取的数据,并使用UMLS mettathesaurus中呈现的关系来识别ICD代码作为特征。我们将研究中每个患者组的特征向量制成表格。我们根据过去的患者数据预测当前的风险水平。我们没有评估时间性的影响,因为我们的数据集代表了(1)相对较短的时间周期和(2)患有严重慢性疾病的老年人群,这些疾病不会随时间发生显著变化。如果所研究的患者接受了抑郁症治疗的转诊,则数据载体仅包括在上述转诊命令下达前24小时内记录的医疗数据。如果过去没有抑郁症治疗的转诊,那么向量包含患者的所有可用数据。 A master data vector encompassing all 84,317 patients was also created using the same approach.

制定金本位制

我们将正则表达式应用于医生向经过认证的心理健康提供者推荐的转诊,以确定医生推荐抑郁症的专门治疗。通过手动检查,我们确定正则表达式模式的使用是100%准确的。

决策模型的建立

我们将5个数据向量(4个患者亚组和1个主数据向量)分成90%训练数据和10%测试数据的随机组。每个训练数据集被用来训练一个决策模型,使用随机森林分类算法[40].选择随机森林算法是因为其在医疗保健挑战决策建模中成功使用的记录[4142]以及开发可解释的机器学习预测的能力[43].我们使用Python编程语言(版本2.7.6)完成所有数据预处理任务,并使用Python scikit-learn包进行决策模型开发和测试[44].

分析

每个决策模型都使用10%坚持测试集进行评估。每个决策模型产生的结果使用曲线下面积(AUC)值进行评估,该值用于测量分类器的准确性。约登J指数[45]用于确定每个决策模型的最佳敏感性和特异性。

从患者群体选择到决策模型评估的流程图可以在图1

图1。从病人组选择到决策模型评估的流程图。印第安纳州健康信息交换中心。
查看此图

患者群体评估

我们共确定了12432例诊断为抑郁症的患者(a组),32249例Charlson指数≥1的患者(B组),7415例Charlson指数≥2的患者(C组)。总的来说,这3组共确定了37560例独特的患者(D组)。

主患者名单以及4个高危患者组均代表成年城市人口:以女性为主,疾病负担高(表1).查尔森指数确定的人群年龄(平均年龄>50岁)比抑郁症人群(平均年龄46.31岁)大。此外,根据查尔森指数确定的人口主要是非裔美国人。相比之下,过去被诊断为抑郁症的人群主要由非西班牙裔白人组成。正如预期的那样,查尔森指数大于等于1的患者人群(30.18%)和查尔森指数大于等于2的患者人群(37.25%)的抑郁症患病率高于总患者名单(19%)。

图2展示了维恩图,显示了研究中确定的高风险患者群体的重叠。

在主患者名单中的84,317名患者中,共有6992名(8.29%)需要抑郁症的高级护理。A组捕获3683例(52.68%),B组捕获4016例(57.43%),C组捕获1026例(14.67%)。总的来说,所有3个患者组都能够识别出5612名(80.26%)需要抑郁症高级护理的患者。

表1。用于决策模型构建的主患者列表/高危患者组的特征。
兴趣特征 掌握病人
集合:所有患者
(N = 84317)
A组:患者
有过去的诊断
抑郁症的
B组:患者
用查尔森牌的
指数≥1
C组:患者
用查尔森牌的
指数≥2
D组:都是唯一的
分组患者
得了
患者组数,n (%) - - - - - -一个 12432 (14.74) 32249 (38.25) 7415 (8.8) 37560 (44.5)
抑郁症需要高级护理,n (%) 6992 (8.29) 3683 (30.04) 4016 (12.94) 1026 (21.6) 5612 (80.26)
人口统计资料

年龄(年),平均值(SD) 43.88 (15.60) 46.31 (14.74) 51.94 (14.55) 59.50 (12.33) 50.31 (14.93)

性别(%) 35.09 30.22 39.8 43.98 42.03

种族/民族(%)


白色(非西班牙裔) 25.21 44.62 33.38 37.02 35.31


非裔美国人(非西班牙裔) 37.23 32.01 42.78 47.26 40.12


西班牙裔或拉丁裔 19.47 11.12 10.60 4.94 7.38

诊断


抑郁症(%) 19.07 One hundred. 30.18 37.25 37.51


Charlson指数得分,平均值(SD) 0.77 (1.21) 0.22 (0.75) 1.89 (1.27) 3.85 (1.14) 1.62 (1.35)

平均住院次数(SD)


艾德b当月到访次数 0.21 (1.03) 0.33 (1.48) 0.26 (1.15) 0.31 (1.14) 0.27 (1.17)


前几个月的急诊科就诊 3.73 (14.40) 4.69 (18.73) 8.63 (24.2) 10.71 (31.36) 8.03 (23.67)

一个不适用。

b急诊室。

图2。研究中确定的患者组之间有重叠。
查看此图

使用抑郁症术语进行特征选择

将患者数据与抑郁症术语进行比较,确定了1150个可纳入每个决策模型的独特概念。中介绍了每个决策模型中包含的特性的描述多媒体附件1

决策模型性能

预测主人群高级护理需求的决策模型报告了78.87%的中等AUC评分(最佳敏感性=68.79%,最佳特异性=76.30%)。然而,预测A至D组患者高级护理需求的决策模型表现得明显更好。A组(既往诊断为抑郁症的患者)的AUC评分为87.29%(最佳敏感性=77.84%,最佳特异性=82.66%)。B组(Charlson指数≥1的患者)AUC评分为91.78%(最佳敏感性=81.05%,最佳特异性=89.21%)。C组(Charlson指数≥2的患者)的AUC评分为94.43%(最佳敏感性=83.91%,最佳特异性=92.18%),而D组(a -C组中唯一的患者列表)的AUC评分为86.31% (图3;最优敏感性=75.31%,最优特异性=76.03%)。每个决策模型的精度-召回曲线在多媒体附件2

每个决策模型的前20个特征可以在多媒体多媒体附件4在所研究的每个决策模型中,呈现这些前20个特征的共同出现。在评估为每个决策模型选择的排名靠前的特征时,我们发现每个高危患者群体的排名靠前的特征之间有显著的重叠。此外,原发性(原发性)高血压、抑郁症、性别和门诊次数出现在每个测试患者人群的前20个特征列表中。

为了证明模型没有受到过度训练的影响,我们增加了一个额外的评估步骤,在其中比较了较小特征子集大小的模型性能。我们使用信息增益对每个决策模型的所有特征进行排序。柯back- leibler散度[46].对于每个患者子组,我们使用排名特征列表来构建多个决策模型,从仅使用5个排名最高的特征训练的决策模型开始,迭代地添加下一个最重要的特征,重新训练模型并使用F1核心评估性能。我们继续这个过程,直到我们使用特征集中的所有n个特征训练了n-5个模型。例如,对于患者组A,我们首先构建一个由5个以患者为中心的特征组成的决策模型,并使用F1分数评估其性能。之后,我们添加了第6个最重要的特征,并重新训练了一个由这6个特征组成的决策模型。我们继续构建模型并评估F1分数,直到我们包含了每个数据集的所有特征。这项工作的结果(多媒体)表明,在前10至20个特征之后,模型性能趋于平稳,并且包含更多的特征并不能提高模型性能。这表明模型没有过拟合,并且在相对少量的特征后达到了最佳性能。

图3。受试者工作特征曲线由决策模型产生,预测所研究的每个患者组的高级护理需求。AUC:曲线下面积。
查看此图

主要研究结果

在整个患者群体中预测抑郁症高级护理需求的决策模型实现了78.87%的AUC评分。相比之下,预测4个高危患者组高级护理需求的决策模型表现更好,AUC得分在86.31至94.43%之间。此外,每个决策模型的最佳敏感性和特异性都非常高,并证明了模型的实际实施潜力。

我们将使用总体开发的决策模型的相对较低的性能归因于金本位的不平衡性质[47]的原因是需要高级护理的患者的患病率相对较低(8.29%),以及整个患者人群中一些患者的可用数据稀少。使用高危患者群体构建的决策模型的高性能可以归因于需要高级护理的患者的患病率较高。尽管各种出版物都提出了解决数据不平衡的方法[4849],我们没有追求这样的方法,因为我们希望专注于展示可以在其他数据集复制的方法,这些数据集可能不平衡,也可能不平衡。

在预测性能评估中,C组(Charlson指数≥2的患者)的AUC评分最高(97.43%)。A组(诊断为抑郁症的患者)和B组(Charlson指数≥1的患者)的AUC评分较低。与A组和b组相比,C组捕获的需要高级护理的患者数量最少。然而,值得注意的是,使用高危人群开发的决策模型都不能捕获所有需要高级护理的患者。总体而言,所有3种模型只能捕获所有需要高级护理的患者的80.26%。其余(19.74%)需要高级护理的患者不符合三种高危患者人群中的任何一种。我们假设,如果有更全面的数据,19.74%的缺失患者将落入3个高危患者组中的1个,从而符合检测条件。

我们提出了一个机器学习的新应用,以解决一个重要的临床相关性问题。我们证明了在不同患者群体中预测抑郁症高级护理需求的能力,并具有相当大的预测性能。这些努力可以很容易地整合到现有的医院工作流程中[42].由于基层医疗服务提供者并非提供全面服务[50],识别和转介有需要的病人的能力极为重要[51].我们的努力产生了一种高度准确、自动化的方法,用于识别需要心理健康全面服务的患者,这对卫生保健组织越来越重要,并受到不断变化的报销政策的激励。通过预测各种高危人群对高级护理的需求,我们为潜在的实施者提供了选择满足他们需求的最佳筛查方法的选项。我们的方法也非常适合利用越来越多的卫生信息技术采用和卫生保健数据集的互操作性,以实现社区范围内的卫生转型[5253].在人口健康信息学领域,它使组织能够利用机器学习的广泛接受和使用,进行跨组织协作和各种数据集的管理[53同时给予实现者选择最适合每个医院系统的方法的自由。此外,这种预测建模的应用可以支持组织一级的人口健康倡议,因为风险分层对于确定哪些患者最需要服务以改善健康和福祉至关重要。此外,在初级保健实施这样的解决方案,确保促进所有患者进入卫生保健系统比在每个慢性保健诊所单独实施更有效。因此,我们的方法能够有效地识别抑郁症的高级护理需求,而不存在过度诊断和过度治疗的风险,也不使用手动筛查机制。

关于将机器学习方法集成到现有临床工作流程中的最佳方法的知识有限。如上文所述,大部分抑郁症患者是经由基层医疗服务机构寻求治疗[5455].然而,对于某些临床实践来说,应用机器学习解决方案来筛查每一次初级保健就诊可能是成本密集型和低效的。因此,评估需要抑郁症高级护理的高危患者子集的替代模型将是有用的。两个潜在的高风险患者群体是(1)已被诊断为抑郁症的患者及(2)患有慢性疾病的患者,因此他们患抑郁症的风险较高[56].使用这些子集构建的模型可能比使用所有初级保健患者构建的模型更实用,并产生更好的机器学习性能,因为基础数据的可变性和感兴趣结果的更高普遍性,这使得更好的模型训练成为可能。

我们在研究方法中发现了一些局限性。我们为用于训练决策模型的每个特征采用了二进制(存在/不存在)标志。我们假设切换到每个特征的表格计数将增加特征向量的粒度,从而提高模型性能。我们研究中使用的患者群体来自埃斯肯纳兹卫生系统,这是一个具有重大健康负担的安全网人群。因此,我们的模型可能无法推广到其他商业保险或更广泛的人群。我们的诊断数据仅限于ICD代码。整合药物、实验室和临床过程数据可以进一步提高决策模型的性能。此外,研究表明,健康的社会决定因素,如低教育程度、贫困、失业和社会孤立,可能对抑郁症和治疗需求产生重大影响[5758].我们建议使用健康的社会决定因素来扩展我们的模型,以评估它们对决策模型性能的影响。

我们承认电子病历数据不完整[59可能会影响模型性能。索赔数据的使用可能使我们能够在每个患者亚组中确定更多需要特定治疗的患者[60].此外,我们感兴趣的结果是由初级保健提供者确定的需要高级护理的患者。因此,我们无法解释那些在没有过去转诊的情况下接受抑郁症高级护理的患者。这样的患者可以从索赔数据中识别出来,并用于增强我们的黄金标准。

我们选择随机森林分类算法用于决策模型构建,基于开发易于为临床受众解释的高性能模型的需要[4243].其他更高级的决策建模方法,如神经网络[61已经显示出在各种医疗保健挑战中提高机器学习表现的潜力。然而,神经网络更复杂,成本更高,并且难以解释[62],这使得供应商更难接受这种模式。此外,考虑到随机森林模型已经实现了显著的性能指标,目前尚不清楚它们是否可以为我们的研究做出贡献。我们建议在评估临床事件的序列或时间性,或随机森林模型的性能不能令人满意的情况下考虑神经网络。

总之,这些结果为预防保健提供了相当大的潜力,并有可能整合到现有的临床工作流程中,以改善获得全面医疗保健服务的机会。

结论

我们的努力证明,我们有能力通过广泛的急性和慢性疾病、患者人口统计、行为和过去的就诊史,在(1)整个患者群体和(2)各种高危患者群体中识别需要高级抑郁症护理的患者。尽管所有模型都获得了显著的性能精度,但侧重于高危患者人群的模型获得了相对更好的结果。此外,我们的方法提供了一种可复制的方法,供实现者根据自己的需求和优先级采用。然而,决策模型的性能可能会根据每个医疗保健系统中患者数据的可用性而有所不同。这些结果显示了实现预防保健的巨大潜力,并可以轻松地整合到现有的临床工作流程中,以改善获得全面卫生保健服务的机会。

致谢

这项研究没有从任何公共、商业或非营利部门的资助机构获得特定的资助。

作者的贡献

第一作者提出并完成了该研究,作为他博士论文的一部分。合著者都是他的论文委员会的成员,他们在数据的获取、分析和解释、方法和分析的严谨性以及撰写手稿方面做出了重大贡献。

利益冲突

没有宣布。

多媒体附件1

用于决策模型构建的患者数据类型。

DOCX文件,13KB

多媒体附件2

所研究的每个决策模型的精度-召回曲线。

DOCX文件,1MB

多媒体

列出每个决策模型的20个顶级特征(按最好到最差的顺序排列),以及它们的最小绝对收缩和选择操作符得分。

DOCX文件,16KB

多媒体附件4

在每个被测患者群体中同时出现前20个特征(1=最重要,20=最不重要)。

DOCX文件,19KB

多媒体

使用迭代增加特征子集大小训练的每个决策模型的F1分数。为了清晰起见,我们的图只包括使用每个患者亚组的前50个特征训练的模型。

PNG文件,102KB

  1. 世界卫生组织,2012。萧条:全球危机。2012年10月10日世界精神卫生日网址:https://www.who.int/mental_health/management/depression/wfmh_paper_depression_wmhd_2012.pdf
  2. 美国精神病学协会,2016。什么是抑郁症?URL:https://www.psychiatry.org/patients-families/depression/what-is-depression[2018-01-01]访问
  3. Lépine JP, Briley M.抑郁症的负担日益加重。神经精神疾病治疗2011;7(增刊1):3-7 [免费全文] [CrossRef] [Medline
  4. 古德尔,Druss BG, Walker ER。精神障碍和医学共病。Synth Proj Res Synth Rep 2011 Feb(21):1-26 [免费全文] [Medline
  5. 杨汉内斯A, Willgoss T, Baldwin R, Connolly M.慢性心力衰竭和慢性阻塞性肺疾病的抑郁和焦虑:患病率,相关性,临床意义和管理原则。老年精神病学杂志2010年12月25日(12):1209-1221。[CrossRef] [Medline
  6. Nouwen A, Winkley K, Twisk J, Lloyd C, Peyrot M, Ismail K,欧洲糖尿病抑郁症(EDID)研究联盟。2型糖尿病是抑郁症发病的危险因素:系统回顾和荟萃分析糖尿病杂志2010年12月;53(12):2480-2486 [免费全文] [CrossRef] [Medline
  7. 世界卫生组织,2016年。严重精神障碍患者的过早死亡http://www.who.int/mental_health/management/info_sheet.pdf[2018-03-01]访问
  8. Hawton K, Casañas IC, Haw C, Saunders K.抑郁症患者自杀的危险因素:系统综述。《情感失调》杂志2013年5月,第1卷第3期:第17-28页。[CrossRef] [Medline
  9. 马瑟斯C,胖DM,布尔玛JT。世界卫生组织,2008年。全球疾病负担:2004年https://www.who.int/healthinfo/global_burden_disease/2004_report_update/en/
  10. 格林伯格PE,富尼埃AA,西西茨基T,派克CT,凯斯勒RC。美国成人重度抑郁症患者的经济负担(2005年和2010年)。临床精神病学杂志2015年2月;76(2):155-162 [免费全文] [CrossRef] [Medline
  11. Wagner HR, Burns B, Broadhead W, Yarnall K, Sigmon A, Gaynes B.家庭实践中的轻度抑郁症:功能性发病率,共发病率,服务利用和结果。精神医学2000年11月30日(6):1377-1390。[CrossRef] [Medline
  12. 韦文斌,谢伯恩C,许恩鲍姆M,段N,梅雷迪思L, Unützer J,等。在管理初级保健中传播抑郁症质量改进计划的影响:一项随机对照试验。中华医学会医学杂志2000年1月12日;29(2):344 - 344。[CrossRef] [Medline
  13. Williams Jr JW, Barrett J, Oxman T, Frank E, Katon W, Sullivan M,等。初级保健中心境恶劣和轻度抑郁症的治疗:一项老年人随机对照试验。中国医学杂志2000年9月27日;284(12):1519-1526。[CrossRef] [Medline
  14. 张志刚,张志刚,张志刚,张志刚,等。心理治疗对重度抑郁症的疗效:芬兰社区的随机试验。BMC精神病学2016年5月6日;16:131 [免费全文] [CrossRef] [Medline
  15. Cuijpers P, van Straten A, Andersson G, van Oppen P.成人抑郁症的心理治疗:比较结果研究的元分析。临床心理咨询杂志2008年12月;76(6):909-922。[CrossRef] [Medline
  16. 在整个生命周期中筛查抑郁症:在初级保健环境中使用的措施的回顾。Am Fam医师2002年9月15日;66(6):1001-1008 [免费全文] [Medline
  17. 美国预防服务工作组。成人抑郁症筛查:美国预防服务工作组建议声明。安实习医学2009年12月1日;151(11):784-792。[CrossRef] [Medline
  18. Corrigan P.污名化如何干扰精神卫生保健。Am Psychol 2004 10月;59(7):614-625。[CrossRef] [Medline
  19. Beck AT, Steer RA, Brown GK。BDI-II,贝克抑郁量表:手册。第二版。德克萨斯州圣安东尼奥市:心理学公司;1996.
  20. Gilbody S, Richards D, Brealey S, Hewitt C.在医疗环境中使用患者健康问卷(PHQ)筛查抑郁症:诊断荟萃分析。J Gen实习医学2007年11月;22(11):1596-1602 [免费全文] [CrossRef] [Medline
  21. 克伦克K,斯皮策RL,威廉姆斯JB。PHQ-15:评估躯体症状严重程度的新措施的有效性。中华精神病学杂志,2002;29(2):344 - 344。[CrossRef] [Medline
  22. Alexopoulos GS, Abrams RC, Young RC, Shamoian CA. Cornell痴呆症抑郁量表。生物精神病学1988年2月1日;23(3):271-284。[CrossRef] [Medline
  23. 威廉姆斯简森-巴顿。标准化汉密尔顿抑郁评分量表:过去,现在和未来。欧洲精神病学临床神经科学2001;251(增刊2):II6-I12。[CrossRef] [Medline
  24. 李志刚,李志刚,李志刚,李志刚。基于gis的抑郁症筛查成本效用分析。安实习医学2001年3月6日;134(5):345-360。[CrossRef] [Medline
  25. Kerr LK, Kerr Jr LD.初级保健中抑郁症筛查工具:文化、性别和躯体症状对抑郁症检测的影响。西方医学杂志2001 11月;175(5):349-352 [免费全文] [CrossRef] [Medline
  26. Mojtabai R, Olfson M.在没有精神病诊断的情况下开抗抑郁药的比例正在增长。卫生Aff (Millwood) 2011年8月30日(8):1434-1442。[CrossRef] [Medline
  27. 社区环境中临床医生确定的抑郁症:与结构化访谈诊断的一致性。心理学报2013;82(3):161-169。[CrossRef] [Medline
  28. 将不快乐医学化:抑郁症的新分类可能会让更多患者接受药物治疗,而他们却无法从中受益。Br Med 2013年12月9日;347:f7140。[CrossRef] [Medline
  29. Thombs BD, Ziegelstein RC, Roseman M, Kloda LA, Ioannidis JP。没有随机对照试验支持美国预防服务工作组指南在初级保健中筛查抑郁症:一项系统综述。BMC Med 2014年1月28日;12:13 [免费全文] [CrossRef] [Medline
  30. Thombs BD, Coyne JC, Cuijpers P, de Jonge P, Gilbody S, Ioannidis JP,等。重新考虑初级保健中抑郁症筛查的建议。CMAJ 2012 3月6日;184(4):413-418 [免费全文] [CrossRef] [Medline
  31. Gilbody S, Sheldon T, Wessely S,我们应该筛查抑郁症吗?Br Med 2006 Apr 29;332(7548):1027-1030 [免费全文] [CrossRef] [Medline
  32. Charlson ME, Charlson RE, Peterson JC, Marinopoulos SS, Briggs WM, Hollenberg JP。Charlson共病指数适用于预测初级保健患者的慢性疾病费用。临床流行病学杂志2008年12月;61(12):1234-1240。[CrossRef] [Medline
  33. DeJean D, Giacomini M, Vanstone M, Brundisini F.慢性疾病患者抑郁和焦虑的经历:系统综述和定性综合。2013年安大略省卫生技术评估季;13(16):1-33 [免费全文] [Medline
  34. Kasthurirathne SN。IUPUI学者作品库。2018。使用临床、行为和社会健康决定因素来改善抑郁症患者需要高级护理的识别URL:https://scholarworks.iupui.edu/bitstream/handle/1805/17765/Kasthurirathne_iupui_0104D_10328.pdf?sequence=1&isAllowed=y
  35. 国家医学图书馆-国家卫生研究院,2016。统一医学语言系统®(UMLS®):mettathesaurushttps://www.nlm.nih.gov/research/umls/knowledge_sources/metathesaurus/[2018-02-01]访问
  36. Aronson AR, Lang FM。MetaMap概述:历史视角和最新进展。中国医学信息杂志2010;17(3):229-236 [免费全文] [CrossRef] [Medline
  37. 国家医学图书馆-国家卫生研究院,2015。事实说明:统一医学语言系统网址:https://www.nlm.nih.gov/pubs/factsheets/umls.html[2018-01-01]访问
  38. McDonald CJ, Overhage JM, Barnes M, Schadow G, Blevins L, Dexter PR, INPC管理委员会。印第安纳州的病人护理网络:一个有效的当地健康信息基础设施。一个工作基础设施协作的例子,它连接了来自五个卫生系统和数亿个条目的数据。卫生Aff (Millwood) 2005;24(5):1214-1220。[CrossRef] [Medline
  39. Overhage JM。印第安纳州健康信息交换中心进:迪克森BE,编辑。卫生信息交换:导航和管理卫生信息系统网络。马萨诸塞州沃尔瑟姆:学术出版社;2016:267 - 279。
  40. 随机森林。Mach Learn 2001;45(1):5-32。[CrossRef
  41. 徐红,夏燕,马姆林,等。使用现有的现成方法来实现更好的公共健康报告:使用纯文本医疗数据和基于非字典的特征选择的替代癌症检测方法的比较J Biomed Inform 2016年4月;60:145-152 [免费全文] [CrossRef] [Medline
  42. Kasthurirathne SN, Vest JR, Menachemi N, Halverson PK, Grannis SJ。评估卫生数据的社会决定因素增强预测模型的能力,以确定需要全面社会服务的患者。美国医学杂志2018年12月1日;25(1):47-53。[CrossRef] [Medline
  43. 祁勇。生物信息学随机森林。见:张成,马勇,编辑。集成机器学习:方法与应用。纽约:施普林格;2012:307 - 323。
  44. Pedregosa F, Varoquaux G, Gramfort A, Michel V, Thirion B, Grisel O,等。Scikit-Learn: Python中的机器学习。J Mach Learn Res 2011; 12:25 -2830 [免费全文
  45. Youden WJ。对诊断测试进行评级的索引。癌症1950年1月;3(1):32-35。[CrossRef] [Medline
  46. Polani D. Kullback-leibler散度。入:Dubitzky W, Wolkenhauer O, Cho KH, Yokota H,编辑。系统生物学百科全书。纽约:施普林格;2013:1087 - 1088。
  47. 李文杰,李志强,李志强。基于随机森林的疾病风险预测方法。BMC Med Inform Decis Mak 2011年7月29日;11:51 [免费全文] [CrossRef] [Medline
  48. 宗伟,黄国贵,陈玉杰。用于不平衡学习的加权极限学习机。神经计算2013年2月;101:229-242。[CrossRef
  49. Lemaître G, Nogueira F,阿里达斯CK。不平衡学习:一个python工具箱来解决机器学习中不平衡数据集的诅咒。J Mach Learn Res 2017;18(1):559-563 [免费全文
  50. Loeb DF, Binswanger IA, Candrian C, Bayliss EA.初级保健医生对初级保健中复杂患者类型学的见解。安Fam 2015年9月;13(5):451-455 [免费全文] [CrossRef] [Medline
  51. Jackson GL, Powers BJ, Chatterjee R, Bettger JP, Kemper AR, Hasselblad V,等。以病人为中心的医疗之家。系统回顾。安实习医学2013年12月5日;158(3):169-178。[CrossRef] [Medline
  52. harrazi H, Weiner JP。it支持的社区卫生干预:挑战、机遇和未来方向。EGEMS (Wash DC) 2014;2(3):1117 [免费全文] [CrossRef] [Medline
  53. 刘志刚,刘志刚,刘志刚,等。拟议的国家人口健康信息学研究和发展议程:国家专家讲习班的建议摘要。J Am Med Inform association 2017年12月24日(1):2-12 [免费全文] [CrossRef] [Medline
  54. 潘文杰,李文杰,李文杰。焦虑和抑郁的心理治疗:meta分析和meta回归。BMC Med 2010 6月25日;8:38 [免费全文] [CrossRef] [Medline
  55. 李志强,李志强,李志强,李志强,等。计算机化认知行为疗法(cCBT)在初级保健中治疗抑郁症(REEACT试验):大规模实用的随机对照试验。中国生物医学杂志2015;351:h5627 [免费全文] [CrossRef] [Medline
  56. Katon WJ。慢性内科疾病患者抑郁症的流行病学与治疗。中国临床神经科学2011;13(1):7-23 [免费全文] [Medline
  57. 世界卫生组织,2014。心理健康的社会决定因素网址:https://www.who.int/mental_health/publications/gulbenkian_paper_social_determinants_of_mental_health/en/
  58. Fryers T, Melzer D, Jenkins R, Brugha T.常见精神障碍的分布:欧洲的社会不平等。临床实践流行病学卫生2005 9月5日;1:14 [免费全文] [CrossRef] [Medline
  59. 许志伟,张海东,张志强,李志强,等。比较基于人群的风险分层模型的表现,使用从门诊电子健康记录中提取的人口统计学、诊断和药物数据与行政索赔。医疗护理2017年12月;55(8):789-796。[CrossRef] [Medline
  60. harrazi H, Anzaldi LJ, Hernandez L, Davison A, Boyd CM, Leff B,等。非结构化电子健康档案数据在老年综合征病例识别中的价值。中国老年医学杂志2018年8月;66(8):1499-1507。[CrossRef] [Medline
  61. 神经网络:综合基础。纽约:皮尔逊;2004.
  62. 李文杰,李文杰,李文杰。表征学习研究的新进展。IEEE Trans - Pattern Anal Mach intel 2013年8月;35(8):1798-1828。[CrossRef] [Medline


AUC:曲线下面积
ICD:《国际疾病分类》
INPC:印第安纳州病人护理网络
PHQ:患者健康问卷
uml:统一医学语言系统


G·艾森巴赫(G Eysenbach)编辑;提交25.02.19;同行评审:A Flynn, H Kharrazi;对作者11.04.19的评论;修订版本收到01.06.19;接受12.06.19;发表22.07.19

版权

©Suranga N Kasthurirathne, Paul G Biondich, Shaun J Grannis, Saptarshi Purkayastha, Joshua R Vest, Josette F Jones。最初发表于《医疗互联网研究杂志》(//www.mybigtv.com), 2019年7月22日。

这是一篇开放获取的文章,根据创作共用署名许可(https://creativecommons.org/licenses/by/4.0/)的条款发布,允许在任何媒介上无限制地使用、分发和复制,前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。


Baidu
map