发表在10卷, No . 2(2022): 2月

本文的预印本(早期版本)可在https://preprints.www.mybigtv.com/preprint/33043,首次出版
自动解释严重慢性阻塞性肺疾病恶化的机器学习预测:回顾性队列研究

自动解释严重慢性阻塞性肺疾病恶化的机器学习预测:回顾性队列研究

自动解释严重慢性阻塞性肺疾病恶化的机器学习预测:回顾性队列研究

原始论文

1华盛顿大学生物医学信息学和医学教育系,华盛顿州西雅图,美国

2医疗服务,旧金山退伍军人事务医疗中心,旧金山,加州,美国

3.美国加州大学旧金山分校医学系

通讯作者:

罗刚,博士

生物医学信息与医学教育系

华盛顿大学

西澳大学南湖联合医学院

共和街850号C栋358047号包厢

西雅图,华盛顿州,98195

美国

电话:1 206 221 4596

传真:1 206 221 2671

电子邮件:gangluo@cs.wisc.edu


背景:慢性阻塞性肺疾病(COPD)是造成死亡的一个主要原因,给卫生保健带来沉重负担。为了优化宝贵的预防保健管理资源的分配,改善高风险COPD患者的预后,我们最近建立了迄今为止最准确的模型来预测COPD严重恶化,需要住院或急诊,在接下来的12个月内。我们的模型是一个机器学习模型。与大多数机器学习模型一样,我们的模型不能解释它的预测,这对临床应用构成了障碍。之前,我们设计了一种方法,可以自动为机器学习预测提供规则类型的解释,并在不损失模型性能的情况下提出量身定制的干预措施。该方法曾用于哮喘预后预测,但未用于COPD预后预测。

摘要目的:本研究旨在评估我们的自动解释方法预测COPD严重恶化的普遍性。

方法:患者队列包括2011年至2019年期间访问华盛顿大学医学设施的所有COPD患者。在对43,576个数据实例的二次分析中,我们使用以前开发的自动解释方法来自动解释我们的模型预测并建议量身定制的干预措施。

结果:我们的方法解释了97.1%(100/103)的模型正确预测的COPD患者在接下来的12个月内发生严重COPD恶化的预测,以及73.6%(134/182)的≥1次严重COPD恶化的患者在接下来的12个月内的预测。

结论:我们的自动解释方法在预测COPD严重恶化方面效果良好。在进一步完善我们的方法后,我们希望能够使用它来促进我们模型的未来临床应用。

国际注册报告标识符(IRRID):rr2 - 10.2196/13783

中国生物医学工程学报;2010;31 (2):393 - 393

doi: 10.2196/33043

关键字



背景

慢性阻塞性肺疾病(COPD)是导致死亡的主要原因[1],影响了6.5%的美国成年人[2]。在美国,慢性阻塞性肺病每年导致70万住院患者和150万急诊患者[2]。严重COPD恶化是指需要住院或急诊的恶化[3.]。这些恶化往往导致健康状况和肺功能的不可逆转的恶化[4-9],占美国每年与慢性阻塞性肺病相关的321亿美元医疗费用总额的90.3% [210]。许多这些恶化,包括47%的住院和许多因COPD而就诊的急诊科,被认为是可以通过适当的门诊治疗来预防的[3.11]。为了减少严重的COPD恶化,许多卫生保健系统和卫生计划使用预测模型来识别高危患者[12]预防护理管理[13]。一旦患者加入护理管理计划,护理经理将定期通过电话跟进患者,评估患者的健康状况,并帮助安排健康和相关服务。对于慢性阻塞性肺病患者,成功的护理管理可以减少高达40%的住院时间[14]和27%的急诊科就诊次数[15]。

作为一个护理管理项目,由于资源的限制,只能接受≤3%的患者[16],该计划的有效性主要取决于所使用的预测模型的性能。为了优化宝贵的护理管理资源的分配,改善高危COPD患者的预后,我们最近建立了迄今为止最准确的模型来预测随后12个月的COPD严重恶化[17]。该模型的受试者工作特征曲线下面积为0.866,灵敏度为56.6%(103/182),特异性为91.17%(6698/7347)。相比之下,据我们所知,每个针对该预测目标发布的先验模型[18-51]在特异性约为91%时,受试者工作特征曲线下面积≤0.809,灵敏度<50%。我们的模型基于极端梯度增强(XGBoost)的机器学习算法[52]。与大多数机器学习模型一样,我们的模型无法解释其预测结果,这对临床应用构成了障碍[53]。提供解释对于护理管理者理解和信任模型的预测来做出护理管理注册决策和确定合适的干预措施至关重要。目前,对于解释对于机器学习预测意味着什么,还没有达成共识。在本文中,通过解释机器学习模型对患者的预测,我们的意思是找到≥1条规则,其左手边被患者满足,右手边与预测一致。之前,我们开发了一种方法,可以自动为任何机器学习模型对表格数据的预测提供规则类型的解释,并在不损失模型性能的情况下提出量身定制的干预措施[54-58]。该方法曾用于哮喘预后预测,但未用于COPD预后预测。

客观的

这项特殊研究的目的是评估我们预测严重COPD恶化的自动解释方法的普遍性。在未来进一步改进我们的方法后,我们的最终目标是护理管理者可以使用我们的方法更快、更可靠地进行COPD护理管理登记和干预决策。


伦理批准和研究设计

华盛顿大学医学院(UWM)的机构审查委员会使用行政和临床数据批准了这项回顾性队列研究(STUDY00000118)。

患者人群

在华盛顿州,UWM是最大的学术医疗保健系统。UWM的企业数据仓库包含来自12个诊所和3家医院的管理和临床数据。该研究使用了与我们之前的预测模型研究相同的患者队列[17]。患者队列包括2011年至2019年期间访问UWM设施的所有COPD患者。改编自文学作品[59-62],如果患者年龄在40岁以上,并且至少符合以下标准之一,则认为患者患有COPD:

  1. 患者门诊就诊诊断代码(国际疾病分类第九次修订(ICD-9): 491.22, 491.21, 491.9, 491.8, 493.2 2x, 492.8, 496;国际疾病分类第十版(ICD-10): J42, J41.8, J44。*, J43.*),随后6个月内服用≥1次长效毒蕈碱拮抗剂(aclidinium, glycopyrolate, tiotropium, umeclidinium)。
  2. 患者有“≥1个ED或≥2个COPD门诊就诊诊断代码”(《国际疾病分类》第九版:491.22、491.21、491.9、491.8、493.2x、492.8、496;国际疾病分类第十版:J42, J41.8, J44。*, J43。*)”
  3. 患者住院出院次数≥1次,主要诊断代码为COPD(《国际疾病分类》第九版:491.22、491.21、491.9、491.8、493.2x、492.8、496;国际疾病分类第十版:J42, J41.8, J44。*, J43。*)”
  4. 患者住院出院≥1次,主要诊断代码为呼吸衰竭(《国际疾病分类》第九版:518.82、518.81、799.1、518.84;国际疾病分类第十版:J96.0*, J80, J96.9*, J96.2*, R09.2)和慢性阻塞性肺病急性加重的二次诊断代码(国际疾病分类第九版:491.22,491.21,493.22,493.21;国际疾病分类,第十版:J44.1, J44.0) [17]。

我们使用了一个排除标准:在计算给定年份的数据实例时,排除了该年度在UWM死亡或未遇到的患者。

数据集

本研究使用了与我们之前的预测模型论文相同的结构化数据集[17]。该数据集包含2011年至2020年期间在12个UWM诊所和3个UWM医院就诊的患者队列的管理和临床数据。

预测目标(因变量或结果变量)

本研究使用了与我们之前的预测模型相同的预测目标[17]。对于在特定年份(指标年)患有COPD且在UWM≥1次的患者,我们使用截至年底的患者数据来预测结果-患者是否会在接下来的12个月内出现≥1次严重COPD恶化。慢性阻塞性肺病严重恶化定义为以慢性阻塞性肺病为主要诊断的住院或急诊科就诊(《国际疾病分类》第九版:491.22,491.21,491.9,491.8,493.2x, 492.8, 496;国际疾病分类第十版:J42, J41.8, J44。*, J43。*)。

数据预处理、预测模型和特征(自变量)

我们采用了与之前预测模型论文相同的方法[17]进行数据预处理。利用我们团队的临床专家提供的上限和下限,以及吉尼斯世界纪录的上限和下限,我们确定了生物学上不可信的值,标记它们缺失,并规范化了每个数字特征。我们的模型使用了229个特征和XGBoost分类算法[52来做预测。如我们上一份文件的网页多媒体附录第二表所列[17],这些特征是根据我们结构化数据集中的属性计算出来的,涵盖了生命体征、诊断、就诊、程序、药物、实验室测试和患者人口统计等各个方面。一个典型特征是患者上次诊断为急性COPD加重后的天数。预测模型的每个输入数据实例都包含这229个特征,对应于不同的患者和索引年对,用于预测患者在接下来12个月的预后。正如我们之前的预测模型论文[17],二元分类的截止阈值设置为预测风险最大的前10%的患者。由于资源限制,一个护理管理程序可以接收≤3%的患者[16]。在使用我们的模型识别出预测风险最大的前10%的患者并使用我们的自动解释方法解释预测后,护理管理者可以查看患者图表,考虑社会维度等因素,并选择≤3%的患者进行护理管理入组。选择10%的值是为了在覆盖较大比例的在接下来的12个月内会有≥1次严重COPD恶化的患者和保持护理管理人员的工作量可控之间取得平衡。

回顾我们的自动解释方法

概述

之前,我们开发了一种方法,可以自动为任何机器学习模型对表格数据的预测提供规则类型的解释,并在不损失模型性能的情况下提出量身定制的干预措施[54-58]。在预测时间之前创建自动解释函数时,我们的方法需要函数设计团队中有≥1名专家手动提供一些信息,例如标记可能与不良结果值有正相关的特征值对,并对这些特征值对项目编译干预措施。这通常可以在几个工时内完成。一旦获得这些信息并将其存储在函数的知识库中,我们的方法就可以自动解释机器学习模型的预测,并在预测时建议量身定制的干预措施。

主要思想

我们的自动解释方法[54-58]同时使用两个模型来区分预测和解释。每个模型都扮演着不同的角色。第一个模型用于预测结果。该模型可以是任何以连续和分类特征为输入的模型,通常被选为在预测方面表现最好的模型。第二个模型包括基于类的关联规则[6364从训练集中挖掘。我们使用第二个模型来解释第一个模型的预测,而不是进行预测。通过自动离散化将每个连续特征转化为≥1个分类特征后[6365],使用Apriori算法挖掘关联规则,而其他标准方法,如频繁模式增长也可以使用[64]。每条规则都显示一个特性模式链接到一个值z的形式的结果变量的:

p1p2和…pkz(1)

这里,每一项p(1≤k)是特征值对(xc),表示该特征x有一个值c如果c是值还是内值c如果c是一个范围。的值kz可能因规则而异。对于好结果和坏结果的二元分类,z通常是坏的结果值。该规则表明,患者的结果倾向于取值z如果病人满足所有p1p2,…,和pk。下面是一个规则的例子:

患者最后一次诊断为急性COPD加重是在过去的81.4天内,并且患者过去一年的COPD缓解处方包括bbb10种不同的药物→患者在接下来的12个月内可能至少有一次严重的COPD加重。

挖掘和修剪规则

每条规则都有两个质量度量:通用性和可信度。作为规则:

p1p2和…pkz(1)

其通用性定义为满足的数据实例的百分比p1p2,…,和pk链接到的所有数据实例中z。它的置信度定义为链接到的数据实例的百分比z在所有满足的数据实例中p1p2,…,和pk。的上下文中,通用性度量规则的覆盖率z。信心衡量的是规则的精确性。

挖掘和修剪规则的过程由五个参数控制:用于形成规则的顶部特征的数量、规则左侧项数的上限、置信度的下限、通用性的下限和置信度差的上限。我们的方法使用的规则是,每个样本的左手边最多包含项目数量的上限,具有大于或等于通用性下限的通用性,并且具有大于或等于置信度下限的置信度。

我们的自动解释方法旨在用于实时临床决策支持。一旦第一个模型提供了对患者的预测结果,我们需要使用第二个模型来快速地为预测提供自动解释,理想情况下是在亚秒内。为此,我们需要控制第二个模型中关联规则的数量,以帮助减少在预测时检索和排序相关规则的开销。我们使用以下三种技巧来减少规则的数量:

  1. 一些机器学习算法,如XGBoost [52],自动计算各特征的重要值。当数据集包含许多特征时,我们只使用第一个模型中重要性值最高的前几个特征来形成规则。通常,我们将要使用的顶级特征的数量设置为最大可能的数量,而不会使关联规则挖掘过程耗尽内存。
  2. 一个规则r1是否存在其他规则r2满足三个条件:r1r2它们右边的值是一样的;左边的项r2左边的项是否有一个合适的子集r1(即r2r1);和信心r2大于或等于的置信度r1−置信差的上限值。
  3. 所有不同的特征值对都由自动解释功能设计团队的临床专家检查和标记。在形成规则时,我们只使用临床专家认为与不良预后值呈正相关的特征值对。

对于每个用于形成关联规则的特征值对项,自动解释功能设计团队的临床专家编制≥0个干预。如果一个项目与≥1项干预相关,则被称为可操作。这些干预会自动附加到左侧包含此条目的规则中。如果规则的左侧包含≥1个可操作项目,并且与≥1个干预相关,则该规则被称为可操作。理论上,对于出现在≥1条挖掘规则左侧的每个特征值对项目组合,临床专家可以编译额外的干预措施,如果这些干预措施尚未为组合中的任何单个特征值对项目编译,则这些干预措施将自动附加到左侧包含该组合的规则上。在实践中,我们不需要这样做来预测严重的COPD恶化,而这种需要可能在未来的一些其他临床预测任务中发生。

解释预言

对于第一个模型预测的每个有不良结果的患者,我们通过呈现第二个模型中的关联规则来解释预测,第二个模型的左手边由患者满足,右手边有不良结果值。使用本文给出的方法对规则进行排序[57]。该方法将5个因素整合到一个规则评分函数中,使其达到平衡。这些因素包括置信度、通用性、规则左侧的项数、规则是否可操作,以及排名较高的规则的信息冗余程度。规则以迭代的方式根据计算的分数进行排名。每条规则都提供了一个解释,为什么病人会有不好的结果。对于提出的每个可操作规则,相关的干预措施将在其旁边显示。这有助于自动解释功能的用户为患者确定合适的干预措施。通常,第二个模型中的规则提供了导致患者出现不良结果的常见原因。虽然有些病人可能会因为这些规则没有涵盖的罕见原因而出现不良结果,但第二种模型通常可以解释第一种模型正确预测的大部分不良结果,尽管不是全部。

参数设置

我们的模型[17]使用229个特征来预测患者的预后。在本研究中,我们使用我们的模型中重要性值最高的前80个特征来形成关联规则。无论使用全部229个特征还是只使用前80个特征,我们的模型在接收者工作特征曲线下的面积相同,为0.866。

在我们之前的研究中,自动解释UWM数据对哮喘结果的预测[55],我们将规则左侧条目数量的上限设置为5,共性的下限设置为1%,置信度的下限设置为50%。最后两个值通常用于挖掘关联规则[63],而通用性基本上是在所有与坏结果相关的数据实例上计算的[54]。第一个值在我们的自动解释方法的解释能力和不使规则过于复杂而难以理解之间取得了平衡。为了设置置信度差的上限值,我们绘制了规则修剪过程中剩余的关联规则数量与置信度差上限的关系图。我们以前的自动解释文件[54-5658[]表明,剩余规则数首先随着置信度差上限的增大而迅速减少,然后在置信度差上限足够大后缓慢减少。置信度差的上限值设置在置信度差的进一步增加对减少剩余规则数量的影响较小的点上。

数据分析

训练集和测试集的分离

我们采用了我们之前的预测模型论文[17将整个数据集分成训练集和测试集。由于结果来自次年,因此数据集包含2011年至2020年10年间9年有效数据(2011-2019年)。为了反映我们的预测模型和我们的自动解释方法在未来临床实践中的应用情况,我们使用2011年至2018年的数据作为训练集来训练我们的模型并计算我们的自动解释方法使用的关联规则,并使用2019年的数据作为测试集来评估我们的模型和我们的自动解释方法的性能。

提供自动解释的例子

为了让读者对我们的自动解释方法产生的结果有一个具体的感受,我们从我们的模型正确预测在接下来的12个月内发生≥1次COPD严重恶化并且我们的自动解释方法可以提供≥1种解释的患者中随机选择3例患者。对于每个例子患者,我们列出了自动解释方法给出的前3个解释。

性能指标

我们使用先前自动解释论文中的以下性能指标来检验自动解释方法的性能[54-5658]。关于我们的自动解释方法的解释能力,一个性能指标是我们的模型正确预测在接下来的12个月内发生≥1次严重COPD恶化的COPD患者中,我们的方法可以提供解释的患者的百分比。我们评估了与此类患者相匹配的(可操作)规则的平均值和中位数。如果患者满足左侧的所有条件,则规则与患者匹配。

如我们之前的自动解释文件所示[54-5658],许多与病人匹配的规则往往在左手边只有一个项目不同。在这种情况下,规则的数量大大超过了这些规则中包含的非重复信息的数量。为了全面概述自动解释提供的信息量,我们检查了(1)(可操作)规则的数量和(2)规则中唯一可操作项目的数量的分布,这些规则与我们的模型正确预测的在接下来的12个月内有≥1次严重COPD恶化的患者相匹配。


我们患者队列的特征

每个数据实例对应一个不同的患者和索引年对。表12分别总结训练集和测试集中数据实例的患者人口统计学和临床特征。这两组特征是相对相似的。在训练集中,5.66%(2040/36,047)的数据实例与随后12个月的严重COPD加重有关。在测试集中,2.42%(182/7529)的数据实例与随后12个月的严重COPD加重有关。这两组特征的详细比较已在我们之前的预测模型论文[17]。

表1。训练集中数据实例的患者人口学和临床特征。
病人的特点 数据实例与无严重COPD相关一个随后12个月加重(n=34,007), n (%) 随后12个月内与COPD严重恶化相关的数据实例(n=2040), n (%) 数据实例(n=36,047), n (%)

14665 (43.12) 749 (36.72) 15414 (42.76)

男性 19342 (56.88) 1291 (63.28) 20633 (57.24)
年龄(年)

40 - 65 17574 (51.68) 1219 (59.75) 18793 (52.13)

> 65 16433 (48.32) 821 (40.25) 17254 (47.87)
比赛

白色 26117 (76.8) 1330 (65.2) 27447 (76.14)

黑人或非裔美国人 4271 (12.56) 524 (25.69) 4795 (13.3)

亚洲 1948 (5.73) 144 (7.06) 2092 (5.8)

美国印第安人或阿拉斯加原住民 687 (2.02) 26日(1.27) 713 (1.98)

夏威夷原住民或其他太平洋岛民 176 (0.52) 8 (0.39) 184 (0.51)

其他的、未知的或未报道的 808 (2.37) 8 (0.39) 816 (2.27)
种族

拉美裔 804 (2.36) 53 (2.6) 857 (2.38)

非西班牙裔 30644 (90.11) 1941 (95.15) 32585 (90.39)

未知或未报道 2559 (7.53) 46 (2.25) 2605 (7.23)
保险

公共 27831 (81.84) 1767 (86.62) 29598 (82.11)

私人 16679 (49.05) 834 (40.88) 17513 (48.58)

自费或慈善 1765 (5.19) 229 (11.23) 1994 (5.53)
数据集中第一次遇到与COPD相关的病例的年数

≤3 28749 (84.54) 1566 (76.76) 30315 (84.1)

> 3 5258 (15.46) 474 (23.24) 5732 (15.90)
吸烟情况

当前吸烟者 15863 (46.65) 1089 (53.38) 16952 (47.03)

他以前吸烟 7022 (20.65) 345 (16.91) 7367 (20.44)

从不吸烟或不认识 11122 (32.7) 606 (29.71) 11728 (32.53)
慢性阻塞性肺病药物处方

萨巴b 20865 (61.36) 1684 (82.55) 22549 (62.55)

央行c 8566 (25.19) 1042 (51.08) 9608 (26.65)

SABA和SAMA组合 6364 (18.71) 810 (39.71) 7174 (19.9)

腊八粥d 8062 (23.71) 842 (41.27) 8904 (24.7)

喇嘛e 9242 (27.18) 1001 (49.07) 10243 (28.42)

LABA和LAMA组合 386 (1.14) 40 (1.96) 426 (1.18)

ICSf 12208 (35.9) 1119 (54.85) 13327 (36.97)

ICS和LABA的结合 7544 (22.18) 782 (38.33) 8326 (23.1)

ICS、LABA和LAMA组合 16 (0.05) 0 (0) 16 (0.04)

系统性皮质类固醇 10149 (29.84) 1144 (56.08) 11293 (31.33)

Phosphodiesterase-4抑制剂 84 (0.25) 10 (0.49) 94 (0.26)
伴随疾病

焦虑或抑郁 10061 (29.59) 725 (35.54) 10786 (29.92)

过敏性鼻炎 2271 (6.68) 174 (8.53) 2445 (6.78)

哮喘 4377 (12.87) 417 (20.44) 4794 (13.3)

糖尿病 7177 (21.1) 446 (21.86) 7623 (21.15)

充血性心力衰竭 5568 (16.37) 495 (24.26) 6063 (16.82)

湿疹 1460 (4.29) 98 (4.8) 1558 (4.32)

高血压 17211 (50.61) 1150 (56.37) 18361 (50.94)

胃食管反流 6655 (19.57) 507 (24.85) 7162 (19.87)

缺血性心脏病 6934 (20.39) 486 (23.82) 7420 (20.58)

肥胖 3232 (9.5) 255 (12.5) 3487 (9.67)

肺癌 742 (2.18) 52 (2.55) 794 (2.2)

睡眠呼吸暂停 2926 (8.6) 253 (12.4) 3179 (8.82)

鼻窦炎 1299 (3.82) 83 (4.07) 1382 (3.83)

一个COPD:慢性阻塞性肺疾病。

b短效β -2激动剂。

c短效毒蕈碱拮抗剂。

d长效β -2激动剂。

e长效毒蕈碱拮抗剂。

fICS:吸入皮质类固醇。

表2。测试集中数据实例的患者人口统计学和临床特征。
病人的特点 数据实例与无严重COPD相关一个随后12个月加重(n=7347), n (%) 随后12个月内与COPD严重恶化相关的数据实例(n=182), n (%) 数据实例(n=7529), n (%)

3242 (44.13) 47 (25.8) 3289 (43.68)

男性 4105 (55.87) 135 (74.2) 4240 (56.32)
年龄(年)

40 - 65 3324 (45.24) 118 (64.8) 3442 (45.72)

> 65 4023 (54.76) 64 (35.2) 4087 (54.28)
比赛

白色 5682 (77.34) 111 (61.0) 5793 (76.94)

黑人或非裔美国人 839 (11.42) 57 (31.3) 896 (11.9)

亚洲 432 (5.88) 7 (3.9) 439 (5.83)

美国印第安人或阿拉斯加原住民 151 (2.06) 5 (2.7) 156 (2.07)

夏威夷原住民或其他太平洋岛民 51 (0.69) 2 (1.1) 53 (0.71)

其他的、未知的或未报道的 192 (2.61) 0 (0.0) 192 (2.55)
种族

拉美裔 185 (2.52) 3 (1.6) 188 (2.5)

非西班牙裔 6909 (94.04) 179 (98.4) 7088 (94.14)

未知或未报道 253 (3.44) 0 (0) 253 (3.36)
保险

公共 6722 (91.49) 179 (98.4) 6901 (91.66)

私人 4532 (61.69) 110 (60.4) 4642 (61.65)

自费或慈善 499 (6.79) 41 (22.5) 540 (7.17)
数据集中第一次遇到与COPD相关的病例的年数

≤3 5073 (69.05) 81 (44.5) 5154 (68.46)

> 3 2274 (30.95) 101 (55.5) 2375 (31.54)
吸烟情况

当前吸烟者 3781 (51.46) 112 (61.5) 3893 (51.71)

他以前吸烟 1242 (16.91) 25 (13.7) 1267 (16.83)

从不吸烟或不认识 2324 (31.63) 45 (24.7) 2369 (31.47)
慢性阻塞性肺病药物处方

萨巴b 4083 (55.57) 158 (86.8) 4241 (56.33)

央行c 1134 (15.43) 68 (37.4) 1202 (15.96)

SABA和SAMA组合 1694 (23.06) 115 (63.2) 1809 (24.03)

腊八粥d 1683 (22.91) 77 (42.3) 1760 (23.38)

喇嘛e 1951 (26.56) 110 (60.4) 2061 (27.37)

LABA和LAMA组合 388 (5.28) 12 (6.6) 400 (5.31)

ICSf 2537 (34.53) 98 (53.8) 2635 (35)

ICS和LABA的结合 1729 (23.53) 75 (41.2) 1804 (23.96)

ICS、LABA和LAMA组合 68 (0.93) 1 (0.5) 69 (0.92)

系统性皮质类固醇 2282 (31.06) 103 (56.6) 2385 (31.68)

Phosphodiesterase-4抑制剂 24 (0.33) 2 (1.1) 26日(0.35)
伴随疾病

焦虑或抑郁 2090 (28.45) 63 (34.6) 2153 (28.6)

过敏性鼻炎 396 (5.39) 14 (7.7) 410 (5.45)

哮喘 1053 (14.33) 43 (23.6) 1096 (14.56)

糖尿病 1649 (22.44) 40 (22) 1689 (22.43)

充血性心力衰竭 1369 (18.63) 43 (23.6) 1412 (18.75)

湿疹 247 (3.36) 11 (6) 258 (3.43)

高血压 3686 (50.17) 105 (57.7) 3791 (50.35)

胃食管反流 1396 (19) 47 (25.8) 1443 (19.17)

缺血性心脏病 1604 (21.83) 54 (29.7) 1658 (22.02)

肥胖 648 (8.82) 21日(11.5) 669 (8.89)

肺癌 200 (2.72) 3 (1.6) 203 (2.7)

睡眠呼吸暂停 887 (12.07) 28日(15.4) 915 (12.15)

鼻窦炎 272 (3.7) 7 (3.8) 279 (3.71)

一个COPD:慢性阻塞性肺疾病。

b短效β -2激动剂。

c短效毒蕈碱拮抗剂。

d长效β -2激动剂。

e长效毒蕈碱拮抗剂。

fICS:吸入皮质类固醇。

关联规则个数

使用预测模型中重要性最高的前80个特征,从训练集中挖掘了7,729,134条关联规则。图1显示剩余规则的数量与置信度差的上限。随着置信度差上限的增大,剩余规则数先快速减少,置信度差上限≥0.15后,剩余规则数缓慢减少。我们将置信度差的上限设置为0.15,得到剩余规则492,803条。

图1所示。剩余关联规则的数目与置信度差的上限之比。
查看此图

前80个特征共有219个不同的特征值对,其中141个(64.4%)是可操作的。我们团队的一位COPD临床专家回顾了前80个特征中所有不同的特征值对,并标记了那些可能与随后12个月内严重COPD恶化呈正相关的特征值。在删除包含任何其他特征值对项的规则后,还剩下460,592条规则。这些规则都是可操作的。

自动解释的例子

为了让读者对我们的自动解释方法产生的结果有一个具体的感受,我们从我们的模型正确预测在接下来的12个月内发生≥1次COPD严重恶化并且我们的自动解释方法可以提供≥1种解释的患者中随机选择3例患者。表3-5显示我们的自动解释方法为每个示例患者提供的前3个解释。

表3。为第一个示例患者生成的前3个关联规则。
等级、规则和规则左侧的项目 项目解释 与本项目有关的发言
排名1:患者最后一次诊断为急性COPD一个在过去的81.4天内,患者的COPD缓解处方包括bb1010种不同的药物患者可能在接下来的12个月内至少有一次严重的COPD恶化

患者最后一次诊断为急性COPD加重是在过去的81.4天 最近急性慢性阻塞性肺病加重表明需要更好地控制疾病。
  • 提供管理慢性阻塞性肺病的教育和更频繁的随访
  • 确保使用适当的COPD药物
  • 考虑注射流感疫苗、肺炎疫苗或戒烟
  • 评估肺部康复或家庭护理的需要
  • 确保患者有初级保健提供者或转介给专科医生

在过去的一年中,该患者的COPD缓解处方包括10种不同的药物 使用多种抢救药物治疗慢性阻塞性肺病表明治疗方案无效、治疗依从性差或疾病控制不佳。
  • 将COPD药物简化为一天一次的配方或联合用药
  • 关注药物之间的不良相互作用
  • 提供关于正确使用COPD药物或吸入器的教育
  • 考虑提高服药依从性的策略,例如及时提醒服药
  • 由医师或药剂师进行药物核对审查
排名2:患者近一年内有8 ~ 19次慢性阻塞性肺病急性加重诊断,最后一次慢性阻塞性肺病诊断时间为近25.6天,近一年内雾化器用药处方包括bb1011种药物患者可能在接下来的12个月内至少有一次严重的COPD恶化

该患者在过去一年中有8至19例慢性阻塞性肺病急性加重诊断 经常出现慢性阻塞性肺病急性加重表明需要更好地控制疾病。
  • 提供管理慢性阻塞性肺病的教育和更频繁的随访
  • 确保使用适当的COPD药物
  • 考虑注射流感疫苗、肺炎疫苗或戒烟
  • 评估肺部康复或家庭护理的需要

患者最后一次COPD诊断是在过去25.6天 最近诊断为COPD并伴有EDb就诊或住院表明病情控制不佳。
  • 提供管理慢性阻塞性肺病的教育和更频繁的随访
  • 确保使用适当的COPD药物
  • 考虑注射流感疫苗、肺炎疫苗或戒烟
  • 评估肺部康复或家庭护理的需要

该患者在过去一年的雾化器用药处方中包括bb1011种药物 使用雾化器治疗COPD的多种药物表明治疗方案无效、治疗依从性差或疾病控制不佳。使用雾化药物可能是慢性阻塞性肺病轻度恶化或更严重的迹象。
  • 将COPD药物简化为一天一次的配方或联合用药
  • 关注药物之间的不良相互作用
  • 提供关于正确使用COPD药物或吸入器的教育
  • 考虑提高服药依从性的策略,例如及时提醒服药
  • 由医师或药剂师进行药物核对审查
排名第三:病人的近1年平均住院时间为0.61 ~ 7.66天,最后一次因慢性阻塞性肺病门诊时间为82.4天,近1年雾化器用药处方药物种类为bb1011种,近1年嗜中性粒细胞最大百分比为bb1076.5%患者可能在接下来的12个月内至少有一次严重的COPD恶化

该患者过去一年的平均住院时间在0.61天至7.66天之间 长期住院可能表明患者有更严重的疾病或合并症。
  • 确保病人有一个初级保健提供者
  • 评估家庭护理或转介到专业护理机构的需要
  • 提供COPD管理教育和护理资源
  • 确保使用适当的COPD药物

患者最后一次因COPD门诊就诊发生在过去82.4天内 如果患者的最后一次COPD门诊就诊是针对急性COPD问题,则可能表明疾病控制不佳,需要额外的支持来控制COPD。
  • 提供COPD管理教育和护理资源
  • 确保使用适当的COPD药物
  • 评估家庭护理或肺部康复的需要

该患者在过去一年的雾化器用药处方中包括bb1011种药物 使用雾化器治疗COPD的多种药物表明治疗方案无效、治疗依从性差或疾病控制不佳。使用雾化药物可能是慢性阻塞性肺病轻度恶化或更严重的迹象。
  • 将COPD药物简化为一天一次的配方或联合用药
  • 关注药物之间的不良相互作用
  • 提供关于正确使用COPD药物或吸入器的教育
  • 考虑提高服药依从性的策略,例如及时提醒服药
  • 由医师或药剂师进行药物核对审查

患者过去一年中性粒细胞最大百分比为76.5% 有大量的中性粒细胞可以表明感染或痛苦。
  • 评估呼吸系统,例如,使用放射成像
  • 考虑做一些诊断性测试,如病毒检测、痰培养或降钙素原
  • 用心电图、超声心动图或脑利钠肽或d -二聚体等实验室检查评估其他潜在的疾病,如心血管疾病

一个COPD:慢性阻塞性肺疾病。

b急诊科。

表4。为第二个示例患者生成的前3个关联规则。
等级、规则和规则左侧的项目 项目解释 与本项目有关的发言
排名1:患者最后一次诊断为急性COPD一个加重发生在过去81.4天,患者有bb0.2 EDb近6个月的就诊次数和患者近1年的雾化器用药处方中包括bb1011种药物患者可能在接下来的12个月内至少有一次严重的COPD恶化

患者最后一次诊断为急性COPD加重是在过去的81.4天 最近急性慢性阻塞性肺病加重表明需要更好地控制疾病。
  • 提供管理慢性阻塞性肺病的教育和更频繁的随访
  • 确保使用适当的COPD药物
  • 考虑注射流感疫苗、肺炎疫苗或戒烟
  • 评估肺部康复或家庭护理的需要
  • 确保患者有初级保健提供者或转介给专科医生

患者在过去的6个月里有2次急诊科就诊 使用急诊科表明病情控制不佳或缺乏获得初级、专业或家庭护理的机会。
  • 提供管理慢性阻塞性肺病的教育和更频繁的随访
  • 确保使用适当的COPD药物
  • 考虑注射流感疫苗、肺炎疫苗或戒烟
  • 评估肺部康复或家庭护理的需要
  • 确保患者有初级保健提供者或转介给专科医生

该患者在过去一年的雾化器用药处方中包括bb1011种药物 使用雾化器治疗COPD的多种药物表明治疗方案无效、治疗依从性差或疾病控制不佳。使用雾化药物可能是慢性阻塞性肺病轻度恶化或更严重的迹象。
  • 将COPD药物简化为一天一次的配方或联合用药
  • 关注药物之间的不良相互作用
  • 提供关于正确使用COPD药物或吸入器的教育
  • 考虑提高服药依从性的策略,例如及时提醒服药
  • 由医师或药剂师进行药物核对审查
2:病人的最大体重指数在过去的一年是< 22.81,去年ED患者的访问与COPD发生不少于27.2天前,不超过94.3天前的平均停留时间和患者的ED访问在过去的一年是在0.03和0.29之间,病人在2和4之间遇到相关的慢性阻塞性肺病急性恶化或呼吸衰竭在过去一年中→病人可能至少有一个严重的慢性阻塞性肺病恶化在接下来的12个月

患者近一年最大BMI <22.81 无意中体重减轻可能表明有合并症或其他并发症,如营养不良或代谢综合征。
  • 优化营养状况,解决低BMI问题
  • 提供饮食教育,并建议适当的运动

患者最后一次与COPD相关的ED就诊时间不少于27.2天,不超过94.3天 最近与慢性阻塞性肺病相关的急诊科就诊表明需要更好地控制这种疾病。
  • 提供管理慢性阻塞性肺病的教育和更频繁的随访
  • 确保使用适当的COPD药物
  • 考虑注射流感疫苗、肺炎疫苗或戒烟
  • 评估肺部康复或家庭护理的需要
  • 确保患者有初级保健提供者或转介给专科医生

在过去一年中,患者在急诊科的平均住院时间在0.03至0.29天之间 使用急诊科表明病情控制不佳或缺乏获得初级、专业或家庭护理的机会。
  • 提供管理慢性阻塞性肺病的教育和更频繁的随访
  • 确保使用适当的COPD药物
  • 考虑注射流感疫苗、肺炎疫苗或戒烟
  • 评估肺部康复或家庭护理的需要
  • 确保患者有初级保健提供者或转介给专科医生

该患者在过去一年中有2至4次与急性COPD恶化或呼吸衰竭有关的遭遇 经常出现慢性阻塞性肺病急性加重或呼吸衰竭表明需要更好地控制疾病。
  • 提供管理慢性阻塞性肺病的教育和更频繁的随访
  • 确保使用适当的COPD药物
  • 考虑注射流感疫苗、肺炎疫苗或戒烟
  • 评估肺部康复或家庭护理的需要
  • 确保患者有初级保健提供者或转介给专科医生
排名3:患者在过去一年中有3到5次急诊科就诊,并且患者的最低SpO2c的比例在17% ~ 89.5%之间,患者在过去一年中嗜中性粒细胞的最大百分比为76.5%,患者在过去一年中每天吸烟0.48包患者可能在接下来的12个月内至少有一次严重的COPD恶化

在过去的一年中,患者有3到5次急诊科就诊 使用急诊科表明病情控制不佳或缺乏获得初级、专业或家庭护理的机会。
  • 提供管理慢性阻塞性肺病的教育和更频繁的随访
  • 确保使用适当的COPD药物
  • 考虑注射流感疫苗、肺炎疫苗或戒烟
  • 评估肺部康复或家庭护理的需要
  • 确保患者有初级保健提供者或转介给专科医生

病人的最小SpO值2在过去的一年里,这一比例在17%到89.5%之间 spoo值低的2表明症状恶化或其他并发症,如低氧血症。
  • 评估低氧血症的心肺原因
  • 考虑夜间血氧测量或睡眠研究来评估夜间低氧血症或睡眠呼吸暂停
  • 评估是否需要家庭供氧或夜间无创通气

患者过去一年中性粒细胞最大百分比为76.5% 有大量的中性粒细胞可以表明感染或痛苦。
  • 评估呼吸系统,例如,使用放射成像
  • 考虑做一些诊断性测试,如病毒检测、痰培养或降钙素原
  • 用心电图、超声心动图或脑利钠肽或d -二聚体等实验室检查评估其他潜在的疾病,如心血管疾病

在过去的一年里,病人每天抽bb0.48包烟 吸烟是慢性阻塞性肺病并发症的一个关键危险因素。
  • 提供有关吸烟危害健康的教育
  • 建议并提供戒烟支持

一个COPD:慢性阻塞性肺疾病。

b急诊科。

c年代PO2:外周毛细血管血氧饱和度。

表5所示。为第三个示例患者生成的前3个关联规则。
等级、规则和规则左侧的项目 项目解释 与本项目有关的发言
排名1:患者COPD评分在24 - 49之间一个在过去的一年中诊断出患有慢性阻塞性肺病,并且患者在过去的一年中使用过bbbb11雾化器,并且患者是黑人或非裔美国人→患者在接下来的12个月内可能至少有一次严重的慢性阻塞性肺病恶化

在过去的一年中,该患者被诊断出24至49例慢性阻塞性肺病 经常接受慢性阻塞性肺病诊断表明疾病控制不良。
  • 提供管理慢性阻塞性肺病的教育和更频繁的随访
  • 确保使用适当的COPD药物
  • 考虑注射流感疫苗、肺炎疫苗或戒烟
  • 评估肺部康复或家庭护理的需要

该患者在过去一年中使用了110张雾化器药物处方 使用雾化器治疗COPD的多种药物表明治疗方案无效、治疗依从性差或疾病控制不佳。使用雾化药物可能是慢性阻塞性肺病轻度恶化或更严重的迹象。
  • 将COPD药物简化为一天一次的配方或联合用药
  • 关注药物之间的不良相互作用
  • 提供关于正确使用COPD药物或吸入器的教育
  • 考虑提高服药依从性的策略,例如及时提醒服药
  • 由医师或药剂师进行药物核对审查

病人是黑人或非裔美国人 呼吸不良和低生活质量在黑人和非裔美国患者中更为普遍。
  • 确保患者获得所需的资源和护理
  • 评估对社会工作或家庭护理的需求
2级:病人最后一次急诊科b与COPD相关的就诊时间不少于27.2天,不超过94.3天,患者在过去一年内的COPD药物处方包括13至16种不同的药物,患者最后一次COPD门诊就诊时间不少于82.4天,不超过327.6天,患者在过去一年中嗜中性粒细胞的最大百分比为bb0 76.5%患者可能在接下来的12个月内至少有一次严重的COPD恶化

患者最后一次与COPD相关的ED就诊时间不少于27.2天,不超过94.3天 最近与慢性阻塞性肺病相关的急诊科就诊表明需要更好地控制这种疾病。
  • 提供管理慢性阻塞性肺病的教育和更频繁的随访
  • 确保使用适当的COPD药物
  • 考虑注射流感疫苗、肺炎疫苗或戒烟
  • 评估肺部康复或家庭护理的需要
  • 确保患者有初级保健提供者或转介给专科医生

在过去的一年中,患者的COPD药物处方包括13到16种不同的药物 使用多种慢性阻塞性肺病药物可能表明治疗方案无效、治疗依从性差或疾病控制不佳。
  • 将COPD药物简化为一天一次的配方或联合用药
  • 关注药物之间的不良相互作用
  • 提供关于正确使用COPD药物或吸入器的教育
  • 考虑一些策略来提高服药依从性,比如使用药片收纳器或及时提醒服药
  • 由医师或药剂师进行药物核对审查

患者最后一次因COPD门诊就诊时间不少于82.4天,不超过327.6天 如果患者的最后一次COPD门诊就诊是针对急性COPD问题,则可能表明疾病控制不佳,需要额外的支持来控制COPD。
  • 提供COPD管理教育和护理资源
  • 确保使用适当的COPD药物
  • 评估家庭护理的需要

患者过去一年中性粒细胞最大百分比为76.5% 有大量的中性粒细胞可以表明感染或痛苦。
  • 评估呼吸系统,例如,使用放射成像
  • 考虑做一些诊断性测试,如病毒检测、痰培养或降钙素原
  • 用心电图、超声心动图或脑利钠肽或d -二聚体等实验室检查评估其他潜在的疾病,如心血管疾病
等级3:患者近一年内诊断急性COPD加重8 ~ 19例,患者近一年内BMI相对下降>0.44%,患者近一年内总住院时间>0.6天患者可能在接下来的12个月内至少有一次严重的COPD恶化

该患者在过去一年中有8至19例慢性阻塞性肺病急性加重诊断 经常出现慢性阻塞性肺病急性加重表明需要更好地控制疾病。
  • 提供管理慢性阻塞性肺病的教育和更频繁的随访
  • 确保使用适当的COPD药物
  • 考虑注射流感疫苗、肺炎疫苗或戒烟
  • 评估肺部康复或家庭护理的需要
  • 确保患者有初级保健提供者或转介给专科医生

在过去的一年中,患者的BMI相对下降了bb0.44% 无意中体重减轻可能表明有合并症或其他并发症,如营养不良或代谢综合征。
  • 优化营养状况,解决低BMI问题
  • 提供饮食教育,并建议适当的运动

该患者近一年来总住院时间为100.6天 长期住院可能表明患者有更严重的疾病或合并症。频繁的住院表明需要更好地控制这种疾病。
  • 确保病人有一个初级保健提供者
  • 评估家庭护理或转介到专业护理机构的需要
  • 提供COPD管理教育和护理资源
  • 确保使用适当的COPD药物

一个COPD:慢性阻塞性肺疾病。

b急诊科。

自动解释方法的性能

利用测试集对自动解释方法进行了评价。我们的方法解释了97.1%(100/103)的COPD患者在接下来的12个月内被我们的模型正确预测为严重COPD恶化的预测。对于每个这样的患者,我们的方法平均给出了13,880.19 (SD 18,700.60)个解释,涵盖了39.80 (SD 11.98)个不同的可操作项目,中位数为4474个解释,中位数为41个不同的可操作项目。每个解释对应一个关联规则。

对于那些被我们的模型正确预测在接下来的12个月内有严重COPD恶化的COPD患者,图2显示与患者匹配的可操作规则数量的分布。这个分布高度偏左,有一条长尾。随着与患者匹配的可操作规则数量的增加,相应等宽桶中的病例频率呈非单调的快速下降趋势。与患者匹配的可操作规则的最大数量相当大(111,062)。然而,只有一个病人符合这么多规则。

图2。我们的模型正确预测在接下来的12个月内有≥1次严重慢性阻塞性肺疾病恶化的患者的可操作规则的数量分布。
查看此图

对于那些被我们的模型正确预测在接下来的12个月内有严重COPD恶化的COPD患者,图3显示与患者匹配的规则中唯一可操作项的数量分布。匹配患者的规则中唯一可操作项的最大数量是57个,这比匹配患者的可操作规则的最大数量要小得多。如图所示表3-5,同一干预措施可与患者匹配规则中≥1个不同的可操作项目相关联。

图3。我们的模型正确预测在接下来的12个月内有≥1次严重慢性阻塞性肺疾病恶化的患者匹配规则中唯一可操作项目的数量分布。
查看此图

我们的自动解释方法解释了73.6%(134/182)的COPD患者在接下来的12个月内发生≥1次严重COPD恶化的预测。


主要研究结果

我们的自动解释方法在预测COPD严重恶化方面具有良好的通用性。我们的方法解释了97.1%(100/103)的COPD患者在接下来的12个月内被我们的模型正确预测为严重COPD恶化的预测。这一比例与我们之前在解释哮喘结局预测时获得的87.6%至97.6%的相应比例相当[54-56]。这个百分比足够大,可以将我们的自动解释方法应用于慢性阻塞性肺病管理的常规临床应用。在进一步完善我们的模型预测COPD严重加重的性能和自动解释方法后,我们希望我们的模型可以与我们的自动解释方法结合使用,为COPD护理管理资源的分配和改善结果提供决策支持。

我们的自动解释方法解释了73.6%(134/182)的COPD患者在接下来的12个月内发生≥1次严重COPD恶化的预测。该百分比<97.1%(100/103),我们的方法解释了我们的模型正确预测在接下来的12个月内发生严重COPD恶化的COPD患者的预测成功率。这似乎可能是因为我们模型的预测结果与关联规则之间的相关性。在我们的模型正确预测在接下来的12个月内有严重COPD恶化的患者中,许多病例似乎很容易使用关联规则来解释结果。在有严重COPD加重的患者中,我们的模型错误地预测在接下来的12个月内没有严重COPD加重,许多患者似乎是任何模型都难以正确预测或解释结果的病例。

相关工作

几年前,我们设计了自动解释方法来处理相对平衡的数据,并演示了我们的方法预测2型糖尿病的诊断[58]。后来,其他研究人员在其他几个临床预测建模任务中展示了我们的方法,例如预测囊性纤维化患者的肺移植或死亡率[66并预测癌症患者的心脏死亡率[67]。最近,我们扩展了我们的自动解释方法,使它也可以处理不平衡的数据,其中一个结果变量的值比另一个值出现的频率要低得多。我们分别在3个医疗保健系统中展示了我们的扩展方法,用于预测哮喘患者的医院就诊情况[54-56]。在预测COPD严重恶化的情况下也会出现数据不平衡,这是本文的用例。

如检讨所述[6869],其他研究人员已经开发了各种方法来自动解释机器学习模型做出的预测。这些方法中的许多方法降低了模型的性能,或者只适用于特定的机器学习算法。这些方法中的大多数都提供了不属于规则类型的解释。更重要的是,这些方法都不能自动建议量身定制的干预措施,这是许多临床应用所需要的。相比之下,我们的自动解释方法具有四个特性,使其特别适合提供临床决策支持:(1)它提供规则型解释,比其他类型的解释更容易理解;(2)它适用于任何表格数据的机器学习模型;(3)不降低模型性能;(4)它是唯一能够自动建议量身定制干预措施的自动解释方法。

Rudin等[70], Ribeiro等[71], Rasouli等[72], Pastor和Baralis [73], Guidotti等[74], Panigutti等[75]使用规则自动解释机器学习预测。这些规则在预测之前是不知道的,因此不可能在预测时使用它们自动建议量身定制的干预措施。除了Pastor和Baralis的案例[73],这些规则不是关联规则。相比之下,我们的自动解释方法在预测之前挖掘关联规则,并在预测时使用它们自动建议量身定制的干预措施。

限制

本研究有5个局限性,值得在未来的工作中解决。

首先,这项研究使用了来自单一医疗保健系统的数据。值得评估我们的自动解释方法在解释其他卫生保健系统中严重COPD恶化的预测方面的表现。

其次,本研究侧重于预测一个结果,即COPD患者在接下来的12个月内是否会出现≥1次严重COPD恶化。评估我们的自动解释方法在解释其他结果预测方面的表现是值得的。

第三,我们的自动解释方法目前用于解释传统非深度学习机器学习算法对表格数据的预测。值得研究的是我们的方法的扩展,以处理深度学习模型对纵向数据所做的预测[7677]。

第四,我们目前还不知道提供自动解释和自动建议干预的最佳方式。有必要研究基于以用户为中心的设计来呈现这些信息的最佳方式。

最后,研究人员已经评估了自动解释对其他几个应用程序决策的影响[78-82],但不适合护理管理。对于本文提出的预测COPD严重恶化的自动解释功能,值得评估显示自动解释和自动建议干预对护理管理入组和干预决策的影响。

结论

我们的自动解释方法在预测COPD严重恶化方面具有良好的通用性。在进一步完善我们的模型预测COPD严重加重的性能和自动解释方法后,我们希望我们的模型可以与我们的自动解释方法结合使用,为COPD护理管理资源的分配和改善结果提供决策支持。

致谢

GL和SZ得到了美国国立卫生研究院国家心肺血液研究所的部分支持,资助号为R01HL142503。国家医学图书馆培训资助项目(编号:T15LM007442)。MA得到了空乘医学研究所(CIA190001)和加州烟草相关疾病研究计划(T29IR0715)的部分资助。资助者在研究设计、数据收集和分析、发表决定或手稿准备中没有任何作用。

作者的贡献

论文主要由GL和SZ负责。SZ进行了文献综述,进行了大部分的数据分析,并撰写了论文的初稿。GL对研究进行了构思和设计,参与了数据分析,并重写了整篇论文。MA提供了临床专业知识,有助于构思报告,并修改了论文。

利益冲突

没有宣布。

  1. 本周的疾病或状况-慢性阻塞性肺病。美国疾病控制与预防中心,2019。URL:https://www.cdc.gov/dotw/copd/index.html[2021-11-14]访问
  2. Ford ES, Murphy LB, Khavjou O, Giles WH, Holt JB, Croft JB。2010年美国≥18岁成人慢性阻塞性肺病的总医疗和缺勤成本及到2020年的预测胸腔2015年1月;147(1):31-45。[CrossRef] [Medline
  3. 2020黄金报告。全球慢性阻塞性肺疾病倡议(GOLD)。2020.URL:https://goldcopd.org/gold-reports[2021-11-14]访问
  4. 张建军,李建军,李建军,等。慢性阻塞性肺疾病急性加重频率对肺功能、健康状况和临床预后的影响。中华肺科杂志[J]; 2009; 44 (4): 591 - 591 [J]免费全文] [CrossRef] [Medline
  5. 张建军,张建军,张建军,等。严重慢性阻塞性肺疾病急性加重后的结局。支持调查人员(了解预后和治疗结果和风险偏好的研究)。[J]中华呼吸与急救医学杂志,1997,11(4):959-967。[CrossRef] [Medline
  6. Viglio S, Iadarola P, Lupi A, Trisolini R, Tinelli C, Balbi B,等。慢性破坏性肺疾病患者尿中氨基葡萄糖和异氨基葡萄糖的MEKC。中华呼吸病学杂志;2009;15(6):1039-1045 [J]免费全文] [CrossRef] [Medline
  7. Kanner RE, Anthonisen NR, Connett JE,肺健康研究小组。下呼吸道疾病促进当前吸烟者的FEV(1)下降,而非患有轻度慢性阻塞性肺病的戒烟者:来自肺部健康研究的结果。[J]中华呼吸与急救医学杂志[J]; 2001; 31(3):358-364。[CrossRef] [Medline
  8. 斯宾塞S,琼斯PW,全球研究小组。慢性支气管炎感染加重后健康状况恢复的时间过程。中华胸科杂志2003;58(7):589-593 [j]免费全文] [CrossRef] [Medline
  9. Spencer S, Calverley PM, Burge PS, Jones PW, ISOLDE(吸入类固醇在阻塞性肺疾病中的作用)研究组。慢性阻塞性肺疾病患者的健康状况恶化。[J]中华呼吸与急救杂志,2001;16(1):1 - 4。[CrossRef] [Medline
  10. Blanchette CM, Dalal AA, Mapel D. 20年来COPD人口统计学和成本的变化。医学经济杂志;2012;15(6):1176-1182。[CrossRef] [Medline
  11. Johnston J, Longman J, Ewald D, King J, Das S, Passey M.慢性疾病潜在可预防住院(PPH)研究:可预防的比例和与可预防PPH相关的因素?英国医学杂志开放2020年11月09日;10(11):e038415 [j]免费全文] [CrossRef] [Medline
  12. Curry N, Billings J, Darin B, Dixon J, Williams M, Wennberg D.预测风险项目文献综述。国王基金,伦敦,2005。URL:http://www.kingsfund.org.uk/sites/files/kf/field/field_document/predictive-risk-literature-review-june2005.pdf,[2021-11-14]访问
  13. Mays GP, Claxton G, White j。管理式医疗反弹?健康计划成本控制战略的最新变化。Health Aff (Millwood) 2004; supply Web Exclusives:427-436 [免费全文] [CrossRef] [Medline
  14. Bandurska E, Damps-Konstańska I, Popowski P, Jędrzejczyk T, Janowiak P, Świętnicka K等。综合护理模式(ICM)对晚期慢性阻塞性肺疾病(COPD)直接医疗费用的影响医学监测2017;06 - 12;23:2850-2862 [j]免费全文] [CrossRef] [Medline
  15. Rice KL, Dewan N, Bloomfield HE, Grill J, Schult TM, Nelson DB,等。慢性阻塞性肺疾病的疾病管理方案:一项随机对照试验。[J]中华呼吸与急救医学杂志,2010;18(7):890-896。[CrossRef] [Medline
  16. 王志强,王志强。健康计划的预测模型。疾病管理健康成果2003;11(12):779-787。[CrossRef
  17. 曾绍平,杨建军,刘建军,等。基于机器学习模型的慢性阻塞性肺疾病急性加重预测研究。[J] .中国医学信息学报,2009;24(1):893 - 893 [J]免费全文] [CrossRef] [Medline
  18. Annavarapu S, Goldfarb S, Gelb M, Moretz C, Renda A, Kaila S.基于行政索赔数据的COPD严重恶化风险预测模型的建立和验证。中华肺科杂志[J]; 2018;13 (3): 1221 - 1230 [J]免费全文] [CrossRef] [Medline
  19. 陈伟,陈文杰,陈建军,陈建军。慢性阻塞性肺疾病急性加重的预测。利用行政数据制定人口监测办法。中南大学学报(自然科学版),2020;17(9):1069-1076。[CrossRef] [Medline
  20. Samp JC, Joo MJ, Schumock GT, Calip GS, Pickard AS, Lee TA。预测慢性阻塞性肺疾病的急性加重。[J]中华医学杂志,2018;24(3):265-279。[CrossRef] [Medline
  21. Thomsen M, Ingebrigtsen TS, Marott JL, Dahl M, Lange P, Vestbo J,等。慢性阻塞性肺疾病的炎症生物标志物和恶化。中华医学杂志,2013,32(6):563 - 563。[CrossRef] [Medline
  22. 李建军,李建军,李建军,等。改善慢性阻塞性肺疾病住院风险的预测:机器学习在远程监测数据中的应用医学互联网研究,2018年9月21日;20(9):e263 [J]免费全文] [CrossRef] [Medline
  23. Suetomo M, Kawayama T,木下T, Takenaka S, Matsuoka M, Matsunaga K,等。COPD评估测试得分与日本慢性阻塞性肺疾病加重相关中华呼吸病杂志,2014,32(5):288-295。[CrossRef] [Medline
  24. 李世德,黄美娟,康健,林超,朴美娟,吴彦明,慢性阻塞性肺病急性加重期(PACE) CAT预测能力的研究。COPD评估试验(CAT)有助于预测高风险患者的COPD恶化。中华呼吸医学杂志,2014;38 (4):563 - 568 [j]免费全文] [CrossRef] [Medline
  25. Faganello MM, Tanni SE, Sanchez FF, Pelegrino NR, Lucheta PA, Godoy I. BODE指数和GOLD分期作为慢性阻塞性肺疾病1年恶化风险的预测因子中华医学杂志,2010;39(1):10-14。[CrossRef] [Medline
  26. Alcázar B, García-Polo C, Herrejón A, Ruiz LA, de Miguel J, Ros JA,等。慢性阻塞性肺疾病加重住院的相关因素中华医学杂志,2012;48(3):70-76。[CrossRef] [Medline
  27. Bertens LC, Reitsma JB, Moons KG, van Mourik Y, Lammers JW, Broekhuizen BD,等。慢性阻塞性肺疾病恶化风险预测模型的开发和验证中华肺科杂志,2013;8:493- 493 [J]免费全文] [CrossRef] [Medline
  28. Miravitlles M, Guerrero T, Mayordomo C, Sánchez-Agudo L, Nicolau F, Segú JL。慢性阻塞性肺病患者急性加重和住院风险增加的相关因素:一项多元logistic回归分析EOLO研究小组。呼吸2000;67(5):495 - 501。[CrossRef] [Medline
  29. Make BJ, Eriksson G, Calverley PM, Jenkins CR, Postma DS, Peterson S等。预测COPD急性加重短期风险的评分(SCOPEX)。中华肺科杂志[J]; 2015;10: 21 - 21 [J]免费全文] [CrossRef] [Medline
  30. 孟淑娟,张建平,张建平,等。慢性阻塞性肺病住院率的预测模型。呼吸护理2015;60(9):1288-1294 [j]免费全文] [CrossRef] [Medline
  31. Kerkhof M, Freeman D, Jones R, Chisholm A, Price DB,呼吸效能组。利用初级保健数据预测慢性阻塞性肺病的频繁恶化。中华肺科杂志[J]; 2015;10:24 -24 [J]免费全文] [CrossRef] [Medline
  32. 陈旭,王强,胡勇,张磊,熊伟,徐勇,等。预测稳定期COPD患者严重恶化的nomogram。[J]中华肺科杂志2020;15:379-388 [J]免费全文] [CrossRef] [Medline
  33. 易建新,陆长荣,刘培平,徐辉,李国华,高军,等。基于“可治疗特征”的住院COPD恶化临床预测模型中华肺科杂志(英文版);2019;14:19 - 19 [J]免费全文] [CrossRef] [Medline
  34. Adibi A, Sin DD, Safari A, Johnson KM, Aaron SD, FitzGerald JM等。急性COPD恶化预测工具(ACCEPT):一项模型研究。中华呼吸医学杂志,2020;8(10):1013-1021。[CrossRef] [Medline
  35. Stanford RH, Nag A, Mapel DW, Lee TA, Rosiello R, Vekeman F,等。使用健康保险索赔数据验证慢性阻塞性肺疾病恶化的新风险措施。高分子学报,2016,33(7):1067-1075。[CrossRef] [Medline
  36. Stanford RH, Nag A, Mapel DW, Lee TA, Rosiello R, Schatz M,等。基于索赔的COPD首次严重恶化风险模型。管理管理杂志2018;24(2):45-53 [J]免费全文] [Medline
  37. Stanford RH, Lau MS, Li Y, Stemkowski S. COPD风险指标在商业和医疗保险人群中的外部验证:COPD治疗比例。[J]中华医学杂志,2019,25(1):58-69。[CrossRef] [Medline
  38. Stanford RH, Korrer S, Brekke L, Reinsch T, Bengtson LG。COPD治疗比率作为严重恶化预测因子的验证和评估。慢性阻塞性肺疾病2020;7(1):38-48 [j]免费全文] [CrossRef] [Medline
  39. 张建军,张建军,李建军,等。慢性阻塞性肺疾病严重程度的综合指标:剂量指数的推导和验证。[J]中华呼吸与急救医学杂志;2009;18(12):1189-1195。[CrossRef] [Medline
  40. Jones RC, Price D, Chavannes NH, Lee AJ, Hyland ME, Ställberg B, IPCRG UNLOCK组。慢性阻塞性肺疾病的多成分评估:ADO和DOSE指数与国际初级保健数据集中全球阻塞性肺疾病类别的评估中华医学会精神病学分会[j]; 2011;26 (4): 591 - 591 [j]免费全文] [CrossRef] [Medline
  41. Fan VS, Curtis JR, Tu SP, McDonell MB, Fihn SD,门诊护理质量改善项目调查员。用生活质量预测阻塞性肺疾病患者住院和死亡率2002年8月;122(2):429-436。[CrossRef] [Medline
  42. Moy ML, Teylan M, Danilack VA, Gagnon DR, Garshick E.每日步数和全身炎症指数预测慢性阻塞性肺疾病的临床结局。中南大学学报(自然科学版),2014,(2):149-157。[CrossRef] [Medline
  43. 王海涛,王海涛,王海涛。慢性阻塞性肺疾病健康预后指标的建立与验证。中华医学杂志2008;16(1):71-79。[CrossRef] [Medline
  44. Lange P, Marott JL, Vestbo J, Olsen KR, Ingebrigtsen TS, Dahl M,等。使用新的GOLD分类预测慢性阻塞性肺疾病的临床病程:一项针对普通人群的研究[J]中华呼吸与急救医学杂志,2012;18(10):975-981。[CrossRef] [Medline
  45. Abascal-Bolado B, Novotny PJ, Sloan JA, Karpman C, Dulohery MM, Benzo RP。临床预测慢性阻塞性肺病住院:优化慢性呼吸问卷。中华肺科杂志[J]; 2011; 22 (3): 391 - 391 [J]免费全文] [CrossRef] [Medline
  46. Blanco-Aparicio M, Vázquez I, Pita-Fernández S, p rtega- diaz S, Verea-Hernando H.健康相关生活质量简短问卷(气道问卷20和临床COPD问卷)预测哮喘和COPD患者恶化的作用。2013年5月27日11:85 [免费全文] [CrossRef] [Medline
  47. 刘建伟,洪勇,徐建军,蔡恩杰,罗世文,李建辉,等。慢性阻塞性肺病加重的临床生理及CT影像危险因素比较。韩国医学杂志2011;26(12):1606-1612 [J]免费全文] [CrossRef] [Medline
  48. Niewoehner DE, Lokhnygina Y, Rice K, Kuschner WG, Sharafkhaneh A, Sarosi GA,等。慢性阻塞性肺病加重和住院的危险指标。Chest 2007;131(1):20-28。[CrossRef] [Medline
  49. Austin PC, Stanbrook MB, Anderson GM, Newman A, Gershon AS。共病分类方法预测慢性阻塞性肺疾病患者预后的行政数据的比较能力。中华流行病学杂志2012;22(12):881-887 [j]免费全文] [CrossRef] [Medline
  50. Marin JM, Carrizo SJ, Casanova C, Martinez-Camblor P, Soriano JB, Agusti AG,等。用BODE指数预测COPD恶化风险。中华呼吸医学杂志;2009;33 (3):373-378 [j]免费全文] [CrossRef] [Medline
  51. Ställberg B, Lisspers K, Larsson K, Janson C, m ller M, Łuczko M,等。基于ARCTIC研究的机器学习预测瑞典初级保健患者COPD加重住院国际肝病[J]; contemporary medicine; 2011;16 (6):677-688 [J]免费全文] [CrossRef] [Medline
  52. 陈涛,Guestrin C. XGBoost:一种可扩展的树木提升系统。2016年:第22届ACM SIGKDD知识发现与数据挖掘国际会议;2016年8月13-17日;旧金山,加利福尼亚州第785-794页。[CrossRef
  53. 美国医疗保健行业的领导者预计,到2023年,人工智能将得到广泛采用。英特尔2018。URL:https://newsroom.intel.com/news-releases/u-s-healthcare-leaders-expect-widespread-adoption-artificial-intelligence-2023[2021-11-14]访问
  54. 罗刚,刘建平,李建平,何胜,石宝玲。哮喘患者哮喘就诊的机器学习预测结果的自动解释:二次分析。中华医学杂志2020年12月31日;8(12):e21965 [j]免费全文] [CrossRef] [Medline
  55. Tong Y, Messinger AI, Luo G.测试一种自动化方法的通用性,用于解释机器学习预测哮喘患者到学术医疗保健系统的哮喘医院就诊情况。IEEE Access 2020;8:195971-195979 [j]免费全文] [CrossRef] [Medline
  56. 罗刚,Nau CL, Crawford WW, Schatz M, Zeiger RS, Koebnick C.哮喘患者哮喘相关医院就诊机器学习预测结果的自动解释方法:定量分析。[J] .中国医学信息学报,2015;23(4):563 - 563 [J]免费全文] [CrossRef] [Medline
  57. 张欣,罗刚。基于排序规则的机器学习预测哮喘患者医院就诊的自动解释:回顾性队列研究。中华医学杂志,2011;9(8):e28287 [j]免费全文] [CrossRef] [Medline
  58. 罗刚。自动解释机器学习预测结果:2型糖尿病风险预测演示。卫生信息系统2016;4:2 [j]免费全文] [CrossRef] [Medline
  59. 慢性阻塞性肺疾病(COPD)住院后30天全因风险标准化再入院率(RSRR)全国质量论坛,2012。URL:http://www.qualityforum.org/Projects/n-r/Pulmonary_Endorsement_Maintenance/1891_30_Day_RSRR_COPD.aspx[2021-11-14]访问
  60. Cooke CR, Joo MJ, Anderson SM, Lee TA, Udris EM, Johnson E,等。使用ICD-9编码和药房记录识别慢性阻塞性肺疾病患者的有效性。医疗卫生服务,2011年2月16日;11:37 [免费全文] [CrossRef] [Medline
  61. 阮HQ,朱丽,Amy Liu LI, Lee JS, Suh D, Korotzer B,等。慢性阻塞性肺疾病患者体育活动与30天再入院风险之间的关系生物工程学报,2014,31(5):695-705。[CrossRef] [Medline
  62. Lindenauer PK, Grosso LM, Wang C, Wang Y, Krishnan JA, Lee TA,等。慢性阻塞性肺疾病加重患者住院30天死亡率风险标准化测量的开发、验证和结果中华医院医学杂志,2013;8(8):428-435。[CrossRef] [Medline
  63. 刘斌,徐伟,马勇。分类与关联规则挖掘的集成。第四届知识发现与数据挖掘国际会议论文集。1998发表于:KDD'98:第四届知识发现与数据挖掘国际会议;1998年8月27日至31日;美国纽约纽约市,第80-86页https://dl.acm.org/doi/10.5555/3000292.3000305
  64. Thabtah足总。关联分类挖掘技术综述。知识工程评论2007;01;22(1):37-65。[CrossRef
  65. Fayyad UM,伊朗KB。用于分类学习的连续值属性的多区间离散化。第13届国际人工智能联合会议论文集。1993提交于:IJCAI'93:第13届国际人工智能联合会议;1993年8月28日至9月3日;chambassry, France, p. 1022-1029https://trs.jpl.nasa.gov/handle/2014/35171
  66. 陈建军,陈建军。基于机器学习的囊性纤维化预测及风险因素分析。科学通报2018;7 (1):11242 [j]免费全文] [CrossRef] [Medline
  67. Alaa m, van der Schaar M. AutoPrognosis:基于贝叶斯优化和结构化核学习的自动临床预后建模。在:ICML'18:第35届国际机器学习会议;2018年7月10日至15日;斯德哥尔摩,瑞典,第139-148页https://arxiv.org/abs/1802.07207
  68. Guidotti R, Monreale A, Ruggieri S, Turini F, Giannotti F, Pedreschi D.黑箱模型解释方法综述。2019年9月30日;51(5):93。[CrossRef
  69. Payrovnaziri SN,陈志,Rengifo-Moreno P, Miller T,卞杰,陈建辉等。使用真实世界电子健康记录数据的可解释人工智能模型:系统范围审查。中华医学杂志,2020;27(7):1173-1185 [J]免费全文] [CrossRef] [Medline
  70. 刘建军,刘建军。基于全局一致规则的机器学习模型的摘要解释:在信用风险评估中的应用。在:CIST'19: INFORMS第11届信息系统与技术会议;2019年10月19日至20日;西雅图,华盛顿州,第1-19页。[CrossRef
  71. Ribeiro MT, Singh S, Guestrin C.锚:高精度模型不可知的解释。参见:第32届AAAI人工智能会议论文集。2018年发表于:AAAI'18:第32届AAAI人工智能会议;2018年2月2-7日;新奥尔良,LA p. 1527-1535https://ojs.aaai.org/index.php/AAAI/article/view/11491
  72. Rasouli P, Yu IC.解释:使用自适应邻域生成解释黑盒分类器。2020国际神经网络联合会议论文集,提交于:IJCNN'20:国际神经网络联合会议;2020年7月19日至24日;英国格拉斯哥,第1-9页。[CrossRef
  73. 牧师E, Baralis E.用地方规则解释黑箱模型。在:SAC'19:第34届ACM/SIGAPP应用计算研讨会;2019年4月8日至12日;利马索尔,塞浦路斯第510-517页。[CrossRef
  74. 刘建军,刘建军,刘建军,刘建军。基于局部规则的黑箱决策系统。出来了。2018.URL:https://arxiv.org/abs/1805.10820[2021-11-14]访问
  75. Panigutti C, Perotti A, Pedreschi D. XAI博士:基于本体的黑盒顺序数据分类解释方法。提交于:FAT'20:公平、问责和透明度会议;2020年1月27日至30日;巴塞罗那,西班牙,629-639页。[CrossRef
  76. 罗刚,Stone BL, Koebnick C,何松,Au DH,盛鑫,等。利用时间特征为慢性阻塞性肺疾病和哮喘护理管理提供数据驱动的临床早期预警:二级分析方案中国生物医学工程学报(英文版);2019;8(6):13783 [j]免费全文] [CrossRef] [Medline
  77. 罗刚。一种从医学数据中半自动提取预测和临床有意义的时间特征用于预测建模的路线图。地球物理学报(英文版);19 (1):391 - 391 [j]免费全文] [CrossRef] [Medline
  78. 张建军,张建军,张建军,等。一种基于人工神经网络的预警处理方法。出来了。2019.URL:https://arxiv.org/abs/1907.03324[2021-11-14]访问
  79. Stites MC, Nyre-Yu M, Moss B, Smutz C, Smith先生。机器学习模型的解释对垃圾邮件检测中人类决策的影响。见:第二届HCI人工智能国际会议论文集。2021年出席:AI-HCI'21:人工智能在HCI国际会议;2021年7月24日至29日;华盛顿特区,269-284页。[CrossRef
  80. 黎伟,谭诚。基于机器学习模型的人类预测与解释:欺骗检测案例研究。提交于:FAT'19:公平、问责和透明度会议;2019年1月29日至31日;亚特兰大,佐治亚州,第29-38页。[CrossRef
  81. Lundberg SM, Nair B, Vavilala MS, horbe M, isses MJ, Adams T,等。手术期间预防低氧血症的可解释的机器学习预测。生物医学工程学报,2018;2(10):749-760 [j]免费全文] [CrossRef] [Medline
  82. Jesus SM, bel m C, Balayan V, Bento J, Saleiro P, Bizarro P,等。我如何选择讲解员?基于应用的事后解释评价。提交于:FAccT'21: 2021 ACM公平、问责和透明度会议;2021年3月3日至10日;加拿大多伦多,第805-815页。[CrossRef


慢性阻塞性肺病:慢性阻塞性肺疾病
艾德:急诊科
UWM:华盛顿大学医学院
XGBoost:极端梯度增压


C·洛维斯编辑;提交26.08.21;经P Orchard, A Rovetta同行评审;对作者的评论13.11.21;修订版本收到15.11.21;接受02.01.22;发表25.02.22

版权

©曾思阳,Mehrdad Arjomandi,罗刚。最初发表于JMIR医学信息学(https://medinform.www.mybigtv.com), 2022年2月25日。

这是一篇在知识共享署名许可(https://creativecommons.org/licenses/by/4.0/)条款下发布的开放获取文章,该许可允许在任何媒介上不受限制地使用、分发和复制,前提是原始作品(首次发表在JMIR Medical Informatics上)被适当引用。必须包括完整的书目信息,到https://medinform.www.mybigtv.com/上原始出版物的链接,以及版权和许可信息。


Baidu
map