发表在23卷第五名(2021): 5月

本文的预印本(早期版本)可在https://preprints.www.mybigtv.com/preprint/27118,首次出版
预测肝素治疗结果和提供剂量建议的临床预测模型:开发和验证研究

预测肝素治疗结果和提供剂量建议的临床预测模型:开发和验证研究

预测肝素治疗结果和提供剂量建议的临床预测模型:开发和验证研究

原始论文

1中国医学科学院北京协和医学院附属北京协和医院重症医学科,复杂重症罕见病国家重点实验室,中国北京

2数字健康中国科技有限公司,北京,中国

3.中国医学科学院、北京协和医学院北京协和医院复杂重症罕见病国家重点实验室信息中心科,中国北京

4中国医学科学院北京协和医学院附属北京协和医院初级保健与家庭医学科,复杂重症罕见病国家重点实验室,中国北京

*这些作者贡献相同

通讯作者:

朱卫国,医学博士,博士

中国医学科学院北京协和医院信息中心,复杂重症罕见病国家重点实验室,北京协和医学院

东城区帅府园1号

北京,

中国

电话:86 69154149

电子邮件:zhuwg@pumch.cn


背景:未分离肝素广泛应用于重症监护病房作为抗凝剂。然而,基于体重的肝素剂量已被证明是次优的,可能会使患者在重症监护病房住院期间处于不必要的风险中。

摘要目的:在这项研究中,我们打算开发和验证一个基于机器学习的模型,以预测肝素治疗结果,并为临床医生提供剂量建议。

方法:采用浅神经网络模型对来自重症监护多参数智能监测III (MIMIC III)数据库的患者和北京协和医院(PUMCH)的患者进行回顾性队列研究。我们将亚治疗、正常和超治疗激活部分凝血活蛋白时间(aPTT)作为肝素治疗的结果进行建模,并使用一组临床特征进行建模。我们的模型将患者分为3种不同的治疗状态。我们测试了我们的模型的预测能力,并通过精度、kappa系数、精密度、召回率和F1分数来评估其性能。此外,为临床决策提供支持,设计并评估了剂量推荐模块。

结果:共有3607例从MIMIC III选择的患者和1549例进入PUMCH的符合我们标准的患者被纳入本研究。浅层神经网络模型的F1得分分别为0.887 (MIMIC III)和0.925 (PUMCH)。与实际处方剂量相比,我们的模型建议亚治疗患者增加72.2% (MIMIC III, 1240/1718)和64.7% (PUMCH, 281/434)的剂量,而建议超治疗患者减少80.9% (MIMIC III, 504/623)和76.7% (PUMCH, 277/361)的剂量,这表明这些建议有助于临床改善,并可以有效缩短临床环境中达到最佳剂量的时间。

结论:对我们预测肝素治疗结果的模型的评估表明,开发的模型可能适用于减少肝素的误用,并为临床医生提供适当的决策建议。

中国医学杂志,2017;23(5):e27118

doi: 10.2196/27118

关键字



现有基于规则的方案指导临床医生根据循证临床指南或最佳实践启动、调整或终止某种治疗程序[1].然而,在真实的临床场景中,个体患者的复杂疾病和生理状况不断发生动态变化,往往超出了指南中描述的典型模型的范围[2].特别是在重症监护环境中,由于缺乏高质量的证据以及治疗的准确性和有效性的紧迫性,在循证医学和个体化医学之间存在决策困境[3.].幸运的是,在大数据和人工智能时代,基于数据采集、整合和重症监护医学应用的进展,机器学习技术有时可以帮助重症监护病房(ICUs)的诊断、治疗和预测[4-6].

肝素(或未分离肝素,UFH)输注是一种药物的一个例子,回顾性数据已被证明在临床环境中提供了宝贵的支持,特别是在患者容易发生血栓栓塞或出血或由这些条件引起的严重并发症的危急环境中[7].几十年来,UFH的给药完全基于患者的体重:基于体重的肝素给药nomogram是应用UFH的标准做法。肝素计数图主要包括经验初始负荷剂量,然后根据每4-6小时监测一次的一系列凝血参数逐级调节[89].不同生理情况的患者,实际的最佳UFH剂量差异很大,对于这些患者,达到最佳剂量的时间可能会延长。此外,由于静脉肝素治疗窗口狭窄,可能会发生与超治疗或亚治疗抗凝相关的不良事件,如出血倾向或血栓形成[7].因此,回顾性分析首先提取序列剂量反应数据,同时提取实验室和其他临床数据,这可能会极大地改善UFH剂量优化的反馈延迟[10].在我们最近的研究中[11],基于公共的多参数重症监护智能监测III (MIMIC III)和ICU电子数据库[1213],我们比较了几种常用的预测肝素治疗效果的模型,并表明基于机器学习的模型优于标准实践,可用于优化和个性化肝素给药,以提高患者的安全性。

虽然我们的UFH模型已经使用公共数据库进行了评估和验证[1014],它还没有在我们当地的临床环境中得到验证,特别是在逐步调节方面。在本研究中,我们将先前优化的UFH模型的验证和应用扩展到中国三级医院的补充ICU——北京协和医院重症医学科(PUMCH)的本地临床数据库。此外,还对MIMIC和PUMCH数据库进行了基于机器学习模型的UFH剂量推荐,目的是有效缩短临床环境中获得最佳剂量的时间。最后,为了进一步促进对数据模型和算法的理解,我们在两个数据库中进行了特征重要性分析。


数据集

为了评估预测模型的适应性并实施外部验证,我们使用了患者数据,包括来自两个数据库的肝素治疗:MIMIC III数据库和PUMCH ICU数据库。MIMIC III数据库是一个免费开放的重症监护医疗数据集,由麻省理工学院计算生理学实验室、贝斯以色列女执事医疗中心和飞利浦医疗保健发布。它包含了贝斯以色列女执事医疗中心(Beth Israel Deaconess medical Center)在2001年至2012年间5万多名ICU成年患者的真实医疗数据[8].PUMCH ICU数据库包括2013年至2019年期间入住PUMCH ICU的2万多名ICU患者的完整临床数据。

肝素治疗结果的定义

根据肝素治疗后患者的治疗性活化部分凝血活酶时间(aPTT)值,我们将患者分为亚治疗性、正常治疗性和超治疗性。我们使用初始肝素输注后8小时至24小时的平均aPTT值作为治疗性aPTT值。图1为两个数据集aPTT值的分布。由于地区、患者特点以及PUMCH分步治疗模式等治疗方案的差异,观察到的治疗性aPTT分布存在较大差异。根据先前的研究[14]和临床医生的建议,我们对2个数据集采用了不同的定义范围(表1).然后,我们用3个标签中的1个标记每个患者记录(亚治疗、正常治疗和超治疗),从而将临床结果预测任务转换为三元分类任务。

图1。治疗激活部分凝血活蛋白时间分布在两个数据集。aPTT:活化部分凝血活酶时间;MIMIC III:重症监护的多参数智能监测III;北京协和医院。
查看此图
表1。2个数据集的治疗活化部分凝血活酶时间分类范围。
部分凝血活酶激活时间(秒) 重症监护III数据集的多参数智能监测 北京协和医院数据集
亚治疗激活部分凝血活酶时间(秒) 0-60 0-35
正常治疗激活部分凝血活酶时间(秒) 60 - 100 35 - 45
超治疗激活部分凝血活酶时间(s) >100 > 45

特征选择

根据相关研究证据和临床实践经验,各种临床特征影响肝素治疗效果[14],即治疗性aPTT。例如,血液中的肌酐几乎全部通过肾小球过滤进入尿液,其浓度在正常情况下是稳定的。因此,血肌酐浓度反映了肾小球的滤过功能,可以作为肾功能的指标。肾脏、肝脏、心脏和凝血功能的测量包括作为感兴趣的特征。血中天冬氨酸转氨酶(AST)和谷丙转氨酶(ALT)浓度对肝细胞损伤敏感,其比值是肝功能的重要指标。包括序贯器官衰竭评估(SOFA)评分。此外,肝素总剂量定义为初始肝素输注后8小时内肝素剂量之和,也被认为是肝素治疗结果的影响因素。因此,为了优化模型预测,我们从2个数据集中选择了感兴趣的临床特征,包括性别、种族、入院类型、年龄、体重、初始aPTT、肌酐、AST/ALT比值(我们在PUMCH中使用ALT值,因为在PUMCH中不是每次都常规检测AST值)、若干SOFA评分和肝素总剂量,如图所示表2.我们使用肝素治疗前最后一次aPTT测量作为初始aPTT值,实验室测试和SOFA评分是最接近初始肝素注射时间的。

表2。从2组数据中选择感兴趣的临床特征。
特性 重症监护III数据集的多参数智能监测 北京协和医院数据集
人口数据

性别 性别

种族 - - - - - -一个

录取类型 - - - - - -

年龄 年龄

重量 重量
实验室测试

最初的aPTTb价值 初始aPTT值

肌酐值 肌酐值

AST / ALTc 丙氨酸转氨酶值
沙发d分数

凝固SOFA评分 凝固SOFA评分

肝脏SOFA评分 肝脏SOFA评分

心血管SOFA评分 心血管SOFA评分

肾脏SOFA评分 肾脏SOFA评分
药物治疗 肝素总剂量 肝素总剂量

一个不可用。

baPTT:活化部分凝血活酶时间。

cAST/ALT:天冬氨酸转氨酶/丙氨酸转氨酶。

dSOFA:顺序器官衰竭评估。

患者纳入标准

入组标准如下:(1)患者年龄≥18岁,(2)患者接受肝素治疗,(3)肝素治疗前后测定aPTT值。基于上述标准,我们最初从MIMIC III数据库收集了6919例患者记录,从PUMCH数据库收集了2152例患者记录。对于MIMIC III数据库,我们首先删除了一些aPTT数据不可用的患者记录。然后我们删除了体重或AST/ALT比值缺失值的记录。接下来,我们删除了超出正常范围的连续特征值的患者记录,包括体重、初始aPTT值、肌酐值、AST/ALT比值和肝素总剂量。根据异常值的统计定义[15],计算这些特征的均值μ和标准差σ;正常范围为max(0, μ-3σ)到μ+3σ。因此,我们删除了这个范围之外的单个记录。中列出了每个特征的正常范围和异常值的数量多媒体附件1.在这一过程之后,3607份患者记录被保留下来。对于PUMCH数据库,经过类似的数据选择过程(根据不同的记录方法,如用PUMCH数据库中的ALT值替换AST/ALT比值),我们收集了1549例患者记录作为PUMCH的研究人群。遴选过程的详情见图2

图2。基于纳入和排除标准的研究队列选择流程。ALT:丙氨酸转氨酶;aPTT:活化部分凝血活酶时间;AST:天门冬氨酸转氨酶;MIMIC III:重症监护的多参数智能监测III;北京协和医院。
查看此图

数据预处理

两个数据集中都缺少SOFA分数,使用3个最近邻算法将缺失值替换为3个最近邻的欧几里得距离的平均值。中列出了缺失的数据归因结果多媒体附件2.我们对性别、种族和录取类型特征应用了一个单热编码器,因为这些都是分类特征。为了避免出现特征值过大而无法进行模型训练的情况,我们使用以下公式对所有连续数值特征进行min-max归一化:

其中x表示一个固定特征的所有记录的值。

模型训练

之前的研究也证实了这一点[11],在用于肝素结局预测任务的几种机器学习模型中,浅神经网络模型效果最好。在这项研究中,我们使用了一个全连接浅神经网络模型[1617预测肝素治疗8小时后患者的治疗效果(亚治疗、正常治疗或超治疗)。这是一个三元分类任务。我们的人工神经网络由一个输入层、一个输出层和3个隐藏层组成。它是完全连接的,这意味着每个神经元接收来自前一层中所有神经元的输入,并将结果传递给下一层中的所有神经元。整流线性单位函数[18]作为激活函数,以增加模型的非线性度,提高模型的效率。隐层神经元数量设置为32/64/24。MIMIC III和PUMCH数据集的模型除了输入略有不同外,基本相同。我们训练该模型5000个epoch,学习率为0.015。全连接神经网络使用TensorFlow (version 1.12.0)构建。每个数据集分为训练集(80%)和测试集(20%),亚治疗记录、正常治疗记录和超治疗记录的比例保持不变。为了验证我们模型的预测性能,在每个数据集上使用了5次交叉验证。

肝素剂量推荐

通过使用上面描述的神经网络模型,我们可以用softmax函数计算一条记录属于3个类别(亚治疗、正常治疗和超治疗)中的每一个类别的概率[19].对于亚治疗或超治疗的患者记录x和可能的剂量α,我们将x的实际总肝素剂量更改为α,并将M(x,α)定义为更改后的正常治疗概率。然后,我们用如下所示的softmax函数计算M(x,α):

其中r、s、t分别为超治疗、正常治疗、超治疗的神经网络模型在此变化后的输出(数值越大,属于这一类的概率越高)。

对于这个亚治疗或超治疗的患者记录x,我们为x提供了一个推荐的肝素总剂量σ(x),它使正常治疗的概率最大化。更具体地说,我们使用以下公式计算了推荐剂量:

其中O表示所有可能剂量的集合。我们相信我们推荐的剂量是合理的,我们的模型可以提高临床医生的判断。

模型评价

模型性能评估

我们用精密度、召回率、F1分数、准确度和kappa系数来评价我们的三元分类模型的能力[20.21].由于微观平均精密度、召回率和F1分数都等于准确率,所以我们只计算准确率、kappa系数、宏观平均精密度、召回率和F1分数来衡量分类性能。详情请参见表3下面的公式。

表3。我们预测的混淆矩阵。一个
实际标签 预测的标签
开始 正常的治疗 Supratherapeutic
开始 一个 B C
正常的治疗 D E F
Supratherapeutic G H

一个用该表来衡量分类性能,如公式所示。

特征重要性评估

为了评估浅层神经网络模型中每个特征的重要性,我们每次删除一个特征,然后计算模型精度的下降。更具体地说,是重要性E第i个特征F可以用公式计算吗E= a - a当使用所有特征时,模型的精度在哪里一个去除特征后的模型是否准确F.具有较高的特征E值对于模型更重要。我们还在每个数据集上使用了5倍交叉验证来提高计算的稳定性。

推荐结果评价

将推荐剂量结果与回顾性数据库中临床医生的实际决定进行比较,并评估临床场景中相应的剂量反应,以验证实际剂量设置是否最优。当实际的剂量设置是亚治疗性的,而我们的推荐剂量更高,或者是超治疗性的,而我们的推荐剂量更低,那么我们认为我们的推荐剂量是合理的。例如,对于1万IUs肝素治疗后预测亚治疗性aPTT结果的患者,如果模型推荐剂量大于1万IUs,我们认为推荐剂量是合理的;如果模型推荐剂量小于10,000 IUs,我们认为推荐剂量不合理。


病人的特点

根据MIMIC III和PUMCH中肝素注射后治疗结果的患者特征显示在表4.3607例MIMIC III患者中,1718例(47.6%)aPPT值在亚治疗范围内,1266例(35.1%)aPPT值在正常治疗范围内,623例(17.3%)aPPT值在超治疗范围内。1549例PUMCH患者中,434例(28.1%)aPPT值在亚治疗范围内,754例(48.7%)aPPT值在正常治疗范围内,361例(23.3%)aPPT值在超治疗范围内。对于数字特征,生成特征密度分布,以明确值是分散的还是集中的(多媒体).

表4。患者特征和根据肝素注射后治疗结果选择的特征。
数据集,病人特征 治疗范围类别
开始 正常的治疗 Supratherapeutic
重症监护III数据库中的多参数智能监测(n=3607) 1718 1266 623

年龄(年),平均值(SD) 65.4 (14.2) 67.8 (15.0) 70.6 (13.9)

重量(kg),平均值(SD) 84.5 (21.8) 81.3 (21.3) 80.5 (21.8)

性别,n (%)


男性 1068 (62.2) 750 (59.2) 320 (51.4)


650 (37.8) 516 (40.8) 303 (48.6)

种族,n (%)


白色 1223 (71.2) 928 (73.3) 441 (70.8)


黑色的 98 (5.7) 111 (8.8) 71 (11.4)


拉丁 42 (2.4) 21日(1.7) 16 (2.6)


亚洲 24 (1.4) 25 (2.0) 25 (4.0)


其他人 331 (19.3) 181 (14.3) 70 (11.2)

入场类型,n (%)


选修 189 (11.0) 69 (5.5) 22日(3.5)


紧急 1474 (85.8) 1152 (91.0) 591 (94.9)


紧急的 55 (3.2) 45 (3.6) 10 (1.6)

最初的aPTT一个值(s),平均值(SD) 39.5 (22.0) 45.5 (26.8) 40.4 (21.2)

肌酐值(mg/dL),平均值(SD) 1.4 (1.0) 1.5 (1.1) 1.7 (1.2)

AST / ALTb平均(SD)比值 1.6 (1.1) 1.7 (1.2) 1.6 (1.0)

凝固的沙发c平均分数(SD) 0.5 (0.8) 0.4 (0.7) 0.4 (0.7)

肝脏SOFA评分,平均值(SD) 0.4 (0.8) 0.4 (0.7) 0.4 (0.8)

心血管SOFA评分,平均值(SD) 1.5 (1.2) 1.5 (1.3) 1.7 (1.3)

肾脏SOFA评分,平均值(SD) 0.8 (1.1) 1.1 (1.2) 1.3 (1.2)

肝素总用量(IUs),平均值(SD) 8449.7 (6773.0) 11299.9 (7550.8) 12667.3 (6932.3)
协和医院(n=1549) 434 754 361

年龄(年),平均值(SD) 55.1 (15.9) 57.8 (15.5) 60.9 (14.9)

重量(kg),平均值(SD) 68.1 (12.6) 67.3 (12.2) 66.5 (12.4)

性别,n (%)


男性 256 (59.0) 453 (60.1) 223 (61.8)


178 (41.0) 301 (39.9) 138 (38.2)

初始aPTT值(s),平均值(SD) 29.5 (5.5) 34.6 (5.8) 39.4 (9.2)

肌酐值(μmol/L),平均值(SD) 107.4 (73.7) 117.2 (78.7) 128.0 (86.3)

丙氨酸转氨酶值(单位/L),平均值(SD) 45.1 (91.7) 47.1 (104.5) 55.7 (141.9)

凝血SOFA得分,平均值(SD) 0.9 (0.9) 1.0 (1.0) 1.1 (1.0)

肝脏SOFA评分,平均值(SD) 0.6 (0.8) 0.7 (0.9) 0.8 (1.0)

心血管SOFA评分,平均值(SD) 2.9 (1.6) 3.0 (1.5) 3.1 (1.5)

肾脏SOFA评分,平均值(SD) 0.5 (0.9) 0.6 (1.0) 0.8 (1.0)

肝素总用量(IU/kg),平均值(SD) 7.5 (4.3) 7.8 (4.4) 9.6 (5.6)

一个aPTT:活化部分凝血活酶时间。

bAST/ALT:天冬氨酸转氨酶/丙氨酸转氨酶。

cSOFA:顺序器官衰竭评估。

模型的性能

我们将每个数据集分为训练集(80%)和测试集(20%)。划分数据集后各治疗水平的比例列于多媒体附件4.浅层神经网络模型在MIMIC III和PUMCH的回顾性队列上进行了训练和测试。模型性能结果列于表5.对于这两个数据集,我们的模型实现了超过0.89的精度,超过0.82的kappa系数,以及超过0.88的宏观平均F1得分。实验结果反映了全连接浅神经网络模型的稳定性能,并表明该模型对不同数据库具有可泛化性。

表5所示。在2个数据集上建立性能模型。
参数 重症监护III数据集的多参数智能监测 北京协和医院数据集
精度 0.891 0.926
Kappa系数 0.823 0.882
Macroaveraged精度 0.890 0.931
Macroaveraged回忆 0.884 0.920
F1宏观平均分数 0.887 0.925

功能的重要性

图3说明了每个特征在我们的预测模型发展中的重要性。中列出的类别对特性进行分组着色表2.数值越高,表示该特征在模型中的重要性越大。从特征重要性评价结果可以看出,两个数据集中的关键特征基本相同,但排名略有不同。对于MIMIC III数据集,肝素总剂量是影响最大的模型因素;体重、初始aPTT值、肌酐值和年龄是关键特征,对模型的影响很大。对于PUMCH数据集,影响最大的特征是初始aPTT值;肝素总用量、年龄、体重和肌酐也是构建模型的重要特征。在这两个数据集中,种族、SOFA分数和性别对模型的影响相对较小。总体而言,特征贡献分析结果与临床经验相对一致。

图3。功能的重要性。ALT:丙氨酸转氨酶;aPTT:活化部分凝血活酶时间;AST:天门冬氨酸转氨酶;MIMIC III:重症监护的多参数智能监测III;PUMCH:北京协和医院;SOFA:顺序器官衰竭评估。
查看此图

肝素推荐剂量评价结果

我们比较了亚治疗性样品的推荐剂量和实际剂量(MIMIC III: n=1718;PUMCH: n=434)和超治疗性样本(MIMIC III: n=623;PUMCH: n = 361)。对于MIMIC III中72.2%(1240/1718)的亚治疗性样本和PUMCH中64.7%(281/434)的亚治疗性样本,我们的模型比临床医生推荐更高的肝素剂量。此外,在MIMIC III中80.9%(504/623)的超治疗性样本和在PUMCH中76.7%(277/361)的超治疗性样本中,我们的模型推荐的肝素剂量低于临床医生的建议。在图4,内圈的实心黄色、绿色和红色分别代表亚治疗、正常和超治疗样本。外环中相同的阴影颜色表示推荐的治疗状态与内圈相匹配,而外环中的细绿色条表示建议在亚治疗样本中增加肝素剂量,在超治疗样本中减少肝素剂量。该模型的建议可以改善肝素治疗的结果,并可能有效地减少在临床环境中达到最佳剂量的时间。

图4。在MIMIC III (A)和PUMCH (B)数据集中推荐肝素剂量结果。MIMIC III:重症监护的多参数智能监测III;北京协和医院。
查看此图

主要结果

在本研究中,我们使用了一个经过验证的浅层神经网络模型,用于UFH输注的临床场景,这种输注通常应用于静脉血栓栓塞的治疗和预防。据我们所知,我们的研究是基于机器学习的模型在用药剂量优化领域的第一个实际验证。我们在MIMIC III和中国高等教育医院的本地重症监护数据库中演示了所提出模型的可行性和效率。根据计算出的个别情况的概率,我们为每个记录提出了一个UFH推荐剂量,对比结果表明,预测的推荐剂量与临床实际情况吻合较好。

与之前工作的比较

正如Ghassemi之前使用MIMIC II数据库进行的一项研究所描述的那样[14],在初始剂量和相应的aPTT反应中出现了很大的变化,这表明在提供者间实践和患者因素中存在潜在的差异。在临床场景中,为了避免这种偏差以及后续的波动和治疗相关的风险,在我们当地的实践中,采用了循序渐进的模式,而不是经验设定初始剂量。根据一系列连续监测的aPTT结果确定适用的给药水平。因此,在本研究中,我们使用肝素治疗8 h后的稳态aPTT值,而不是单一值。结果表明,基于机器学习的模型可以有效地预测初始给药后的aPTT反应,并以逐步的模式进行,这有助于缩短治疗方案的持续时间,避免治疗相关风险。在我们之前的工作中,我们证明了与极端梯度增强、自适应增强和支持向量机等算法相比,浅神经网络算法表现最好[11].基于我们当地的临床数据库和改进的治疗模式,我们验证了之前开发的模型,并证明了这种基于机器学习的算法对UFH治疗的适用性。尽管我们在之前的研究中已经在2个公共数据集上训练了机器学习模型,这些数据集主要来自于著名的MIMIC和电子ICU数据库,但它们可能无法推广到其他机构和人群。尽管如此,我们的经验表明,在特定的临床场景中,模型在重新训练后可以顺利迁移到新的数据集,这反映了机器学习算法的灵活性和简单性。值得注意的是,在不同数据集上的验证证明了模型的可泛化性,但对于每个数据集,模型不一定具有相同的系数集。

可解释性问题仍然是机器学习算法在临床应用中的一个问题。可解释性有助于医生根据众多临床变量做出决策,而不是简单地提供预测或描述[22].在这项研究中,我们计算了浅层神经网络模型中每个特征的重要性。如图3,总肝素剂量、体重、初始aPTT值、肌酐值和年龄是两个数据集最重要的5个特征,尽管它们的具体顺序在数据集之间有所不同。此外,如图表4,肝素平均总剂量从亚治疗患者到正常治疗患者,再到超治疗患者依次增加。年龄较大、体重较轻、肌酐水平较高倾向于超治疗性给药,这是合理的。相反,年龄越小,体重越重,肌酐水平越低,往往导致亚治疗剂量。这与临床经验相一致,可为临床医生提供一些实际支持。特征重要性分析不仅在一定程度上描述了模型是如何工作的,而且可以促使临床医生更加关注重要的临床变量。虽然人工神经网络模型通常被视为黑盒模型,但我们相信对这些模型的分析和解释将有助于理解模型。

对于每个亚治疗或超治疗的患者,我们通过模型推荐肝素总剂量。用模型本身评价推荐剂量是不合理的;因此,我们通过与临床医生实际给予的剂量进行比较,来评估推荐剂量的合理性。值得注意的是,在MIMIC III数据集中,由于肝素总剂量是最重要的特征,因此对合理推荐肝素剂量贡献最大。相比之下,对于PUMCH数据集,由于初始aPTT值是最重要的特征,而肝素总用量相对不那么重要,因此合理推荐肝素用量的评价结果略低,如图所示图4.此外,本研究初步评估了推荐剂量结果。例如,对亚治疗患者建议增加剂量被评价为改善预后;然而,推荐的剂量不一定会导致正常的肝素治疗结果,它也可能导致超治疗状态。我们将在今后的研究中进一步完善评价方法。

限制

这项研究有几个局限性。首先,我们的研究受到回顾性性质和数据来源的限制。这种基于机器学习的模型的性能需要在临床实践中得到验证,以便为治疗提供有价值的建议。因此,除了利用更多的临床数据库进行模型优化和交叉验证外,还应进行精心设计的、前瞻性的交叉临床研究。其次,我们的结果受到临床数据库中人群规模的限制;更大的队列可能有助于更准确的预测和更精确的稳定剂量水平的建议。考虑到数据和逻辑结构的相似性,其他临床场景如治疗药物监测、稳态平衡、输血控制等也可以作为该模型的合适应用。第三,如上所述,考虑到MIMIC III和PUMCH临床数据库的不同时间跨度、治疗模式和患者特征,如2个特征集不完全一致,2个数据集的最佳给药水平和相应的aPTT结果不同。然而,正如模型性能和特征重要性结果所证明的那样,这些差异在临床实践或机器学习算法中都没有导致剂量-效应关系的差异。虽然将输入特征应用于其他数据集时需要调整或预处理,但我们仍然认为预测模型和推荐方法应用于肝素结局预测和决策临床场景时提供了一种机器学习解决方案。 Furthermore, from the perspective of model development, our fully connected shallow neural network model is currently a static model that does not make use of dynamic time series data. In addition, we have not incorporated other available relevant features into the model, such as medical history, comorbidities, surgery history, and intake of medications other than heparin. In the future, with the goal of achieving better predictions of the outcome of heparin treatment and recommending more reasonable heparin dosages, we will build a dynamic model such as a recurrent neural network or a long short-term memory model and incorporate more features.

结论

基于我们之前工作中训练和验证的机器学习模型,本研究旨在进一步验证该模型及其浅层神经网络在当地临床环境中的有效性。我们发现,数据驱动的机器学习方法可以有效地用于逐步剂量模式的UFH治疗的临床场景。该结果为预测UFH治疗结果和向临床医生推荐最佳UFH剂量提供了支持。我们还评估了每个模型特征的重要性,以帮助解释和理解机器学习模型。

致谢

本研究得到国家重点研发计划项目(项目2018YFC0116903、2018YFC0116905)、中国健康信息与医疗大数据协会重症感染镇痛镇静大数据专项基金(Z-2019-1-001)、中国医学科学院医学科学创新基金(项目2016- im2 -2-004)的支持。

作者的贡献

YL和WZ为通讯作者,对整篇文章的完整性负责。DL, JG, NH和HW作为共同第一作者贡献相同。DL、LS和YL负责研究构想和设计。HJ和WZ负责数据访问和隐私管理。JG, CL, QW, HJ负责数据清理和算法实现。LS、DL、HW负责数据分析和结果解释。DL, JG和NH起草了手稿。所有作者都对重要的知识内容进行了修改。

利益冲突

没有宣布。

多媒体附件1

每个临床特征的正常范围和异常值的数量。

DOCX文件,14kb

多媒体附件2

缺失数据归因结果。

DOCX文件,14kb

多媒体

不同特征的密度函数。

DOCX文件,12563 KB

多媒体附件4

划分数据集后各治疗水平的比例。

DOCX文件,14kb

  1. Hannes K, Leys M, Vermeire E, Aertgeerts B, Buntinx F, Depoorter a .在全科实践中实施循证医学:基于焦点小组的研究。BMC Fam Pract 2005 Sep 09;6:37 [免费全文] [CrossRef] [Medline
  2. Kuzniewicz MW, Vasilevskis EE, Lane R, Dean ML, Trivedi NG, Rennie DJ,等。ICU风险调整死亡率的变化:评估方法的影响和潜在混杂因素。胸部2008年6月;133(6):1319-1327。[CrossRef] [Medline
  3. 书评:在临床实践中使用指南。SAGE出版社:英国伦敦;2001.
  4. Pirracchio R, Cohen MJ, Malenica I, Cohen J, Chambaz A, Cannesson M, ACTERREA研究小组。大数据和有针对性的机器学习在行动中协助ICU的医疗决策。麻醉危重护理疼痛医学2019年8月;38(4):377-384。[CrossRef] [Medline
  5. Nemati S, Ghassemi MM, Clifford GD。从次优临床实例中获得最佳药物剂量:一种深度强化学习方法。IEEE工程医学生物Soc 2016年8月;2016:2978-2981。[CrossRef] [Medline
  6. 刘珊,见KC, Ngiam KY, Celi LA,孙霞,冯敏。强化学习在重症监护临床决策支持中的应用综述。J Med Internet Res 2020年7月20日;22(7):e18477 [免费全文] [CrossRef] [Medline
  7. Melloni C, Alexander KP, Chen AY, Newby LK, Roe MT, Allen LaPointe NM, CRUSADE Investigators。非st段抬高急性冠脉综合征患者未分次肝素给药与大出血风险美国心脏杂志2008年8月;156(2):209-215。[CrossRef] [Medline
  8. Cruickshank MK, Levine MN, Hirsh J, Roberts R, Siguenza M.一种用于肝素治疗管理的标准肝素nomogram。Arch Intern Med 1991 Feb;151(2):333-337。[Medline
  9. Hirsh J, Anand SS, Halperin JL, Fuster V,美国心脏协会。美国心脏协会科学声明:抗凝治疗指南:肝素:美国心脏协会医疗保健专业人员的声明。动脉粥样硬化血栓血管生物学2001 7月;21(7):E9-E9。[CrossRef] [Medline
  10. Lin R, Stanley MD, Ghassemi MM, Nemati S. ICU药物剂量和监测的深度确定性政策梯度方法。IEEE工程医学生物Soc 2018年7月;2018:4927-4931 [免费全文] [CrossRef] [Medline
  11. 苏玲,刘超,李东,何俊,郑峰,姜华,等。通过比较多种机器学习方法获得最佳肝素剂量:回顾性研究。JMIR Med Inform 2020年6月22日;8(6):e17648。[CrossRef] [Medline
  12. 张志刚,刘志刚,张志刚,张志刚,等。这是一个免费访问的重症监护数据库。科学数据2016年5月24日;3:160035 [免费全文] [CrossRef] [Medline
  13. Pollard TJ, Johnson AEW, Raffa JD, Celi LA, Mark RG, Badawi O. eICU合作研究数据库,一个免费的重症监护研究多中心数据库。科学数据2018年9月11日;5:19 08 [免费全文] [CrossRef] [Medline
  14. Ghassemi MM, Richter SE, Eche IM, Chen TW, Danziger J, Celi LA。优化用药剂量的数据驱动方法:关注肝素。重症监护医学2014年9月40日(9):1332-1339 [免费全文] [CrossRef] [Medline
  15. 库西诺D, Chartier S.异常值检测和处理:综述。国际医学杂志;2010年6月30日;3(1):58-67。[CrossRef
  16. Hopfield JJ。具有紧急集体计算能力的神经网络和物理系统。中国科学院自然科学研究所1982年4月;79(8):2554-2558 [免费全文] [CrossRef] [Medline
  17. Anderson JA, Silverstein JW, Ritz SA, Jones RS.独特特征,分类感知和概率学习:神经模型的一些应用。心理评论1977年9月;84(5):413-451。[CrossRef
  18. gloria X, Yoshua B, Antoine B.深度稀疏整流神经网络。AISTATS。2011.URL:http://proceedings.mlr.press/v15/glorot11a/glorot11a.pdf[2021-04-27]访问
  19. Softmax函数。维基百科。URL:https://en.wikipedia.org/wiki/Softmax_function[2021-04-21]访问
  20. 张志强,李志强。分类任务绩效指标的系统分析。信息处理与管理2009 july;45(4):427-437。[CrossRef
  21. 科恩的kappa系数。维基百科。URL:https://en.wikipedia.org/wiki/Cohen%27s_kappa[2021-04-21]访问
  22. Guidotti R, Monreale A, Ruggieri S, Turini F, Giannotti F, Pedreschi D.黑箱模型解释方法的调查。ACM计算调查(CSUR) 2018;51(5):1-42。[CrossRef


ALT:丙氨酸转氨酶
aPTT:活化部分凝血活酶时间
AST:天冬氨酸转氨酶
加护病房:重症监护室
模仿III:重症监护中的多参数智能监护3
PUMCH:北京协和医院
沙发:顺序器官衰竭评估
能:依诺肝素


R·库卡夫卡编辑;提交12.01.21;作者:李俊,钱波,王磊;对作者29.01.21的评论;修订本收到日期:07.03.21;接受24.03.21;发表20.05.21

版权

©李东凯,高建伟,洪娜,王浩,苏龙祥,刘春,何洁,蒋慧珍,王强,龙云,朱卫国。最初发表于《医疗互联网研究杂志》(//www.mybigtv.com), 2021年5月20日。

这是一篇开放获取的文章,根据创作共用署名许可(https://creativecommons.org/licenses/by/4.0/)的条款发布,允许在任何媒介上无限制地使用、分发和复制,前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。


Baidu
map