JMIR医学信息学-通过比较多种机器学习方法获得最佳肝素剂量:回顾性研究

原始论文

¹北京协和医学院中国医学科学院北京协和医院重症医学科，北京

²神州数码健康科技有限公司，北京

^3.北京协和医学院中国医学科学院北京协和医院信息管理系，北京

⁴北京协和医学院中国医学科学院北京协和医院普通内科/信息管理科，中国北京

这些作者的贡献相同

通讯作者:

云龙，医学博士，博士

重症医学系

北京协和医院

北京协和医学院，中国医学研究院

北京市东城区帅福园1号，100730

北京

中国

电话:86 10 69152318

电子邮件:ly_icu@aliyun.com

背景:肝素是重症监护病房最常用的药物之一。在临床实践中，使用基于体重的肝素给药图是治疗血栓形成的标准做法。最近，机器学习技术极大地提高了计算机提供临床决策支持的能力，并使计算机生成基于算法的肝素剂量建议成为可能。

摘要目的:本研究的目的是利用机器学习方法预测肝素治疗的效果，以预测为基础优化重症监护病房的肝素剂量。患者状态预测是基于激活的部分凝血活酶时间在3个不同的范围:亚治疗，正常治疗和超治疗。

方法:来自2个重症监护研究数据库的回顾性数据(重症监护多参数智能监测III, MIMIC-III;使用e重症监护室合作研究数据库(eICU)进行分析。将候选机器学习模型(随机森林、支持向量机、自适应增强、极端梯度增强和浅层神经网络)在3组患者中进行比较，以评估预测亚治疗、正常治疗和超治疗患者状态的分类性能。模型结果用准确率、召回率、F1评分和准确率进行评估。

结果:数据来自MIMIC-III数据库(n=2789例)和eICU数据库(n=575例)。在3类分类中，浅层神经网络算法表现最好(数据集1、2、3的F1得分分别为87.26%、85.98%和87.55%)。浅层神经网络算法在患者治疗状态组中F1得分最高:亚治疗状态组(数据集1):79.35%;数据集2:83.67%;数据集3:83.33%)，正常治疗(数据集1:93.15%;数据集2:87.76%;数据集3:84.62%)，超治疗(数据集1:88.00%;数据集2:86.54%;数据集3:95.45%)治疗范围。

结论:通过比较多个机器学习模型，找到最适合预测肝素治疗效果的模型，并可用于进一步指导肝素的最佳剂量。使用多中心重症监护病房数据，我们的研究证明了使用数据驱动方法预测肝素治疗结果的可行性，因此，如何使用基于机器学习的模型来优化和个性化肝素剂量以提高患者安全性。人工分析和验证表明，该模型优于标准实践肝素治疗剂量。

中华医学杂志，2020;8(6):817648

doi: 10.2196/17648

关键字

肝素钠；剂量；机器学习；优化；加护病房

在医院中，重症监护病房的独特之处在于，大量的信息是由计算机化系统收集和显示的，诊断和治疗的准确性可以深刻地影响护理质量和病人的结果。1]。数据驱动的临床决策支持系统有潜力帮助临床医生优化重症监护病房的治疗和药物，以最大限度地提高每位患者的医疗效果[2]。

肝素是重症监护病房最常用的药物之一，静脉不分离肝素是抗凝治疗的基本方法。在大多数临床实践指南中，肝素的剂量仅基于患者的体重;使用基于体重的肝素给药图是治疗血栓形成的标准做法[3.，4]。对于单纯根据体重确定肝素剂量的肥胖患者，可能得不到适当的肝素剂量，建议如降低初始输注速率[5-7]或使用调整后的体重[8已被报道。在临床实践中，活化的部分凝血活酶时间通常反映凝血水平。高活化的部分凝血活素时间意味着血液凝结缓慢，而低活化的部分凝血活素时间意味着血液凝结迅速。通常，每4 ~ 6小时抽取血样监测活化的部分凝血活素时间，通过活化的部分凝血活素时间是否及时到达治疗窗口来衡量抗凝治疗结果;然而，基于体重的方法容易导致不适当的剂量，其显示亚治疗或超治疗的活化部分凝血活素时间。此外，不适当剂量的未分离肝素导致的危险因素尚不清楚。只有高初始输注率、高龄和女性被报道与超治疗激活部分凝血活素时间相关[9，10]。肝素给药指南关于初始负荷剂量，维持剂量和速率，以及活化部分凝血活酶时间测量间隔在各机构之间差异很大。此外，临床医生根据患者的直接情况和需要选择不同的肝素给药途径，如静脉推注或静脉滴注。

最近，机器学习技术极大地提高了计算机提供临床决策支持的能力，从而使计算机生成基于算法的肝素剂量建议成为可能。多元逻辑回归[11]和多项逻辑回归[12]已被用于估计肝素剂量，准确度约为60%。算法也被用于研究[13，14]用于其他抗凝剂，如华法林剂量调整，但发现患者内部的高变异性削弱了预测的准确性。

由于这些原因，迫切需要一种可靠的方法来帮助医生快速预测和优化肝素剂量。激活部分凝血活素时间治疗窗口期的建模和预测需要考虑患者治疗过程中的多种因素，从而提供适当的决策支持建议，帮助指导临床医生确定和准备后续的肝素剂量或调整剂量率。

数据集

数据摘自重症监护多参数智能监测III数据库(MIMIC-III) [15]及电子加护病房合作研究资料库(eICU) [16]，目的是比较多个预测模型，并评估不同患者组的结果。进行了跨数据库评估。MIMIC-III数据库和eICU数据库是包含医疗数据的免费开放数据集。MIMIC-III数据库包含来自贝斯以色列女执事医疗中心重症监护病房的数据，由麻省理工学院计算生理学实验室发布。eICU数据库由Philips e -重症监护病房研究所发布，其中包含来自美国大陆许多重症监护病房的数据。从数据库中提取了14,806名在重症监护病房住院期间接受肝素治疗的成年患者的数据。仅使用初始肝素剂量给药后4至6小时的活化部分凝血活素时间测量的患者数据，将队列规模减少到3835。我们根据过去的经验和之前的研究选择了4到6个小时[11];在这段时间内，第一次激活部分凝血活酶时间测量通常发生的比例最大的患者。在临床实践中，有不同的给药途径来给药。静脉推注和静脉滴注两种常用的肝素输送方法，在实践中根据患者的病情和医生的偏好进行选择;因此，将患者数据进一步按给药途径进行分类——静脉推注(数据集1)和静脉滴注(数据集2和3)。

特征选择

结果感兴趣的活化部分凝血活素时间4至6小时后，初始肝素输注。由于数据来自贝斯以色列女执事医疗中心，我们采用贝斯以色列女执事医疗中心使用的治疗时间定义来定义本研究中活化部分凝血活酶治疗时间，以确保一致性。正常治疗被定义为激活部分凝血活素的时间从60秒到100秒，超治疗被定义为激活部分凝血活素的时间大于100秒，亚治疗被定义为激活部分凝血活素的时间小于60秒[11]。选择感兴趣的临床特征，以优化预测治疗性活化部分血小板活素时间——年龄、种族、性别、初始肝素剂量、初始肝素注射与首次测定活化部分血小板活素时间的间隔、肌酐浓度、入院类型和天冬氨酸转氨酶与丙氨酸转氨酶比值(AST/ALT比值)。这些特征作为一个整体对患者的预后有贡献，例如，血液中的肌酐几乎完全通过肾小球滤过进入尿液，其浓度在正常情况下是稳定的;因此，血中肌酐浓度反映肾小球滤过功能，可作为肾功能指标。血中谷草转氨酶和丙氨酸转氨酶的浓度水平对肝细胞损伤非常敏感，其比值是判断肝功能的重要指标。这些特征已在另一项研究中得到报道和讨论[11]，许多特征与初始肝素剂量后第一次测量活化的部分凝血活素时间有统计学意义。

数据预处理

对患者数据进行预处理，对感兴趣的特征进行编码并归一化为变量。的方法填充了一些特征的缺失值k-最近邻算法，该算法利用欧几里得距离根据中最近邻的值来填充缺失值k维度。

数据中的极值会影响训练和预测过程。对连续特征进行预处理时需要进行归一化处理;然而，极端值虽然可能很少，但会对规范化的输出产生负面影响。连续特征(年龄、肝素剂量、肌酐值、AST/ALT比值)均手工验证z分数在-3到+3之间。根据离群值的统计定义[17]，正常范围应为z=−3z= + 3;因此,z超出此范围的分数应在标准化之前删除。年龄数据在正常范围内;然而，从初始肝素剂量、肌酐浓度和AST/ALT比值数据中去除异常值。

模型训练和性能调优

在初始肝素剂量后4 ~ 6小时测量的活化部分凝血活素时间值使用三元分类分为亚治疗、正常和超治疗。在本研究中实现并测试了支持向量机、随机森林、自适应增强、极端梯度增强和浅层神经网络算法。

支持向量机基于两类数据之间的边界最大化(即从分离超平面到最近数据点的最小距离)。高斯核保证了分类是非线性的。自适应增强、极端梯度增强和随机森林方法都是基于使用增强作为学习方法。增强方法选择已知的特征来提高模型的预测能力，从而同时降低维数。其中典型的样本特征是应用于每个样本的弱分类器的输出，自适应增强通过改变样本的权重来训练不同的弱分类器，并且弱类被组合成加权和，代表增强分类器的最终输出。极端梯度增强是基于梯度增强的，在梯度增强的过程中，算法学习一个增强树的集合，并在分类误差和模型复杂性之间进行仔细的权衡。极端梯度增强最近在应用机器学习领域占据主导地位(例如，在结构化或表格数据的Kaggle竞赛中)[18]。随机森林方法生成多个决策树，每个决策树提供一个分类。森林按占多数的分类选择最终输出。人工神经网络是由多层神经元构成的;每个神经元接收一些输入变量，并将结果传递给下一层的神经元。人工神经网络可以学习与输入输出变量相关的复杂函数，并能够处理变量与函数之间的复杂关系。我们的浅层神经网络是使用TensorFlow(版本1.13.1)构建的。

从亚治疗、正常治疗和超治疗数据组中按1:1:1的比例纳入样本，用于三元分类模型的训练和验证。每个数据集分为80%的训练和交叉验证和20%的测试。

搜索支持向量机、随机森林、自适应增强和极端梯度增强算法的最佳参数(GridSearch;Scikitlearn包)，并用于训练模型。在浅层神经网络模型中，使用2个隐藏层，神经元数量设置为36/24，以降低模型复杂度。为了避免过拟合，需要尽早停止和正则化。Dropout是避免过拟合和提高鲁棒性的有效方法。采用整流线性单元激活函数增加非线性[16，17，19]。采用Adam优化器进行模型训练，初始学习率为0.0015。我们将模型训练了1500个epoch，辍学率设置为0.75。为了验证我们的模型的预测性能，每个模型都使用了5倍交叉验证。

模型评价

以下措施:精度=真阳性/（真阳性×假阳性)，回忆=真阳性/（真阳性+假阴性)，F1的分数= 2 × (精度×回忆) / (精度+回忆),精度= (真阳性+真正的负) / (真阳性+真正的负+假阳性+假阴性)，用来评价我们的3类分类模型的能力[20.]。对于比例为1:1:1的样本，微平均精密度、召回率和F1分数均等于正确率;因此，我们只比较平均精度和宏观平均精度、召回率和F1分数来衡量这些模型的分类性能。

在研究人群中活化部分凝血活酶时间分布

去除异常值后，我们分别从MIMIC-III数据库中提取符合纳入标准的静脉推注患者(数据集1,n=1758)和静脉滴注患者(数据集2,n=1031)的数据，从eICU数据库中提取静脉滴注患者(数据集3,n=575)的数据。在数据集1中，25.3%(445/1758)的患者活性部分凝血酶时间测量值在正常治疗范围内，51.3%(901/1758)的患者活性部分凝血酶时间测量值在亚治疗范围内，23.4%(412/1758)的患者活性部分凝血酶时间测量值在超治疗范围内。在数据集2中，27.0%(279/1031)、48.1%(496/1031)和24.9%(256/1031)的患者在正常、亚治疗和超治疗范围内的活化部分凝血活酶时间测量值分别为图1．在数据集3中，27.6%(158/575)、59.0%(339/575)和13.6%(78/575)的患者在正常、亚治疗和超治疗范围内测量到活化的部分凝血活酶时间。

所选特性的汇总统计信息

根据初始肝素注射后第一次测量活化部分凝血活酶时间的治疗范围，数据集1,2和3中患者数据的描述性总结显示在表1．

表1。所选特征的汇总统计信息。

患者群体及特征			治疗范围
			子	正常的	在上
数据集1:MIMIC-III^一个静脉推注(N=1756)			901	445	412
	年龄(岁)，平均(SD)		65.4 (14.6)	68.1 (15.1)	69.3 (14.2)
	初始肝素剂量(单位/小时)，平均值(SD)		907.0 (818.8)	1224.2 (1097.5)	1303.5 (908.4)
	aPTT^b(小时)，平均值(SD)		4.9 (0.6)	4.9 (0.6)	4.9 (0.6)
	种族，n (%)
		白色	639 (70.9)	311 (69.9)	291 (70.6)
		亚洲	11 (1.2)	5 (1.1)	7 (1.7)
		黑色的	40 (4.4)	27日(6.1)	46 (11.2)
		拉丁美洲裔	13 (1.4)	11 (2.5)	14 (3.4)
		其他人	198 (22.0)	91 (20.4)	54 (13.1)
	性别，n (%)
		男性	550 (61.0)	256 (57.5)	217 (52.7)
		女	351 (39.0)	189 (42.5)	195 (48.3)
	准入类型，n (%)
		选修	111 (12.3)	26日(5.8)	15 (3.6)
		紧急	768 (79.8)	398 (89.4)	388 (94.2)
		紧急的	32 (3.6)	21日(4.7)	9 (2.2)
数据集2:MIMIC-III静脉滴注(N=1031)， N			496	279	256
	年龄(岁)，平均(SD)		64.9 (15.4)	68.6 (15.2)	70.1 (14.8)
	初始肝素剂量(单位/小时)，平均值(SD)		969.4 (398.3)	1148.7 (395.8)	1229.8 (495.3)
	aPTT(小时)，平均值(SD)		5.0 (0.6)	4.9 (0.5)	5.0 (0.6)
	种族，n (%)
		白色	353 (71.2)	208 (74.6)	179 (70.0)
		亚洲	9 (1.8)	9 (3.2)	10 (3.9)
		黑色的	46 (9.3)	29 (10.4)	42 (16.4)
		拉丁美洲裔	12 (2.4)	7 (2.5)	9 (3.5)
		其他人	76 (15.3)	26日(9.3)	15 (6.2)
	性别，n (%)
		男性	312 (62.9)	163 (58.4)	132 (51.6)
		女	184 (37.1)	116 (41.6)	124 (48.4)
	准入类型，n (%)
		选修	59 (11.9)	25 (9.0)	8 (3.1)
		紧急	436 (87.9)	250 (89.6)	245 (95.7)
		紧急的	1 (0.2)	4 (1.4)	3 (1.2)
数据集3:eICU^d静脉滴注(N=575)			339	158	78
	年龄(岁)，平均(SD)		64.8 (13.9)	69.0 (14.4)	73.1 (12.3)
	初始肝素剂量(单位/小时)，平均值(SD)		1005.7 (892.6)	973.5 (519.3)	950.4 (539.4)
	aPTT(小时)，平均值(SD)		5.2 (0.6)	5.2 (0.6)	5.2 (0.6)
	种族，n (%)
		白色	244 (72.0)	106 (67.1)	46 (59.0)
		亚洲	4 (1.2)	2 (1.3)	2 (2.6)
		黑色的	30 (8.8)	20 (12.7)	9 (11.5)
		拉丁美洲裔	22日(6.5)	19日(12.0)	12 (15.4)
		其他人	39 (11.5)	11 (7.0)	9 (11.5)
	性别，n (%)
		男性	217 (64.3)	99 (62.7)	37 (47.4)
		女	122 (35.7)	59 (37.3)	41 (52.6)
	肌酐(mg/dL)，平均值(SD)		1.7 (1.7)	2.0 (2.1)	2.0 (1.5)
	AST / ALT^c，均值(SD)		1.5 (1.2)	1.7 (1.3)	1.5 (1.1)

^一个重症监护多参数智能监测III数据库。

^b第一次测量活化部分凝血活酶时间。

^cAST/ALT:天冬氨酸转氨酶比值/丙氨酸转氨酶。

^deICU:电子重症监护室数据库。

数据预处理结果

剔除了3个异常值:肝素剂量、肌酐值和AST/ALT比值。统计异常值见多媒体附录1．并非所有患者都有完整的临床资料，如154例患者缺少AST/ALT比值，占静脉推注患者的8.76% (多媒体附录2)。算法(k最近邻)用于填充缺失值。由于据报填入的数值可达40%是合适的[21]，我们认为填充特征对活化的部分凝血活酶时间的影响是合理的。

模型性能结果

为了消除类别不平衡，我们在数据集1中随机为每个治疗状态选择400个样本，在数据集2中为每个治疗状态随机选择250个样本，在数据集3中为每个治疗状态随机选择120个样本。对于亚治疗和正常治疗类别，我们使用一般下采样来减少样本数量，而对于超治疗类别，我们使用上采样将样本数量增加到120;因此，实验使用数据集1中的1200个样本，数据集2中的750个样本，数据集3中的360个样本。模型性能结果见表2．

F1分数提供了对模型的综合评价。如多媒体附录3结果表明，极端梯度增强算法的F1得分次之(数据集1、2和3分别为77.58%、73.94%和78.85%)，仅次于浅层神经网络算法(数据集1、2和3分别为87.26%、85.98%和87.55%)。自适应增强模型在所有3个数据集上的表现也很好(数据集1、2和3分别为72.80%、81.67%和77.65%)，与极端梯度增强模型的得分接近(数据集1、2和3分别为77.58%、73.94%和78.85%)。随机森林模型的表现略差(数据集1、2和3分别为68.20%、73.15%和65.59%)。5种模型的混淆矩阵如图多媒体附录4．在进一步的实验中，随机森林的表现仍然优于本文未讨论的其他模型，如Naïve贝叶斯、逻辑回归、k和决策树，如图所示多媒体附录3．

表2。机器学习算法的宏观平均得分。

模型		精度,%	记得,%	F1分数，%	准确性,%
数据集1:MIMIC-III^一个(静脉推送患者)
	随机森林	68.96	68.75	68.70	68.75
	自适应增强	74.37	72.92	72.80	72.92
	支持向量机	85.19	73.33	73.79	73.33
	极端梯度增压	79.27	76.25	77.58	76.25
	浅层神经网络	88.05	86.67	87.26	86.67
数据集2:MIMIC-III(静脉滴注患者)
	随机森林	66.71	65.33	65.06	65.33
	自适应增强	77.29	77.33	77.30	77.33
	支持向量机	84.59	71.33	71.71	71.33
	极端梯度增压	77.45	77.33	77.38	77.33
	浅层神经网络	85.99	86.00	85.98	86.00
数据集3:eICU^b(静脉滴注患者)
	随机森林	66.77	66.56	65.59	68.06
	自适应增强	78.03	77.78	77.65	77.78
	支持向量机	84.74	76.39	76.19	76.39
	极端梯度增压	79.16	79.17	78.85	79.17
	浅层神经网络	87.80	87.50	87.55	87.50

^一个重症监护多参数智能监测III数据库。

^beICU:电子重症监护室数据库。

在亚治疗类别中，自适应增强在数据集1中达到了最高的精度(84.48%)，而神经网络模型在其他数据集中达到了最高的精度(数据集2:83.67%;数据集3:83.33%)。支持向量机在所有3个数据集中实现了最高的召回率(数据集1:100%;数据集2:100%;数据集3:95.83%)。在正常治疗类中，高斯核支持向量机在所有3个数据集上都达到了100%的精度。浅层神经网络的召回率最高(数据集1:85.00%;数据集2:86.00%;数据集3:91.67%)。在超治疗类中，支持向量机达到了最高的精度(数据集1:100%; data set 2: 100%; data set 3: 95.24%); however, recall of the support vector machine was not very high (data set 1: 57.50%; data set 2: 58.00%; data set 3: 83.33%). The shallow neural network achieved the best recall in all 3 data sets (data set 1: 100%; data set 2: 100%; data set 3: 95.83%). Considering the comprehensive performance which is best evaluated by F1 score, the shallow neural network achieved the best F1 score in all 3 patient groups: subtherapeutic (data set 1: 79.35%; data set 2: 83.67%; data set 3: 83.33%), normal therapeutic (data set 1: 93.15%; data set 2: 87.76%; data set 3: 84.62%), and supratherapeutic (data set 1: 88.00%; data set 2: 86.54%; data set 3: 95.45%) therapeutic ranges. Additional results are listed in表3，表4,表5．

表3。亚治疗模型表现。

模型		精度,%	记得,%	F1分数，%
数据集1:MIMIC-III^一个(静脉推送患者)
	随机森林	67.61	60.00	63.58
	自适应增强	84.48	61.25	71.01
	支持向量机	55.56	One hundred.	71.43
	极端梯度增压	74.32	68.75	71.43
	浅层神经网络	79.35	91.25	84.89
数据集2:MIMIC-III(静脉滴注患者)
	随机森林	58.82	80.00	67.80
	自适应增强	78.43	80.00	79.21
	支持向量机	53.76	One hundred.	69.93
	极端梯度增压	74.32	68.75	71.43
	浅层神经网络	83.67	82.00	82.83
数据集3:eICU^b(静脉滴注患者)
	随机森林	66.67	58.33	62.22
	自适应增强	77.27	70.83	73.91
	支持向量机	58.97	95.83	73.02
	极端梯度增压	76.00	79.17	77.55
	浅层神经网络	83.33	83.33	83.33

^一个重症监护多参数智能监测III数据库。

^beICU:电子重症监护室数据库。

表4。模型表现为正常治疗。

模型		精度,%	记得,%	F1分数，%
数据集1:MIMIC-III^一个(静脉推送患者)
	随机森林	63.64	84.00	72.41
	自适应增强	71.26	77.50	74.25
	支持向量机	One hundred.	62.50	76.92
	极端梯度增压	78.72	74.00	76.29
	浅层神经网络	93.15	85.00	88.89
数据集2:MIMIC-III(静脉滴注患者)
	随机森林	73.81	62.00	67.39
	自适应增强	78.43	80.00	79.21
	支持向量机	One hundred.	56.00	71.79
	极端梯度增压	72.55	74.00	73.27
	浅层神经网络	87.76	86.00	86.87
数据集3:eICU^b(静脉滴注患者)
	随机森林	70.00	65.00	61.90
	自适应增强	81.82	53.85	78.26
	支持向量机	One hundred.	50.00	66.67
	极端梯度增压	80.00	66.67	72.73
	浅层神经网络	84.62	91.67	87.50

^一个重症监护多参数智能监测III数据库。

^beICU:电子重症监护室数据库。

表5所示。超治疗的模型性能。

模型		精度,%	记得,%	F1分数，%
数据集1:MIMIC-III^一个(静脉推送患者)
	随机森林	75.95	75.00	75.47
	自适应增强	67.37	80.00	73.14
	支持向量机	One hundred.	57.50	73.02
	极端梯度增压	80.77	78.75	79.75
	浅层神经网络	88．00	82.50	85.16
数据集2:MIMIC-III(静脉滴注患者)
	随机森林	67.50	54.00	60.00
	自适应增强	75.00	72.00	73.47
	支持向量机	One hundred.	58.00	73.42
	极端梯度增压	76.47	78.00	77.23
	浅层神经网络	86.54	90.00	88.24
数据集3:eICU^b(静脉滴注患者)
	随机森林	63.64	87.50	73.68
	自适应增强	75.00	87.50	80.77
	支持向量机	95.24	83.33	88.89
	极端梯度增压	81.48	91.67	86.27
	浅层神经网络	95.45	87.50	91.30

^一个重症监护多参数智能监测III数据库。

^beICU:电子重症监护室数据库。

主要结果

在我们的实验中，神经网络在所有评估指标上都取得了最高分。神经网络模型使用多层从原始数据中逐步提取更高层次的特征，这可能是神经网络能够学习一些未知特征的原因，这些特征有助于提供更好的正常治疗激活部分凝血活酶时间分类。由于不同的特征可能是相关的(如肌酐值和天冬氨酸转氨酶)，线性分类模型不合适。随机森林、自适应增强和极端梯度增强是集成学习方法。通过集成弱分类器，大大提高了分类性能。高斯核支持向量机是一种应用广泛且功能强大的分类器。高斯核确保了分类器是非线性的，这符合我们的数据的特点，并且该方法能够证明高性能;然而，神经网络模型能够考虑复杂函数变量之间的复杂关系。在测试的方法中，浅层神经网络的效果最好。在静脉推注(数据集1)情况下，浅层神经网络在每个指标(精度、召回率、F1评分和准确性)上的性能比其他算法高出约10%，在静脉滴注情况下(数据集2和数据集3)，浅层神经网络的性能比其他算法的性能高出约9%。 and the support vector machine were the models that subperformed to the shallow neural network although their scores were, nevertheless, all above 70%. The random forest model demonstrated the worst performance.

由于其相对较高的准确性，这种浅神经网络模型应该能够比仅考虑患者体重的肝素剂量指南更好地推荐剂量。

在临床实践中，静脉推注和静脉滴注都是肝素常用的给药途径。静脉推肝素常用于抢救需要及时干预降凝的危重患者，静脉滴注肝素常用于预防血栓形成或栓塞性疾病的长期用药。两种给药途径具有不同的临床意义;因此，我们将2个数据库中的患者组分成3个数据集，以验证他们是否会有不同的模型预测。结果表明，模型预测性能在3个数据集之间具有可比性，这使我们深入了解了稳定性，并且表明无论管理路径或数据源如何，模型都是稳定的。

的优势

由于不同机构的正常治疗激活部分凝血活素时间范围不同，我们的浅神经网络模型可以通过调整参数来适应不同的肝素给药指南。此外，该模型也可以应用于再训练后的其他药物剂量优化问题。在治疗患者时，肝素的推荐剂量可使正常治疗可能性最大化。该模型预测的未来应用有可能提高患者安全，最大限度地减少出血或血栓栓塞事件的风险，降低医疗成本，提高临床医生的效率。

限制

我们研究的一个挑战是确定影响肝素剂量的特征。首先，平衡离散特征和连续特征及其相对重要性将提高模型训练性能和特征利用率，但在本研究中没有进行。其次，不同的特征可能是相互关联的，因为它们都有助于患者的综合状况;因此，确定内在关系将进一步提高模型性能。模型优化和验证将在未来的研究中使用不同的重症监护室数据库。药物与肝素的相互作用和累积效应通常不考虑在内，因为肝素的半程时间太短，无法影响监测到的4至6小时间隔。没有使用更精确的神经网络结构;下一步将是探索特征之间的内在关系，并使用额外的临床数据集进一步验证模型结果。由于本研究是在非临床环境中进行的，因此在实际应用中还将进一步完善。

与前期工作比较

很难获得个性化而不是广泛的规范数据来确定重症监护病房的药物剂量。肝素剂量通常仅根据体重来确定，体重是在患者到达重症监护病房时测量或估计的。在这里，我们区分了两种给药途径，为临床医生提供更详细的建议和选择。3个数据集的总体预测准确率分别为88.00%、86.00%和87.50%。MIMIC-III回顾性数据中的两种递送途径显示，激活部分凝血活素时间的患者比例比正常治疗性激活部分凝血活素时间的患者高3倍(静脉推注患者为25.3%，静脉滴注患者为27.0%)，高于以往研究报道[11，12]进行多元逻辑回归(地表下体积=0.48)和多项逻辑回归(准确率=60%)。统计结果与以前的报告一致。据报道，高龄和性别(女性)与超治疗激活部分凝血活素时间相关[9，10]，以及高初始肝素剂量、高AST/ALT比值和急诊入院类型。

结论

该研究旨在为预测肝素治疗结果提供支持，并为临床医生推荐最佳肝素剂量。使用数据驱动的机器学习方法来预测亚治疗、正常治疗和超治疗激活部分凝血活酶时间的概率。通过对不同模型的比较，我们建议采用由具有参数可调性的浅神经网络组成的支撑系统。本研究结果为个性化用药优化提供了新的见解，并证明了该模型在不同医疗机构应用的可行性。

致谢

本研究得到国家重点研发计划项目(2018YFC0116905)的支持。

作者的贡献

YL、WZ和NH为通讯作者，对整个作品的完整性负责。LS、CL、DL和JH均为共同第一作者，负责研究构思和设计。JH, FZ, HJ负责数据清理和算法实现。DL、MG、HW负责数据分析和结果解释。LS, CL, NH和JH起草了手稿。所有作者都修改了手稿中重要的知识内容。

利益冲突

没有宣布。

‎

多媒体附录1

离群值预处理。

DOCX文件，41 KB

‎

多媒体附录2

缺少数据输入。

DOCX文件，13 KB

‎

多媒体附录3

不同算法在3个不同数据集上的宏观平均得分。

DOCX文件，18kb

‎

多媒体附录4

混淆矩阵。

DOCX文件，17kb

Williams CN, Bratton SL, Hirshberg EL。计算机决策支持在成人和儿童重症监护。世界急救医学杂志2013年12月04日;2(4):21-28 [J]免费全文] [CrossRef] [Medline］
Pirracchio R, Cohen MJ, Malenica I, Cohen J, Chambaz A, Cannesson M, ACTERREA研究小组。大数据和有针对性的机器学习正在帮助ICU的医疗决策。中华医学杂志，2019;38(4):377-384 [j]免费全文] [CrossRef] [Medline］
Raschke RA, Reilly BM, Guidry JR, Fontana JR, Srinivas S.基于体重的肝素剂量图与“标准治疗”图的比较。一项随机对照试验。实习医学1993年12月1日;119(9):874-881。［CrossRef] [Medline］
刘建军，刘建军，刘建军。实施以体重为基础的肝素图作为实践指南的有效性。《中华医学杂志》1996;16(5):349 - 349。［Medline］
斯普瑞尔W，韦德W，哈克比W，莱斯利RB。在肥胖和非肥胖患者中使用基于体重的肝素给药方案的抗凝效果。[J]中华卫生杂志，2001,15;58(22):2143-2146。［CrossRef] [Medline］
Gerlach A, Folino J, Morris BN, Murphy CV, Stawicki SP, Cook CH.基于实际体重的非肥胖、肥胖和病态肥胖危重患者肝素剂量的比较。中华临床医学杂志;2013;3(3):195-199 [J]免费全文] [CrossRef] [Medline］
王晓明，王晓明，王晓明，等。肝素在肥胖危重患者抗凝治疗中的应用。[J]中国医学杂志;2015;30(2):395-399。［CrossRef] [Medline］
范杰，John B, Tesdal E.肥胖患者调整体重对肝素剂量的影响。[J]中华卫生杂志，2016;33(3):562 - 562。［CrossRef] [Medline］
Melloni C, Alexander KP, Chen AY, Newby LK, Roe MT, Allen LaPointe NM, CRUSADE Investigators。非st段抬高急性冠状动脉综合征患者未分级肝素剂量与大出血风险[J] .中国医学杂志2008;26 (2):391 - 391 [J]免费全文] [CrossRef] [Medline］
李M, Wali A, Menon V, Berkowitz S, Thompson T, Califf R，等。激活部分凝血活素时间的决定因素，激活部分凝血活素时间与临床结果的关系，以及肝素治疗急性冠脉综合征患者的最佳给药方案:GUSTO-IIb综述。[J] journal of clinical nursing; 2002;14(2):91-101。［CrossRef] [Medline］
Ghassemi MM, Richter SE, Eche IM, Chen TW, Danziger J, Celi LA。优化药物剂量的数据驱动方法:关注肝素。重症监护医学2014 Oct 5;40(9):1332-1339 [j]免费全文] [CrossRef] [Medline］
刘建军，刘建军，李建军，等。基于数据流的个体化用药研究。发表于:使用挥发性数据流的个性化药物给药。第三十二届AAAI人工智能会议研讨会;2018;美国路易斯安那州新奥尔良市河畔希尔顿酒店https://aaai.org/ocs/index.php/WS/AAAIW18/paper/view/17234
Grzymala-Lubanski B, Själander S, Renlund H, Svensson PJ, Själander A.瑞典国家质量注册中心AuriculA的计算机辅助华法林剂量-算法建议比手动更改剂量表现更好。血栓病杂志，2013;31(2):130-134。［CrossRef] [Medline］
雅各布斯M.个性化抗凝血管理的强化学习。电子论文2014年5月:670 [免费全文] [CrossRef］
Johnson AE, Pollard TJ, Shen L, Lehman LH, Feng M, Ghassemi M，等。MIMIC-III，一个免费访问的重症监护数据库。Sci Data 2016; 5 (1):160035 [j]免费全文] [CrossRef] [Medline］
Pollard TJ, Johnson AEW, Raffa JD, Celi LA, Mark RG, Badawi O. eICU合作研究数据库:一个免费的多中心重症监护研究数据库。Sci Data 2018 Sep 11;5(1):180178 [j]免费全文] [CrossRef] [Medline］
库西诺D, Chartier S.异常值检测与处理综述。Int。j . psychol。[j] .科学通报2010;3(1):58-67。［CrossRef］
陈涛，Guestrin C. XGBoost:一种可扩展的树木提升系统。第22届ACM SIGKDD国际知识发现与数据挖掘会议论文集，2016年8月发表于:知识发现与数据挖掘;2016年8月;旧金山，第785-794页。［CrossRef］
Krizhevsky A, Sutskever I, Hinton GE。基于深度卷积神经网络的ImageNet分类。参考文献:神经信息处理系统2012年发表于:国际神经信息处理系统会议;2012;太浩湖，内华达州，美国。
李建军，李建军。基于分类任务的绩效评价方法研究。信息处理与管理2009;45(4):427-437。［CrossRef］
李建军，李建军，李建军，等。离散数据分类误差的估计方法。模式识别2008;Dec;41(12):3692-3705 [j]免费全文] [CrossRef］

‎

ALT:丙氨酸转氨酶

AST:天冬氨酸转氨酶

eICU:e重症监护室

MIMIC-III:重症监护III多参数智能监测(或重症监护III医疗信息集市)

郝T、唐B编辑;提交31.12.19;经张z, S Ayabakan同行评审;对作者23.02.20的评论;收到修改版本18.04.20;接受19.04.20;发表22.06.20

这是一篇在知识共享署名许可(https://creativecommons.org/licenses/by/4.0/)条款下发布的开放获取文章，该许可允许在任何媒介上不受限制地使用、分发和复制，前提是原始作品(首次发表在JMIR Medical Informatics上)被适当引用。必须包括完整的书目信息，到http://medinform.www.mybigtv.com/上原始出版物的链接，以及版权和许可信息。

本文内容如下e-collection /主题问题:

通过比较多种机器学习方法获得最佳肝素剂量:回顾性研究

通过比较多种机器学习方法获得最佳肝素剂量:回顾性研究

原始论文

通讯作者:

摘要

关键字

介绍

方法

数据集

特征选择

数据预处理

模型训练和性能调优

模型评价

结果

在研究人群中活化部分凝血活酶时间分布

所选特性的汇总统计信息

数据预处理结果

模型性能结果

讨论

主要结果

的优势

限制

与前期工作比较

结论

致谢

作者的贡献

利益冲突

参考文献

缩写