发表在gydF4y2Ba在gydF4y2Ba第八卷gydF4y2Ba7号gydF4y2Ba(2020)gydF4y2Ba: 7月gydF4y2Ba

本文的预印本(早期版本)可在gydF4y2Bahttps://preprints.www.mybigtv.com/preprint/15965gydF4y2Ba,首次出版gydF4y2Ba.gydF4y2Ba
基于机器学习的迟发性新生儿脓毒症早期检测预测模型:发展与观察研究gydF4y2Ba

基于机器学习的迟发性新生儿脓毒症早期检测预测模型:发展与观察研究gydF4y2Ba

基于机器学习的迟发性新生儿脓毒症早期检测预测模型:发展与观察研究gydF4y2Ba

原始论文gydF4y2Ba

1gydF4y2Ba韩国城南市首尔国立大学盆唐医院电子医疗研究与商业办公室医疗信息通信技术研究中心gydF4y2Ba

2gydF4y2Ba韩国城南市首尔大学盆唐医院儿科gydF4y2Ba

这些作者的贡献相同gydF4y2Ba

通讯作者:gydF4y2Ba

刘秀英博士gydF4y2Ba

医疗信息通信技术研究中心gydF4y2Ba

电子健康研究和商业办公室gydF4y2Ba

首尔大学盆唐医院gydF4y2Ba

盆唐区卓玛路172号gydF4y2Ba

Seongnam-si 13620gydF4y2Ba

大韩民国gydF4y2Ba

电话:82 32 787 8980gydF4y2Ba

电子邮件:gydF4y2Bayoosoo0@snubh.orggydF4y2Ba


背景:gydF4y2Ba新生儿败血症与新生儿重症监护病房(NICU)的大多数死亡和发病率有关。许多研究已经开发了用于新生儿血流感染早期诊断的预测模型,但由于这些模型基于高分辨率波形数据,因此在数据收集和管理方面存在局限性。gydF4y2Ba

摘要目的:gydF4y2Ba本研究的目的是通过使用无创生命体征数据和机器学习技术来检验预测模型的可行性。gydF4y2Ba

方法:gydF4y2Ba我们使用重症监护医疗信息市场III临床数据库中发布的重症监护病房电子病历数据。使用我们提出的前向特征选择技术的迟发性新生儿脓毒症(LONS)预测算法基于NICU住院患者数据,旨在在发生前48小时检测临床脓毒症。使用各种特征选择算法和机器学习模型对该预测模型的性能进行了评估。gydF4y2Ba

结果:gydF4y2Ba研究发现,LONS预测模型的性能与使用侵入性数据(如高分辨率生命体征数据、血气估计、血细胞计数和pH值)的预测模型相当。48小时预测模型的受试者工作特征曲线下面积为0.861,发病检测模型的受试者工作特征曲线下面积为0.868。新生儿脓毒症的主要特征是血压、血氧饱和度和体温。利用特征的峰度和偏度进行特征生成,表现出最高的性能。gydF4y2Ba

结论:gydF4y2Ba我们的研究结果证实,基于机器学习的LONS预测模型可以使用在临床环境中定期测量的生命体征数据来开发。未来的研究应使用不同类型的数据集进行外部验证,并对所建立的模型进行实际的临床验证。gydF4y2Ba

中华医学杂志,2020;8(7):591 - 591gydF4y2Ba

doi: 10.2196/15965gydF4y2Ba

关键字gydF4y2Ba



随着新生儿重症监护病房(NICUs)护理系统的发展,极低出生体重儿的存活率大大提高。然而,新生儿脓毒症仍然与新生儿重症监护病房的大多数发病率和死亡率有关,据报道,体重<1500 g的婴儿死亡中有20%是由脓毒症引起的。此外,患有败血症的婴儿死亡的可能性是没有败血症的婴儿的三倍[gydF4y2Ba1gydF4y2Ba]。新生儿脓毒症分为发生在出生72小时内的早发型新生儿脓毒症和发生在出生72小时至120天之间的晚发型新生儿脓毒症(LONS) [gydF4y2Ba1gydF4y2Ba,gydF4y2Ba2gydF4y2Ba]。早发性新生儿败血症是由子宫内感染或阴道分娩时母亲的垂直细菌传播引起的,而LONS不仅由垂直细菌传播引起,还由卫生保健提供者和环境的水平细菌传播引起。gydF4y2Ba

B组败血症gydF4y2Ba链球菌gydF4y2Ba这是早发性新生儿败血症的最常见原因,可在分娩前减少80%,必要时可在分娩时给予抗生素预防。然而,与早发性新生儿脓毒症不同,LONS没有特异性的抗生素预防,也没有强大的算法可以在无症状的新生儿中早期发现[gydF4y2Ba3.gydF4y2Ba,gydF4y2Ba4gydF4y2Ba]。确诊LONS需要进行血培养试验,但平均需要2-3天才能获得血培养结果。一般来说,经验性抗生素治疗是为了减少治疗延误的风险。即使血培养结果为阴性,但由于血培养结果有假阴性的可能,当LONS的临床症状出现时,抗生素治疗也会延长[gydF4y2Ba5gydF4y2Ba,gydF4y2Ba6gydF4y2Ba]。这种治疗过程会导致细菌耐药性,由于长期抗生素治疗而产生不良反应,并增加医疗费用。gydF4y2Ba

由于一些研究通过使用深度学习和机器学习分析了计算机断层扫描、磁共振成像扫描和x线片等医学成像数据,最近的研究开发了用于新生儿血液感染和症状性全身炎症反应综合征早期诊断的预测模型[gydF4y2Ba7gydF4y2Ba-gydF4y2Ba9gydF4y2Ba]。gydF4y2Ba

Griffin等[gydF4y2Ba10gydF4y2Ba,gydF4y2Ba11gydF4y2Ba提出了一种通过检查心率异常期特征来鉴别早期脓毒症的方法。Stanculescu等[gydF4y2Ba12gydF4y2Ba]将自回归隐马尔可夫模型应用于婴儿去饱和、心动过缓等生理事件,利用发病预测模型预测感染的发生。此外,提出了一个模型,通过生成基于婴儿电子病历(EMR)中记录的生命体征或实验室特征的机器学习模型来进行预测[gydF4y2Ba13gydF4y2Ba,gydF4y2Ba14gydF4y2Ba]。然而,除败血症外,心率特征还可受到呼吸恶化和外科手术的影响[gydF4y2Ba15gydF4y2Ba]和心率特征不能在没有心率特征指数功能的监护仪中获得。现有的预测模型还涉及高计算成本、高分辨率数据或实验室参数,如全血细胞计数、未成熟中性粒细胞与总中性粒细胞的比例和多形核白细胞计数。gydF4y2Ba

基于EMR数据的机器学习预测模型研究存在固有的问题,如高维数和稀疏度、数据偏差、异常事件少等[j]。gydF4y2Ba16gydF4y2Ba-gydF4y2Ba18gydF4y2Ba]。以往的研究试图通过使用过采样、欠采样、数据处理和特征选择等技术来解决上述问题[gydF4y2Ba19gydF4y2Ba-gydF4y2Ba22gydF4y2Ba]。然而,与以往的预测模型相比,使用数据增强学习处理数据的模型的性能并没有明显提高,基于emr的预测模型仍然受到挑战[gydF4y2Ba17gydF4y2Ba,gydF4y2Ba20.gydF4y2Ba,gydF4y2Ba21gydF4y2Ba]。因此,通过使用重症监护医疗信息市场III (MIMIC-III)数据库中的数据[gydF4y2Ba23gydF4y2Ba],我们的目标是应用特征选择算法开发一种机器学习模型,通过低稀疏性和少场景来可靠地预测LONS,并通过无创生命体征数据和机器学习技术来检验所开发的预测模型的可行性。此外,我们试图在LONS中确定具有临床意义的生命体征及其相应的特征分析方法。gydF4y2Ba


数据来源和目标人群gydF4y2Ba

在本研究中,MIMIC-III数据库[gydF4y2Ba23gydF4y2Ba],由贝斯以色列女执事医疗中心重症监护病房入院的公开数据组成。使用MIMIC-III数据库的数据进行研究已得到贝斯以色列女执事医疗中心和麻省理工学院机构审查委员会的批准。选取2001-2008年MIMIC-III数据库中NICU住院患者作为总体,提取其数据。患者被分为败血症组和对照组。脓毒症组根据出院报告,诊断代码为败血症、围产期特异性感染、脓毒症、脓毒症休克、全身炎症反应综合征等患者。MIMIC-III数据库的诊断记录使用了国际疾病分类第九版,临床修改代码038(败血症),771(围产期特定婴儿),995.9(全身炎症反应综合征)或785.52(感染性休克),包括上述诊断。gydF4y2Ba

脓毒症诊断事件的识别gydF4y2Ba

由于MIMIC-III数据库的诊断表中不包含诊断时间信息,因此只能从实验室检测顺序和干预信息中间接提取诊断时间信息。一般认为血培养阳性、临床恶化、c反应蛋白水平高为危险因素,通过汇总危险因素信息给予抗生素治疗[gydF4y2Ba3.gydF4y2Ba,gydF4y2Ba4gydF4y2Ba,gydF4y2Ba6gydF4y2Ba]。然而,在早产儿中,新生儿期的正常情况与败血症的临床症状难以区分,由于无法从MIMIC-III数据库中获得c反应蛋白值,因此根据血培养检测时间和抗生素处方时间提取败血症诊断时间。通常,根据确认败血症的标准,选择阳性血培养结果作为金标准。然而,由于可以从早产儿或极低出生体重婴儿身上收集的血液样本数量非常有限,因此血液培养的数量也很少。此外,由于血培养敏感性低、既往使用过广谱抗生素、新生儿血培养潜伏期长等原因,可能出现假阴性结果[gydF4y2Ba24gydF4y2Ba,gydF4y2Ba25gydF4y2Ba]。因此,根据广谱抗生素给药顺序时间、静脉途径给药顺序时间、血培养顺序时间提取脓毒症诊断时间。在MIMIC-III数据库中,将微生物事件表中SPEC_TYPE_DESC项标记为血培养的日期指定为血培养日期,将药物为广谱抗生素和ROUTE填充为IV的日期指定为处方表中的抗生素日期。gydF4y2Ba

特征处理与输入gydF4y2Ba

在机器学习模型中,选择了以下特征:心率、收缩压、舒张压、平均血压、血氧饱和度、呼吸频率、体温。在MIMIC-III数据库中,可作为预测模型候选特征的生命体征和实验室数据有:心率、收缩压、舒张压、平均血压、呼吸频率、体温、血氧饱和度、格拉斯哥昏迷量表评分、白细胞计数、红细胞计数、血小板计数、胆红素水平、白蛋白水平、pH值、钾水平、钠水平、肌酐水平、血尿素氮、葡萄糖水平、二氧化碳分压,吸入氧分数,血清碳酸氢盐水平,红细胞压积,潮气量,平均气道压,气道峰值压,平台气道压,Apgar评分。其中,主要生命体征(体温、心率、呼吸频率和血压)和血氧饱和度定期记录,而其他测量值的利用受到限制,因为它们不是定期记录或仅针对特定患者记录。因此,我们选择了体温、心率、呼吸频率、血压、血氧饱和度等可以普遍应用于预测模型的特征。此外,这些生命体征通常可以从床边获得,不需要实验室测试,并且可以在大多数医院应用。然而,虽然可以直观地使用生命体征的当前值作为输入数据,但患者的不规则观察周期会增加其复杂性。因此,在本研究中,我们试图通过额外计算生命体征的统计值和当前值,并比较和评估每个生命体征的显著统计值和观察期的表现,来提高患者实际生理恶化的准确性。用于生成的统计值、生命体征和处理后的观察窗口大小见gydF4y2Ba表1gydF4y2Ba.在本研究中,我们使用了许多基于emr的预测模型和时间序列分析所使用的统计值。然而,主要应用于时间序列的傅里叶变换分析、小波变换和频谱分析,由于需要高频且相对周期性的数据才能产生显著的结果,因此被排除在本研究之外。gydF4y2Ba

对于正态分布的拟合优度检验,<5000个样本采用Shapiro-Wilk检验,≥5000个样本采用Kolmogorov-Smirnov检验。当根据分布族选择合适的统计方法时,使用这些正态性检验。对于正态分布的连续变量,采用Pearson相关;否则,使用斯皮尔曼相关。如果不满足正态分布,则通过高斯核密度估计变量的概率密度函数来计算熵。统计学意义设为0.05。采用缺失值滤波和3 -sigma规则对数据质量进行评价,对不符合数据质量的生命体征采用最后一次观察结转法。末次观察结转法类似于一般临床中使用生命体征进行诊断,主要作为临床预测模型中缺失值的补全方法。当不存在实测值时,对数据中的缺失值进行零补全,表明该缺失值在预测模型中从未被测量过。应用统计特征处理后,若因除零等原因无法进行计算,则进行零插补。gydF4y2Ba

表1。生命体征的实验设置、统计方法、处理窗口时间。h:小时。gydF4y2Ba
类别gydF4y2Ba 实验选择gydF4y2Ba
生命体征的价值gydF4y2Ba 心率,呼吸频率,血氧饱和度,收缩压,平均血压,舒张压,体温gydF4y2Ba
特征处理的统计方法gydF4y2Ba 平均值、中位数、最小值、最大值、标准差、偏度、峰度、斜率、熵、δ、绝对δ、相关系数、相互关系gydF4y2Ba
处理后的观测窗口大小gydF4y2Ba 3小时,6小时,12小时,24小时gydF4y2Ba

特征选择算法gydF4y2Ba

为了提高模型的性能并排除低特征重要度的统计特征值,采用了一种主要在现有机器学习中使用并得到验证的方法。由于本研究所用数据的稀疏度较大,且系数不大于典型数据(gydF4y2Ba表1gydF4y2Ba).此外,将本文提出的特征选择算法(gydF4y2Ba图1gydF4y2Ba).gydF4y2Ba

‎gydF4y2Ba
图1所示。提出了特征选择算法。gydF4y2Ba
查看此图gydF4y2Ba

在本研究中,M是预测模型,x是由每个生命体征得出的特征,F是模型的性能以及接收者工作特征(ROC)和平均精度的总和。在本研究的数据中,当发生率过低时,很难衡量小班的表现。因此,对模型选择的主要类和次要类的分类性能进行评价,同时作为平均精度和ROC曲线下面积(AUROC)的总和。当从生命体征中提取特征时,仅限于使用基于预测时间的过去观测数据,以防止由于未来观测而产生的任何前瞻。此外,为了衡量所提出的特征选择算法的性能,我们比较了每种特征选择技术中常用的方法。在滤波方法中,选择卡方和互信息增益。在嵌入式方法中,选择了基于lasso线性模型l1的特征选择、额外树、随机森林和梯度增强树的特征选择。排除其他主成分分析。主成分分析主要用于高维空间;因此,需要对生成的特征进行额外的分析。 This means that the direct interpretation power is relatively low in terms of the correlation between the predicted results and the feature importance. In addition, principal component analysis has several disadvantages such as the feature transformation is possible only when all the existing features are contained and high computational cost. Thus, principal component analysis was excluded owing to the above problems. To minimize the differences between the models’ coincidence and temporal characteristics, the observation window and feature processing time stamps were used equally and the model was built without data sampling.

机器学习算法gydF4y2Ba

对于LONS预测的分类算法,选择并评估了逻辑回归、高斯Naïve贝叶斯、决策树、梯度增强、自适应增强、bagging分类器、随机森林和多层感知器。这些机器学习分类器主要用于线性模型、朴素贝叶斯、决策树、集成方法和神经网络模型等监督学习方法。在深度学习模型的情况下,性能随层数和学习率的变化而变化较大,数据量不足以训练深度学习模型。因此,深度学习模型被排除在外。为了评估特征选择模型与所提出算法之间的性能,将目标人群的10%作为特征选择数据集,80%作为训练集,10%作为测试集,进行分层的10倍交叉验证。然后,进行100次自举,得到性能指标95%部分的置信区间。模型性能指标通过准确性、AUROC曲线、精密度-召回率曲线下面积(APRC)、正预测值、负预测值、精密度和召回率调和平均值(F1分数)等指标,对不平衡数据性能进行详细评价。gydF4y2Ba

数据采样算法gydF4y2Ba

如果将数据采样算法应用于数据集标记后的模型学习,则由于数据的不平衡和压倒性,很难实现正常的模型学习。在本研究中,将欠采样算法、过采样算法以及过采样和欠采样算法的组合作为数据采样算法应用于训练集,并使用未采样的测试集检查EMR数据集的模型性能受影响的程度。使用的过采样算法是合成少数派过采样技术(SMOTE) [gydF4y2Ba26gydF4y2Ba]、自适应合成采样法[gydF4y2Ba27gydF4y2Ba]和randomoverampler。使用的欠采样算法为NearMiss [gydF4y2Ba28gydF4y2Ba], RandomUnderSampler, All-K-Nearest-Neighbors [gydF4y2Ba29gydF4y2Ba], InstanceHardnessThreshold [gydF4y2Ba30.gydF4y2Ba]。对于过采样和欠采样相结合的算法,SMOTE + Wilson’s Edited Nearest Neighbor (SMOTEENN)规则[gydF4y2Ba31gydF4y2Ba]和SMOTE + Tomek链接[gydF4y2Ba32gydF4y2Ba]被应用。gydF4y2Ba

算法的评价gydF4y2Ba

介绍的方法gydF4y2Ba图2gydF4y2Ba分别介绍了用于评价的特征选择算法和预测模型。为了防止测试集的泄漏,MIMIC-III数据通过分层洗牌的方式进行划分,将特征选择评估数据集组织为20%,预测模型评估数据集组织为80%。为了避免由于优化的10倍交叉验证估计量而导致测试集的高估,通过初始化每一倍的超参数来测量预测模型的性能。对于特征选择算法,性能分类基于高斯Naïve贝叶斯分类器,如Phyu和Oo的研究[gydF4y2Ba33gydF4y2Ba]。考虑到分类器的评价算法比较直接,而集成分类器(如梯度增强机)在特征之间存在相互作用、非线性关系和自动特征选择等问题,并且由于统计属性存在模糊性,所以没有选择该分类器作为基模型[gydF4y2Ba34gydF4y2Ba]。此外,每个生命体征的平均值、最小值、最大值、标准差和中位数被指定为基线特征,并与未进行特征选择的模型进行比较。将现有的研究模型与本研究中提出的模型开发算法进行比较,同时展示了所提出模型的性能以及使用MIMIC-III数据所产生的性能。我们使用statmodels和NumPy库来分析统计属性。metric模块是scikit-learn库中的一个Python模块,用于评估分类器。gydF4y2Ba

‎gydF4y2Ba
图2。评估过程图为模型和算法。MIMIC-III:重症监护医疗信息集市;NICU:新生儿重症监护病房。gydF4y2Ba
查看此图gydF4y2Ba

研究人群的特征gydF4y2Ba

表2gydF4y2Ba显示了本研究中婴儿的群体特征。在MIMIC-III数据库的7870名婴儿中,21名婴儿被分配到临床LONS组,2798名婴儿符合对照组的纳入标准。临床LONS组与对照组的胎龄、出生体重和住院时间均有显著差异。临床LONS组的中位胎龄(IQR)为30(27.0-34.5)周,出生体重为0.80 (0.71-1.07)kg,略低于对照组的中位胎龄(IQR)为34(33.5-34.5)周,出生体重为2.02 (1.58-2.53)kg。临床LONS组重症监护时间明显长于对照组(分别为87.9天和13.3天)。男性比例(%)显示,临床LONS组和证实败血症组的男婴感染风险均较高(分别为61.9%和51.5%)。gydF4y2Ba

表2。目标人群的特征(N=7870)。gydF4y2Ba
人口特征gydF4y2Ba NICUgydF4y2Ba一个gydF4y2Ban = 96gydF4y2Ba 临床朗gydF4y2BabgydF4y2Ba组,n = 21gydF4y2Ba 证实败血症组,n=715gydF4y2Ba NICU对照组,n=2798gydF4y2Ba
胎龄(周),中位数(25 -75百分位)gydF4y2Ba 34.5 (33.5 - -35.5)gydF4y2Ba 30 (27.0 - -34.5)gydF4y2Ba 30 (26.6 - -34.5)gydF4y2Ba 34 (33.5 - -34.5)gydF4y2Ba
出生体重(kg),中位数(25 -75百分位)gydF4y2Ba 2.56 (0.36 - -3.27)gydF4y2Ba 0.80 (0.71 - -1.07)gydF4y2Ba 0.98 (0.72 - -1.28)gydF4y2Ba 2.02 (1.58 - -2.53)gydF4y2Ba
停留时间(天),中位数(25 -75个百分位数)gydF4y2Ba 0.9 (0.1 - -10.0)gydF4y2Ba 87.9 (61.9 - -110.9)gydF4y2Ba 71.2 (42.2 - -107.2)gydF4y2Ba 13.3 (7.1 - -28.5)gydF4y2Ba
医院死亡率n (%)gydF4y2Ba 64 (0.8)gydF4y2Ba 3 (3.1)gydF4y2Ba 1 (5.0)gydF4y2Ba 14 (0.5)gydF4y2Ba
性别,n (%)gydF4y2Ba

男,4243 (53.9)gydF4y2Ba 54 (56.3)gydF4y2Ba 13 (61.9)gydF4y2Ba 368 (51.5)gydF4y2Ba 1508 (53.9)gydF4y2Ba

女性,3627 (46.1)gydF4y2Ba 42 (43.7)gydF4y2Ba 8 (38.1)gydF4y2Ba 347 (48.5)gydF4y2Ba 1290 (46.1)gydF4y2Ba
种族,n (%)gydF4y2Ba

怀特,4764 (60.5)gydF4y2Ba 56 (58.3)gydF4y2Ba 13 (61.9)gydF4y2Ba 463 (64.8)gydF4y2Ba 1747 (62.4)gydF4y2Ba

非裔美国人,865 (11.0)gydF4y2Ba 14 (14.6)gydF4y2Ba 3 (14.3)gydF4y2Ba 77 (10.8)gydF4y2Ba 301 (10.8)gydF4y2Ba

亚洲,715 (9.1)gydF4y2Ba 2 (2.1)gydF4y2Ba 0 (0.0)gydF4y2Ba 36 (5.0)gydF4y2Ba 161 (5.8)gydF4y2Ba

西班牙裔,369 (4.7)gydF4y2Ba 3 (3.1)gydF4y2Ba 1 (4.8)gydF4y2Ba 29 (4.1)gydF4y2Ba 136 (4.9)gydF4y2Ba

其他,1157 (14.7)gydF4y2Ba 21日(21.9)gydF4y2Ba 4 (19.0)gydF4y2Ba 110 (15.4)gydF4y2Ba 453 (16.2)gydF4y2Ba
住院类型,n (%)gydF4y2BacgydF4y2Ba

新生儿,7859 (99.9)gydF4y2Ba 95 (99.0)gydF4y2Ba 21日(100.0)gydF4y2Ba 713 (99.7)gydF4y2Ba 2787 (96.4)gydF4y2Ba

紧急情况,220 (2.8)gydF4y2Ba 22日(22.9)gydF4y2Ba 7 (33.3)gydF4y2Ba 9 (1.3)gydF4y2Ba 87 (3.0)gydF4y2Ba

紧急,23 (0.3)gydF4y2Ba 0 (0.0)gydF4y2Ba 0 (0.0)gydF4y2Ba 1 (0.1)gydF4y2Ba 16 (0.6)gydF4y2Ba

选修课,4 (0.1)gydF4y2Ba 0 (0.0)gydF4y2Ba 0 (0.0)gydF4y2Ba 0 (0.0)gydF4y2Ba 2 (0.1)gydF4y2Ba

一个gydF4y2BaNICU:新生儿重症监护病房。gydF4y2Ba

bgydF4y2Ba迟发性新生儿败血症。gydF4y2Ba

cgydF4y2Ba允许复制入场类型。gydF4y2Ba

特征选择算法的性能gydF4y2Ba

经过100圈的自举,比较了所提特征选择算法与现有特征选择算法的性能;算法的实测性能如图所示gydF4y2Ba表3gydF4y2Ba.考虑到在本研究数据等不平衡数据中,AUROC和准确率有可能被高估,我们基于APRC和F1测度进行性能评价,可以对主要类和次要类的分类性能进行评价。当窗口大小为6小时时,卡方特征选择的准确率最高,为0.60。基于额外树的特征选择的AUROC为0.79,APRC为0.23,F1得分为0.21。当目标窗口大小设置为12小时时,卡方(准确率0.68,阳性预测值0.18),额外树(APRC 0.24)和所提出的算法(AUROC 0.79, F1评分0.25,加权F1 0.65)的性能优于基线。然而,人工信息增益和lasso L1惩罚分类的特征选择仍然低于基线模型的性能。在24小时窗口内,该算法的AUROC为0.81 (0.81-0.82),APRC为0.24 (0.23-0.25),F1评分为0.33(0.32-0.34),整体表现出较高的性能。当评估兼容性间隔时,尽管样本引起了变化,但仍然显示了统一的性能。总的来说,随着观测窗口的持续时间的增加,接收由统计值组成的特征作为输入的模型与基线特征模型相比,性能有所提高。lasso L1惩罚分类模型是一种单变量方法,其指标最高,准确率为0.90。 However, an AUROC of 0.69 and F1 score of 0.05 indicate that a feature that can barely distinguish normal from suspected infection conditions was selected. The wrapper method feature selection, which was expected to show a high performance, showed a lower performance than the baseline feature model when the observation window was 6 hours. When the observation time was increased to 12 or 24 hours, the extra tree feature selection showed a high performance. However, as the confidence interval appears wider, the robustness based on the sample population changes is lower than those of the other feature selection algorithms. In particular, the feature selection of the feature importance in the random forest and gradient boosting classifier showed an AUROC of 0.56-0.62 and 0.69-0.75, respectively, at 12 hours, and with the 24-hour window, it showed a wide range of confidence intervals at 0.72-0.79 and 0.75-0.81, respectively.

表3。各种特征选择算法的比较结果gydF4y2Ba一个gydF4y2Ba.gydF4y2Ba
窗口大小和算法gydF4y2Ba 精度gydF4y2BabgydF4y2Ba,优势比(95% CI)gydF4y2Ba AUROCgydF4y2BacgydF4y2Ba,优势比(95% CI)gydF4y2Ba 亚太gydF4y2BadgydF4y2Ba,优势比(95% CI)gydF4y2Ba F1gydF4y2BaegydF4y2Ba,优势比(95% CI)gydF4y2Ba Weighted-F1gydF4y2BafgydF4y2Ba,优势比(95% CI)gydF4y2Ba PPVgydF4y2BaggydF4y2Ba,优势比(95% CI)gydF4y2Ba 净现值gydF4y2BahgydF4y2Ba,优势比(95% CI)gydF4y2Ba
24小时gydF4y2Ba

提出了gydF4y2Ba 0.76 (0.75 - -0.78)gydF4y2Ba 0.81 (0.80 - -0.81)gydF4y2Ba 0.31 (0.31 - -0.32)gydF4y2Ba 0.39 (0.38 - -0.40)gydF4y2Ba 0.80 (0.79 - -0.81)gydF4y2Ba 0.28 (0.27 - -0.29)gydF4y2Ba 0.95 (0.95 - -0.96)gydF4y2Ba

CSgydF4y2Ba我gydF4y2Ba 0.83 (0.81 - -0.84)gydF4y2Ba 0.77 (0.76 - -0.77)gydF4y2Ba 0.28 (0.27 - -0.29)gydF4y2Ba 0.34 (0.34 - -0.35)gydF4y2Ba 0.83 (0.82 - -0.85)gydF4y2Ba 0.30 (0.29 - -0.31)gydF4y2Ba 0.92 (0.92 - -0.93)gydF4y2Ba

米格gydF4y2BajgydF4y2Ba 0.15 (0.13 - -0.17)gydF4y2Ba 0.53 (0.51 - -0.54)gydF4y2Ba 0.12 (0.12 - -0.13)gydF4y2Ba 0.20 (0.20 - -0.21)gydF4y2Ba 0.08 (0.06 - -0.11)gydF4y2Ba 0.11 (0.11 - -0.12)gydF4y2Ba 0.99 (0.98 - -0.99)gydF4y2Ba

LL1gydF4y2BakgydF4y2Ba 0.27 (0.23 - -0.31)gydF4y2Ba 0.54 (0.52 - -0.55)gydF4y2Ba 0.12 (0.12 - -0.13)gydF4y2Ba 0.22 (0.21 - -0.22)gydF4y2Ba 0.26 (0.21 - -0.30)gydF4y2Ba 0.13 (0.12 - -0.13)gydF4y2Ba 0.93 (0.93 - -0.94)gydF4y2Ba

等gydF4y2BalgydF4y2Ba 0.64 (0.60 - -0.68)gydF4y2Ba 0.79 (0.77 - -0.81)gydF4y2Ba 0.31 (0.29 - -0.32)gydF4y2Ba 0.36 (0.35 - -0.37)gydF4y2Ba 0.68 (0.64 - -0.73)gydF4y2Ba 0.24 (0.23 - -0.26)gydF4y2Ba 0.97 (0.96 - -0.97)gydF4y2Ba

射频gydF4y2Ba米gydF4y2Ba 0.31 (0.27 - -0.36)gydF4y2Ba 0.65 (0.61 - -0.68)gydF4y2Ba 0.20 (0.18 - -0.23)gydF4y2Ba 0.25 (0.24 - -0.26)gydF4y2Ba 0.30 (0.25 - -0.36)gydF4y2Ba 0.15 (0.14 - -0.16)gydF4y2Ba 0.98 (0.98 - -0.98)gydF4y2Ba

GBgydF4y2BangydF4y2Ba 0.49 (0.44 - -0.54)gydF4y2Ba 0.72 (0.70 - -0.75)gydF4y2Ba 0.25 (0.23 - -0.27)gydF4y2Ba 0.30 (0.29 - -0.32)gydF4y2Ba 0.51 (0.45 - -0.57)gydF4y2Ba 0.19 (0.18 - -0.21)gydF4y2Ba 0.97 (0.97 - -0.98)gydF4y2Ba

基线gydF4y2Ba 0.56 (0.53 - -0.58)gydF4y2Ba 0.77 (0.77 - -0.77)gydF4y2Ba 0.27 (0.26 - -0.28)gydF4y2Ba 0.30 (0.29 - -0.31)gydF4y2Ba 0.62 (0.59 - -0.65)gydF4y2Ba 0.19 (0.18 - -0.19)gydF4y2Ba 0.96 (0.96 - -0.97)gydF4y2Ba
12个小时gydF4y2Ba

提出了gydF4y2Ba 0.65 (0.62 - -0.68)gydF4y2Ba 0.75 (0.75 - -0.76)gydF4y2Ba 0.25 (0.24 - -0.25)gydF4y2Ba 0.31 (0.30 - -0.32)gydF4y2Ba 0.70 (0.67 - -0.73)gydF4y2Ba 0.21 (0.20 - -0.22)gydF4y2Ba 0.95 (0.95 - -0.95)gydF4y2Ba

CSgydF4y2Ba 0.77 (0.75 - -0.78)gydF4y2Ba 0.72 (0.71 - -0.72)gydF4y2Ba 0.22 (0.22 - -0.23)gydF4y2Ba 0.30 (0.29 - -0.30)gydF4y2Ba 0.79 (0.78 - -0.81)gydF4y2Ba 0.23 (0.22 - -0.23)gydF4y2Ba 0.93 (0.92 - -0.93)gydF4y2Ba

米格gydF4y2Ba 0.17 (0.15 - -0.19)gydF4y2Ba 0.58 (0.56 - -0.60)gydF4y2Ba 0.15 (0.14 - -0.16)gydF4y2Ba 0.21 (0.20 - -0.21)gydF4y2Ba 0.13 (0.10 - -0.16)gydF4y2Ba 0.11 (0.11 - -0.11)gydF4y2Ba 0.98 (0.97 - -0.98)gydF4y2Ba

LL1gydF4y2Ba 0.11 (0.11 - -0.11)gydF4y2Ba 0.50 (0.50 - -0.50)gydF4y2Ba 0.11 (0.11 - -0.11)gydF4y2Ba 0.20 (0.19 - -0.20)gydF4y2Ba 0.02 (0.02 - -0.02)gydF4y2Ba 0.11 (0.11 - -0.11)gydF4y2Ba 1.00 (1.00 - -1.00)gydF4y2Ba

等gydF4y2Ba 0.48 (0.44 - -0.51)gydF4y2Ba 0.78 (0.77 - -0.80)gydF4y2Ba 0.29 (0.28 - -0.30)gydF4y2Ba 0.29 (0.27 - -0.30)gydF4y2Ba 0.53 (0.49 - -0.57)gydF4y2Ba 0.17 (0.16 - -0.19)gydF4y2Ba 0.97 (0.97 - -0.98)gydF4y2Ba

射频gydF4y2Ba 0.25 (0.21 - -0.29)gydF4y2Ba 0.61 (0.58 - -0.64)gydF4y2Ba 0.18 (0.16 - -0.19)gydF4y2Ba 0.23 (0.22 - -0.24)gydF4y2Ba 0.22 (0.17 - -0.27)gydF4y2Ba 0.13 (0.12 - -0.14)gydF4y2Ba 0.99 (0.99 - -0.99)gydF4y2Ba

GBgydF4y2Ba 0.41 (0.37 - -0.45)gydF4y2Ba 0.74 (0.72 - -0.76)gydF4y2Ba 0.24 (0.23 - -0.26)gydF4y2Ba 0.27 (0.25 - -0.27)gydF4y2Ba 0.45 (0.40 - -0.50)gydF4y2Ba 0.16 (0.15 - -0.17)gydF4y2Ba 0.97 (0.97 - -0.98)gydF4y2Ba

基线gydF4y2Ba 0.62 (0.59 - -0.66)gydF4y2Ba 0.73 (0.73 - -0.74)gydF4y2Ba 0.23 (0.23 - -0.24)gydF4y2Ba 0.30 (0.30 - -0.31)gydF4y2Ba 0.67 (0.63 - -0.71)gydF4y2Ba 0.20 (0.19 - -0.21)gydF4y2Ba 0.95 (0.95 - -0.95)gydF4y2Ba
6个小时gydF4y2Ba

提出了gydF4y2Ba 0.44 (0.40 - -0.47)gydF4y2Ba 0.70 (0.70 - -0.71)gydF4y2Ba 0.20 (0.20 - -0.21)gydF4y2Ba 0.25 (0.24 - -0.25)gydF4y2Ba 0.49 (0.45 - -0.52)gydF4y2Ba 0.15 (0.14 - -0.16)gydF4y2Ba 0.96 (0.95 - -0.96)gydF4y2Ba

CSgydF4y2Ba 0.56 (0.52 - -0.61)gydF4y2Ba 0.67 (0.65 - -0.68)gydF4y2Ba 0.18 (0.17 - -0.19)gydF4y2Ba 0.25 (0.24 - -0.26)gydF4y2Ba 0.60 (0.56 - -0.65)gydF4y2Ba 0.16 (0.16 - -0.17)gydF4y2Ba 0.93 (0.93 - -0.94)gydF4y2Ba

米格gydF4y2Ba 0.11 (0.11 - -0.11)gydF4y2Ba 0.50 (0.50 - -0.50)gydF4y2Ba 0.11 (0.11 - -0.11)gydF4y2Ba 0.19 (0.19 - -0.20)gydF4y2Ba 0.03 (0.02 - -0.03)gydF4y2Ba 0.11 (0.11 - -0.11)gydF4y2Ba 0.99 (0.98 - -1.00)gydF4y2Ba

LL1gydF4y2Ba 0.11 (0.11 - -0.11)gydF4y2Ba 0.50 (0.50 - -0.50)gydF4y2Ba 0.11 (0.11 - -0.11)gydF4y2Ba 0.19 (0.19 - -0.20)gydF4y2Ba 0.02 (0.02 - -0.02)gydF4y2Ba 0.11 (0.11 - -0.11)gydF4y2Ba 1.00 (1.00 - -1.00)gydF4y2Ba

等gydF4y2Ba 0.46 (0.41 - -0.50)gydF4y2Ba 0.71 (0.69 - -0.74)gydF4y2Ba 0.23 (0.22 - -0.24)gydF4y2Ba 0.28 (0.26 - -0.29)gydF4y2Ba 0.49 (0.43 - -0.54)gydF4y2Ba 0.17 (0.16 - -0.18)gydF4y2Ba 0.97 (0.96 - -0.97)gydF4y2Ba

射频gydF4y2Ba 0.30 (0.25 - -0.34)gydF4y2Ba 0.61 (0.59 - -0.64)gydF4y2Ba 0.17 (0.15 - -0.18)gydF4y2Ba 0.17 (0.15 - -0.18)gydF4y2Ba 0.22 (0.21 - -0.23)gydF4y2Ba 0.28 (0.22 - -0.34)gydF4y2Ba 0.97 (0.96 - -0.98)gydF4y2Ba

GBgydF4y2Ba 0.37 (0.32 - -0.42)gydF4y2Ba 0.66 (0.63 - -0.69)gydF4y2Ba 0.19 (0.18 - -0.21)gydF4y2Ba 0.25 (0.24 - -0.26)gydF4y2Ba 0.38 (0.32 - -0.44)gydF4y2Ba 0.15 (0.14 - -0.16)gydF4y2Ba 0.96 (0.95 - -0.97)gydF4y2Ba

基线gydF4y2Ba 0.60 (0.56 - -0.63)gydF4y2Ba 0.72 (0.71 - -0.72)gydF4y2Ba 0.21 (0.21 - -0.22)gydF4y2Ba 0.29 (0.21 - -0.22)gydF4y2Ba 0.65 (0.61 - -0.69)gydF4y2Ba 0.18 (0.18 - -0.19)gydF4y2Ba 0.95 (0.95 - -0.95)gydF4y2Ba

一个gydF4y2Ba每一栏的最高分以斜体显示。gydF4y2Ba

bgydF4y2Ba准确性:(真正+真负)/(正+负)。gydF4y2Ba

cgydF4y2BaAUROC:接收机工作特性下的面积。gydF4y2Ba

dgydF4y2Ba精确召回曲线下面积。gydF4y2Ba

egydF4y2BaF1:查准率和查全率的调和平均值。gydF4y2Ba

fgydF4y2BaWeighted-F1:宏观F1测量。gydF4y2Ba

ggydF4y2BaPPV:阳性预测值。gydF4y2Ba

hgydF4y2BaNPV:负的预测值。gydF4y2Ba

我gydF4y2BaCS:卡方检验。gydF4y2Ba

jgydF4y2BaMIG:相互信息获取。gydF4y2Ba

kgydF4y2BaLL1:套索L1处罚分类。gydF4y2Ba

lgydF4y2BaET:额外的树。gydF4y2Ba

米gydF4y2Ba随机森林。gydF4y2Ba

ngydF4y2BaGB:梯度增强。gydF4y2Ba

数据采样性能gydF4y2Ba

数据抽样的测量方法是将观察时间固定为24小时,使用高斯Naïve贝叶斯分类器仅对训练数据进行抽样,并进行分层10倍交叉验证。精度分析结果表明,自适应合成采样方法、All-K-Nearest-Neighbors、InstanceHardnessThreshold和SMOTEENN的精度均优于0.7的平均值,超过了原始数据的0.579。AUROC和APRC表明,除SMOTEENN外,所有采样方法的性能都低于或类似于原始采样方法。在F1评分中,SMOTEENN和实例硬度阈值的性能均高于原值。gydF4y2Ba

所选特征的特征gydF4y2Ba

所提出的特征选择方法得到的特征如图所示gydF4y2Ba表4gydF4y2Ba.临床医生可以通过图的形式提供有关选定特征的临床信息gydF4y2Ba表5gydF4y2Ba和gydF4y2Ba多媒体附录1gydF4y2Ba.gydF4y2Ba表5gydF4y2Ba表示根据所选特征的值学习到的预测模型计算出的24小时后发病的特征重要性。gydF4y2Ba多媒体附录1gydF4y2Ba提供有关预测模型如何做出决策的信息。在每个生命体征主要选取的特征中选取3个特征,确认基于窗口大小选取的潜在特征的差异。对于24小时窗口大小,当前和以前的测量之间的增量是所有生命体征的主要变量。其中,呼吸频率峰度、体温峰度、标准血氧饱和度和血压δ的提取与脓毒性休克预测模型的显著特征相似[gydF4y2Ba35gydF4y2Ba],如Carrara等人提出的。随着窗口大小的减小,特征的数据特征的重要性向均值、熵和δ熵转移。这可能是因为,在疑似感染的新生儿中,记录的频率在同一时期内增加,从而影响熵增,并被选为主要变量。当gydF4y2BaPgydF4y2Ba采用多因素logistic回归分析特征值,重点关注有统计学意义变量的感染点和非感染点,血氧饱和度表现为去饱和症状,感染点血氧饱和度变化幅度较大。对于心率,在感染点观察到心动过速症状。对于体温,δ峰度表示较低的预期感染点。测量LONS的临床体征体温不稳定、心动过缓、心动过速、低血压[gydF4y2Ba25gydF4y2Ba]。与12小时窗口大小的基线模型相比,发现统计变量具有较低或相似的性能。这表明,至少12小时的累积生命体征必须进行统计分析,以便它们可以用作重要的生理标志。gydF4y2Ba

表4。从提出的特征选择算法中选择特征。gydF4y2Ba
生命体征和预测窗口大小gydF4y2Ba 特征处理的统计方法gydF4y2Ba
心率gydF4y2Ba

24小时gydF4y2Ba 均值,中值,最小值gydF4y2Ba

12个小时gydF4y2Ba 均值,最小绝对值,中位数绝对值gydF4y2Ba

6个小时gydF4y2Ba 均值,熵δ,熵gydF4y2Ba
呼吸速率gydF4y2Ba

24小时gydF4y2Ba 均值,中位数,峰度gydF4y2Ba

12个小时gydF4y2Ba 均值,熵增量,最小绝对增量gydF4y2Ba

6个小时gydF4y2Ba 平均熵,绝对熵,熵gydF4y2Ba
血氧饱和度gydF4y2Ba

24小时gydF4y2Ba 均值,标准差,最大绝对值gydF4y2Ba

12个小时gydF4y2Ba 均值,最大绝对值,标准差gydF4y2Ba

6个小时gydF4y2Ba 均值,熵增量,绝对熵增量gydF4y2Ba
舒张压gydF4y2Ba

24小时gydF4y2Ba 均值,最大绝对增量,最大增量gydF4y2Ba

12个小时gydF4y2Ba 均值,峰度,绝对峰度gydF4y2Ba

6个小时gydF4y2Ba 均值,熵增量,绝对熵增量gydF4y2Ba
平均血压gydF4y2Ba

24小时gydF4y2Ba 均值,最大绝对增量,最大增量gydF4y2Ba

12个小时gydF4y2Ba 均值,最大绝对值,峰度gydF4y2Ba

6个小时gydF4y2Ba 均值,熵增量,绝对熵增量gydF4y2Ba
收缩压gydF4y2Ba

24小时gydF4y2Ba 均值,最大绝对增量,最大增量gydF4y2Ba

12个小时gydF4y2Ba 均值,峰度,绝对峰度gydF4y2Ba

6个小时gydF4y2Ba 平均熵,绝对熵,熵gydF4y2Ba
体温gydF4y2Ba

24小时gydF4y2Ba 均值,峰度,绝对均值gydF4y2Ba

12个小时gydF4y2Ba 均值,熵增量,绝对熵增量gydF4y2Ba

6个小时gydF4y2Ba 均值,熵增量,绝对熵增量gydF4y2Ba
表5所示。基于特征选择算法的预测模型给出了预测特征重要性的实例。gydF4y2Ba
生命体征gydF4y2Ba 特征处理的统计方法gydF4y2Ba 特征重要性值gydF4y2Ba
体温gydF4y2Ba 的意思是gydF4y2Ba 0.282gydF4y2Ba
血氧饱和度gydF4y2Ba 的意思是gydF4y2Ba 0.133gydF4y2Ba
血氧饱和度gydF4y2Ba 标准差δgydF4y2Ba 0.126gydF4y2Ba
心率gydF4y2Ba 的意思是gydF4y2Ba 0.106gydF4y2Ba
体温gydF4y2Ba 平均绝对增量gydF4y2Ba 0.052gydF4y2Ba
心率gydF4y2Ba 绝对中位数增量gydF4y2Ba 0.046gydF4y2Ba
呼吸速率gydF4y2Ba 的意思是gydF4y2Ba 0.042gydF4y2Ba
平均血压gydF4y2Ba 的意思是gydF4y2Ba 0.032gydF4y2Ba
体温gydF4y2Ba 峰度δgydF4y2Ba 0.022gydF4y2Ba
平均血压gydF4y2Ba 最大绝对增量gydF4y2Ba 0.022gydF4y2Ba
舒张压gydF4y2Ba 最大绝对增量gydF4y2Ba 0.019gydF4y2Ba
平均血压gydF4y2Ba 最大的三角洲gydF4y2Ba 0.018gydF4y2Ba
呼吸速率gydF4y2Ba 绝对峰度gydF4y2Ba 0.017gydF4y2Ba
收缩压gydF4y2Ba 最大绝对增量gydF4y2Ba 0.016gydF4y2Ba
舒张压gydF4y2Ba 的意思是gydF4y2Ba 0.013gydF4y2Ba
收缩压gydF4y2Ba 的意思是gydF4y2Ba 0.013gydF4y2Ba
呼吸速率gydF4y2Ba 绝对中位数增量gydF4y2Ba 0.011gydF4y2Ba
血氧饱和度gydF4y2Ba 最大绝对增量gydF4y2Ba 0.010gydF4y2Ba
舒张压gydF4y2Ba 最大的三角洲gydF4y2Ba 0.009gydF4y2Ba
收缩压gydF4y2Ba 最大的三角洲gydF4y2Ba 0.006gydF4y2Ba
心率gydF4y2Ba 最小绝对增量gydF4y2Ba 0.004gydF4y2Ba

预测模型的性能gydF4y2Ba

本研究中提出的模型和先前研究中开发的模型见gydF4y2Ba表6gydF4y2Ba.基于开始点,我们开发了以下两种模型:预测模型,提前48小时预测LONS的发生;检测模型,在测量时发现LONS。本文模型的整体性能优于以往研究的模型[gydF4y2Ba12gydF4y2Ba,gydF4y2Ba14gydF4y2Ba]。与数据来源相同的NICU脓毒症预测模型MIMIC-III相比,本研究建立的模型在患者数量较多的情况下表现出较高的性能。对比模型性能,boost型链接多周估计器的梯度增强预测模型的AUROC为0.881,APRC为0.536,F1评分为0.625,而检测模型的AUROC为0.877,APRC为0.567,F1评分为0.653,表现出较高的性能。logistic回归和L2惩罚多层感知器预测模型的AUROC分别为0.874和0.860,APRC分别为0.558和0.496,F1得分分别为0.593和0.542,而检测模型的AUROC分别为0.874和0.860,APRC分别为0.558和0.534,F1得分分别为0.615和0.595,总体上优于现有的LONS预测模型。gydF4y2Ba

表6所示。预测模型的性能结果(微平均)。gydF4y2Ba
模型(验证数据源)gydF4y2Ba 预测(h)gydF4y2Ba 精度gydF4y2Ba一个gydF4y2Ba AUROCgydF4y2BabgydF4y2Ba 亚太gydF4y2BacgydF4y2Ba F1gydF4y2BadgydF4y2Ba Weighted-F1gydF4y2BaegydF4y2Ba PPVgydF4y2BafgydF4y2Ba 净现值gydF4y2BaggydF4y2Ba
提出了优化算法LONSgydF4y2BahgydF4y2Ba预测模型(MIMIC-III)gydF4y2Ba我gydF4y2Ba

逻辑回归gydF4y2Ba 48gydF4y2Ba 0.812gydF4y2Ba 0.861gydF4y2Ba 0.446gydF4y2Ba 0.522gydF4y2Ba 0.835gydF4y2Ba 0.395gydF4y2Ba 0.958gydF4y2Ba

高斯Naïve贝叶斯gydF4y2Ba 48gydF4y2Ba 0.694gydF4y2Ba 0.821gydF4y2Ba 0.394gydF4y2Ba 0.424gydF4y2Ba 0.743gydF4y2Ba 0.283gydF4y2Ba 0.964gydF4y2Ba

决策树分类器gydF4y2Ba 48gydF4y2Ba 0.811gydF4y2Ba 0.841gydF4y2Ba 0.449gydF4y2Ba 0.504gydF4y2Ba 0.833gydF4y2Ba 0.389gydF4y2Ba 0.950gydF4y2Ba

额外的树分类器gydF4y2Ba 48gydF4y2Ba 0.867gydF4y2Ba 0.803gydF4y2Ba 0.367gydF4y2Ba 0.131gydF4y2Ba 0.822gydF4y2Ba 0.527gydF4y2Ba 0.874gydF4y2Ba

装袋分类器gydF4y2Ba 48gydF4y2Ba 0.863gydF4y2Ba 0.771gydF4y2Ba 0.335gydF4y2Ba 0.251gydF4y2Ba 0.835gydF4y2Ba 0.469gydF4y2Ba 0.883gydF4y2Ba

随机森林分类器gydF4y2Ba 48gydF4y2Ba 0.867gydF4y2Ba 0.805gydF4y2Ba 0.371gydF4y2Ba 0.205gydF4y2Ba 0.831gydF4y2Ba 0.514gydF4y2Ba 0.879gydF4y2Ba

演算法gydF4y2BajgydF4y2Ba分类器gydF4y2Ba 48gydF4y2Ba 0.825gydF4y2Ba 0.831gydF4y2Ba 0.421gydF4y2Ba 0.507gydF4y2Ba 0.842gydF4y2Ba 0.407gydF4y2Ba 0.944gydF4y2Ba

梯度增强分类器gydF4y2Ba 48gydF4y2Ba 0.845gydF4y2Ba 0.859gydF4y2Ba 0.462gydF4y2Ba 0.522gydF4y2Ba 0.856gydF4y2Ba 0.445gydF4y2Ba 0.939gydF4y2Ba

多层感知器分类器gydF4y2Ba 48gydF4y2Ba 0.811gydF4y2Ba 0.841gydF4y2Ba 0.449gydF4y2Ba 0.504gydF4y2Ba 0.833gydF4y2Ba 0.389gydF4y2Ba 0.950gydF4y2Ba
提出的优化算法检测模型(MIMIC-III)gydF4y2Ba

逻辑回归gydF4y2Ba 0-48gydF4y2Ba 0.798gydF4y2Ba 0.862gydF4y2Ba 0.568gydF4y2Ba 0.619gydF4y2Ba 0.814gydF4y2Ba 0.501gydF4y2Ba 0.943gydF4y2Ba

高斯Naïve贝叶斯gydF4y2Ba 0-48gydF4y2Ba 0.690gydF4y2Ba 0.806gydF4y2Ba 0.492gydF4y2Ba 0.523gydF4y2Ba 0.720gydF4y2Ba 0.380gydF4y2Ba 0.942gydF4y2Ba

决策树分类器gydF4y2Ba 0-48gydF4y2Ba 0.812gydF4y2Ba 0.614gydF4y2Ba 0.306gydF4y2Ba 0.376gydF4y2Ba 0.786gydF4y2Ba 0.572gydF4y2Ba 0.839gydF4y2Ba

额外的树分类器gydF4y2Ba 0-48gydF4y2Ba 0.809gydF4y2Ba 0.794gydF4y2Ba 0.491gydF4y2Ba 0.180gydF4y2Ba 0.748gydF4y2Ba 0.683gydF4y2Ba 0.813gydF4y2Ba

装袋分类器gydF4y2Ba 0-48gydF4y2Ba 0.812gydF4y2Ba 0.774gydF4y2Ba 0.461gydF4y2Ba 0.327gydF4y2Ba 0.777gydF4y2Ba 0.592gydF4y2Ba 0.831gydF4y2Ba

随机森林分类器gydF4y2Ba 0-48gydF4y2Ba 0.817gydF4y2Ba 0.825gydF4y2Ba 0.513gydF4y2Ba 0.302gydF4y2Ba 0.775gydF4y2Ba 0.656gydF4y2Ba 0.827gydF4y2Ba

演算法分类器gydF4y2Ba 0-48gydF4y2Ba 0.813gydF4y2Ba 0.835gydF4y2Ba 0.513gydF4y2Ba 0.598gydF4y2Ba 0.822gydF4y2Ba 0.529gydF4y2Ba 0.914gydF4y2Ba

梯度增强分类器gydF4y2Ba 0-48gydF4y2Ba 0.830gydF4y2Ba 0.868gydF4y2Ba 0.592gydF4y2Ba 0.624gydF4y2Ba 0.836gydF4y2Ba 0.563gydF4y2Ba 0.919gydF4y2Ba

多层感知器分类器gydF4y2Ba 0-48gydF4y2Ba 0.799gydF4y2Ba 0.849gydF4y2Ba 0.558gydF4y2Ba 0.611gydF4y2Ba 0.813gydF4y2Ba 0.502gydF4y2Ba 0.935gydF4y2Ba

一个gydF4y2Ba准确性:(真正+真负)/(正+负)。gydF4y2Ba

bgydF4y2BaAUROC:接收机工作特性下的面积。gydF4y2Ba

cgydF4y2Ba精确召回曲线下面积。gydF4y2Ba

dgydF4y2BaF1:查准率和查全率的调和平均值。gydF4y2Ba

egydF4y2BaWeighted-F1:宏观f1测量。gydF4y2Ba

fgydF4y2BaPPV:阳性预测值。gydF4y2Ba

ggydF4y2BaNPV:负的预测值。gydF4y2Ba

hgydF4y2Ba迟发性新生儿败血症。gydF4y2Ba

我gydF4y2BaMIMIC-III:重症监护医疗信息集市。gydF4y2Ba

jgydF4y2BaAdaBoost:自适应增强。gydF4y2Ba


本研究表明,将EMR记录的生物信号用于基于所提算法的特征选择和学习时,可以产生一个可以提前48小时预测LONS的模型。我们的模型也显示出比以前研究的高分辨率模型更高或相似的性能。基于EMR的基于生命体征的预测模型的模型性能超过了Mani等人提出的基于实验室测试学习的模型[gydF4y2Ba14gydF4y2Ba]。与同一分类器相比,我们的随机森林算法预测模型的ROC为0.805,而Mani等人实验室测试的随机森林模型的ROC为0.805 [gydF4y2Ba14gydF4y2Ba]为0.650,基于生命体征的学习模型表现出更高的性能。Stanculescu等[gydF4y2Ba12gydF4y2Ba]自回归隐马尔可夫模型的F1得分为0.690,APRC为0.63,较本研究基于EMR的基于生命体征的预测模型表现出更高的性能。然而,与检测模型相比,我们基于EMR的基于生命体征的预测模型显示出更高的综合性能。即使心率特征的ROC为0.72-0.77,EMR记录的基于生命体征的预测模型也比基于心电图的呈现模型具有更高的预测精度[gydF4y2Ba10gydF4y2Ba]。预计所提出的模型即使在无法收集高分辨率生物特征数据或无法定期进行血液培养和实验室测试的环境中也会显示出很高的贡献。与现有机器学习中主要使用的包装方法和嵌入方法特征选择方法相比,本文提出的特征选择方法具有鲁棒性。通过选择的特征,可以从EMR中反向提取主要生理标志物。特别是对于生命体征正常范围定义不足的早产儿,24小时内的生物信号δ和峰度等统计变量可作为患者病情分类的基础。由于患者标准不同,没有将血压作为关键指标,但可以通过统计处理将其作为主要特征。此外,预期作为关键指标的呼吸率的贡献很低。这可能是因为由于干预和通气程序,婴儿的呼吸速率有轻微的变化。在低分辨率EMR数据中,相关系数和相互关系表现出较低的可预测性。然而,它们有望在高分辨率数据集上产生显著的结果。 The vital sign–based prediction model developed in this study has low interpretability, similar to the deep learning and machine learning prediction models in previous studies [12gydF4y2Ba,gydF4y2Ba14gydF4y2Ba]。然而,本研究中提出的特征选择在线性分类器(如逻辑回归)中表现出很高的性能,而在其他分类器中表现出没有显著变化。如果我们利用这一点,将特征选择应用于具有高可解释性的全连接条件随机场和贝叶斯推理等模型,可以解决上述问题。与之前模型中的数百个特征空间相比,假设所选特征具有数十个特征空间,那么简单地查看模型的输入变量将具有足够高的可解释性。gydF4y2Ba

本研究有以下局限性。首先,需要外部验证,因为训练和测试数据集是在MIMIC-III数据库中创建的。进行n倍交叉验证以尽可能减少数据偏差,但结果可能因临床医生的记录周期、模式和政策而异。因此,算法生成的模型是否同样适用于其他EMR数据库,还需要进一步的研究。其次,数据提取的局限性在于预测模型仅针对非侵入性体征生成。这是因为非侵入性测量的数量相对高于侵入性测量,因此从大多数患者中提取。然而,侵入性测量方法具有提供准确测量值的优点;因此,它适用于需要密切观察的患者。在未来,有创性测量方法应用于本研究的预测模型中,是否有性能上的提升,还需要进一步研究。第三,没有感染的婴儿可能包括在本研究中,或者脓毒症发作的时间可能没有正确记录。 In clinical practice, empirical antibiotic treatment may be administered to noninfected infants with symptoms of sepsis to reduce mortality. Therefore, there is a limitation that false-positive sepsis can occur. In addition, since the MIMIC-III database covers the period from 2001 to 2008, the data may differ by patient population, treatment, and sepsis definition. Fourth, in the vital sign–based prediction model developed in this study, only multilayer perceptron was applied as a deep learning model. In addition, the performance presented in this study is likely to be lower than the maximum performance that can be modeled because the vital sign–based prediction model that was based on EMR developed in this study is a default model with no hyperparameter tuning. Therefore, advanced deep learning models should be applied to develop sophisticated and accurate prediction models in future studies. Lastly, our model could not be compared with the risk score model and the medical guidelines used in clinical practice. In clinical practice, the results of the hematology tests such as complete blood cell count, immature neutrophil to total neutrophil ratio, and polymorphonuclear leukocyte counts are mainly applied. In the MIMIC-III database used in this study, there was not enough data to record the results of the hematology test as a score model, which makes it difficult to directly compare the performance with the prediction model of the study. Further, ethnicity, gender, and immaturity might affect the outcomes since each factor affects the incidence of sepsis. Previous studies have shown that low birth weight and male gender as risk factors of infection could affect the probability of bloodstream infection. Ethnicity did not seem to directly affect the incidence of sepsis, but the sepsis incidence is different according to the community income level. Therefore, if the aforementioned characteristics of the infants are different from the population of this study, then there is a possibility of obtaining different results. Moreover, the MIMIC-III database lacks the number of infant samples that can be configured for each condition, and it is difficult to show the difference in the results. Nevertheless, acceptable results will be obtained again if the proposed algorithm is reperformed for a specific population. In addition, although the gene type was not recorded in the MIMIC-III database and could not be included, research on gene types should be conducted in the future. If the vital sign–based prediction model that was based on EMR developed in this study is applied to clinical sites, patients with a high LONS risk can be identified up to 48 hours in advance with high accuracy based on the nonregular charts. This could be the basis for triage of patients with a high LONS risk. Combining the predicted results of this algorithm with vital signs traditionally used in clinical sites and test results will help clinicians reach an augmented decision.

综上所述,我们利用EMR数据中的特征选择生成关键特征后,开发了一个预测模型。这样,与之前的特征选择相比,基于EMR的基于生命体征的预测模型具有较高的预测性能和鲁棒性。本研究模型有望显著降低LONS患者的死亡率,并可通过深度学习模型和模型优化进行精细预测。然而,数据提取的局限性和构建数据收集环境的需要仍然是在临床实践中应用预测模型的主要挑战。因此,需要进一步的研究来解决这些问题。gydF4y2Ba

致谢gydF4y2Ba

本研究由韩国健康技术研发项目通过韩国健康产业发展研究所(KHIDI)资助,由大韩民国卫生和福利部资助(批准号:HI18C0022)。gydF4y2Ba

利益冲突gydF4y2Ba

没有宣布。gydF4y2Ba

‎gydF4y2Ba
多媒体附录1gydF4y2Ba

决策树分类器的决策树图示例。颜色表示每个节点中的主要类。gydF4y2Ba

PNG文件,2685 KBgydF4y2Ba

  1. 霍尼克,福特P,克拉克R,瓦特K,本杰明D,史密斯P等。来自新生儿重症监护病房的大量低出生体重婴儿的早发性和晚发性败血症。儿童早期发展2012年5月;88:S69-S74。(gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  2. Stoll BJ, Gordon T, Korones SB, Shankaran S, Tyson JE, Bauer CR,等。极低出生体重新生儿的迟发性败血症:来自国家儿童健康和人类发展研究所新生儿研究网络的报告。中华儿科杂志;1996;29(1):63-71。(gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  3. Fanaroff AA, Korones SB, Wright LL, Verter J, Poland RL, Bauer CR等。极低出生体重儿迟发性败血症的发生率、表现特征、危险因素及意义国家儿童健康和人类发展研究所新生儿研究网络。儿科感染杂志1998;17(7):593-598。(gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  4. 刘国强,刘国强,刘国强,刘国强。鉴别早产儿迟发性败血症的临床体征。中华儿科杂志;2013;32(4):508 -508。(gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  5. Borghesi A, Stronati M.预防新生儿重症监护病房医院获得性感染的策略。中华临床医学杂志;2008;32(4):393 - 393。(gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  6. Sivanandan S, Soraisham AS, Swarnam K.新生儿败血症和脑膜炎抗菌治疗的选择和持续时间。中华儿科杂志;2011;37 - 39 [J]gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  7. Zech JR, Badgeley MA, Liu M, Costa AB, Titano JJ, Oermann EK。深度学习模型检测胸片肺炎的变量泛化性能:一项横断面研究。PLoS Med 2018;15(11):e1002683 [j]gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  8. 刘霞,Faes L, Kale AU, Wagner SK, Fu DJ, Bruynseels A,等。深度学习与医疗保健专业人员从医学影像中检测疾病的比较:系统回顾和荟萃分析。《柳叶刀数字健康》2019年10月;1(6):e271-e297。(gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  9. Malak JS, Zeraati H, Nayeri FS, Safdari R, Shahraki AD。使用人工智能技术的新生儿重症监护决策支持系统:系统回顾。人工智能学报,2018;22(4):2685-2704。(gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  10. Griffin MP, O’shea TM, Bissonette EA, Harrell FE, Lake DE, Moorman JR.。新生儿败血症和败血症样疾病前的异常心率特征。中华儿科杂志2003;53(6):920-926。(gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  11. 使用新型心率分析对新生儿败血症和败血症样疾病的早期诊断。中华儿科杂志;2001;31(1):97-104。(gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  12. 李建军,李建军,李建军,等。基于隐马尔可夫模型的新生儿脓毒症早期诊断。IEEE生物医学学报;2014;18(5):1560-1570。(gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  13. Stanculescu I, Williams C, Freer Y.层次切换线性动力系统在新生儿脓毒症监测中的应用。2014年6月24日发表于:第30届人工智能不确定性会议论文集;2014年7月23日;魁北克市,加拿大魁北克省。gydF4y2Ba
  14. 马志强,陈强,陈志强,等。使用机器学习进行迟发性新生儿败血症早期检测的医疗决策支持。中华医学杂志,2014;21(2):326-336 [J]gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  15. Sullivan BA, Grice SM, Lake DE, Moorman JR, Fairchild KD。感染与早产儿心率异常特征的其他临床相关性。中华儿科杂志;2014;31 (4):775- 778 [J]gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  16. 杨建军,李建军,刘建军,等。电子健康档案的研究与应用。学报,2012;13(6):395-405。(gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  17. 吴杰,Roy J, Stewart WF。利用电子病历数据进行预测建模。医疗保健2010;48:S106-S113。(gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  18. 米托荣,王峰,王生,姜鑫,杜德利季涛。医疗保健领域的深度学习:回顾、机遇和挑战。生物通报2018年11月27日;19(6):1236-1246 [j]gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  19. 拉赫曼MM,戴维斯DN。解决医疗数据集中的类不平衡问题。IJMLC 2013:224 - 228。(gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  20. Segura-Bedmar I, Colón-Ruíz C, Tejedor-Alonso M, Moro-Moro M.探索机器学习方法的大数据EMR预测过敏反应。[J]中国生物医学工程学报,2018;37 (2):559 - 559 [J]gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  21. Mazurowski MA, Habas PA, Zurada JM, Lo JY, Baker JA, Tourassi GD。训练用于医疗决策的神经网络分类器:不平衡数据集对分类性能的影响。神经网络学报,2008;21(2-3):427-436 [j]gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  22. 郑凯,高军,颜凯,黄斌,叶伟。电子病历的偏见解决方法。美国纽约州纽约:计算机协会;2017年第23届ACM SIGKDD知识发现与数据挖掘国际会议论文集;2017年8月;Halifax, NS, Canada p. 2171-2180gydF4y2Bahttps://doi.org/10.1145/3097983.3098149gydF4y2Ba(gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  23. Johnson AEW, Pollard TJ, Shen L, Lehman LH, Feng M, Ghassemi M,等。MIMIC-III,一个免费访问的重症监护数据库。Sci Data 2016 5月24日;3:160035 [j]gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  24. 格尔蒂·K,德沃斯·H, Ieven MM, Mahieu LM。新生儿血培养阳性时间:速度与激情?中华微生物学杂志;2011;30(4):446-453。(gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  25. 泽维拉A,奥乔亚TJ。新生儿败血症诊断和治疗的挑战。中华儿科杂志;2015;61(1):1-13 [J]gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  26. Chawla NV, Bowyer KW, Hall LO, Kegelmeyer WP。SMOTE:合成少数派过采样技术。[j] 2002年6月1日;16:32 -357。(gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  27. 何宏,白燕,加西亚E,李绍林。ADASYN:一种自适应综合采样方法的不平衡学习。: IEEE;2008年6月发表于:2008 IEEE国际神经网络联合会议(IEEE World Congress on Computational Intelligence);2008年6月1-8日;中国香港。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  28. 张杰,马尼。非平衡数据分布的KNN方法:一个涉及信息提取的案例研究。2003年8月21日,发表于:国际机器学习会议(ICML 2003),非平衡数据集学习研讨会;八月二十一日;华盛顿特区。gydF4y2Ba
  29. 编辑最近邻规则的实验。IEEE反式。系统。,Man, Cybern 1976 Jun;SMC-6(6):448-452. [CrossRefgydF4y2Ba]gydF4y2Ba
  30. 张建军,张建军。基于实例的数据复杂度分析。Mach Learn 2013 11月5日;95(2):225-256 [j]gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  31. Batista GEAPA, Prati RC, Monard MC.平衡机器学习训练数据的几种方法的行为研究。SIGKDD空洞。新闻学报2004年6月1日;6(1):20-29。(gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  32. 刘建军,刘建军,刘建军,等。基于数据均衡的关键词自动标注方法研究。发表于:第二届巴西生物信息学研讨会论文集;2003年12月3日至5日;澳门,里约热内卢de Janeiro,巴西,第10-18页gydF4y2Bahttps://pdfs.semanticscholar.org/c1a9/5197e15fa99f55cd0cb2ee14d2f02699a919.pdfgydF4y2Ba
  33. 蔡普,吴NN。特征选择方法的性能比较。科学通报,2016(2);42:06 - 06。(gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  34. 弗里德曼JH。随机梯度增强。计算统计与数据分析2002;38(4):367-378。(gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  35. Carrara M, Baselli G, Ferrario M.基于常规记录数据的感染性休克患者死亡率预测模型。计算数学方法医学2015;2015:761435 [j]gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba


‎gydF4y2Ba
亚太:gydF4y2Ba精密度-召回曲线下面积gydF4y2Ba
AUROC:gydF4y2Ba接收机工作特性下的面积gydF4y2Ba
EMR:gydF4y2Ba电子病历gydF4y2Ba
经度:gydF4y2Ba迟发性新生儿败血症gydF4y2Ba
MIMIC-III:gydF4y2Ba重症监护医疗信息集市3gydF4y2Ba
NICU:gydF4y2Ba新生儿重症监护病房gydF4y2Ba
中华民国:gydF4y2Ba接收机工作特性gydF4y2Ba
杀:gydF4y2Ba合成少数派过采样技术gydF4y2Ba
SMOTEENN:gydF4y2BaSMOTE + Wilson的编辑近邻规则gydF4y2Ba


C·洛维斯编辑;提交22.08.19;经SY Shin, F Agakov, A Aminbeidokhti同行评审;对作者16.10.19的评论;修订版本收到27.03.20;接受07.06.20;发表31.07.20gydF4y2Ba

版权gydF4y2Ba

©Wongeun Song, Se Young Jung, Hyunyoung Baek, Chang Won Choi, Young Hwa Jung, Sooyoung Yoo。原发表于JMIR医学信息学(http://medinform.www.mybigtv.com), 2020年7月31日。gydF4y2Ba

这是一篇在知识共享署名许可(https://creativecommons.org/licenses/by/4.0/)条款下发布的开放获取文章,该许可允许在任何媒介上不受限制地使用、分发和复制,前提是原始作品(首次发表在JMIR Medical Informatics上)被适当引用。必须包括完整的书目信息,到http://medinform.www.mybigtv.com/上原始出版物的链接,以及版权和许可信息。gydF4y2Ba


Baidu
map