发表在24卷第12名(2022): 12月

本文的预印本(早期版本)可在https://preprints.www.mybigtv.com/preprint/41819,首次出版
基于机器学习的方法预测成人和儿童创伤性脑损伤的预后和住院时间:回顾性队列研究

基于机器学习的方法预测成人和儿童创伤性脑损伤的预后和住院时间:回顾性队列研究

基于机器学习的方法预测成人和儿童创伤性脑损伤的预后和住院时间:回顾性队列研究

原始论文

1安徽医科大学附属第二医院神经外科,安徽医科大学,中国合肥

2安徽新华大学大数据与人工智能学院,中国合肥

*这些作者贡献相同

通讯作者:

赵兵,医学博士

神经外科

安徽医科大学附属第二医院

安徽医科大学

芙蓉路678号

合肥,230601

中国

电话:86 138 6611 2073

传真:86 0551 63869400

电子邮件:aydzhb@126.com


背景:成人和儿童创伤性脑损伤(TBI)的治疗和护理是一个棘手的全球健康问题。预测外伤性脑损伤患者的预后和住院时间,可提高治疗效果,显著减轻社会医疗负担。将新的机器学习方法应用于脑外伤领域,对于确定临床治疗的预后和成本效益可能是有价值的。

摘要目的:我们的目标是结合多种机器学习方法来构建混合模型,用于预测成人和儿童TBI的预后和住院时间。

方法:我们收集了2017年5月至2022年5月在安徽医科大学第二附属医院神经外科中心治疗的患者的相关临床信息,其中80%用于模型训练,20%用于筛选和数据拆分测试。我们使用5个交叉验证来训练和测试机器学习模型,以避免过拟合。在机器学习模型中,以11类自变量为输入变量,以格拉斯哥结局量表评分为评估患者预后的指标,以患者住院时间为输出变量。模型训练完成后,我们从5轮交叉验证中获得并比较每个机器学习模型的误差,以选择最佳预测模型。利用2021年6月至2022年2月在安徽医科大学第一附属医院治疗的患者的临床数据对模型进行外部测试。

结果:最终的卷积神经网络支持向量机(CNN-SVM)模型在测试集和外部验证集预测格拉斯哥结局量表评分的准确率分别为93%和93.69%,在测试集和外部验证集的曲线下面积分别为94.68%和94.32%。最终构建的卷积神经网络-支持向量回归(CNN-SVR)模型在测试集和外部验证集预测住院时间的平均绝对百分比误差分别为10.72%和10.44%。决定系数(R2)在测试集和外部验证集分别为0.93和0.92。与分别建立的反向传播神经网络、CNN和SVM模型相比,我们的混合模型被认为是最优的,具有较高的置信度。

结论:本研究展示了结合多种机器学习方法构建的两种混合模型的临床效用,可以准确预测成人和儿童TBI的预后和住院时间。这些模型的应用可以减轻医生在评估TBI时的负担,并在医疗决策过程中协助临床医生。

中国医学杂志,2018;24(12):e41819

doi: 10.2196/41819

关键字



背景

全世界每年有5000多万人遭受创伤性脑损伤(TBI),这降低了患者的生活质量,并导致高发病率和死亡率。全球约有一半人口可能在一生中经历一次或多次脑损伤[12].据报告,创伤性脑损伤负担最重的是低收入和中等收入国家[3.],在这些地区,医疗资源有限,缺乏医疗经验,患者往往预后不良,进一步加重了社会的医疗负担。因此,创建一个可以预测患者预后和住院时间的工具,以帮助临床医生做出医疗决策,对于实现精准医疗至关重要[4].

随着计算机的普及和计算机科学的飞速发展,人们越来越多地利用计算机知识来解决实际问题,机器学习方法也越来越受到科学家的重视。机器学习是一门专注于计算机如何从数据中学习的科学学科,已广泛应用于军事和民用领域[5].将计算机算法纳入医学的研究也有报道[6-10].目前常用的机器学习方法包括人工神经网络和反向传播神经网络,其中一些经典算法已被广泛应用,但其容易过拟合的缺点难以解决。卷积神经网络(CNN)、支持向量机(SVM)和支持向量回归(SVR)等新算法很好地解决了这一缺陷,允许构建更准确的机器学习模型。将这些算法整合到临床实践中的研究很少,更不用说预测患者预后和住院时间等复杂的研究了。cnn是一类融合卷积计算的前馈神经网络,具有深度结构,是深度学习的代表性算法之一[11].cnn被构建来模拟生物视觉感知机制,可以直接处理二维图像,因此在图像处理中得到广泛应用[1213].考虑到CNN在图像领域已经取得了很大的成功,我们想看看当输入数据是结构化数据时,CNN是否也能有很好的预测和分类结果。支持向量机是一类广义线性分类器,它以监督学习的方式对数据进行二元分类,其中决策边界是为学习样本求解的最大边缘超平面。支持向量机本身是针对分类问题而提出的,而支持向量机是支持向量机的一个重要应用分支,它是支持向量机在回归预测问题上的一个应用,两者都适用于我们的研究。与传统的机器学习方法相比,CNN、SVM和SVR具有更快的学习速度,更好的网络泛化能力,对变量的分类和预测更加准确。

目的

本研究的目的是将机器学习中的最新算法应用于医学,基于相关临床数据进行结果预测。机器学习方法通过对原始数据的分析处理和各种预测算法的应用,在输入和输出数据之间建立映射关系。CNN、SVM和SVR是新一代算法中具有代表性的算法。因此,我们结合这些方法的优点,建立了两种混合模型用于患者预测。在这项研究中,我们的目的是证明这两种方法在预测创伤性损伤患者方面都是有效的,我们希望为未来从事医疗保健信息分析的研究人员提供启发。


伦理批准

本回顾性队列研究于2020年12月由安徽医科大学第二附属医院伦理委员会批准(批准文号S20210098)。参与者或代理人在入场后24小时内签署相关知情同意书。

参与者

该预测模型基于2017年5月至2022年5月在安徽医科大学第二附属医院神经外科中心和2021年6月至2022年2月在安徽医科大学第一医院登记的1001例外伤性颅脑损伤患者的相关数据。通过随机分割,我们使用训练模型中80%的数据,剩余20%的数据来测试模型性能。我们还收集了安徽医科大学第一附属医院111例患者的临床数据,作为模型外部验证的试验队列。

在此期间,我们纳入了所有具有完整的人口学、临床和放射学资料的患者,纳入标准为(1)外力导致的颅脑损伤;(2)颅脑外伤的临床诊断;(3)有完整的临床资料,包括病例、病程记录、影像学检查和检测报告。我们的模型预测结果包括患者的住院时间;出院的决定需要治疗小组讨论和有经验的神经外科医生评估。因此,当患者死亡时,当患者家属主观意愿放弃治疗时,当患者转移到其他科室而失去随访时,住院时间结果不准确。排除标准如下:(1)患者在住院期间死亡,(2)患者家属要求放弃治疗(包括经济因素),患者自动出院,(3)其他重伤患者,需要转相关部门进一步治疗,(4)有颅脑损伤史(图1而且2).

图1。训练集和测试集。TBI:创伤性脑损伤。
查看此图
图2。外部验证集。TBI:创伤性脑损伤。
查看此图

数据收集

通过查阅相关文献,经过正规培训的神经学家从纳入患者的电子病历中提取建模所需的数据,包括患者的一般特征(性别、年龄、既往病史)、TBI患者的临床和影像学数据(TBI的机制、损伤后意识丧失、格拉斯哥昏迷量表[GCS]评分、放射科医生和神经外科医生共同诊断的颅骨计算机断层扫描[CT]结果,其他部位损伤、治疗、进入重症监护病房(ICU)和并发症),以及住院时间。用于构建预测模型的变量的分类和定义列于表1

表1。用于构建模型的变量。
变量 合计(n=801), n (%) 数据类型
年龄(年)
≥17 49 (6.1) 浮点数据
18-44 220 (27.5) 浮点数据
45 - 64 321 (40.1) 浮点数据
65 - 74 147 (18.3) 浮点数据
≤75 64 (8.0) 浮点数据
性别
男性 577 (72.0) 二进制数据
224 (28.0) 二进制数据
既往病史
高血压 146 (18.2) 二进制数据
糖尿病 42 (5.2) 二进制数据
冠状动脉疾病 16 (2.0) 二进制数据
慢性肾功能衰竭 6 (0.7) 二进制数据
脑梗死 18 (2.2) 二进制数据
呼吸系统疾病 10 (1.2) 二进制数据
损伤机制
落在同一架飞机上 214 (26.7) 二进制数据
从高处跌落 140 (17.5) 二进制数据
交通事故 415 (51.8) 二进制数据
物体撞击头部 32 (4.0) 二进制数据
意识丧失
是的 385 (48.0) 二进制数据
没有 416 (52.0) 二进制数据
格拉斯哥昏迷量表评分
13 - 15 480 (59.9) 二进制数据
9 - 12 123 (15.4) 二进制数据
3 - 8 198 (24.7) 二进制数据
神经成像结果
硬膜外血肿 244 (30.5) 二进制数据
硬脑膜下血肿 434 (54.2) 二进制数据
蛛网膜下腔出血 411 (51.3) 二进制数据
颅骨骨折 509 (63.5) 二进制数据
弥漫性轴索损伤 13 (1.6) 二进制数据
脑疝 20 (2.5) 二进制数据
治疗
保守的 180 (22.5) 二进制数据
神经外科手术 621 (77.5) 二进制数据
其他部位损伤
其他区域骨折 232 (29.0) 二进制数据
内脏挫伤 18 (2.2) 二进制数据
外伤性湿肺 103 (12.9) 二进制数据
气胸 16 (2.0) 二进制数据
重症监护病房住院时间(天)
≤5 103 (12.9) 浮点数据
6 - 15 94 (11.7) 浮点数据
≥16 30 (3.7) 浮点数据
并发症
感染 191 (23.8) 二进制数据
气管切开术 133 (16.6) 二进制数据
电解质紊乱 230 (28.7) 二进制数据
器官功能受损 256 (32.0) 二进制数据
贫血 118 (14.7) 二进制数据
血凝异常 36 (4.5) 二进制数据
脑脊液漏 18 (2.2) 二进制数据
格拉斯哥结局量表评分
1 0 (0) 二进制数据
2 85 (10.6) 二进制数据
3. 97 (12.1) 二进制数据
4 419 (52.3) 二进制数据
5 200 (25.0) 二进制数据
住院天数(天)
≤10 225 (28.1) 浮点数据
11日至20日 365 (45.6) 浮点数据
21 - 30 152 (19.0) 浮点数据
31-40 53 (6.6) 浮点数据
≥41 6 (0.7) 浮点数据

1975年Jennett和Bond公布的格拉斯哥结果量表(GOS)评分[14已成为世界范围内最广泛使用的评估残疾和创伤性脑损伤后恢复的预后工具之一(表2).得分为1的患者被排除,得分为5和4的患者被认为已经康复,得分为2和3的患者被认为预后较差。这支持我们使用该工具作为评估患者预后的标准。

表2。格拉斯哥结局量表类别的描述。
分数
1 是脑外伤的直接结果,还是…due to secondary complications or other complications
2 植物人状态 没有反应和说不出话的病人……
3. 严重的残疾 病人是有意识的,但每天的一些日常生活活动需要另一个人的帮助。
4 中度残疾 患者可以在家照顾自己,可以出门购物,也可以乘坐公共交通工具出行。然而,以前的一些活动,无论是在工作中还是在社交生活中,现在都因为身体或精神上的缺陷而不再可能……
5 良好的复苏 患者有能力恢复正常的职业和社会活动,尽管可能有轻微的身体或精神缺陷。社会结果应该包括在这里的评估,如休闲活动和家庭关系

建模

神经学家参与了整个模型开发过程,并监督算法的临床应用,以确保模型的预测是有意义的,研究过程符合伦理委员会的要求。

CNN-SVM混合模型预测GOS评分

CNN提取数据特征的能力适用于本研究对多维输入数据的处理[15].支持向量机可以自动识别出具有较好的鉴别能力的支持向量进行分类。所得到的分类器可以最大化类与类之间的间隔,从而具有更好的适应性和更高的分类精度[16],适用于GOS分类结果的预测。因此,本研究将CNN与SVM相结合,构建了用于预测TBI患者预后的CNN-SVM混合模型。该模型结合了CNN和SVM各自的优点,提高了模型的预测精度,因此具有更大的优势[17].

在CNN-SVM混合模型中,输入层由11类输入参数组成,输出层分为5类GOS评分。在最初的1001个数据集中,随机选择80%作为训练集,20%作为测试集。进行了5轮模型学习和验证,最终得到5次训练和测试的平均GOS分类准确率。利用Pyrorch框架和Python 3.9编程语言开发了CNN-SVM混合模型。

采用CNN-SVM模型对GOS评分进行分类预测。选择交叉熵作为模型的损失函数。通过训练选择超参数,然后用最优模型的最优参数对完整的训练数据进行再训练。经过多次尝试,选择校正后的线性单元作为模型的激活函数[18].优化器使用动量梯度下降[19].学习率设置为10-3,批大小根据训练集中的样本数量设置为64,以保证内存利用率,提高相同数量数据的处理速度。SVM模型采用基基函数核,避免陷入局部最优解。罚则(P=100)和支持向量机的核参数(γ=0.02)采用网格搜索方法[20.].CNN-SVM混合模型的构建过程如图所示图3;关于CNN中的设置,关于结构化数据的卷积层和池化层的详细信息显示在表3

图3。卷积神经网络-支持向量机混合模型构建过程。支持向量机:支持向量机;格拉斯哥结果评分。
查看此图
表3。CNN参数设置。
网络层 模型参数设置
输入层 数据矩阵
卷积层1 64个1×1卷积核;Kernel_size = 5
卷积层2 128个1×1卷积核;Kernel_size = 5
池层1 MaxPool;kernel_size = 1;步幅= 2
卷积层3 128个1×1卷积核;Kernel_size = 5
池层2 MaxPool;kernel_size = 1;步幅= 2
卷积层4 256个1×1卷积核;Kernel_size = 5
池层3 MaxPool;kernel_size = 1;步幅= 2
卷积层5 516 1×1卷积核;Kernel_size = 5
池层4(自适应池层) 输出一维矢量
全连接层 输出
CNN-SVR混合模型预测住院时间

支持向量机用于分类问题。支持向量机是支持向量机的一个重要应用分支。支持向量机和支持向量机的不同之处在于,支持向量机的目标是最大化到超平面中最近样本点的距离,而支持向量机的目标是最小化到超平面中最远样本点的距离。因此,SVR在本研究中适用于住院时间的回归预测,但不适用于分类问题的预测。我们将CNN与SVR相结合,构建了用于TBI患者住院时间预测的CNN-SVR混合模型。输入层由11个输入参数组成,输出层为停留时间。我们随机选择原始1001个数据集中的80%作为训练集,20%作为测试集。本研究采用平均绝对百分比误差(mean absolute percentage error, MAPE)来衡量模型中实际住院时间与预测住院时间之间的误差,如式(1)所示y表示真实数据和ŷ表示预测数据。本文利用Pyrorch框架和Python 3.9编程语言开发了CNN-SVR混合模型。

采用CNN-SVR模型预测脑外伤患者的住院时间。选择均方误差作为回归预测模型的损失函数。通过训练选择超参数,用最优模型的最优参数对完整的训练数据进行再训练。经过多次尝试,选择校正线性单元作为模型的激活函数。根据Kingma和Ba的报道,使用了优化器[21].学习率设置为10-3,根据训练集中的样本数量设置为32个批次。SVR模型采用基基函数核。的惩罚因素P最后采用核参数γ=0.01的网格搜索方法确定SVR =100。CNN-SVR混合模型的构建过程为图4,关于结构化数据的卷积层和池化层的详细信息显示在表3

图4。卷积神经网络-支持向量回归混合模型构建过程。SVR:支持向量回归。
查看此图

评价指标

所有1001个有效样本被分为训练集和测试集。数据按照统计特征相似原则进行划分。训练集被分为总样本量的0.8,并包括交叉验证数据。训练和测试重复5次,取平均值。对于GOS评分的分类预测,采用精密度度量来衡量分类准确率。对于脑外伤患者住院时间的预测模型,决定系数(R2)和MAPE对模型性能进行检验。

GOS评分对脑外伤患者预后的预测

为了建立最优的GOS分类模型,本研究将CNN-SVM模型设计与CNN、SVM、BP神经网络模型构建进行了比较。准确度表示测试集中分类正确的样本占总样本量的比例,可以评价模型的预测精度,受试者工作特征曲线是灵敏度和特异性连续变量的复合指标,曲线下面积(area under the curve, AUC)可以评价模型的泛化能力。我们用精度和AUC来评价分类模型的优缺点。4个模型(BP, CNN, SVM, CNN-SVM)在测试数据集中的精度和AUC分别表示在表4.CNN-SVM混合模型的分类结果具有最高的精度和AUC;准确率分别比BP、CNN和SVM模型提高16.50%、9.00%和5.50%,AUC分别比BP、CNN和SVM模型提高15.75%、10.47%和6.33%。这些结果表明,采用CNN-SVM混合模型对GOS评分进行分类预测是最优的。

表4。四种模型的精度和曲线下面积。
模型 ACC一个, % AUCb, %
训练集 测试组 训练集 测试组
英国石油公司c 83.63 76.50 86.57 78.93
美国有线电视新闻网d 87.63 84.00 87.18 84.21
支持向量机e 90.13 87.50 91.24 88.35
CNN-SVM 94.13 93.00 96.89 94.68

一个ACC:准确性。

bAUC:曲线下面积。

cBP:反向传播。

dCNN:卷积神经网络。

eSVR:支持向量机。

为了进一步验证CNN-SVM的可靠性和优点,使用安徽医科大学第一附属医院的111份数据记录进行验证。将收集到的11类输入变量输入到4个模型中,比较分类结果;实验结果显示在图5.4种模型(CNN-SVM、BP、CNN和SVM)分类GOS评分的准确率分别为93.69%、75.68%、81.98%和88.29%,AUC分别为94.32%、77.89%、84.57%和87.12%。CNN-SVM模型的准确率和AUC最好。因此,通过对医院外部数据的验证,CNN-SVM模型仍然是预测GOS分类模型的最优模型。

图5。外部验证集中4个模型的准确度和曲线下面积。ACC:精度;AUC:曲线下面积;CNN-SVM:卷积神经网络支持向量机;BP:反向传播;CNN:卷积神经网络;支持向量机:支持向量机。
查看此图

外伤性脑损伤患者住院时间预测

为了建立TBI患者住院时间预测的最佳模型,本研究在设计CNN-SVR模型的基础上,比较了CNN、SVR和BP神经网络模型的构建。的R2以及4个模型(CNN-SVR、BP、CNN和SVR)之间的MAPE,分别用于预测训练集和测试集的停留时间和真实停留时间表5.CNN-SVR混合模型的预测结果误差最小。与BP模型、CNN模型和SVR模型相比,MAPE分别降低了7.61%、10.15%和3.65%,说明混合CNN-SVR模型对住院时间的预测效果最佳,预测精度更高。的R2的拟合值高于其他3个模型,训练集和测试集的拟合值分别为0.96和0.93,表明CNN-SVR拟合效果最佳。

这些结果表明,CNN-SVR模型对训练样本具有较高的回归拟合和回归精度,具有较好的学习能力。该模型可以利用现有数据进行最大程度的训练,同时准确地逼近训练样本的实际值。总体而言,模型对预测样本的回归拟合和预测精度均低于模型样本。参数间的差异越小,说明模型泛化能力越强。模型评价数据显示,CNN-SVR模型最接近实际预测能力和建模效果,且差异最小。这说明CNN模型具有较好的鲁棒性和实际泛化性能,最适合作为预测模型。

表5所示。四种模式预测的平均绝对百分比误差和决定系数。
模型 日军一个, % R2
训练误差 测试错误 训练误差 测试错误
英国石油公司b 13.18 18.33 0.82 0.79
美国有线电视新闻网c 15.29 20.69 0.76 0.73
SVRd 10.86 14.37 0.89 0.85
CNN-SVR 8.12 10.72 0.96 0.93

一个MAPE:平均绝对百分比误差。

bBP:反向传播。

bCNN:卷积神经网络。

bSVR:支持向量回归。

为了进一步比较算法的可靠性,使用安徽医科大学第一附属医院的111份数据记录进行外部验证。共将收集到的数据中的11类输入变量输入到4个模型中,比较模型预测效果的优劣。文中给出了实验结果图6.总体而言,CNN-SVR预测的住院时间轮廓与患者的真实住院时间轮廓大体一致。我们进一步计算了MAPE和R2CNN-SVR模型中BP、CNN和SVR模型分别为10.44%、17.60%、20.71%和16.00%,分别为0.92、0.76、0.73和0.79。CNN-SVR模型在MAPE和R2指标。因此,经医院外部数据验证,CNN-SVR模型是预测TBI患者住院时间的最佳模型。

图6。4种模型的预测结果与真实值的比较。SVR:支持向量回归;BP:反向传播;CNN-SVR:卷积神经网络-支持向量回归;CNN:卷积神经网络。
查看此图

主要研究结果

将CNN、SVM和SVR应用于混合预测模型的开发是可行的,其性能优于传统算法。在本研究中,我们对2种预测结果分别进行了4个模型的比较和构建,其中CNN-SVM和CNN-SVR两种混合模型在预测结果中各项指标表现最好。第一种是混合CNN-SVM模型,结合CNN和SVM各自的优势,预测GOS评分,在训练集、测试集和外部验证集的准确率分别为94.13%、93.00%和93.69%,auc分别为96.89%、94.68%和94.32%。第二个模型是混合CNN-SVR模型,用于预测MAPE的实际停留时间R2分别为8.12%和0.96,10.72%和0.93,10.44%和0.92在训练集,测试集和外部验证集。数据是最优的,表明我们的预测模型具有较高的可靠性,结果具有临床实用价值。据我们所知,这是第一个基于临床数据建立TBI患者预后和住院时间混合预测模型的研究。

与之前工作的比较

已有研究提出了一种用于临床研究的线性回归(LR)评分体系,但其特异性和敏感性较低,预测性能不如多元预测模型。此外,当LR用于描述复杂的多元非线性关系时,由于变量之间存在多重共线性,其鲁棒性可能较低,且往往需要进行复杂的变换[22].我们的机器学习模型代表了新一代的多元统计方法,可以更有效地处理多维因素,适合纳入更广泛的风险因素进行预测。这种能力减少了对从业者经验的依赖,并确保客观结果。例如,肾移植后延迟移植物功能的预测表明,与LR相比,基于svm的机器学习表现出更好的性能[23].事实上,冯等人[24]将22种机器学习方法与LR进行了比较,并报告LR的AUC为0.83,准确率为88%,而几乎所有机器学习算法的AUC都高于LR。与传统方法相比,机器学习方法在特征选择方面具有优势;考虑的因素越多,预测就越准确。事实上,机器学习方法已经应用于TBI领域[925-27]使用经典算法如人工神经网络和BP神经网络,但这些算法存在严重的缺点。这也激励我们将下一代机器学习方法应用于临床应用。

我们在研究中使用了CNN,因为它是一种强大的机器学习模型,通常用于神经外科领域分析颅骨CT扫描[28-30.].随着计算能力的发展,cnn的网络深度不断增加,能够更精确地逼近非线性递增的目标函数。然而,这也伴随着网络复杂度的增加,使得网络难以优化,容易出现过拟合。因此,我们引入SVM并将两者结合起来,为预测患者预后(GOS评分)这样的分类问题构建了一个更可靠的模型;相反,患者的住院时间构成了一个回归预测问题,SVM的一个分支SVR的提出正是为了解决回归问题;因此,我们结合SVR和CNN建立了一个混合模型来预测住院时间。对比验证表明,我们的模型在训练、测试和外部验证集上优于单独构建的CNN、SVM或SVR、BP模型。这证实了我们的猜想,使用新颖的机器学习方法并结合它们各自的优势来构建混合模型来解决预测问题是可行和有效的,并且结果与临床相关。

TBI患者通常病情较重,住院时间较长,这种新型的混合预测模型可以为医疗决策者的工作提供可靠的参考,有助于更准确地管理患者。11类输入变量在以往的研究中均有,且均为TBI领域常用的临床数据,易于收集,这也说明了我们研究的可操作性和实用性。

限制

虽然我们的研究为基于机器学习的建模在TBI领域的使用奠定了基础,但也应该承认一些局限性。首先,机器学习方法对大多数医生来说是一种不熟悉的计算结构,可能会被认为是深奥的或未经证实的。然而,随着技术的快速进步,人工智能和机器学习将不可避免地成为未来被广泛使用的工具。其次,由于我区安徽省儿童医院的位置,儿童重度TBI样本量可能不足。在这方面,后期可能需要与儿童医院合作,收集尽可能多的TBI儿童数据,进一步完善模型。在本研究中,我们收集了患者的既往病史,并将其分为6类,这可能没有足够大的样本量,还有其他类型的既往病史可能会影响住院时间;后续研究需要进一步扩大样本量以提高模型的准确性。此外,输入数据之间也可能存在微小的显著关系;例如,患者入院时的GOS评分和提示脑疝的头部CT可能对模型有重大影响。这涉及到输入变量和特征选择之间的多重共线性,这是我们下一阶段研究的重点。

最近关于检测患者体液标志物以预测患者预后的报道越来越多[3132].虽然这些研究中的预测性能没有取代基于机器学习的模型,但这些研究提供了关于收集相关预测器作为机器学习模型输入数据的见解。尽管本研究存在一定局限性,但首次使用下一代算法构建TBI患者预后和住院时间预测的混合模型,且模型优于传统算法,说明CNN-SVM和CNN-SVR模型可用于临床工作。

结论

总之,我们的研究是第一个结合多种新颖的机器学习方法来开发应用于TBI的混合模型。我们的混合模型取得了优异的结果,快速准确地预测了目标值,性能更加稳定。该模型的进一步复制可能使临床团队和医院管理人员协同工作,以提供最佳的临床护理,并可能在小型偏远或基本设施中帮助缺乏经验的从业人员。我们相信我们的方法将提供更可靠和准确的预测,这些预测可以实时更新,对临床工作具有重要意义。

致谢

本研究由安徽省重点研发计划项目31804h08020270、安徽省高校优秀青年人才支持计划项目gxypZD2019019、安徽省自然科学研究重点项目KJ2019A0267、安徽省高校拔尖人才学术资助项目gxbjZD10资助。

作者的贡献

BZ负责整个研究的设计和修改手稿。LZ, ZN, QG收集数据。CF筛选并检查数据。YP建立了模型。CF和YP起草了手稿。所有作者都对这项研究做出了实质性的贡献,并提供了提交版本的批准。

利益冲突

没有宣布。

  1. Maas AIR, Menon DK, Adelson PD, Andelic N, Bell MJ, Belli A, TBIR参与者和调查者。创伤性脑损伤:改善预防、临床护理和研究的综合方法。《柳叶刀神经杂志》2017年12月16(12):987-1048。[CrossRef] [Medline
  2. 皮克尔西默EE,塞拉西AW,顾JK,朗格卢瓦JA。一项以人群为基础的创伤性脑损伤住院患者结局研究:南卡罗来纳州创伤性脑损伤随访登记的操作。中国脑外伤杂志2006;21(6):491-504。[CrossRef] [Medline
  3. 张志刚,张志刚,张志刚,张志刚,等。估计创伤性脑损伤的全球发病率。《神经外科杂志》2018年4月1日-18日。[CrossRef] [Medline
  4. Agarwal V,张磊,朱军,方松,程涛,洪超,等。通过网络搜索行为预测医疗保健利用的影响:数据驱动的分析。J medical Internet Res 2016年9月21日;18(9):e251 [免费全文] [CrossRef] [Medline
  5. 托RC。机器学习在医学中的应用。发行量2015年11月17日;132(20):1920-1930 [免费全文] [CrossRef] [Medline
  6. 蒙泰罗M,纽科姆VFJ,马修F,阿达蒂亚K, Kamnitsas K,费兰特E,等。利用深度学习对头部CT创伤性脑损伤病变进行多类别语义分割和量化:一项算法开发和多中心验证研究。柳叶刀数字健康2020年6月;2(6):e314-e322 [免费全文] [CrossRef] [Medline
  7. 王旭,钟娟,雷涛,陈东,王华,朱林,等。创伤后癫痫的人工神经网络预测模型:回顾性队列研究。J Med Internet Res 2021年8月19日;23(8):e25090 [免费全文] [CrossRef] [Medline
  8. Shahjouei S, Ghodsi SM, Zangeneh Soroush M, Ansari S, Kamali-Ardakani S.人工神经网络预测颅内动脉瘤手术中安全的临时动脉闭塞时间。中华临床医学杂志2021年4月02日;10(7):1464 [免费全文] [CrossRef] [Medline
  9. 许俊,尹建国,朴华,金永德,南宏,许建华。基于机器学习的急性中风预后预测模型。2019年5月;50(5):1263-1265。[CrossRef] [Medline
  10. Tunthanathip T, sai - heng S, Oearsakul T, Sakarunchai I, Kaewborisutsakul A, Taweesomboonyat C.机器学习在神经手术手术部位感染预测中的应用。神经外科焦点2019年8月1日;47(2):E7。[CrossRef] [Medline
  11. 王鹏,范娥,王鹏。基于传统机器学习和深度学习的图像分类算法比较分析。图案识别让2021年1月;141:61-67。[CrossRef
  12. 沈东,吴刚,苏华。深度学习在医学图像分析中的应用。2017年6月21日:19:21 -248 [免费全文] [CrossRef] [Medline
  13. 刘志刚,刘志刚,刘志刚。卷积神经网络在植被遥感中的应用研究进展。ISPRS J摄影测量遥感2021年3月173:24-49。[CrossRef
  14. Jennett B, Bond M.严重脑损伤后的预后评估。《柳叶刀》1975年3月01日;1(7905):480-484。[CrossRef] [Medline
  15. 张伟,于勇,齐勇,舒峰,王勇。基于时空分析和CNN深度学习的短期交通流预测。交通运输科学2019年7月8日;15(2):1688-1711。[CrossRef
  16. Klöppel S, Stonnington CM, Chu C, Draganski B, Scahill RI, Rohrer JD,等。阿尔茨海默病MR扫描的自动分类。Brain 2008 Mar 07;131(Pt 3):681-689 [免费全文] [CrossRef] [Medline
  17. 牛晓霞,孙春春。一种新的基于CNN-SVM的手写数字识别方法。模式识别2012年4月;45(4):1318-1325。[CrossRef
  18. Jarrett K, Kavukcuoglu K, Ranzato M, LeCun Y.什么是物体识别的最佳多阶段架构?2009年发表于:IEEE第十二届计算机视觉国际会议(ICCV);2009;京都,第2146-2153页。[CrossRef
  19. B.加速迭代方法收敛的一些方法。苏联计算数学数学物理1964年1月;4(5):1-17。[CrossRef
  20. 侯凯,邵刚,王华,郑龙,张强,吴松,等。基于改进支持向量机的实用电力系统稳定性分析算法研究。Prot Control Mod Power Syst 2018 5月8日;3(1):1。[CrossRef
  21. 金马平,巴杰。亚当:一种随机优化方法。出来了。2017年1月30日在线预印本发布2017:1。
  22. 你的合资企业。使用人工神经网络与逻辑回归预测医疗结果的优缺点。临床流行病学杂志1996 11月;49(11):1225-1231。[CrossRef] [Medline
  23. Decruyenaere A, Decruyenaere P, Peeters P, Vermassen F, Dhaene T, Couckuyt I.肾移植后延迟移植物功能的预测:逻辑回归和机器学习方法的比较。BMC Med Inform Decis Mak 2015年10月14日;15:83 [免费全文] [CrossRef] [Medline
  24. 冯健,王勇,彭杰,孙敏,曾杰,姜辉。logistic回归与机器学习算法在外伤性脑损伤生存预测中的比较。J急救护理2019年12月;54:11 -116。[CrossRef] [Medline
  25. 郭晓明,王晓明,王晓明,等。基于人工神经网络模型的创伤性重症监护病房(ICU)预后预测研究。中国临床诊断杂志2015 Apr;9(4):OC19-OC23 [免费全文] [CrossRef] [Medline
  26. 黑尔A,斯通科D,林J, Guillamondegui O,香农C,帕特尔M.使用人工神经网络预测创伤性脑损伤。中华神经外科杂志2018 Nov 02;23(2):219-226 [免费全文] [CrossRef] [Medline
  27. Majdan M, Brazinova A, Rusnak M, Leitgeb J.创伤性脑损伤后的预后预测:常规使用严重程度评分和多变量预后模型的比较。神经科学农村实践2017 Sep 04;8(1):20-29 [免费全文] [CrossRef] [Medline
  28. 张鹏飞,郭毅,张志强,张志强,等。头部CT出血评价的混合三维/二维卷积神经网络。AJNR Am神经放射杂志2018年9月;39(9):1609-1616 [免费全文] [CrossRef] [Medline
  29. Chilamkurthy S, Ghosh R, Tanamala S, Biviji M, Campeau NG, Venugopal VK,等。头部CT扫描关键发现检测的深度学习算法:一项回顾性研究。柳叶刀2018年12月1日;392(10162):2388-2396。[CrossRef] [Medline
  30. Arbabshirani MR, Fornwalt BK, Mongelluzzo GJ, Suever JD, Geise BD, Patel AA,等。先进的机器学习在行动:识别颅内出血的计算机断层扫描与临床工作流程集成。NPJ数字医学2018;1:9 [免费全文] [CrossRef] [Medline
  31. 陈伟,杨娟,李波,彭刚,李涛,李林,等。嗜中性粒细胞与淋巴细胞比率是严重创伤性脑损伤患者预后的新预测因子。中国脑外伤康复杂志2018;33(1):E53-E59。[CrossRef] [Medline
  32. Zadora P, Dabrowski W, Czarko K, Smolen A, Kotlinska-Hasiec E, Wiorkowski K,等。术前中性粒细胞-淋巴细胞计数比率有助于预测神经胶质肿瘤的分级:一项初步研究。中华神经外科杂志,2015;49(1):41-44。[CrossRef] [Medline


AUC:曲线下面积
英国石油公司:反向传播
有线电视新闻网:卷积神经网络
CT:计算机断层扫描
gc:格拉斯哥昏迷量表
非政府组织:格拉斯哥结果量表
加护病房:重症监护室
LR:线性回归
日军:平均绝对百分比误差
支持向量机:支持向量机
SVR:支持向量回归
创伤性脑损伤:创伤性脑损伤


G·艾森巴赫(G Eysenbach)编辑;提交09.08.22;同行评议:H Ellethy, M Kapsetaki, D Barsasella, H Veldandi;对作者19.10.22的评论;修订版本于04.11.22收到;接受15.11.22;发表09.12.22

版权

©方成,潘一峰,赵洛通,牛兆义,郭庆国,赵兵。最初发表于《医疗互联网研究杂志》(//www.mybigtv.com), 2022年12月9日。

这是一篇开放获取的文章,根据创作共用署名许可(https://creativecommons.org/licenses/by/4.0/)的条款发布,允许在任何媒介上无限制地使用、分发和复制,前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。


Baidu
map