医学互联网研究杂志-使用常规血液样本预测COVID-19患者入院时死亡率的人工智能模型:集成模型的开发和验证

原始论文

¹韩国益山圆光大学生物医学工程

²韩国益山圆光大学医院创伤外科

^3.韩国益山圆光大学医院内科

⁴大韩民国光州，全南国立大学医学院胸外科和心血管外科

⁵大韩民国光州，全南国立大学医学院内科

⁶大韩民国首尔成均馆大学医学院三星医疗中心重症监护医学系

⁷韩国益山圆光大学医学院生物化学系

⁸韩国益山圆光大学医学院病理科

⁹生物技术和人类系统，美国马萨诸塞州列克星敦，麻省理工学院林肯实验室

¹⁰韩国首尔蔚山大学医学院峨山医学中心放射学和放射学研究所

*这些作者贡献相同

通讯作者:

Jinseok Lee博士

生物医学工程

Wonkwang大学

Iksan Daero

Iksan 54538

大韩民国

电话:82 1638506970

电子邮件:gonasago@gmail.com

背景:伴有急性呼吸窘迫、多器官衰竭和死亡的COVID-19在世界范围内的传播速度比以前想象的快得多。但目前治疗方法有限。

摘要目的:为了克服这一问题，我们开发了一个COVID-19人工智能(AI)模型，名为EDRnet(基于深度神经网络和随机森林模型的集成学习模型)，使用入院时的常规血液样本预测住院死亡率。

方法:我们选择了28种血液生物标志物，并使用患者的年龄和性别信息作为模型输入。为了改进死亡率预测，我们采用了深度神经网络和随机森林模型相结合的集成方法。我们使用来自中国武汉361名COVID-19患者的血液样本数据库来训练我们的模型，并将其应用于三家韩国医疗机构的106名COVID-19患者。

结果:在测试数据集中，EDRnet具有较高的敏感性(100%)、特异性(91%)和准确性(92%)。为了扩展患者数据点的数量，我们开发了一个web应用程序(BeatCOVID19)，任何人都可以访问该模型来预测死亡率，并可以注册他或她自己的血液实验室结果。

结论:我们新的人工智能模型EDRnet准确预测了COVID-19的死亡率。它是公开提供的，旨在帮助卫生保健提供者抗击COVID-19并改善患者的结果。

中国医学网络学报2020;22(12):e25442

doi: 10.2196/25442

关键字

新型冠状病毒肺炎；人工智能；血液样本；死亡率的预测

COVID-19是由SARS-CoV2引起的高传染性传染病。在严重情况下，COVID-19可引起急性呼吸窘迫、多器官功能衰竭，最终导致死亡[1］．截至2020年11月，全球COVID-19病例和死亡人数分别接近6000万和150万。

在大流行情况下，管理确诊为COVID-19患者的最重要问题是在疾病早期选择有高死亡率风险的患者，并提供适当的治疗[2］．特别是高危患者的病情会迅速恶化。一些论文报道了COVID-19死亡患者最初症状轻微，但突然过渡到危重阶段，导致死亡[3.-5］．在意大利，75%的死亡患者在入院时表现出轻微症状，如发烧、呼吸困难和咳嗽[1］．因此，尽早预测死亡率的预后模型的发展是非常关键的。

在这场大流行危机中，资源和医务人员的短缺给卫生保健系统带来了重大问题。因此，人工智能(AI)可以帮助管理新冠肺炎患者。最近的一项研究开发了一种基于血液检测结果的死亡率人工智能预测模型[6］．在本研究中，Yan等人初步考虑了73种血源性标志物的死亡率预测模型;最后选择3种血液生物标志物，包括乳酸脱氢酶(LDH)、淋巴细胞和高敏c反应蛋白(hs-CRP)。该模型基于使用XGBoost分类器的决策树，预测死亡率的准确率为90% [7来分析特征的重要性。

然而，Yan等人的研究存在缺陷。首先，从基于xgboost的特征选择中获得的三个生物标志物可能不是最佳选择。特征重要性提供了一个分数，表明每个特征在模型中决策树的构建中所起的作用。然而，由于机器学习算法的随机性，每个特征的重要性得分可能会有所不同。此外，在决策树算法(如XGBoost和随机森林(RF))中，当多个特征在分割过程中具有相同的增益时，通过随机选择其中的特征来生成树中的分支。其次，大量研究表明，COVID-19的疾病进展不仅与LDH有关[2，8-11]，淋巴细胞[12，13]，以及hs-CRP [2，10，14-17]也与其他基于血液的生物标志物，如中性粒细胞计数[16，18，19]、白蛋白[18，20.，21]，以及凝血酶原活性[18，22-24］．在我们的研究中，我们开发了一个人工智能模型，使用28种生物标志物来预测COVID-19患者的死亡率。第三，基于生物标志物的三种AI模型[6在病人康复或死亡前10天预测死亡率。这些局限性表明，该模型可能不适用于刚刚确诊并住院的COVID-19患者。

因此，在本研究中，我们旨在开发一个基于血液检测的AI模型，用于入院早期死亡率预测。我们在一个公共网站上部署了开发的人工智能模型，以便所有患者和医务人员都可以使用单个患者的血液检测结果预测死亡率。

数据集

这项研究得到了韩国圆光大学医院(WKUH)、全南国立大学医院(CNUH)和三星医疗中心(SMC)的批准。知情同意被放弃。对于训练数据，我们使用了2020年1月10日至2020年2月24日在中国武汉同济医院收集的375名COVID-19患者的血液检测结果[6］．其中14例患者在入院后1天内未进行血检，361例患者中男性212例(58.7%)，女性149例(41.3%);平均年龄58.9岁(SD 16.5)。如在多媒体附件1， 361例患者的训练数据集包括入院日期和时间、出院日期和时间、年龄、性别、死亡结局以及入院后24小时内的血液检查结果。对于检测数据，我们从三家医疗机构收集了COVID-19患者的医疗记录(N=106): CNUH (85/ 106,80.2%)， WKUH(11/ 106,10.4%)和SMC(10/ 106,9.4%)。这106例COVID-19患者的血液实验室结果是在2020年2月至2020年7月期间收集的。与训练数据类似，我们使用入院后24小时内获得的血液测试数据(见多媒体附件2)．为了总结训练和测试数据集的统计数据，在训练和测试数据集中将患者分为存活组和死亡组。不同患者和机构的血液检测数量不同。在训练数据集中，每位患者的平均血液检测次数为61.21次(24-73次范围)，在测试数据集中为35.36次(30-55次范围)。在训练数据集中，平均住院天数为13.82(幸存者组)和8.16(死亡组)，在测试数据集中，平均住院天数为18.21(幸存者组)和17.98(死亡组)表1)．

表1。训练和测试数据集的统计摘要。

患者数据		训练数据集(N=361)	测试数据集(N=106)
		同济医院	CNUH^一个(n = 85)	WKUH^b(n = 11)	SMC^c(n = 10)	总(N = 106)
患者人数，n (%)
	总计	361 (100)	85 (100)	11 (100)	10 (100)	106 (100)
	活了下来	195 (54.0)	85 (100)	9 (82)	10 (100)	104 (98.1)
	已故的	212 (58.7)	0 (0)	2 (18)	0 (0)	2 (1.9)
性别，n (%)
	男性	212 (58.7)	34 (40)	5 (45)	3 (30)	42 (39.6)
	女	149 (41.3)	51 (60)	6 (55)	7 (70)	64 (60.4)
平均住院天数(SD)
	活了下来	13.82 (6.38)	15.06 (7.90)	28.16 (11.13)	30.95 (23.03)	18.21 (11.46)
	已故的	8.16 (7.38)	N/A^d	17.98 (11.83)	N/A	17.98 (11.83)
年龄(年)，平均值(SD)		58.91 (16.49)	44.14 (21.81)	56.27 (23.00)	58.20 (21.05)	46.73 (22.28)
收集的血液生物标志物数量
	Min-max	24 - 73	32-55	30-52	30 - 40	30-55
	意思是(SD)	61.21 (6.92)	36.89 (4.11)	35.00 (5.31)	34.20 (3.16)	35.36 (4.19)

^一个全南大学医院。

^b圆光大学医院。

^c三星医疗中心。

^dN/A:不适用;该机构的测试数据集中没有死亡患者。

特征选择

考虑到来自训练数据的总共73个血液生物标志物，我们进行了方差分析(ANOVA)，其中使用了一个F根据每种血液生物标志物检测两组之间的任何显著差异(即，死者与幸存者)。对于特征选择，我们还考虑了可用数据率(ADR)，这是指有多少血液生物标志物数据可用于训练AI模型。计算方法为

在哪里N_病人患者总数(N=361)是多少N_{生物标志物}是具有每种特定生物标志物数据的患者数量。

基于方差分析，我们首先选择了与P值小于10⁵．随后，我们排除了4个ADR值小于90%的生物标志物。表2总结了28个生物标志物的最终选择与相应的方差分析P价值和ADR价值。的方差分析P训练数据集中所有73个生物标志物的值和ADR值总结在多媒体，表S1。在幸存者和死者组中选择的28个生物标志物的样本分布显示在多媒体，图S1。

表2。用于人工智能模型训练的28个血液生物标志物列表。

生物标志物指数	血液生物标志物	方差分析^一个P价值	美国存托凭证^b, %
1	淋巴细胞	2.44×10⁻⁴⁶	96.95
2	中性粒细胞	5.65×10⁻⁴³	96.68
3.	白蛋白	2.90×10⁻³⁷	96.12
4	乳酸脱氢酶	4.18×10⁻³⁶	96.12
5	中性粒细胞计数	3.54×10⁻³⁵	96.68
6	超敏c反应蛋白	8.38×10⁻³⁵	94.74
7	凝血酶原活性	3.20×10⁻²⁶	94.18
8	钙	2.24×10⁻¹⁹	95.29
9	尿素	3.29×10⁻¹⁷	96.12
10	估计肾小球滤过率	5.05×10⁻¹⁷	96.12
11	单核细胞	1.09×10⁻¹⁴	96.95
12	球蛋白	6.06×10⁻¹³	96.12
13	嗜酸性粒细胞	2.07×10⁻¹²	96.68
14	葡萄糖	2.39×10⁻¹¹	93.63
15	红细胞分布宽度(RDW)	8.43×10⁻¹⁰	92.24
16	HCO_3.⁻(碳酸氢钠)	2.68×10⁻⁹	96.12
17	标准偏差	3.06×10⁻⁹	92.24
18	血小板计数	1.46×10⁻⁸	96.68
19	平均血小板体积	1.92×10⁻⁷	92.24
20.	血小板大细胞比率	2.02×10⁻⁷	92.24
21	凝血酶原时间	3.42×10⁻⁷	94.18
22	血清总蛋白	5.29×10⁻⁷	96.12
23	血小板分布宽度	6.98×10⁻⁷	92.24
24	天冬氨酸转氨酶	1.01×10⁻⁶	96.12
25	血小板压积	1.49×10⁻⁶	92.24
26	嗜酸性粒细胞计数	2.90×10⁻⁶	92.24
27	碱性磷酸酶	8.27×10⁻⁶	96.12
28	国际标准比率	2.65×10⁻⁵	92.24

^一个方差分析:方差分析。

^bADR:可用数据速率。

预处理

鉴于所选的28个生物标志物，每位患者的可用生物标志物的平均数量为训练数据的27.22 (SD 2.33)和测试数据的16.86 (SD 1.58)，总结于表3．为了处理缺失的数据，我们从每个生物标记物的训练数据中计算平均值，并用训练和测试数据集的平均值替换缺失的数据。然后，我们在28个生物标记物中添加了另外两个特征(即年龄和性别)，并使用30个特征训练我们的AI模型。

表3。用于人工智能模型训练的每个患者可用的血液生物标记物的数量。

数据集和来源		血液生物标记物的数量
数据集和来源		意思是(SD)		Min-max
培训数据:同济医院		27.22 (2.33)		13-28
测试数据
	全南大学医院		20.39 (1.13)		19到24
	圆光大学医院		15.82 (1.94)		14-19
	三星首尔医院		14.40 (1.58)		14日至17日
	总计		16.86 (1.58)		14 - 24

对于这30个特征，我们执行了数据集标准化，这是机器学习估计器的常见要求。标准化改变了每个特征的数据分布，均值为零，标准差为1

在哪里意思是(火车)而且SD(火车)分别是来自训练数据的每个特征的平均值和标准偏差值。标准化应用于训练和测试数据集。

集成AI模型的开发

如图1，新的集成AI模型由5层深度神经网络(DNN)和RF模型组成。我们的集成AI模型被命名为EDRnet(基于DNN和RF模型的集成学习模型)。5层DNN由一个输入层、三个全连接(FC)层和一个输出层组成。输入层包含30个特征，包括28个生物标志物、年龄和性别。输入层依次馈送到三个FC层，每个FC层由30、16和8个节点组成。为了缓解过拟合问题，我们应用了0.3的退出率。然后，最后一个FC层被输入到softmax层，这是一个输出层，提供患者死亡的概率。图S2多媒体显示了我们的DNN模型及其在Keras上运行的打印文本摘要，其中参数(即权重和偏差)的总数为1571。

图1。提出了由5层深度神经网络(DNN)和随机森林(RF)模型组成的死亡率预测集成模型(EDRnet)。在两个模型的训练中，分别进行10次重复10次分层交叉验证，计算DNN模型p(DNN)和RF模型p(RF)的预测死亡率概率。在p(DNN)和p(RF)的基础上，通过软投票得到集合模型的最终预测死亡率p(EDR)。ADR:可用数据率;方差分析:方差分析;EDRnet:基于DNN和RF模型的集成学习模型。

对于5层DNN，进行10次重复10次分层交叉验证，以验证模型的泛化能力。训练数据(N=361)随机洗牌，分层划分为10个相等的亚组。在这10个子组中，保留一个子组作为测试模型的验证数据集，其余9个子组作为训练数据集。然后，该过程重复10次，10个子组中的每一个子组都只使用一次作为验证数据集。通过重复这种分层的10次交叉验证过程10次，从5层DNN中总共得到100个模型。然后，我们用加权平均对模型进行集合

在哪里p_米(款)预测死亡概率值是否来自米^thDNN模型，p(款)集合结果是否对应于预测的死亡率预测概率，和_米(款)的归一化权重值是米^th模型。我们得到了归一化的权重值_米(款)作为

权重在哪里w_米(款)是使用验证损失从米^th模型中,l_米(款),因为

与5层DNN一起，我们单独训练了一个RF模型。对于射频模型，训练100棵决策树，最大深度为4，最大特征数为5。与5层DNN相似，我们进行了10次重复10次分层交叉验证，并将100个模型进行加权平均为

在哪里p_米(RF)预测死亡概率值是否来自米^th射频模型，p (RF)集合结果是否对应于预测的死亡率预测概率，和_米(RF)的归一化权重值是米^th模型。我们得到了归一化的权重值_米作为

权重在哪里w_米(RF)是使用验证损失从米^th模型中,l_米(RF),因为

给出两个集合结果p(款)而且p (RF),最后通过软投票得到最终的预测死亡率概率值。基于两个概率值的平均值p(款)而且p (RF),如果该值大于或等于0.5，则预测结果代表死亡;否则，它代表生存。

实现

我们使用TensorFlow(版本1.13.1的图形处理单元，GPU)和Keras(版本2.2.4的GPU)实现和训练EDRnet。NumPy，版本1.16.4;Pandas，版本:0.25.3;Matplotlib, 3.1.2版本;利用scikit-learn 0.22.1版本建立模型并对结果进行分析。我们在NVIDIA GeForce GTX 1080 Ti GPU上使用Adam优化器和方程9中的二进制交叉熵代价函数训练模型，学习率为0.0001，批处理大小为64

在哪里y_我标签(例如，1表示已故，0表示幸存)和p (y)_我）是否预测每个病人死亡的概率为批大小N患者人数。

人工智能模型的性能评估

为了评估人工智能模型在预测死亡率方面的表现，我们使用了敏感性、特异性、准确性和平衡准确性指标，定义为

其中TP、TN、FP、FN分别代表真阳性、真阴性、假阳性、假阴性。

在训练数据集中，基于10次重复10次分层交叉验证评估AI模型的预测性能。在测试数据集中，独立评估了人工智能模型的预测性能。

为了比较我们提出的EDRnet模型与其他外部AI模型的性能，我们分别训练了XGBoost和AdaBoost (AB)模型，每个模型都被评估为单个模型和与DNN结合的集成模型，得到四个模型:XGBoost、AB、DNN与XGBoost (EDX)集成以及DNN与AB (EDA)集成。对于这些模型的训练，我们搜索提供最高验证精度值的最优超参数，如中所示多媒体，表S2。此外，我们采用了Li等人最近发表的AI模型[6]通过基于xgboost的特征选择，使用决策树进行性能比较。我们使用106例患者的测试数据集对所有5个外部AI模型进行了评估。

RF、DNN和我们的集成模型EDRnet的交叉验证表明，验证数据集上的准确性RF为89%，DNN为92%，EDRnet为93%。因此，EDRnet提供了最高的敏感性，特异性，准确性和平衡的准确性值(见表4)．

表4。交叉验证精度比较。

模型	交叉验证结果(N=361)，平均值(SD)
	灵敏度	特异性	精度	平衡精度
随机森林	0.89 (0.06)	0.89 (0.07)	0.89 (0.04)	0.89 (0.04)
深度神经网络	0.91 (0.06)	0.93 (0.04)	0.92 (0.04)	0.92 (0.06)
EDRnet^一个	0.92 (0.05)	0.93 (0.03)	0.93 (0.03)	0.93 (0.05)

^一个EDRnet:基于深度神经网络和随机森林模型的集成学习模型。

此外，我们将EDRnet应用于106例韩国患者作为独立的测试数据集，检查TP、TN、FP、FN、敏感性、特异性、准确性和平衡准确性。结果表明，该模型的敏感性为100%，特异性为91%，准确度为92%，平衡准确度为96%，表明在中国患者数据上训练和验证的模型可以应用于韩国患者的死亡率预测表5)．训练时EDRnet中DNN和RF的计算时间分别为796秒和126秒。EDRnet测试的总计算时间为72秒。

表5所示。我们提出的EDRnet(基于深度神经网络和随机森林模型的集成学习模型)模型的测试结果。

模型	测试数据	真负，%	假阳性，%	假阴性，%	真正，%	灵敏度	特异性	精度	平衡精度
EDRnet	CNUH^一个	79	6	0	0	N/A^b	0.93	0.93	0.93
EDRnet	WKUH^c	7	2	0	2	1.00	0.78	0.82	0.89
EDRnet	SMC^d	9	1	0	0	N/A	0.90	0.90	0.90
EDRnet	总计	95	9	0	2	1.00	0.91	0.92	0.96

^一个全南大学医院。

^bN/A:不适用。

^c圆光大学医院。

^d三星医疗中心。

接下来，我们总结了XGBoost、AB、RF、DNN、EDX、EDA、Li等模型的性能比较结果[6]和EDRnet。考虑所有变量，EDRnet具有最高的预测性能。实际上，XGBoost的平衡准确度为88%，AB为89%，RF为92%，DNN为71%，EDX为88%，EDA为71%，Li等人的模型为67% [6]， 96%使用EDRnet。值得注意的是，Li等人的模型的准确性仅为36%，这表明少数血液标志物可能不足以预测患者的死亡率(见表6)．

表6所示。各种方法的性能比较。

模型	真负，%	假阳性，%	假阴性，%	真正，%	灵敏度	特异性	精度	平衡精度
XGBoost	80	24	0	2	1.00	0.77	0.77	0.88
演算法	81	23	0	2	1.00	0.78	0.78	0.89
随机森林	87	17	0	2	1.00	0.84	0.84	0.92
5层深度神经网络(DNN)	95	9	1	1	0.50	0.91	0.90	0.71
DNN + XGBoost	80	24	0	2	1.00	0.77	0.77	0.88
AdaBoost	96	8	1	1	0.50	0.92	0.91	0.71
Li等人的模型[6］	36	68	0	2	1.00	0.35	0.36	0.67
DNN +随机森林 (EDRnet^一个）	95	9	0	2	1.00	0.91	0.92	0.96

^一个EDRnet:基于DNN和随机森林模型的集成学习模型。

我们提出的EDRnet模型使用28种血液生物标志物进行预测，但它不需要全部28种血液生物标志物。在我们的测试数据集中，使用可用的生物标记物对每个患者的EDRnet训练进行验证，范围从14到24图2)．结果显示，大多数患者有19到21个可用的生物标志物(即15名患者中有19个，41名患者中有20个，22名患者中有21个)，具有类似的高预测精度(即分别为93%，95%和86%)。对于有17和18个可用生物标志物的患者，准确度分别为75%和50%。相比之下，具有14至16个生物标志物的患者显示出83%至100%的高精度。

为了进一步研究可用生物标记物数量的影响，我们根据可用生物标记物的数量估计了准确性值(见图3)．为了估计，我们从所有测试数据点中随机选择1到20个生物标志物，并以100次重复测试模型。当随机选择生物标志物时，只模拟实际可用的生物标志物数量等于或大于随机选择生物标志物数量的样本。结果表明，准确性随着可用生物标志物数量的增加而增加，直到达到19个生物标志物。

图3。根据可用生物标记物的数量估计精度值。红圈代表中位数。顶部和底部的柱状图分别表示第75和第25百分位。顶部和底部的蓝色矩形分别表示第90和第10百分位。顶部和底部的蓝色菱形分别代表第95和第5百分位。

此外，我们开发的AI模型EDRnet已成功部署在一个公共网站上[25这样任何人都可以通过个人的血液测试结果来预测死亡率。web应用程序提供了预测的死亡概率，如图4．用户输入他或她的血液样本结果(参见图4A)，然后给出预测死亡率结果(见图4b).目前web应用程序不存储用户输入的任何信息。但是，我们考虑并计划存储用户同意输入的信息，通过实时学习过程来改进AI模型。

图4。已部署的web应用程序，BeatCOVID19 [25]:(a)用户输入血样结果的输入窗口;(b)输入血样结果后的预测死亡率结果。

关于临床特征(见表7)，两组共病差异无统计学意义。在初始症状方面，死亡组比幸存者组出现更频繁的呼吸困难症状(66.7% vs 16.8%;P= .04点)。死亡组所有患者均需供氧。死亡组比存活组心态改变更频繁(50.0% vs 1.0%;P= .02点)。死亡组和存活组在抗病毒药物(如洛匹那韦或利托那韦、氯喹或羟氯喹、利巴韦林、瑞德西韦和奥司他韦)或抗炎药物(如干扰素、地塞米松和甲强的松)方面无显著差异。然而，死亡组接受了更多的抗生素或联合治疗。

表7所示。来自测试数据集的患者组的临床特征。

特征		死亡组(n=2)	幸存者组(n=104)	总(N = 106)	P价值
共病率，n (%)
	糖尿病	0 (0)	10 (9.6)	10 (9.4)	>。
	哮喘	0 (0)	8 (7.7)	8 (7.5)	>。
	慢性阻塞性肺疾病	0 (0)	0 (0)	0 (0)	>。
	冠心病	0 (0)	3 (2.9)	3 (2.8)	>。
	心血管病	0 (0)	1 (1.0)	1 (0.9)	>。
	慢性肾病	0 (0)	1 (1.0)	1 (0.9)	>。
	慢性肝病	0 (0)	0 (0)	0 (0)	>。
	充血性心力衰竭	1 (50)	3 (2.9)	4 (3.8)	厚
	癌症	0 (0)	3 (2.9)	3 (2.8)	>。
初始症状，n (%)
	发热	2 (100)	59 (56.7)	61 (57.5)	收
	咳嗽	1 (50)	46 (44.2)	47 (44.3)	>。
	呼吸困难	2 (100)	18 (16.8)	20 (18.2)	.04点
	腹泻	0 (0)	11 (10.3)	11 (10.0)	>。
	肌痛	0 (0)	26日(24.3)	26日(23.6)	>。
初始生命体征，平均值(SD)
	收缩压(mm Hg)	127.5 (17.7)	128.0 (18.5)	128.0 (18.4)	.97点
	舒张压(mm Hg)	74.5 (10.6)	78.8 (12.8)	78.7 (12.8)	.64点
	心率(每分钟)	96.5 (24.7)	84.2 (17.7)	84.4 (17.8)	点
	呼吸频率(每分钟)	29.5 (10.6)	20.2 (4.1)	20.4 (4.3)	点
心态改变，n (%)		1 (50)	1 (1.0)	2 (1.9)	02
需氧量，n (%)
	无氧气供应	0 (0)	83 (79.8)	83 (78.3)	07
	传统的氧	1 (50)	15 (14.4)	16 (15.1)	i =
	高流量鼻插管	0 (0)	3 (2.9)	3 (2.8)	>。
	无创通气	0 (0)	0 (0)	0 (0)	>。
	机械通风	1 (50)	3 (2.9)	4 (3.8)	厚
	体外膜氧合	0 (0)	1 (1.0)	1 (0.9)	>。
药物制剂，n (%)
	洛匹那韦或利托那韦	2 (100)	30 (28.8)	32 (30.2)	16
	氯喹或羟氯喹	0 (0)	7 (6.7)	7 (6.6)	>。
	利巴韦林	0 (0)	0 (0)	0 (0)	>。
	瑞德西韦	0 (0)	0 (0)	0 (0)	获得
	奥司他韦	0 (0)	2 (1.9)	2 (1.9)	获得
	干扰素	0 (0)	0 (0)	0 (0)	>。
	地塞米松	0 (0)	1 (1.0)	1 (0.9)	>。
	甲基强的松龙	0 (0)	4 (3.8)	4 (3.8)	>。
	抗生素	2 (100)	8 (7.7)	10 (9.4)	措施
	结合	2 (100)	15 (14.4)	17 (16.0)	02

主要研究结果

我们的新人工智能模型EDRnet能够使用入院后24小时内获得的28种血液生物标志物预测COVID-19患者的死亡率。在独立测试数据集中，EDRnet表现出了出色的预测性能，具有较高的敏感性(100%)、特异性(91%)和准确性(92%)。通过采用DNN和RF模型相结合的集成方法，我们能够提高预测性能。值得注意的是，EDRnet是通过使用中国患者的数据进行培训和使用韩国患者的数据进行测试而开发的。

EDRnet有几个优点。首先，EDRnet可以在入院早期(即入院后24小时内)预测哪些患者具有较高的死亡风险。与之前Yan等人报道的AI预测模型相比，这是一个实质性的改进，该模型在生存或死亡发生前10天预测死亡率[6］．根据先前的研究，入院时的死亡率预测可为临床医生提供大量信息，因为疾病进展的关键时间是症状出现后10至14天[13，16，26］．EDRnet可以就谁应该集中治疗提供优先治疗指导。其次，EDRnet仅使用血液生物标志物来预测死亡率。一般情况下，COVID-19患者在入院时进行血液化验[9，27］．血液生物标志物是用于定量估计患者病情的客观指标，有助于保证AI模型的可靠性。我们没有包括主观生物标志物，如症状，也没有包括易感因素，如潜在的共病，因为这些指标难以量化，并且可能显示患者之间的高度变异性。第三，我们EDRnet模型中使用的血液生物标志物的临床意义和意义已经通过许多先前的临床研究得到了很好的研究。因此，人工智能的预测死亡率结果是可解释的，医生很容易理解。此外，在我们的EDRnet模型中使用了几种主要的血液生物标志物。

淋巴细胞、中性粒细胞、单核细胞、嗜酸性粒细胞和血小板的血液学变化很常见，因为这些变化与COVID-19感染中的病毒复制和过度炎症有关[12，13］．严重者出现CD4+/CD8+ T细胞浸润和隔离，导致外周血淋巴细胞减少。中性粒细胞计数[19-21]在重度组中显著高于轻度组。血小板计数、血小板体积和血小板大细胞比例与COVID-19感染有关，因为免疫破坏可导致血小板不适当的激活和消耗，以及巨核生成受损[28-30.］．

在血液化学方面，hs-CRP是代表急性期炎症的主要生物标志物[2，10，14-17］．LDH与细胞损伤有关，因此LDH升高是COVID-19严重程度和死亡率的独立危险因素[2，8-11］．低白蛋白血症(18，20.，21]，低钙血症[31-33]，以及天冬氨酸氨基转移酶升高[18与需要在重症监护室住院治疗的严重COVID-19感染高度相关。尿素和估计的肾小球滤过率是与潜在慢性肾脏疾病相关的重要实验室发现，而慢性肾脏疾病是众所周知的死亡易感因素[34］．在凝血特征上，COVID-19通常表现为高凝状态，重症患者凝血酶原时间和国际归一化比值升高[3.，18］．

在本研究中，除了抗生素和抗病毒药物如瑞德西韦的使用外，在死亡组和幸存者组之间的药物使用没有观察到显著差异。抗生素或联合治疗通常用于疑似细菌重复感染的严重疾病。迄今为止，还没有成功有效的药物治疗COVID-19。在本研究中，药物治疗与生存期无显著相关性。

EDRnet并不需要所有28种血液生物标志物来预测死亡率。只要在入院时至少有19个血液生物标志物，EDRnet就能很好地工作。与之前使用三种生物标志物的COVID-19死亡率人工智能预测模型相比，可能有人担心EDRnet需要太多的生物标志物。然而，在日常临床实践中，我们通常会对COVID-19住院患者进行这些血液检测。如果积累了更多的数据，那么我们就可以减少用于预测死亡率的血液生物标志物的数量。

局限性和未来工作

我们的研究有几个局限性。首先，可用于检测的患者数量可能很少。根据约翰·霍普金斯冠状病毒资源中心的数据，韩国的死亡率为1.7%。世界杯时间比赛时间在106名韩国患者的测试数据集中，死亡率为1.9%，几乎与实际死亡率相当。可能有必要通过训练来自世界各地的大量人口数据集来更新EDRnet。为了更新EDRnet，我们制作了一个web应用程序[25这样任何人都可以访问这个模型。我们认为，向公众开放人工智能模型有助于提高其性能和通用性。其次，我们的数据不包括其他种族，如高加索人或中东人。我们未来的研究计划是建立一个实时的AI训练系统，可以继续使用从世界各地前瞻性收集的数据来训练我们的模型。此外，我们将升级web应用程序，使数据库框架允许用户输入他或她的血液样本结果和结果。在扩展数据的基础上，对EDRnet进行改进，使其具有更好的泛化能力。

结论

总之，我们开发了新的人工智能模型EDRnet，仅使用血液生物标志物预测COVID-19患者入院时的死亡率。它现在向公众开放，希望它可以帮助医疗服务提供者对抗COVID-19，改善患者的结果。

致谢

这项工作得到了韩国医疗设备发展基金的资助，由韩国政府(科学和信息通信技术部;产业通商资源部;大韩民国卫生和福利部;(批准号:202012B04和NRF-2020R1A2C1014829)，以及韩国健康产业发展研究院(批准号:202012B04)。HI18C1216)。作者RJ目前是麻省理工学院林肯实验室的员工。本出版物中报告的结果/发现没有使用实验室的资金或资源。

作者的贡献

HK和HC对超参数搜索和建模进行了机器学习和深度学习仿真。CP验证了将应用于COVID-19患者的血液生物标志物，并撰写了论文初稿。DWK、SEK、CRC、REK收集并验证数据并进行统计分析。HL开发并维护了web应用程序。KWK、JHS和TYC对模拟进行了验证和确认，并帮助起草了手稿。RJ验证了机器学习和深度学习技术的方法论。JL和WSK构思并参与了研究的设计和协调，并撰写了最初的手稿。所有作者都阅读并批准了最终的手稿。

利益冲突

没有宣布。

‎

多媒体附件1

训练数据集。

XLSX文件(Microsoft Excel文件)，96kb

‎

多媒体附件2

测试数据集。

XLSX文件(Microsoft Excel文件)，35kb

‎

多媒体

补充数字和表格。

DOCX文件，876 KB

COVID-19监测小组。意大利COVID-19死亡患者的特征:基于2020年3月20日现有数据的报告。意大利罗马:罗马高等学院Sanità;2020.URL:https://www.epicentro.iss.it/coronavirus/bollettino/Report-COVID-2019_20_marzo_eng.pdf[2020-12-17]访问
李超，叶静，陈强，胡伟，王玲，范勇，等。乳酸脱氢酶(LDH)水平升高是COVID-19严重程度和死亡率的独立危险因素。老龄化(纽约州奥尔巴尼)2020年8月14日;12(15):15670-15681 [免费全文] [CrossRef] [Medline］
罗磊，徐敏，杜敏，寇华，廖东，程震，等。早期凝血试验预测COVID-19的风险分层和预后。老龄化(纽约州奥尔巴尼)2020年8月29日;12(16):15918-15937 [免费全文] [CrossRef] [Medline］
赖超，刘永华，王超，王勇，薛松，甄敏，等。无症状携带者状态、急性呼吸道疾病和严重急性呼吸系统综合征冠状病毒2 (SARS-CoV-2)引起的肺炎:事实和神话。中华微生物学杂志;2020年6月;53(3):404-412 [J]免费全文] [CrossRef] [Medline］
索拉比C，阿尔萨菲Z，奥尼尔N，可汗M，克万A，贾比尔A，等。世界卫生组织宣布全球进入紧急状态:对2019年新型冠状病毒(COVID-19)的回顾。Int J Surg 2020 Apr;76:71-76 [免费全文] [CrossRef] [Medline］
闫磊，张宏，Goncalves J，肖勇，王敏，郭勇，等。COVID-19患者可解释的死亡预测模型Nat Mach Intell 2020年5月14日;2(5):283-288。［CrossRef］
Chen T, Guestrin C. XGBoost:一个可扩展的树木增强系统。见:第22届ACM SIGKDD知识发现和数据挖掘国际会议论文集。纽约州纽约:计算机协会;2016年发表于:第22届ACM SIGKDD知识发现与数据挖掘国际会议;2016年8月13-17日;旧金山，加州785-794页网址:https://dl.acm.org/doi/pdf/10.1145/2939672.2939785［CrossRef］
吴美美，姚林，王勇，朱晓霞，王晓峰，唐普军，等。血清乳酸脱氢酶(LDH)在2019新型冠状病毒肺炎中的潜在应用价值的临床评价Respir Res 2020 july 06;21(1):171 [免费全文] [CrossRef] [Medline］
Henry BM, de Oliveira MHS, Benoit S, Plebani M, Lippi G. 2019年冠状病毒疾病(COVID-19)中与重症和死亡率相关的血液学、生化和免疫生物标志物异常:一项荟萃分析。临床化学实验室2020年6月25日;58(7):1021-1028。［CrossRef] [Medline］
王志强，王志强，王志强，等。乳酸脱氢酶水平预测2019冠状病毒疾病(COVID-19)的严重程度和死亡率:一项汇总分析。Am J急诊医学2020年9月38日(9):1722-1726 [免费全文] [CrossRef] [Medline］
乳酸脱氢酶:一种作为COVID-19标记物重生的旧酶(不仅如此)。临床化学实验室医学2020年8月24日;58(12):1979-1981。［CrossRef] [Medline］
严重冠状病毒疾病-2019 (COVID-19)中的淋巴细胞减少:系统综述和荟萃分析。J重症监护2020;8:36 [免费全文] [CrossRef] [Medline］
阮强，杨凯，王伟，姜丽，宋娟。基于武汉150例患者数据分析的COVID-19死亡的临床预测因子重症监护医学2020年5月;46(5):846-848 [免费全文] [CrossRef] [Medline］
新冠肺炎早期c反应蛋白水平。医学感染2020年6月;50(4):332-334 [免费全文] [CrossRef] [Medline］
王东，胡斌，胡超，朱峰，刘霞，张杰，等。武汉市138例新型冠状病毒感染的肺炎住院患者临床特征分析JAMA 2020 Mar 17;323(11):1061-1069 [免费全文] [CrossRef] [Medline］
管伟，倪震，胡勇，梁伟，欧超，何军，中国新冠肺炎医疗专家组。2019年中国冠状病毒病临床特征nengl J Med 2020 Apr 30;382(18):1708-1720 [免费全文] [CrossRef] [Medline］
谭超，黄勇，石峰，谭凯，马强，陈勇，等。c反应蛋白与计算机断层扫描结果相关，可早期预测严重的COVID-19。J Med Virol 2020 july;92(7):856-862 [免费全文] [CrossRef] [Medline］
龙华，聂林，向旭，李华，张旭，付旭，等。d -二聚体和凝血酶原时间是COVID-19重症和预后不良的重要指标。Biomed Res Int 2020;2020:6159720 [免费全文] [CrossRef] [Medline］
孔敏，张辉，曹旭，毛霞，陆哲。中性粒细胞-淋巴细胞水平升高与重症COVID-19相关。流行病感染2020年7月09;148:e139 [免费全文] [CrossRef] [Medline］
Aziz M, Fatima R, Lee-Smith W, Assaly R.低血清白蛋白水平与严重COVID-19的相关性:系统综述和荟萃分析。重症监护2020年5月26日;24(1):255 [免费全文] [CrossRef] [Medline］
Aziz M, Fatima R, Assaly R.白细胞介素6升高与重症COVID-19:一项荟萃分析。J Med Virol 2020 Nov;92(11):2283-2285 [免费全文] [CrossRef] [Medline］
柳叶刀血液学杂志。COVID-19凝血病:一个不断发展的故事。Lancet Haematol 2020 Jun;7(6):e425 [免费全文] [CrossRef] [Medline］
新型冠状病毒肺炎患者凝血参数异常与预后不良相关。血栓血肿杂志2020年5月;18(5):1233-1234。［CrossRef] [Medline］
鲍勒斯，普拉顿，夏泰，戴维，李凯，哈特，等。COVID-19患者狼疮抗凝血和异常凝血测试。N Engl J Med 2020 7月16日;383(3):288-290 [免费全文] [CrossRef] [Medline］
BeatCOVID19。URL:http://beatcovid19.ml/[2020-12-15]访问
钱刚，杨宁，丁峰，马亚勇，王忠，沈勇，等。浙江省91例COVID-19住院患者的流行病学和临床特征:一项回顾性多中心病例系列QJM 2020 july 01;113(7):474-481 [免费全文] [CrossRef] [Medline］
罗勇，袁旭，薛勇，毛林，林青，唐刚，等。使用基于常规实验室检测的诊断模型来区分SARS-CoV-2感染者与流感病毒感染者。国际传染病杂志2020 Jun; 39:436-440 [免费全文] [CrossRef] [Medline］
赵旭，王凯，左鹏，刘勇，张敏，谢松，等。血小板计数早期下降与COVID-19患者预后不良有关-预测、预防和个性化医疗方法的适应症EPMA J 2020五月14:1-7 [免费全文] [CrossRef] [Medline］
朱松，董林，蔡伟。中性粒细胞与淋巴细胞、血小板与淋巴细胞比值对新冠肺炎的预测价值。重症监护2020年8月28日;24(1):532 [免费全文] [CrossRef] [Medline］
萨德尔，SeyedAlinaghi S, Ghiasvand F, Hassan Nezhad M, Javadian N, Hossienzade R，等。一例COVID-19患者孤立性严重血小板减少症病例报告。IDCases 2020;21:e00820 [免费全文] [CrossRef] [Medline］
Cappellini F, Brivio R, Casati M, Cavallero A, Contro E, Brambilla P. COVID-19患者血液中总钙和电离钙水平较低。临床化学实验室2020年8月27日;58(9):e171-e173。［CrossRef] [Medline］
Di Filippo L, Formenti AM, Rovere-Querini P, Carlucci M, Conte C, Ciceri F，等。低钙血症非常普遍，预示着COVID-19患者需要住院治疗。内分泌2020 Jun;68(3):475-478 [免费全文] [CrossRef] [Medline］
孙杰，张伟，邹玲，刘勇，李娟，阚旭，等。血清钙作为2019年冠状病毒病患者临床严重程度和预后的生物标志物。老龄化(纽约州奥尔巴尼)2020年6月25日;12(12):11287-11295 [免费全文] [CrossRef] [Medline］
高敏，王强，魏健，朱智，李慧。2019年重症冠状病毒肺炎患者出现加重肾损害症状。J临床实验室肛肠2020年10月;34(10):e23535 [免费全文] [CrossRef] [Medline］

‎

阿瑟:演算法

美国存托凭证:可用数据速率

人工智能:人工智能

方差分析:方差分析

CNUH:全南大学医院

款:深度神经网络

EDA:深度神经网络和AdaBoost集成

EDRnet:基于深度神经网络和随机森林模型的集成学习模型

谱:集成了深度神经网络和XGBoost

舰队指挥官:完全连接

FN:假阴性

外交政策:假阳性

GPU:图形处理单元

hs-CRP:高敏c反应蛋白

LDH:乳酸脱氢酶

射频:随机森林

SMC:三星首尔医院

TN:真正的负

TP:真阳性

WKUH:圆光大学医院

编辑:G·艾森巴赫，R·库卡夫卡;提交03.11.20;同行评议:J Lee, C Jeong;对作者24.11.20的评论;订正版本收到24.11.20;接受08.12.20;发表23.12.20

©Hoon Ko, Heewon Chung, Wu Seong Kang, Chul Park, Do Wan Kim, Seong Eun Kim, Chi Ryang Chung, Ryoung Eun Ko, Hooseok Lee, Jae Ho Seo, Tae-Young Choi, Rafael Jaimes, Kyung Won Kim, Jinseok Lee。最初发表于《医疗互联网研究杂志》(//www.mybigtv.com)， 2020年12月23日。

这是一篇开放获取的文章，根据创作共用署名许可(https://creativecommons.org/licenses/by/4.0/)的条款发布，允许在任何媒介上无限制地使用、分发和复制，前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息，//www.mybigtv.com/上的原始出版物的链接，以及此版权和许可信息。

本文内容如下e-collection /主题问题:

使用常规血液样本预测COVID-19患者入院时死亡率的人工智能模型:集成模型的开发和验证