这是一篇开放获取的文章,根据创作共用署名许可协议(https://creativecommons.org/licenses/by/4.0/)的条款发布,允许在任何媒介上不受限制地使用、分发和复制,前提是正确引用了首次发表在JMIR医学信息学上的原创作品。必须包括完整的书目信息,http://medinform.www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。gydF4y2Ba
COVID-19给美国各地的医疗机构带来了前所未有的压力。准确识别病情恶化风险增加的患者可能有助于医院管理其资源,同时提高患者护理质量。在这里,我们提出了预测重症监护转移和其他不可预见事件(PICTURE)的分析模型的结果,以确定即将发生重症监护病房转移、呼吸衰竭或死亡的高风险患者,目的是改善对COVID-19恶化的预测。gydF4y2Ba
本研究旨在验证PICTURE模型预测普通病房和COVID-19患者意外恶化的能力,并将其性能与Epic恶化指数(EDI)进行比较,Epic恶化指数是一种现有模型,最近已被评估用于COVID-19患者。gydF4y2Ba
使用2014年至2018年的电子健康记录数据,在一组住院的非covid -19患者身上训练并验证了PICTURE模型。然后将其应用于两组拒绝测试的患者:2019年的非COVID-19患者和2020年的COVID-19检测呈阳性的患者。通过受试者工作特征曲线下面积(AUROC)和精确召回曲线下面积,将PICTURE结果与EDI和NEWS评分进行正面比较。我们比较了模型预测不良事件(定义为重症监护病房转移、机械通气使用或死亡)的能力。Shapley值被用来为PICTURE预测提供解释。gydF4y2Ba
在非covid -19普通病房患者中,PICTURE每次观察的AUROC为0.819 (95% CI 0.805-0.834),而EDI的AUROC为0.763 (95% CI 0.746-0.781;n = 21740;gydF4y2Ba
与EDI相比,PICTURE模型在预测我们队列中普通病房患者和COVID-19阳性患者的不良预后方面更准确。在考虑潜在的COVID-19感染初期浪潮时,持续预测这些事件的能力可能特别有价值。该模型的通用性将需要在其他医疗保健系统中进行测试以验证。gydF4y2Ba
COVID-19对美国医疗保健系统的影响怎么说都不为过。疫情给全国医院带来了前所未有的临床压力,促使重症监护病房(ICU)和低敏锐度野战医院的能力激增,以适应增加的患者负荷。一个能够识别病情恶化风险增加的患者的预测早期预警系统,可以帮助医院维持高水平的患者护理,同时更有效地分配其紧张的资源。然而,最近的一项综述表明,缺乏高质量的COVID-19患者恶化的经过验证的模型[gydF4y2Ba
在COVID-19大流行之前,医院已经并将继续应用早期预警系统,以在患者病情恶化事件发生之前预测病情,为卫生保健提供者提供干预时间[gydF4y2Ba
在COVID-19患者中评估的一个模型是Epic恶化指数(EDI;Epic Systems Inc) [gydF4y2Ba
在这项研究中,我们将先前描述的预测重症监护转移和其他不可预见事件(图)模型应用于一组COVID-19检测呈阳性的患者[gydF4y2Ba
该研究方案已获得密歇根大学机构审查委员会(HUM00092309)的批准。EHR数据收集自2014年1月1日至2020年11月11日的大型三级学术医疗系统(密歇根医学)。前5年数据(2014-2018;N =131,546次相遇)用于训练和验证模型,而2019年的数据被保留为抵抗测试集(N =33,472次相遇)。训练、验证和测试人群被分割,以防止集合之间多家医院相遇的重叠。这三个队列的纳入标准定义为18岁或以上,并在普通病房住院(有住院或其他观察状态)。我们排除了出院到临终关怀且ICU转诊来自普通病房以外楼层(如手术或介入放射科)的患者,以排除计划中的ICU转诊。我们还排除了使用左心室辅助装置的患者,以避免人工血压读数。gydF4y2Ba
要纳入COVID-19队列(n=637次接触),患者必须因COVID-19诊断入院,并在接触期间接受密歇根医学的COVID-19检测呈阳性。然后使用2019年测试集中使用的相同标准对这些患者进行过滤,除了临终关怀的区别。仅纳入出院患者或已经历不良事件的患者。gydF4y2Ba
研究人口。gydF4y2Ba一个gydF4y2Ba
数据集gydF4y2Ba | Non-COVID-19gydF4y2Ba | 新型冠状病毒肺炎gydF4y2Ba |
|
||||||||||
|
培训2014 - 2018gydF4y2Ba | 验证2014 - 2018gydF4y2Ba | 测试2019gydF4y2Ba | 测试2020gydF4y2Ba |
|
||||||||
遇到,ngydF4y2Ba | 105457年gydF4y2Ba | 26089年gydF4y2Ba | 33472年gydF4y2Ba | 637gydF4y2Ba | N/AgydF4y2BacgydF4y2Ba | ||||||||
病人,ngydF4y2Ba | 62392年gydF4y2Ba | 15597年gydF4y2Ba | 23368年gydF4y2Ba | 600gydF4y2Ba | N/AgydF4y2Ba | ||||||||
年龄(年),中位数(IQR)gydF4y2Ba | 60.2 (46.5 - -70.8)gydF4y2Ba | 60.4 (46.7 - -71.2)gydF4y2Ba | 61.0 (47.0 - -71.5)gydF4y2Ba | 61.8 (49.6 - -72.0)gydF4y2Ba | 02gydF4y2Ba | ||||||||
|
|||||||||||||
|
白色gydF4y2Ba | 86522 (82.0)gydF4y2Ba | 21647 (83.0)gydF4y2Ba | 27036 (80.8)gydF4y2Ba | 329 (51.6)gydF4y2Ba | <措施gydF4y2Ba | |||||||
|
黑色的gydF4y2Ba | 12344 (11.7)gydF4y2Ba | 2861 (11.0)gydF4y2Ba | 4214 (12.6)gydF4y2Ba | 220 (34.5)gydF4y2Ba | <措施gydF4y2Ba | |||||||
|
亚洲gydF4y2Ba | 2145 (2.0)gydF4y2Ba | 504 (1.9)gydF4y2Ba | 686 (2.0)gydF4y2Ba | 29 (4.6)gydF4y2Ba | <措施gydF4y2Ba | |||||||
|
其他gydF4y2BadgydF4y2Ba | 4446 (4.2)gydF4y2Ba | 1077 (4.1)gydF4y2Ba | 1536 (4.6)gydF4y2Ba | 59 (9.3)gydF4y2Ba | <措施gydF4y2Ba | |||||||
女性,n (%)gydF4y2Ba | 53225 (50.5)gydF4y2Ba | 13048 (50.0)gydF4y2Ba | 16760 (50.1)gydF4y2Ba | 282 (44.3)gydF4y2Ba | .003gydF4y2Ba | ||||||||
|
4236 (4.0)gydF4y2Ba | 1007 (3.9)gydF4y2Ba | 1337 (4.0)gydF4y2Ba | 155 (24.3)gydF4y2Ba | <措施gydF4y2Ba | ||||||||
|
死亡gydF4y2Ba | 920 (0.9)gydF4y2Ba | 232 (0.9)gydF4y2Ba | 277 (0.8)gydF4y2Ba | 16 (2.5)gydF4y2Ba | <措施gydF4y2Ba | |||||||
|
加护病房gydF4y2BafgydF4y2Ba转移gydF4y2Ba | 2979 (2.8)gydF4y2Ba | 717 (2.7)gydF4y2Ba | 1000 (3.0)gydF4y2Ba | 139 (21.8)gydF4y2Ba | <措施gydF4y2Ba | |||||||
|
机械通风gydF4y2Ba | 1330 (1.3)gydF4y2Ba | 299 (1.1)gydF4y2Ba | 352 (1.1)gydF4y2Ba | 49 (7.7)gydF4y2Ba | <措施gydF4y2Ba | |||||||
|
心脏骤停gydF4y2BaggydF4y2Ba | 143 (0.1)gydF4y2Ba | 37 (0.1)gydF4y2Ba | 56 (0.2)gydF4y2Ba | N/AgydF4y2Ba | N/AgydF4y2Ba |
一个gydF4y2Ba患者被分为四个研究队列之一:学习模型参数的训练集,模型结构和超参数调整的验证集,用于评估的坚持测试集,以及由COVID-19检测呈阳性的患者组成的最终测试集。数值是根据医院的个别病例计算的。gydF4y2Ba
bgydF4y2Ba
cgydF4y2BaN/A:不适用。gydF4y2Ba
dgydF4y2Ba其他各占人口不到1%的种族被纳入“其他”标题下。gydF4y2Ba
egydF4y2Ba事件率表示发生以下事件之一的复合结局:死亡、ICU转院、机械通气和心脏骤停。还报告了这些不良事件的个别频率,并表示每种特定结果首先发生的病例数。有关计算这些目标的过程,请参阅结果部分。gydF4y2Ba
fgydF4y2BaICU:重症监护室。gydF4y2Ba
ggydF4y2Ba心脏骤停没有被用作COVID-19阳性人群的目标,因为在撰写本文时尚未获得手动判定的数据。gydF4y2Ba
用作预测因子的变量从EHR中收集,广泛包括生命体征和生理观察、实验室和代谢值以及人口统计学。我们根据之前的分析选择了特定的特征[gydF4y2Ba
训练、验证和非covid -19测试队列(2014年至2019年收集的数据)的主要结局是死亡、心脏骤停(由美国心脏协会定义)gydF4y2Ba
为了验证我们自动生成标签的准确性,一名临床医生(作者MRM)手动检查了20次患者病历,以确定患者是否感染了COVID-19,记录的事件是否真的发生了,以及事件是否在计划外。为此,我们从每个就诊次数超过8次的患者服务中随机抽取了两次就诊(一次是积极的,另一次是消极的,如果有的话),以确保所有服务中标签的准确性。结果是20次接触的样本,其中11次是积极的。临床医生对每一次遭遇所记录的感兴趣事件进行复查,以确定事件是否发生,是否紧急(非计划)。对于被标记为阴性的患者,临床医生审查了整个患者图表,以确保在遭遇期间没有不良事件发生。结果表明,20例患者均感染了COVID-19,所有标签和事件时间均准确,所有事件均为计划外事件。这为自动生成的结果准确识别非计划不良事件提供了证据。gydF4y2Ba
为了训练和评估PICTURE模型,我们将数据分为四部分:使用2014年至2018年数据的训练和验证集,使用2019年数据的测试集,以及由COVID-19阳性患者的数据组成的第四组。我们对集合进行了划分,将同一个体的多次医院遭遇限制在一个队列中,防止队列之间的患者水平重叠。入院日期为2014年1月1日至2018年12月31日的病例被用于训练、验证和超参数调优(n= 131546例病例)。这些患者被进一步划分为训练组和验证组,比例为80%/20%。入院日期在2019年1月1日至12月31日之间的患者被保留为坚持测试集(n=33,472次相遇)。最后,2020年3月1日至9月11日期间COVID-19检测呈阳性的患者被保留为单独的一组(n=637例)。gydF4y2Ba
图片训练和验证框架。电子健康记录数据分为COVID-19患者和非COVID-19患者。2014年1月1日至2018年12月31日期间入院的患者被留作训练(80%)和验证(20%)子集。入院日期在2019年1月1日至12月31日之间的患者被用作非covid -19检测集。从2020年开始,COVID-19检测呈阳性的病例被作为单独的测试集提供。在这种情况下,给定的患者有多次相遇重叠这些边界,只有后来的相遇被认为是消除队列之间的患者重叠。EDI:史诗劣化指数;新闻:国家预警评分;图:预测重症监护转移和其他不可预见的事件;XGBoost:极端梯度增强。gydF4y2Ba
由于EHR以长格式存储数据(每个新行对应于新时间点的新测量值),因此首先将其转换为宽结构,以便每个观察值代表给定患者在给定时间点的所有特征。训练集和验证集被分组为8小时窗口,以确保每次遭遇在医院中有相同数量的观察时间,避免强调在训练模型时获得更频繁更新的患者,如Gillies等人所述[gydF4y2Ba
EDI是Epic系统公司开发的专利模型。密歇根医学院使用Epic作为其电子病历系统,并有权使用EDI工具。与PICTURE类似,它使用EHR中通常可用的临床数据来预测患者病情恶化。使用类似的复合结局进行训练,包括死亡、ICU转移和复苏作为不良事件[gydF4y2Ba
NEWS是由皇家内科医师学会开发的第二个指标,用于检测病情恶化事件(如心脏骤停、ICU转院和死亡)风险增加的患者[gydF4y2Ba
我们首先评估了PICTURE模型在由2019年患者组成的坚持测试集中所有33,472次遭遇中的表现。在初步分析中,使用另一个预警综合评分NEWS进行比较[gydF4y2Ba
由于EDI每15分钟进行一次预测,因此我们模拟了每次新数据点到达时以不规则的间隔计算的PICTURE分数如何与EDI对齐。这将2019年测试集的可用相遇次数限制在21740次,COVID-19队列的可用相遇次数限制在607次。通过在EDI预测之前进行最近的PICTURE预测,将PICTURE分数合并到EDI值上。这是为了在校准过程中给予EDI任何优势。gydF4y2Ba
PICTURE预测与EDI分数的对齐。尽管每当一个新的观察结果(例如,一个新的生命体征)被输入到系统中,PICTURE系统就会输出预测,但EDI评分每15分钟生成一次。为了给EDI任何潜在的优势,在每个EDI预测之前,通过选择最近的PICTURE分数,将PICTURE分数与EDI分数对齐。在这两种情况下,发生在目标前30分钟和目标后30分钟的观测被排除(红色)。对于没有经历不良事件的患者,在整个遭遇中计算最大得分。EDI:史诗劣化指数;图:预测重症监护转移和其他不可预见的事件。gydF4y2Ba
AUROC和AUPRC作为模型间比较的主要标准。AUROC可以解释为两个随机选择的观测值(一个具有积极的目标,另一个具有消极的目标)按模型预测分数的正确顺序排序的概率。AUPRC描述了敏感度范围内的平均阳性预测值(PPV)。我们还用自举方法计算了95%的遭遇级统计ci,使用1000次复制来计算关键ci。对于观察级统计,块引导被用于确保偶遇之间和偶遇观察内的随机化。gydF4y2Ba
尽管越来越先进的机器学习模型带来了许多好处,但这些模型在医疗领域的使用却落后于其他领域。其中一个影响因素是其复杂性,这使得所得到的预测难以解释,进而难以建立临床医生的信任[gydF4y2Ba
PICTURE和EDI都不是经过校准的分数——也就是说,即使它们的输出范围从0到1(在EDI的情况下是0到100),这些值也不能反映退化的概率[gydF4y2Ba
首先使用2019年抵制测试集中的33,472次遭遇评估了PICTURE模型准确预测复合目标的能力。为了提供比较基线,NEWS分数与每个PICTURE预测输出一起计算。观测级和相遇级AUROC和AUPRC均以95% ci表示gydF4y2Ba
评估PICTURE(非covid -19队列的表现)。gydF4y2Ba
粒度和分析gydF4y2Ba | AUROCgydF4y2Ba一个gydF4y2Ba(95%可信区间gydF4y2BabgydF4y2Ba)gydF4y2Ba |
|
AUPRCgydF4y2BadgydF4y2Ba(95%置信区间)gydF4y2Ba |
|
事件发生率(%)gydF4y2Ba | ||||||||||
|
<措施gydF4y2Ba |
|
<措施gydF4y2Ba | 1.01gydF4y2Ba | |||||||||||
|
图片gydF4y2BaegydF4y2Ba | 0.821 (0.810 - -0.832)gydF4y2Ba |
|
0.099 (0.085 - -0.110)gydF4y2Ba |
|
|
|||||||||
|
新闻gydF4y2Baf, ggydF4y2Ba | 0.753 (0.741 - -0.765)gydF4y2Ba |
|
0.058 (0.049 - -0.064)gydF4y2Ba |
|
|
|||||||||
|
<措施gydF4y2Ba |
|
<措施gydF4y2Ba | 3.99gydF4y2Ba | |||||||||||
|
图片gydF4y2Ba | 0.846 (0.834 - -0.858)gydF4y2Ba |
|
0.326 (0.301 - -0.351)gydF4y2Ba |
|
|
|||||||||
|
新闻gydF4y2Ba | 0.782 (0.768 - -0.795)gydF4y2Ba |
|
0.185 (0.165 - -0.203)gydF4y2Ba |
|
|
一个gydF4y2BaAUROC:受试者工作特征曲线下的面积。gydF4y2Ba
bgydF4y2Ba95% ci采用1000个重复的块自举法计算。在观察关卡中,这种引导在遭遇关卡中被阻止了。gydF4y2Ba
cgydF4y2Ba
dgydF4y2BaAUPRC:精确召回曲线下的面积。gydF4y2Ba
egydF4y2Ba图:预测重症监护转移和其他不可预见的事件。gydF4y2Ba
fgydF4y2Ba新闻:国家预警评分。gydF4y2Ba
ggydF4y2BaNEWS被用作比较的基线。gydF4y2Ba
然后将PICTURE与2019年同一坚持测试集中非covid -19患者的EDI模型进行比较。由于可用EDI分数的限制,相遇次数限制在21,740次。这些时间匹配分数再次在观察和相遇水平上使用AUROC和AUPRC进行评估(gydF4y2Ba
非covid -19队列中PICTURE和EDI的比较。gydF4y2Ba
粒度和分析gydF4y2Ba | AUROCgydF4y2Ba一个gydF4y2Ba(95%置信区间)gydF4y2Ba |
|
AUPRCgydF4y2BacgydF4y2Ba(95%置信区间)gydF4y2Ba |
|
事件发生率(%)gydF4y2Ba | ||
|
0.77gydF4y2Ba | ||||||
|
图片gydF4y2BadgydF4y2Ba | 0.819 (0.805 - -0.834)gydF4y2Ba |
对EDIgydF4y2BaegydF4y2Ba: <措施gydF4y2Ba 与新闻gydF4y2BafgydF4y2Ba: <措施gydF4y2Ba |
0.115 (0.096 - -0.130)gydF4y2Ba |
vs EDI: <.001gydF4y2Ba vs新闻:<.001gydF4y2Ba |
|
|
|
EDIgydF4y2Ba | 0.763 (0.746 - -0.781)gydF4y2Ba |
vs新闻:.01gydF4y2Ba |
0.081 (0.066 - -0.094)gydF4y2Ba |
vs新闻:<.001gydF4y2Ba |
|
|
|
新闻gydF4y2Ba | 0.745 (0.729 - -0.761)gydF4y2Ba |
N/AgydF4y2BaggydF4y2Ba |
0.062 (0.051 - -0.072)gydF4y2Ba |
N/AgydF4y2Ba |
|
|
|
4.21gydF4y2Ba | ||||||
|
图片gydF4y2Ba | 0.859 (0.846 - -0.873)gydF4y2Ba |
vs EDI: <.001gydF4y2Ba vs新闻:<.001gydF4y2Ba |
0.368 (0.335 - -0.400)gydF4y2Ba |
vs EDI: <.001gydF4y2Ba vs新闻:<.001gydF4y2Ba |
|
|
|
EDIgydF4y2Ba | 0.803 (0.788 - -0.821)gydF4y2Ba |
vs新闻:.15gydF4y2Ba |
0.274 (0.244 - -0.301)gydF4y2Ba |
vs新闻:<.001gydF4y2Ba |
|
|
|
新闻gydF4y2Ba | 0.797 (0.781 - -0.814)gydF4y2Ba |
N/AgydF4y2Ba |
0.229 (0.204 - -0.254)gydF4y2Ba |
N/AgydF4y2Ba |
|
一个gydF4y2BaAUROC:受试者工作特征曲线下的面积。gydF4y2Ba
bgydF4y2Ba
cgydF4y2BaAUPRC:精确召回曲线下的面积。gydF4y2Ba
dgydF4y2Ba图:预测重症监护转移和其他不可预见的事件。gydF4y2Ba
egydF4y2BaEDI:史诗劣化指数。gydF4y2Ba
fgydF4y2Ba新闻:国家预警评分。gydF4y2Ba
ggydF4y2BaN/A:不适用。gydF4y2Ba
图片与EDI的比较。面板A:非covid -19队列中PICTURE、EDI和NEWS模型的受试者工作特征(ROC)曲线。曲线下图片面积(AUC): 0.819;Edi auc: 0.763;新闻auc: 0.745。图B:非covid -19队列中两种模型的精度-召回(PR)曲线。图片auc: 0.115;Edi auc: 0.081;新闻auc: 0.062。图C: COVID-19队列中PICTURE、EDI和NEWS模型的ROC曲线。 PICTURE AUC: 0.849; EDI AUC: 0.803; NEWS AUC: 0.746. Panel D: PR curves for the two models. PICTURE AUC: 0.173; EDI AUC: 0.131; NEWS AUC: 0.098 in the COVID-19 cohort. All curves represent observation-level analysis. EDI: Epic Deterioration Index; FPR: false-positive rate; NEWS: National Early Warning Score; PICTURE: Predicting Intensive Care Transfers and Other Unforeseen Events; TPR: true-positive rate.
除了分类性能,前置时间是预测分析效用的另一个关键组成部分。提前时间是指警报和实际事件之间的时间,它决定了临床医生根据模型的建议采取行动的时间。我们通过排除不良事件发生前0.5小时、1小时、2小时、6小时、12小时和24小时的数据,并计算遭遇级别的性能,以阈值独立的方式评估了模型在不同提前时间的相对性能(gydF4y2Ba
非covid -19队列的提前时间分析。gydF4y2Ba一个gydF4y2Ba
交货时间(小时)gydF4y2Ba | AUROCgydF4y2BabgydF4y2Ba(95%置信区间)gydF4y2Ba | AUPRCgydF4y2BacgydF4y2Ba(95%置信区间)gydF4y2Ba | 事件发生率(%)gydF4y2Ba | 样本容量ngydF4y2Ba | |||||
|
图片gydF4y2BadgydF4y2Ba | EDIgydF4y2BaegydF4y2Ba | 图片gydF4y2Ba | EDIgydF4y2Ba |
|
|
|||
0.5gydF4y2Ba | 0.859 (0.846 - -0.873)gydF4y2Ba | 0.803 (0.787 - -0.820)gydF4y2Ba | 0.368 (0.336 - -0.400)gydF4y2Ba | 0.274 (0.244 - -0.302)gydF4y2Ba | 4.21gydF4y2Ba | 21636年gydF4y2Ba | |||
1gydF4y2Ba | 0.850 (0.835 - -0.864)gydF4y2Ba | 0.795 (0.778 - -0.811)gydF4y2Ba | 0.346 (0.315 - -0.379)gydF4y2Ba | 0.254 (0.227 - -0.280)gydF4y2Ba | 4.18gydF4y2Ba | 21636年gydF4y2Ba | |||
2gydF4y2Ba | 0.838 (0.823 - -0.853)gydF4y2Ba | 0.784 (0.767 - -0.802)gydF4y2Ba | 0.321 (0.292 - -0.352)gydF4y2Ba | 0.238 (0.210 - -0.265)gydF4y2Ba | 4.14gydF4y2Ba | 21622年gydF4y2Ba | |||
6gydF4y2Ba | 0.825 (0.810 - -0.840)gydF4y2Ba | 0.768 (0.750 - -0.787)gydF4y2Ba | 0.280 (0.249 - -0.310)gydF4y2Ba | 0.210 (0.184 - -0.237)gydF4y2Ba | 3.92gydF4y2Ba | 21572年gydF4y2Ba | |||
12gydF4y2Ba | 0.817 (0.801 - -0.832)gydF4y2Ba | 0.767 (0.749 - -0.786)gydF4y2Ba | 0.247 (0.215 - -0.275)gydF4y2Ba | 0.183 (0.159 - -0.207)gydF4y2Ba | 3.67gydF4y2Ba | 21515年gydF4y2Ba | |||
24gydF4y2Ba | 0.808 (0.790 - -0.826)gydF4y2Ba | 0.759 (0.740 - -0.779)gydF4y2Ba | 0.205 (0.172 - -0.230)gydF4y2Ba | 0.144 (0.121 - -0.164)gydF4y2Ba | 3.24gydF4y2Ba | 21419年gydF4y2Ba |
一个gydF4y2Ba两种模型在不同提前时间的表现(遭遇水平)通过评估之前的最大预测得分来评估gydF4y2Ba
bgydF4y2BaAUROC:受试者工作特征曲线下的面积。gydF4y2Ba
cgydF4y2BaAUPRC:精确召回曲线下的面积。gydF4y2Ba
dgydF4y2Ba图:预测重症监护转移和其他不可预见的事件。gydF4y2Ba
egydF4y2BaEDI:史诗劣化指数。gydF4y2Ba
当应用于COVID-19检测呈阳性的患者时,PICTURE表现同样良好。使用PICTURE和EDI的比较部分概述的过程,将PICTURE分数再次与EDI分数对齐。结果包括607次遭遇战。gydF4y2Ba
与非covid -19队列一样,在进一步提前预测时,进行了类似的前置时间分析,以评估PICTURE和EDI的表现。再次在事件发生前0.5小时、1小时、2小时、6小时、12小时和24小时设置阈值,并排除在此截止时间后发生的观察。在我们的队列中,即使在提前24小时进行预测时,PICTURE也再次优于EDI (gydF4y2Ba
COVID-19检测呈阳性患者的PICTURE和EDI比较gydF4y2Ba
粒度和分析gydF4y2Ba | AUROCgydF4y2Ba一个gydF4y2Ba(95%置信区间)gydF4y2Ba |
|
AUPRCgydF4y2BabgydF4y2Ba(95%置信区间)gydF4y2Ba |
|
事件发生率(%)gydF4y2Ba | ||
|
3.20gydF4y2Ba | ||||||
|
图片gydF4y2BacgydF4y2Ba | 0.849 (0.820 - -0.878)gydF4y2Ba |
对EDIgydF4y2BadgydF4y2Ba: <措施gydF4y2Ba 与新闻gydF4y2BaegydF4y2Ba: <措施gydF4y2Ba |
0.173 (0.116 - -0.211)gydF4y2Ba |
对EDI: .002gydF4y2Ba vs新闻:<.001gydF4y2Ba |
|
|
|
EDIgydF4y2Ba | 0.803 (0.772 - -0.838)gydF4y2Ba |
vs新闻:<.001gydF4y2Ba |
0.131 (0.087 - -0.163)gydF4y2Ba |
vs新闻:.002gydF4y2Ba |
|
|
|
新闻gydF4y2Ba | 0.746 (0.708 - -0.783)gydF4y2Ba |
N/AgydF4y2BafgydF4y2Ba |
0.098 (0.066 - -0.122)gydF4y2Ba |
N/AgydF4y2Ba |
|
|
|
20.6gydF4y2Ba | ||||||
|
图片gydF4y2Ba | 0.895 (0.868 - -0.928)gydF4y2Ba |
vs EDI: <.001gydF4y2Ba vs新闻:<.001gydF4y2Ba |
0.665 (0.590 - -0.743)gydF4y2Ba |
vs EDI: <.001gydF4y2Ba vs新闻:<.001gydF4y2Ba |
|
|
|
EDIgydF4y2Ba | 0.802 (0.762 - -0.848)gydF4y2Ba |
vs新闻:.05gydF4y2Ba |
0.510 (0.438 - -0.588)gydF4y2Ba |
vs新闻:.02gydF4y2Ba |
|
|
|
新闻gydF4y2Ba | 0.773 (0.732 - -0.818)gydF4y2Ba |
N/AgydF4y2Ba |
0.441 (0.364 - -0.510)gydF4y2Ba |
N/AgydF4y2Ba |
|
一个gydF4y2BaAUROC:受试者工作特征曲线下的面积。gydF4y2Ba
bgydF4y2BaAUPRC:精确召回曲线下的面积。gydF4y2Ba
cgydF4y2Ba图:预测重症监护转移和其他不可预见的事件。gydF4y2Ba
dgydF4y2BaEDI:史诗劣化指数。gydF4y2Ba
egydF4y2Ba新闻:国家预警评分。gydF4y2Ba
fgydF4y2BaN/A:不适用。gydF4y2Ba
COVID-19队列的提前时间分析。gydF4y2Ba一个gydF4y2Ba
交货时间(小时)gydF4y2Ba | AUROCgydF4y2BabgydF4y2Ba(95%置信区间)gydF4y2Ba | AUPRCgydF4y2BacgydF4y2Ba(95%置信区间)gydF4y2Ba | 事件发生率(%)gydF4y2Ba | 样本容量ngydF4y2Ba | ||||
|
图片gydF4y2BadgydF4y2Ba | EDIgydF4y2BaegydF4y2Ba | 图片gydF4y2Ba | EDIgydF4y2Ba |
|
|
||
0.5gydF4y2Ba | 0.895 (0.867 - -0.926)gydF4y2Ba | 0.802 (0.761 - -0.842)gydF4y2Ba | 0.665 (0.586 - -0.739)gydF4y2Ba | 0.510 (0.436 - -0.587)gydF4y2Ba | 20.6gydF4y2Ba | 607gydF4y2Ba | ||
1gydF4y2Ba | 0.887 (0.860 - -0.918)gydF4y2Ba | 0.793 (0.753 - -0.836)gydF4y2Ba | 0.631 (0.553 - -0.710)gydF4y2Ba | 0.491 (0.418 - -0.570)gydF4y2Ba | 20.5gydF4y2Ba | 606gydF4y2Ba | ||
2gydF4y2Ba | 0.870 (0.840 - -0.901)gydF4y2Ba | 0.794 (0.754 - -0.833)gydF4y2Ba | 0.598 (0.518 - -0.675)gydF4y2Ba | 0.478 (0.400 - -0.555)gydF4y2Ba | 20.1gydF4y2Ba | 603gydF4y2Ba | ||
6gydF4y2Ba | 0.847 (0.813 - -0.885)gydF4y2Ba | 0.769 (0.729 - -0.813)gydF4y2Ba | 0.552 (0.474 - -0.639)gydF4y2Ba | 0.435 (0.354 - -0.517)gydF4y2Ba | 19.3gydF4y2Ba | 597gydF4y2Ba | ||
12gydF4y2Ba | 0.821 (0.783 - -0.863)gydF4y2Ba | 0.752 (0.708 - -0.798)gydF4y2Ba | 0.497 (0.411 - -0.577)gydF4y2Ba | 0.403 (0.333 - -0.480)gydF4y2Ba | 17.9gydF4y2Ba | 587gydF4y2Ba | ||
24gydF4y2Ba | 0.808 (0.767 - -0.856)gydF4y2Ba | 0.740 (0.690 -796)gydF4y2Ba | 0.443gydF4y2BafgydF4y2Ba(0.344 - -0.529)gydF4y2Ba | 0.370 (0.289 - -0.459)gydF4y2Ba | 16.0gydF4y2Ba | 574gydF4y2Ba |
一个gydF4y2Ba通过评估给定事件发生前x小时的最大预测得分,再次评估两个模型在不同提前时间的表现(遭遇水平),x的范围从0.5到24逐渐增大。在这组非covid -19患者中,PICTURE的表现始终优于EDI。在每一级审查中gydF4y2Ba
bgydF4y2BaAUROC:受试者工作特征曲线下的面积。gydF4y2Ba
cgydF4y2BaAUPRC:精确召回曲线下的面积。gydF4y2Ba
dgydF4y2Ba图:预测重症监护转移和其他不可预见的事件。gydF4y2Ba
egydF4y2BaEDI:史诗劣化指数。gydF4y2Ba
fgydF4y2Ba
为了向临床医生提供影响给定PICTURE评分的因素的描述,我们使用在每次观察时计算的Shapley值。gydF4y2Ba
沙普利总结情节。面板A描绘了来自2019年测试集的沙普利值的汇总汇总图,而面板B对应于COVID-19阳性患者。20个最具影响力的特征从上到下排序,并绘制了所有预测的Shapley值分布。Shapley值的大小显示在横轴上,而特征本身的值则由颜色表示。例如,面板a中超过24小时的大量氧气支持(红色)与对模型的高度积极影响相关,而低至无氧气支持(蓝色)则将模型推回到0。BUN:血液尿素氮;GCS:格拉斯哥昏迷量表;INR:国际标准化比率;世鹏科技电子:沙普利;WBC:白细胞。gydF4y2Ba
PICTURE评分和EDI评分均提示患者病情恶化的风险;然而,这两个分数都没有作为概率进行校准。因此,警报阈值可以提供一种方便的机制来决定是否提醒临床医生他们的病人处于增加的风险中。之前一项评估COVID-19患者使用EDI的研究发现,EDI得分为64.8或更高可作为识别风险增加患者的可行阈值[gydF4y2Ba
分数分布及校正曲线。面板A显示了PICTURE和EDI分数分布的KDE。除原始图片分数外,还包括logit转换分数。图B描述了PICTURE和EDI评分(0.1,0.2,0.3,…0.9)与观察到的风险的分位数。PICTURE和EDI都不是作为概率进行校准的,因此,设置报警阈值的使用可能有助于在患者风险增加时向临床医生发出警报。EDI:史诗劣化指数;KDE:核密度估计;图:预测重症监护转移和其他不可预见的事件。gydF4y2Ba
为了模拟临床医生何时可能收到来自PICTURE系统的警报,选择了四个阈值,并根据观察到的EDI评分的敏感性、特异性、PPV和NPV进行对齐,使用Singh等人提出的64.8值[gydF4y2Ba
警报阈值和中间交货时间。gydF4y2Ba一个gydF4y2Ba
分数gydF4y2Ba | 阈值来源gydF4y2Ba | 阈值gydF4y2Ba | 灵敏度gydF4y2Ba | 特异性gydF4y2Ba | PPVgydF4y2BabgydF4y2Ba | 净现值gydF4y2BacgydF4y2Ba | 世界发展报告》gydF4y2BadgydF4y2Ba | F1的分数gydF4y2BaegydF4y2Ba | 交货时间gydF4y2BafgydF4y2Ba(h:min),中位数(IQR)gydF4y2Ba |
EDIgydF4y2BaggydF4y2Ba | 辛格等[gydF4y2Ba |
64.8gydF4y2Ba | 0.448gydF4y2Ba | 0.917gydF4y2Ba | 0.583gydF4y2Ba | 0.865gydF4y2Ba | 1.71gydF4y2Ba | 0.507gydF4y2Ba | 32:26 (4:37-66:08)gydF4y2Ba |
|
|||||||||
|
按灵敏度对齐gydF4y2Ba | 0.165gydF4y2Ba | N/AgydF4y2Ba我gydF4y2Ba | 0.946gydF4y2Ba | 0.683gydF4y2Ba | 0.869gydF4y2Ba | 1.46gydF4y2Ba | 0.541gydF4y2Ba | 40:14 (7:51-67:50)gydF4y2Ba |
|
根据专用性排列gydF4y2Ba | 0.097gydF4y2Ba | 0.616gydF4y2Ba | N/AgydF4y2Ba | 0.658gydF4y2Ba | 0.902gydF4y2Ba | 1.52gydF4y2Ba | 0.636gydF4y2Ba | 40:04 (7:44-91:00)gydF4y2Ba |
|
按PPV对齐gydF4y2Ba | 0.048gydF4y2Ba | 0.792gydF4y2Ba | 0.851gydF4y2Ba | N/AgydF4y2Ba | 0.940gydF4y2Ba | N/AgydF4y2Ba | 0.668gydF4y2Ba | 54:10 (29:26-115:50)gydF4y2Ba |
|
NPV对齐gydF4y2Ba | 0.173gydF4y2Ba | 0.432gydF4y2Ba | 0.946gydF4y2Ba | 0.675gydF4y2Ba | N/AgydF4y2Ba | 1.48gydF4y2Ba | 0.527gydF4y2Ba | 41:40 (7:31-68:30)gydF4y2Ba |
一个gydF4y2Ba根据Singh等人提出的阈值64.8计算EDI的敏感性、特异性、PPV和NPV [gydF4y2Ba
bgydF4y2BaPPV:阳性预测值。gydF4y2Ba
cgydF4y2BaNPV:负预测值。gydF4y2Ba
dgydF4y2BaWDR:井检比。gydF4y2Ba
egydF4y2BaF1评分以PPV与敏感性之间的谐波平均值计算。gydF4y2Ba
fgydF4y2Ba使用PICTURE和EDI之间的真阳性交叉来确定提前时间,并计算为患者首次越过阈值与首次恶化事件之间的时间。gydF4y2Ba
ggydF4y2BaEDI:史诗劣化指数。gydF4y2Ba
hgydF4y2Ba图:预测重症监护转移和其他不可预见的事件。gydF4y2Ba
我gydF4y2BaN/A:不适用。gydF4y2Ba
PICTURE在每一次观测中都对所包含的特征进行预测。评估PICTURE性能的一个自然起点是这个粒度级别。使用Gillies等人概述的一般结构[gydF4y2Ba
EDI不会对每个特征观测都做出预测;相反,它每15分钟做出一次预测。为了提供与EDI的直接比较,我们对PICTURE分数进行了子集化,并将其与EDI分数进行时间匹配,如Performance Measures一节中所述。在这组非covid -19患者中,PICTURE的AUROC显著优于EDI,观察水平AUROC为0.819,而EDI的AUROC为0.763。这种性能差距延续了多个周期,即使仅限于不良事件发生前24小时或更长时间收集的数据,PICTURE的性能仍然很高,AUROC为0.808,而EDI的AUROC降至0.759。这些结果表明,在密歇根大学医院使用PICTURE而不是EDI将导致更少的错误警报。尽管模型被迫在不良事件发生前更长的时间内做出预测,但PICTURE仍然保持了性能的改善。gydF4y2Ba
随着EDI越来越多地被研究为衡量COVID-19患者恶化风险的可行指标[gydF4y2Ba
一个重要的讨论点是,在COVID-19患者中观察到的恶化率要高得多(20.6% vs 4.21%)。这可能是由于与普通病房人群相比,病毒的严重程度以及在大流行早期面临疾病的临床医生所支持的积极治疗方案的综合作用,而这种疾病代表着许多未知。因此,COVID-19患者和普通病房患者之间的校准和警报阈值部分中提出的阈值选择可能不同。与普通测试集相比,当应用于COVID-19患者时,PICTURE分析(以AUROC衡量)的性能略有提高(尽管95% ci重叠),这表明COVID-19患者可能是一项更容易的分类任务。这得到了以下事实的支持:通过观察水平AUROC (0.763 vs 0.803)衡量,EDI在COVID-19队列中的表现也更好,尽管这一增加在遭遇水平的结果中没有持续(AUROC 0.803 vs 0.802)。gydF4y2Ba
PICTURE模型的一个关键特征是它使用Shapley值来帮助向临床医生解释个人预测。这些解释有助于增加模型的可解释性,允许临床医生评估单个模型评分,并确定潜在的下一步、后续测试或治疗计划。gydF4y2Ba
模拟警报阈值的计算基于Singh等人提出的EDI阈值的衍生灵敏度、特异性、PPV和NPV [gydF4y2Ba
为了演示PICTURE的潜在用途,选择了一个单独的医院遭遇,在中可视化了PICTURE和EDI的轨迹gydF4y2Ba
为了模拟从PICTURE接收警报的临床医生可能遇到的情况,在两个警报阈值处解释PICTURE预测的Shapley值被记录在gydF4y2Ba
1例患者的样本轨迹。面板A描述了患者最终转移到ICU护理级别之前27小时内的PICTURE预测(绿条)。注意到两个可能的警报阈值:一个(红色:0.165)基于EDI在阈值64.8处的敏感性(由Singh等人提出[gydF4y2Ba
样本预测重症监护转移和其他不可预见事件的解释。gydF4y2Ba
等级和特征名gydF4y2Ba一个gydF4y2Ba | 价值gydF4y2Ba | 中位数(差)gydF4y2BabgydF4y2Ba | 沙普利得分gydF4y2Ba | ||||
|
|||||||
|
1.补氧(滚动最多24小时)gydF4y2Ba | 7 L / mingydF4y2Ba | 2.0 (0.0 - -3.0)gydF4y2Ba | 1.06gydF4y2Ba | |||
|
2.热点;gydF4y2Ba2gydF4y2BadgydF4y2Ba(滚动24小时分钟)gydF4y2Ba | 85%gydF4y2Ba | 92.0 (90.0 - -94.0)gydF4y2Ba | 0.93gydF4y2Ba | |||
|
3.呼吸速率gydF4y2Ba | 26 bpmgydF4y2Ba | 20.0 (18.0 - -20.0)gydF4y2Ba | 0.76gydF4y2Ba | |||
|
4.温度gydF4y2Ba | 39.1˚CgydF4y2Ba | 36.9 (36.8 - -37.2)gydF4y2Ba | 0.32gydF4y2Ba | |||
|
5.蛋白质水平gydF4y2Ba | 5.7gydF4y2Ba | 6.0 (5.6 - -6.4)gydF4y2Ba | 0.13gydF4y2Ba | |||
|
|||||||
|
1.补氧(滚动最多24小时)gydF4y2Ba | 35升/分钟gydF4y2Ba | 2.0 (0.0 - -3.0)gydF4y2Ba | 1.93gydF4y2Ba | |||
|
2.热点;gydF4y2Ba2gydF4y2Ba(滚动24小时分钟)gydF4y2Ba | 85%gydF4y2Ba | 92.0 (90.0 - -94.0)gydF4y2Ba | 1.09gydF4y2Ba | |||
|
3.呼吸速率gydF4y2Ba | 24 bpmgydF4y2Ba | 20.0 (18.0 - -20.0)gydF4y2Ba | 0.73gydF4y2Ba | |||
|
4.心率gydF4y2BaegydF4y2Ba | 124 bpmgydF4y2Ba | 83.0 (74.0 - -92.0)gydF4y2Ba | 0.71gydF4y2Ba | |||
|
5.温度gydF4y2Ba | 39.1˚CgydF4y2Ba | 36.9 (36.8 - -37.2)gydF4y2Ba | 0.32gydF4y2Ba |
一个gydF4y2Ba前5个特征对应于预测重症监护转移和其他不可预见事件的预测,因为它越过ppv对齐阈值和灵敏度对齐阈值gydF4y2Ba
bgydF4y2Ba包括中位数和IQR进行比较,并使用COVID-19数据集计算。gydF4y2Ba
cgydF4y2BaPPV:阳性预测值。gydF4y2Ba
dgydF4y2Ba热点;gydF4y2Ba2gydF4y2Ba:脉搏血氧仪测得的氧饱和度。gydF4y2Ba
egydF4y2Ba心率是这两个时间点之间的主要差异。当预测重症监护转移和其他不可预见事件评分在重症监护转移前12.5小时首次超过PPV阈值时,心率保持在65 bpm,并不是Shapley测量的主要特征之一。在事件发生前11个小时,当预测重症监护转移和其他不可预见事件得分达到最高时,心率已跳至124 bpm,是Shapley值测量的第四大最具影响力的特征。gydF4y2Ba
这一分析仅限于单一的学术医疗中心,其推广到其他医疗保健系统将需要未来的研究。我们的COVID-19患者样本的规模也有限,这限制了我们检测PICTURE和EDI之间差异的能力。最后,由于事件发生率增加,校准和警报阈值部分中提出的阈值可能与一般人群中使用的阈值不同。阈值还可能需要在将来进行调优,以适应各个单元的需要。gydF4y2Ba
PICTURE早期预警系统准确预测不良患者结局,包括ICU转院、机械通气和密歇根医学院的死亡。在考虑到可能即将到来的第二波COVID-19感染时,持续预测这些事件的能力可能特别有价值。EDI是一种广泛的恶化模型,最近在COVID-19人群中进行了评估。PICTURE和EDI都使用了大约13万例非COVID-19病例进行训练,以确定总体恶化情况,因此对COVID-19人群没有过度拟合[gydF4y2Ba
补充材料。gydF4y2Ba
精度-召回曲线下的面积gydF4y2Ba
接收机工作特性曲线下面积gydF4y2Ba
血尿素氮gydF4y2Ba
史诗变质指数gydF4y2Ba
电子健康记录gydF4y2Ba
格拉斯哥昏迷量表gydF4y2Ba
重症监护室gydF4y2Ba
国家预警评分gydF4y2Ba
负预测值gydF4y2Ba
预测重症监护转移和其他不可预见的事件gydF4y2Ba
推动原始数据科学gydF4y2Ba
阳性预测值gydF4y2Ba
precision-recallgydF4y2Ba
接收机工作特性gydF4y2Ba
氧饱和度由脉搏血氧仪测量gydF4y2Ba
这项研究部分得到了密歇根数据科学研究所“推动COVID-19研究原始数据科学(PODS)小额赠款”奖的支持。AJA已获得NIH/NHLBI (F32HL149337)的资助。gydF4y2Ba
CEG、RPM Jr和KRW已经通过密歇根大学技术转让办公室提交了一项关于本文中介绍的机器学习方法的专利。gydF4y2Ba