发表在23卷第九名(2021): 9月

本文的预印本(早期版本)可在https://preprints.www.mybigtv.com/preprint/27798,首次出版
利用电子健康记录预测住院心脏骤停患者的死亡率和再入院率:一种机器学习方法

利用电子健康记录预测住院心脏骤停患者的死亡率和再入院率:一种机器学习方法

利用电子健康记录预测住院心脏骤停患者的死亡率和再入院率:一种机器学习方法

原始论文

1台大医院云林分院急诊科,云林,台湾

2Knowtions Research,多伦多,安大略省,加拿大

3.国立台湾大学附属医院内科,台北市

4国立台湾大学附属医院急诊科,台北市

*这些作者贡献相同

通讯作者:

黄建华,医学博士

急诊科

台大医院

中山南路7号

台北,100年

台湾

电话:886 0972651304

电子邮件:chhuang5940@ntu.edu.tw


背景:院内心脏骤停(IHCA)与恢复期的高死亡率和医疗费用相关。预测不良结果事件,包括再入院,可提高采取适当干预措施的机会,并降低卫生保健成本。然而,与早期预测IHCA幸存者不良事件相关的研究很少。因此,我们在本研究中使用了深度学习模型进行预测。

摘要目的:本研究旨在证明,通过适当的数据集和学习策略,我们可以根据IHCA幸存者的历史索赔预测他们的30天死亡率和再入院率。

方法:获得了国家健康保险研究数据库的索赔数据,包括168,693例至少经历过一次IHCA的患者和1,569,478例临床记录,以生成用于结果预测的数据集。我们预测了每个当前记录后的30天死亡率/再入院(全部死亡率/全部再入院)和IHCA后的30天死亡率/再入院(心脏骤停[CA]-死亡率/再入院)。我们开发了一种分层向量化器(HVec)深度学习模型来提取患者信息并预测死亡率和再入院率。为了将临床记录的文本医学概念嵌入到我们的深度学习模型中,我们使用Text2Node来计算所有医学概念代码的分布式表示作为128维向量。随着患者的人口统计信息,我们的新型HVec模型生成嵌入向量来分层描述记录级和患者级的健康状态。提出了包含两个主要任务和辅助任务的多任务学习方法。由于CA死亡率和CA再入院率很少见,因此对CA患者进行个体上抽样和CA记录加权来提高预测性能。

结果:通过模型学习过程中的多任务学习设置,我们实现了ca -死亡率0.752,all -死亡率0.711,ca -再入院0.852,all -再入院0.889的接收器工作特征下的面积。在通过上采样和加权解决了ca -死亡率/ ca -再入院的极度不平衡问题后,受试者工作特征下的面积提高到ca -死亡率的0.808和ca -再入院的0.862。

结论:这项研究证明了通过机器学习预测IHCA幸存者未来结果的潜力。结果表明,我们提出的方法可以有效地缓解数据不平衡问题,并训练出更好的结果预测模型。

中国医学杂志,2016;23(9):e27798

doi: 10.2196/27798

关键字



背景

在美国,每年约有20.9万名患者经历院内心脏骤停(IHCA) [1].生存到出院的比率约为14%,只有7%的IHCA患者能够重新获得独立生活或部分独立生活[2].为了减少IHCA对个人生活或社会的严重影响,确定改善IHCA结果的措施至关重要。

之前的工作

IHCA幸存者及其神经预后的预后因素和预测工具已在先前的研究中确定[3.-8].然而,早期预警系统预测IHCA幸存者死亡率的证据是有限的。目前已经开发了使用生理跟踪和触发系统(TTSs)的早期预警评分系统,用于识别有IHCA风险或其他严重后果(包括死亡)的患者[9-11].大多数TTSs依赖于病房工作人员对生命体征的常规观察。虽然许多患者可以用这种方法进行监测,但支持使用TTSs的证据质量很差。具体而言,大多数TTSs敏感性低,阳性预测值低,特异性高[1213].除了IHCA后的高死亡率外,IHCA后的再入院有很大的成本负担,并与合并症有关。预测再入院事件为适当干预和降低卫生保健成本提供了机会,包括进一步再入院[1415].

我们的研究

在这里,我们首先从国家健康保险研究数据库(NHIRD)中提取IHCA队列。我们基于NHIRD的历史电子健康记录(EHRs)评估了他们的风险。为了提供足够长的临床干预窗口期,我们使用IHCA后30天的死亡率和再入院率作为我们的预测目标。与TTSs相比,EHRs由医生编写,包含一些重要的医疗信息,包括患者的诊断和管理。为了获得更好的性能,我们开发了一种新的深度学习模型,层次矢量器(HVec),以分析患者的历史EHRs并预测死亡率和再入院率。本研究旨在证明,通过适当的数据集和学习策略,我们可以根据IHCA患者的病史声明预测其结果,并帮助临床医生设计更有效的干预方案。


数据收集

本研究获国立台湾大学医学院机构评审委员会批准。从NHIRD中提取的IHCA队列包括超过9年(2002年1月1日至2010年12月31日)至少发生过一次IHCA事件的168,693例患者。台湾国民健康保险计划是台湾唯一的健康保险计划,覆盖台湾99.99%的人口[16].NHIRD包含住院和门诊(诊所或急诊科)的所有健康记录;然而,这些记录不能具体地与每个病人联系起来。研究期间使用了《国际疾病分类第九修订版》(ICD-9)进行诊断和医疗程序。NHIRD包含医疗信息,包括性别、年龄、诊断、医疗程序、手术、用药、实验室检测、护理地点、出院状态和每次医院就诊费用。实验室检测结果和床边信息,包括生命体征、血压和体检,不包括在NHIRD中。

IHCA人群由ICD-9程序代码为99.60(心肺复苏,未另行规定)和99.63(闭式胸心按摩)的住院患者记录定义[17].我们使用了提取、转换和加载(ETL,参见图1)将原始数据处理成一个干净的数据库,以消除缺失或无效信息的记录。清理后的数据库中的原始数据被重新分组为三个主要类别(保险公司、个人和护理人员),以改进数据组织。此外,词汇表是基于提取的概念,在原始数据中使用。

图1。将原始NHIRD数据转换为数据集的ETL过程。在队列选择和剔除无效数据后,对原始数据进行提取、转换并加载到清理后的数据库中。ETL:提取、转换、加载;国际疾病分类;国家健康保险研究数据库。
查看此图

实验数据集

数据集中的168,693名患者被分为三个数据集:训练、验证和测试。训练数据集(数据集的70%)用于训练每个模型。其余30%的患者在验证数据集和测试数据集之间平均分配,以调整超参数(表1),并分别评估模型性能。

为了进行比较,我们对死亡率和再入院率训练了两个单任务模型。为了不影响验证和测试数据集的分布,只对训练数据集进行人员上抽样和事件加权。F1评分和受试者工作特征下面积(AUROC)是我们的主要评价指标。

表1。Hyperparameter设置。
Hyperparameter 价值
访问嵌入尺寸 200
RNN一个输出的大小 128
学习速率 1 e - 3
辍学率 0.5
l2_weights 0.01
代码嵌入大小 128

一个RNN:循环神经网络。

输入特性

在对数据集的回顾性回顾中,每个人都可能在9年内有多次到该医院的临床记录(住院/门诊)。每个临床记录都被设定为一个分析单位。对于每一个临床记录,信息被提取并分组为输入和目标特征(见表2而且3.).输入特征包括以下五个主要组:

  1. 病历由五种编码组成,临床病历中的所有编码都映射到40多万个临床概念。可从该组确定当前记录中患者的健康状况。
  2. 人口统计包括目标患者的年龄、性别和信息。
  3. 护理场所信息包括患者接受治疗的临床机构信息。
  4. 记录统计数据提供了有关记录的长度(按天计算)、每种国际疾病分类(ICD)代码类别中的代码数量以及所涉及的总货币成本的信息。这可以帮助模型在记录水平上估计患者疾病的严重程度。
  5. 历史信息描述了以前的住院和入院情况。在我们的模型中,它被用来估计患者的整体健康状况。
表2。模型输入特征的总结。
组和特性名称 功能描述
医疗记录

诊断 来自健康记录的诊断代码 128

程序 健康记录中的程序代码 128

药物 健康记录上的药物代码 128

测试 健康记录上的实验室测试代码 128

其他 健康记录中的其他代码 128
人口统计资料

索赔类型 住院或门诊病人 2

年龄 参加活动的年龄 1

性别 男性或女性 2
护理场所信息

护理场所类型 站点类型(公共、企业或私人) 21

护理场所专业化 医疗中心、社区医院、地区医院、地区医院或诊所 5

护理站点排名 护理场所的等级 17
记录统计

住院 当前住院时间 1

总成本 五种ICD的货币成本一个代码 5

总菌数 五个ICD代码的计数 5
历史信息

过去住院时间 一个人在3、6、12和24个月内住院的天数 4

过往入场次数 一个人在3、6、12和24个月内住院的次数 4

一个国际疾病分类。

表3。预测目标总结。
组和特性名称 功能描述
主要目标

死亡率 该事件是否会导致(1至30天内)另一起死亡事件 1

重新接纳 该事件是否会导致(1至30天内)另一次再入院事件 1

目标

研究人员设定了30天的阈值,以预测患者是否会在30天内死亡或重新入院。当患者有住院或门诊死亡记录或在IHCA后病危出院时,定义死亡率。对于再入院,预测患者是否在出院后1 - 30天内再入院。与其他死亡率研究相比,我们的研究排除了有死亡率的记录(0天死亡率记录)。这种策略的主要目的是减少这些记录中特征的“泄漏”。我们的初步结果显示,死亡率记录的特征通常包含明确表明患者死亡率的信息(如呼吸衰竭)。事实上,这些特征是预测死亡率的重要因素。然而,这类病例对我们的模型并不有利,因为这些患者病情严重,很难进行任何干预治疗。此外,这些特征与死亡率的高度相关性会导致模型依赖于它们而低估其他潜在的预测因素。为避免漏失,使模型关注其他预测因素,将死亡记录设为阴性类,既往死亡记录(30天内)设为阳性类。

在临床实践中,患者IHCA和出院后30天的结局是非常有趣的。心脏骤停后30天死亡率或再入院率(CA;ca -死亡率/ ca -再入院)是30天死亡率或再入院的子集。在本文的其余部分,all -mortality/ all -再入院将用于表示所有记录的30天死亡率或再入院。CA死亡率/CA再入院是指CA后30天的死亡率或再入院(图2).

图2。ALL/ ca死亡率和ALL/ ca再入院率。心脏骤停后30天死亡和再入院的3种情况。红色的事件是我们想要预测的结果。全部死亡率:所有记录后30天死亡率;全部再入院:所有记录后30天再入院;CA:心脏骤停;ca死亡率:心脏骤停记录后30天死亡率;ca再入院:心脏骤停记录后30天再入院。
查看此图

全癌死亡率/全癌再入院比CA死亡率/CA再入院更常见,因为大多数人在第一次CA事件后无法存活。这意味着当我们想要预测一个CA康复患者的未来结果时,我们没有足够的阳性病例进行分析。

层次矢量器

每条记录被构造成一个707维向量,用于进一步训练。基于表1,除ICD代码特征(文本特征)外,所有特征都可以用一次性编码向量化。ICD编码特征直接从健康记录中提取。利用医学知识嵌入系统Text2Node将文本特征嵌入向量[18].ICD代码的五个类别中的每一个类别都可以包含来自单个记录的多个ICD代码,并且所有代码被添加在一起作为给定类别的单个代码(参见图3作为一个例子)。Text2Node从大量的医学知识库中训练而来,可以有效地将文本医学概念转化为潜在空间,同时保留相似概念之间的关系。

图3。Text2Node嵌入示例[18]以及在临床记录中嵌入诊断代码。暗:维度;国际疾病分类。
查看此图

对于每个临床记录,通过将所有特征向量分层地连接到组向量(见图4),得到临床记录载体。在根据日期对每个临床记录向量进行排序后,使用时间序列技术训练一个模型来预测每个记录的结果。

图4。特征拼接生成临床记录向量用于时间序列分析。国际疾病分类;Vec:向量。
查看此图

模型架构

深度循环神经网络(RNNs)已被证明是预测时间序列数据的强大工具。在临床研究中,使用rnn特别是长短期记忆(LSTM)进行临床预测已被广泛研究[19-21].受到崔的启发[19],我们提出了一个基于LSTM网络的HVec模型(图5).在这个框架中,记录编码器是一个完全连接的层,它为每个临床记录独立生成记录嵌入。记录嵌入是一个潜在的载体,它包含了代表当前临床记录的所有信息。这个潜在向量被用作LSTM的输入来更新人向量(即患者状态)。然后用这个人向量来预测我们的目标。

图5。使用LSTM网络的HVec模型。HVec:层次向量化器;LSTM:长短期记忆;Vec:向量。
查看此图

然而,大多数先前的研究都是基于一个相对平衡的数据集。正如我们前面指出的,ca死亡率/ ca再入院率的分布是极其不平衡的。使用极度不平衡的数据集训练LSTM网络总是具有挑战性的,因为如果没有精心设计的训练策略,模型可能会有偏差(即预测所有记录的负类)。为了解决这个问题,提出了两种不同的训练策略来缓解训练步骤中的模型偏差:

  1. 引入多任务学习框架,将多个相关学习任务结合起来,使梯度正则化,缓解训练过程中的数据不平衡问题。
  2. 在个体水平上,CA死亡率/CA再入院记录被上抽样,在记录水平上,CA记录被赋予更高的权重。

多任务学习

提出了多任务学习框架,并在HVec输出中添加了几个辅助相关任务(图6).在这个框架中,主要功能是死亡率和再入院率。这里,我们没有将每个主要任务输出分别划分为ALL-mortality/ all -再入院和CA-mortality/ ca -再入院,而是认为输出涵盖了两者,因为后者是前者的子集。尽管分布不同,但它们仍然可以通过提出的人员上抽样和CA记录加权(在下一节中描述)同时实现。受之前研究的启发[22],引入三个辅助自编码器任务来帮助模型学习嵌入(图6).还引入了两个自监督回归任务,以允许嵌入“记住”当前成本并预测未来成本。此外,考虑到我们在之前的分析中观察到IHCA与死亡率的相关性,我们实施了另一个分类任务来预测记录是否为IHCA记录。

为了监测不同任务的梯度,用辅助任务规范学习过程,采用了Du等的定理1 [23].

定理1给定任意梯度向量场G(θ(t)) =∇θ(θ)(1)表示主要任务和一个任意矢量场V(θ)(t))表示来自另一个辅助任务的梯度,更新策略使用:

θ(t + 1): =θ(t)(t)(G(θ(t)) + v (θ(t)) + max (0, cos(G(θ(t)), V(θ(t))))(2)

用适当的可以覆盖到局部最小。

根据这一定理,HVec可以对大数据集进行学习和收敛。

图6。多任务学习的多输出。和:累积;Emb:嵌入;急诊室:急诊室;住院时间:住院时间;国际疾病分类;IHCA:院内心脏骤停;有限公司:信息;LSTM:长短期记忆; Stats: statistics; Vec: vector.
查看此图

人员上抽样和CA记录加权

虽然在多任务学习中可以监测来自不同任务的梯度,但对于严重不平衡的数据集(例如CA-mortality),辅助任务可能无法正则化主要任务。当我们训练HVec模型时,一个人的所有记录都被视为单个连续记录,并一起输入模型。因此,在每批中,批大小等于该批中的人数。与所有记录的数量相比,每个人的CA记录数量相对较少。与all死亡率和all再入院率相比,ca死亡率和ca再入院率较低。

加权策略[24]从两个角度解决了这一问题:在个体层面,每批有ca死亡率/ ca再入院记录的患者都有向上抽样(见图7);在记录水平上,赋予CA记录更高的权重,以使目标函数对CA死亡率/CA再入院记录更敏感。对有ca死亡/ ca再入院记录的患者进行抽样,可以保证在个人层面上有更多的ca死亡/ ca再入院记录[25].

为CA记录分配更高的权重也可以通过相应修改损失函数来强调训练过程中的CA记录。考虑N-loss函数{L1L,…N}对应于辅助任务,损失函数可写成(3)。

在哪里(4)是一个函数,如果括号中的语句为真,则等于1,否则为0;wpos而且w负的分别为正类权重和负类权重。结合公式1中的梯度更新策略,HVec可以有效地从极度不平衡的数据集中学习。

图7。人upsampling。
查看此图

概述

在过去的9年里,从NHIRD中总共提取了168,693名患者和4,622,079份临床记录,其中3,052,601份记录(牙医记录、传统医学记录或当地诊所记录)被排除,因为这些记录集中在重复的条件下,主要是给机器学习模型添加了噪声(图8).

图8。研究队列的CONSORT图。全部死亡率:所有记录后30天死亡率;全部再入院:所有记录后30天再入院;CA:心脏骤停;CA死亡率:CA记录后30天死亡率;CA再入院:CA记录后30天再入院;IHCA:院内心脏骤停。
查看此图

清理后的数据库中有1,569,478份临床记录,包括住院和门诊记录,来自168,693名至少经历过一次IHCA事件的患者(平均每人记录数量:9.30,SD为10.90)。结果表明数据集不平衡,其中最不平衡的任务是ca死亡率,比率为0.53%。研究人群的特征总结在表4.共有173345份IHCA记录(占总临床记录的11.04%),平均每人1.02份IHCA记录。数据集中患者年龄从0岁(新生儿)到118岁(平均年龄68.66岁,标准差18.96岁),其中女性104691例,男性64002例。总体而言,164322例(97.4%)患者仅发生过一次CA, 4174例(2.4%)患者发生过两次CA,只有197例(0.2%)患者发生过两次以上CA。87,311例患者死亡(死亡率为51.75%)。在这87,311例患者中,82,225例患者在首次住院期间死亡(94.17%;图9).

表4。研究人群特征。一个
特征 研究人群(N=168,693)
年龄(年),平均值(SD) 68.66 (18.96)
性别(男性),n (%) 64002 (37.9)
人均纪录数字,平均值(SD) 9.30 (10.90)
心脏骤停频率n (%)

1 164322 (97.4)

2 4174 (2.4)

≥3 197 (0.2)
死亡率,n (%) 87311 (51.75)

一个连续变量表示为平均值(SD),分类变量表示为数量(占研究人群的百分比)。

图9。年龄和死亡率统计数据集。CA:心脏骤停。
查看此图

实验一:单任务学习与多任务学习

本实验未采用人员上抽样和事件加权。模型性能总结在表中5而且6

表5,多任务学习可以在AUROC和F1评分方面改善all -死亡率和ca -死亡率的模型性能。基于单任务和多任务结果,与ALL-mortality task相比,极度不平衡的CA-mortality task在性能上有相对较高的改进。但由于比例不平衡,精度相对较低,这也影响了F1的得分。此外,ca死亡率的F1评分太低,不适合实际应用。

表5所示。ca死亡率和all死亡率的单任务和多任务学习性能。一个
死亡率 CA-mortality ALL-mortality

AUROCb F1 精度 回忆 AUROC F1 精度 回忆
单任务操作学习 0.658 0.014 0.010 0.024 0.663 0.130 0.101 0.180
多任务学习 0.752 0.049 0.041 0.060 0.711 0.147 0.093 0.349

一个CA死亡率:心脏骤停死亡率(CA记录后30天死亡率);全部死亡率:所有记录后30天死亡率。

bAUROC:接收机工作特性下的面积。

表6多任务学习对再入院预测的改善没有对死亡率预测的改善那么显著。此外,在ca -再入院预测中,F1评分和精度降低。

表6所示。ca重新入学和all重新入学的单任务和多任务学习性能。一个
重新接纳 CA-readmission ALL-readmission

AUROCb F1 精度 回忆 AUROC F1 精度 回忆
单任务操作学习 0.847 0.214 0.162 0.315 0.872 0.554 0.424 0.801
多任务学习 0.852 0.209 0.152 0.335 0.889 0.562 0.430 0.811

一个CA再入院:心脏骤停再入院(CA记录后30天再入院);全部再入院:所有记录后30天再入院。

bAUROC:接收机工作特性下的面积。

在本实验中,与单任务学习相比,多任务学习在ALL-mortality和ALL-readmission方面表现更好。然而,多任务学习无法解决极度不平衡的数据集。

实验二:提高CA预测性能

实验1表明,由于数据集极度不平衡,基于ca死亡率和ca再入院数据,模型难以做出良好的预测。在本实验中,我们证明了通过应用人员上抽样和事件加权,我们可以进一步提高ca -死亡率和ca -再入院的表现,而不会显著影响all -死亡率和all -再入院。在我们的实验中,上采样率表示在一批中对阳性类别(ca死亡或ca再入院患者)进行了多少次上采样,上采样率为1意味着我们没有进行上采样。CA事件权重表示损失的权重wpos在方程3中,我们总是设w负的= 1。我们在实验中使用了不同的上采样率和事件权重。我们的结果总结在表格中7而且8,包括先前关于单任务模型性能的结果(每个表的第一行)。

总的来说,与30天死亡率任务相比,不平衡的30天死亡率任务在应用平衡技术时表现出更大的性能提升。如表7,在上抽样和事件加权后,模型对all死亡率和ca死亡率都表现出改善。对于ca死亡率,F1评分增加了36.7%(从0.049增加到0.067)。

表7所示。死亡率模型及其各自的超参数配置及其在预测ca死亡率和all死亡率方面的表现。一个
死亡率 CA-mortality ALL-mortality
Upsampling率 事件的重量 多任务 AUROCb F1 AUROC F1
1 1 没有 0.658 0.014 0.663 0.130
1 1 是的 0.752 0.049 0.711 0.147
10 1 是的 0.808 0.064 0.728 0.155
10 5 是的 0.802 0.067 0.726 0.158

一个CA死亡率:心脏骤停死亡率(CA记录后30天死亡率);全部死亡率:所有记录后30天死亡率。

bAUROC:接收机工作特性下的面积。

与all -死亡率和ca -死亡率相似,应用这两种技术后,all -再入院和ca -再入院的AUROC和F1评分都有所增加。基于的结果表8,在ca再入院预测中实现了微小但一致的增加。然而,all再入院预测没有显著改善。这是因为对于一个更加平衡的数据集,上抽样和事件加权不会对学习过程产生很大影响。

表8所示。再入院模型及其各自的超参数配置及其在预测ca -再入院和all -再入院中的性能。一个
重新接纳 CA-readmission ALL-readmission
Upsampling率 事件的重量 多任务 AUROCb F1 AUROC F1
1 1 没有 0.847 0.214 0.872 0.554
1 1 是的 0.852 0.209 0.889 0.562
5 1 是的 0.861 0.230 0.884 0.555
5 5 是的 0.862 0.237 0.884 0.555

一个CA再入院:心脏骤停再入院(CA记录后30天再入院);全部再入院:所有记录后30天再入院。

bAUROC:接收机工作特性下的面积。

综上所述,结果表明,多任务学习、上采样和事件加权可以有效地提高模型对不平衡数据集的预测性能。我们还表明,这些技术可以共同用于一个极端不平衡的数据集,以获得更好的结果。


在这项研究中,我们构建了一个大型患者数据库,其中包括超过16.8万名IHCA患者9年的电子病历,可用于未来IHCA相关研究。此外,我们开发了一个HVec模型(LSTM模型),该模型使用多任务学习策略来预测30天的死亡率和再入院率。

结果表明,我们的模型可以成功地预测IHCA患者的未来死亡率和再入院数据。在本研究中,我们提出了个人上抽样和记录加权策略来处理极度不平衡的数据问题。应用这些技术后,在ca死亡率和ca入院预测方面取得了一些改进。

与其他使用深度学习模型预测CA后另一个IHCA事件的研究相反[26],我们的研究重点是预测IHCA患者出院后的未来结局。据我们所知,这是第一个通过机器学习预测IHCA事件后死亡率和再入院率的研究。该模型可作为IHCA患者的监测系统。在不久的将来有高死亡率或再入院风险的患者可以在出院前进行识别和重新评估。该研究还证明了另一种模型的潜力,即在使用以前的电子病历记录(ALL-mortality/ all - remission)后预测未来的死亡率和再入院率。该模型可能有助于识别住院和门诊情况下的高风险人群。然而,与本研究中选择的患者相比,普通人群的死亡率和再入院率有所不同。利用医院电子病历和NHIRD中的患者信息,我们可以构建一个基于机器学习方法的实时警报系统,以预测IHCA幸存者的不良事件,并改善他们的预后。需要进一步的前瞻性研究来验证该系统在一般人群中的效用。

一些研究报告了预测CA患者预后的模型[8].在对现有预测模型的系统回顾中,AUROC值中位数为0.84,IQR为0.80至0.89 [8].Chan等人报道,对于IHCA幸存者,院内复苏后心脏骤停生存(CASPRI)评分可用于预测出院后良好的神经预后[3.].CASPRI评分的AUROC为0.80。Nanayakkara等人使用深度学习模型预测CA幸存者的IHCA事件,AUROC为0.87 [26].在我们的研究中,我们遇到了数据不平衡的困难。使用适当的学习策略,我们获得了类似的AUROC值(ca死亡率0.808,ca再入院率0.862)。但由于数据不平衡,本研究的查全率和查准率较低。这是我们要解决的挑战。在使用历史医疗记录预测结果时,在许多情况下,记录包含可能表明结果的信息。例如,危急诊断和抢救药物往往与死亡率有关。包含这些类型的信息可以促进训练,并提供较高的AUROC和F1;然而,模型本身的用途有限。在我们的研究中,为避免过拟合,将死亡率记录设置为负类。 In further studies, the model may be improved by adjusting the threshold to optimize the trade-off between specificity and sensitivity.

在我们的HVec框架中,我们将每个人的ehr编码为两个潜在向量级别(记录级和人级),并确保模型同时使用无监督自编码器策略进行学习。这些潜在载体的预测结果是有希望的。这两个层面的潜在病媒可能被进一步探讨,以促进临床医生的决策和提供更好的临床干预。此外,人载体可作为生物标志物,在医疗保健环境之外评估一个人的整体健康状况。以及一些最近开发的模型,如深度病人[22]和MixEHR [27],我们表明,使用深度神经网络从电子病历中提取信息可能解决复杂的临床研究问题。

数据分布不平衡在临床研究中很常见,特别是在与疾病相关的预测中。与常见疾病相比,许多重要疾病缺乏阳性病例,难以培养出好的模型。在之前的研究中[19],作者试图通过使用平衡的分布式数据集来解决这个问题,并使用平衡的数据集训练深度学习模型。同样,在这项涉及ca死亡率和ca再入院率的研究中,我们证明了通过仔细设计模型学习策略(如多任务学习和上抽样),可以用机器学习模型有效地解决临床研究中的一些常见问题。

本研究有一定的局限性。首先,IHCA队列是从NHIRD中回顾性提取的。需要进一步的研究来评估该模型作为早期预警系统的有效性,并确定该系统如何影响患者的结果。其次,由于我们的模型是基于NHIRD开发的,因此没有证明该模型对其他健康保险数据集的泛化。第三,由于研究设计的原因,没有将每位患者的生命体征和实验室数据纳入分析。电子病历和患者临床数据的结合可能会进一步提高模型的性能。第四,传统的机器学习方法存在可解释性的局限性。在本研究中,30天死亡率/再入院的具体危险因素尚不清楚。在未来的研究中,我们计划建立一个可解释的模型,并研究模型中的具体预测因素。

总之,我们的模型在预测IHCA后30天死亡率和再入院方面表现良好,可以帮助临床医生更好地监测CA患者的状态。我们的目标是为临床医生提供更多的前瞻性干预建议。然而,深度学习模型的解释能力仍然存在挑战。我们未来的工作将主要集中在使用电子病历训练的模型的解释能力。

致谢

本研究由台湾科技部资助(项目编号:109-2634-F-002-031)。CYC、YLH、CHH参与数据收集。SA、AW、KCF和JX参与构建深度学习模型。CYC和SA对这篇文章贡献均等,并起草了文章。最后,YLH, CHH, RS做了最后的修改。YLH, CHH和RS作为通讯作者贡献相同。所有作者都同意这篇文章的最终版本。

利益冲突

没有宣布。

  1. Writing GM, Mozaffarian D, Benjamin EJ, Go AS, Arnett DK, Blaha MJ,等。心脏病和中风统计-2016更新:来自美国心脏协会的一份报告。发行量2016年1月26日;133(4):e38-e360。[CrossRef] [Medline
  2. 王超,黄超,常伟,蔡敏,于平,吴勇,等。针对性体温管理治疗成人住院心脏骤停的结果:一项回顾性队列研究PLoS One 2016;11(11):e0166148 [免费全文] [CrossRef] [Medline
  3. Chan PS, Spertus JA, Krumholz HM, Berg RA, Li Y, Sasson C,接受指南-复苏登记调查员。一种有效的预测工具,用于医院内心脏骤停的初始幸存者。Arch Intern Med 2012 Jun 25;172(12):947-953 [免费全文] [CrossRef] [Medline
  4. Holmberg MJ, Moskowitz A, Raymond TT, Berg RA, Nadkarni VM, Topjian AA,美国心脏协会的指南-复苏调查员。儿科住院心脏骤停初始幸存者死亡率预测工具的推导和内部验证。儿科危重症护理医学2018年3月;19(3):186-195 [免费全文] [CrossRef] [Medline
  5. Chan PS, Nallamothu BK, Krumholz HM, Spertus JA, Li Y, Hammill BG,美国心脏协会获得指南-复苏调查员。院内心脏骤停老年幸存者的长期结局N Engl J Med 2013年3月14日;368(11):1019-1026 [免费全文] [CrossRef] [Medline
  6. 谢丽丽,马佩拉,朱奇曼斯,朱丽娜,等。OHCA(院外心脏骤停)和CAHP(心脏骤停医院预后)评分用于预测院内心脏骤停后的结果:来自多中心登记的见解复苏2020年11月;156:167-173。[CrossRef] [Medline
  7. 钟超,赵伟,黄艳,陈玲,洪超,赵华。利用人工神经网络识别住院心脏骤停的预后因素并建立准确的预后预测。中华神经科学杂志2021年6月15日;425:117445。[CrossRef] [Medline
  8. Carrick RT, Park JG, McGinnes HL, Lundquist C, Brown KD, Janes WA,等。心脏骤停的临床预测模型:当前科学调查和模型性能分析。JAHA 2020 8月18日;9(16):e017625。[CrossRef
  9. Jansen JO, Cuthbertson BH。在ICU之外检测危重疾病:跟踪和触发系统的作用。Curr Opin Crit Care 2010 Jun;16(3):184-190。[CrossRef] [Medline
  10. Smith GB, Prytherch DR, Schmidt PE, Featherstone PI。综合加权“跟踪和触发”系统的审查和性能评估。复苏2008年5月;77(2):170-179。[CrossRef] [Medline
  11. 高H, McDonnell A, Harrison DA, Moore T, Adam S, Daly K,等。系统的回顾和评估生理轨迹和触发预警系统,以识别病房中的高危患者。重症监护医学2007年4月;33(4):667-679。[CrossRef] [Medline
  12. Sharpley JT, Holden JC。在某区综合医院建立预警评分系统。护理危重症护理2004;9(3):98-103。[CrossRef] [Medline
  13. Priestley G, Watson W, Rashidian A, Mozley C, Russell D, Wilson J,等。引入重症监护外展:一项综合医院分阶段引入的病房随机试验。重症监护医学2004七月;30(7):1398-1404。[CrossRef] [Medline
  14. Chan PS, Nallamothu BK, Krumholz HM, Curtis LH, Li Y, Hammill BG,美国心脏协会指南-复苏调查员。住院心脏骤停幸存者的再入院率和长期住院费用Circ cardiovascular qualal Outcomes 2014 11月;7(6):889-895 [免费全文] [CrossRef] [Medline
  15. 森田Y, Haruna T, Haruna Y, Nakane E, Yamaji Y, Hayashi H,等。美国住院心肺复苏后30天再入院的发生率、预测因素、原因和费用复苏2019年1月;134:19-25。[CrossRef] [Medline
  16. 谢超,苏超,邵松,宋松,林松,高阳勇,等。台湾国民健康保险研究资料库:过去与未来。临床流行病学2019;11:349-358 [免费全文] [CrossRef] [Medline
  17. DeZorzi C, Boyle B, Qazi A, Luthra K, Khera R, Chan PS,等。识别心脏骤停患者的行政计费代码。中国心血管病杂志2019年4月02日;33 (12):1598-1600 [免费全文] [CrossRef] [Medline
  18. Soltani R, Tomberg a . Text2node:用于将任意短语映射到分类法的跨域系统。出来了。2019年4月11日。URL:https://arxiv.org/abs/1905.01958v1[2019-04-11]访问
  19. 崔e, Bahadori MT, Schuetz A, Stewart WF,孙j .医生AI:通过循环神经网络预测临床事件。JMLR Workshop Conf Proc 2016 Aug;56:301-318 [免费全文] [Medline
  20. 陈凯,陈国强,李志强,等。可扩展和精确的深度学习与电子健康记录。NPJ数字医学2018;1:18 [免费全文] [CrossRef] [Medline
  21. Shickel B, Tighe PJ, Bihorac A, Rashidi P.深度EHR:用于电子健康记录分析的深度学习技术的最新进展。IEEE生物医学健康信息2018年12月;22(5):1589-1604。[CrossRef] [Medline
  22. Miotto R, Li L, Kidd BA, Dudley JT。深度患者:从电子健康记录预测患者未来的无监督表示。科学报告2016年12月17日;6:26094 [免费全文] [CrossRef] [Medline
  23. 杜杨,蔡尔内基,贾雅库玛,帕斯卡努R, Lakshminarayanan B.基于梯度相似度的辅助损失自适应。arXiv 2018 12月5日1812 [免费全文
  24. 何海波,从不平衡数据中学习。IEEE知识数据学报2009年9月21日(9):1263-1284。[CrossRef
  25. ErtekinŞ。自适应过采样在不平衡数据分类中的应用。入职:格伦贝E,伦特R,编辑。信息科学与系统,2013。电气工程课堂讲稿,第264卷。可汗:施普林格;9月24日,2013:261-269。
  26. Nanayakkara S, Fogarty S, Tremeer M, Ross K, Richards B, Bergmeir C,等。利用机器学习描述心脏骤停后住院死亡风险:一项回顾性国际注册研究PLoS Med 2018 11月;15(11):e1002709 [免费全文] [CrossRef] [Medline
  27. 李勇,奈尔平,吕晓华,文忠,王勇,Dehaghi AAK,等。从电子健康档案中推断多模态潜在主题。Nat Commun 2020年5月21日;11(1):2536 [免费全文] [CrossRef] [Medline


AUROC:接收机工作特性下的面积
CA:心脏骤停
CASPRI:院内复苏后心脏骤停存活情况
心肺复苏:心肺复苏术
电子健康档案:电子健康记录
ETL:提取、转换和加载
HVec:分层vectorizer
ICD:国际疾病分类
IHCA:院内心脏骤停
LSTM:长短期记忆
NHIRD:全国健康保险研究数据库
OHCA:院外心脏骤停
RNN:循环神经网络
TTS:track-and-trigger系统


R·库卡夫卡编辑;提交08.02.21;A Ćirković, W Yang, SF Sung, B Richards同行评审;对作者15.03.21的评论;修订版本于09.05.21收到;接受21.07.21;发表13.09.21

版权

©池建宇,奥爽,Adrian Winkler,傅宽春,徐洁,何益伦,黄建华,Rohollah Soltani。最初发表于医学互联网研究杂志(//www.mybigtv.com), 2021年9月13日。

这是一篇开放获取的文章,根据创作共用署名许可(https://creativecommons.org/licenses/by/4.0/)的条款发布,允许在任何媒介上无限制地使用、分发和复制,前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。


Baidu
map