这是一篇开放获取的文章,根据创作共用署名许可(https://creativecommons.org/licenses/by/4.0/)的条款发布,允许在任何媒介上无限制地使用、分发和复制,前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。
电子病历中的序贯信息对患者预后预测有重要价值和帮助,但由于其不均匀性、不规则性和异质性,很少用于患者相似度的测量。
我们的目标是开发一个患者相似度框架,用于患者结局预测,该框架利用了电子病历系统中的顺序和横断面信息。
使用编辑距离从时间戳事件序列计算序列相似度,使用动态时间翘曲和Haar分解从时间序列计算趋势相似度。我们还提取了横断面信息,即人口统计学、实验室检测和放射报告数据,用于额外的相似性计算。我们通过构建k -最近邻分类器来预测急性心肌梗死患者的死亡率和再入院率,验证了该框架的有效性,使用来自(1)公共数据集和(2)私人数据集的数据,在入院、第7天和出院3个时间点提供早期预警患者结局。我们还构建了最先进的欧几里得距离k近邻、逻辑回归、随机森林、长短期记忆网络和循环神经网络模型,用于比较。
在住院期间的所有可用信息中,使用相似模型的预测模型优于基于公共和私有数据集的基线模型。对于死亡率预测,除逻辑回归模型外,所有模型都显示随着时间的推移性能有所改善。在再入院预测的预测表现上没有这种增加的趋势。当使用入院后第一周的信息时,随机森林和逻辑回归模型分别在死亡率和再入院预测方面表现最佳。
对于患者结局预测,患者相似度框架有助于对不均匀的电子病历数据进行顺序相似度计算,并有助于提高预测性能。
近年来,个性化医疗和临床决策支持已成为热门问题和研究热点,如利用电子病历建模辅助临床医生诊断疾病[
以往的研究[
不幸的是,与典型的现实数据一样,电子病历数据通常是异构的、不规则的和不均匀的,这对建模和度量相似性提出了挑战[
因为很少有分析[
在中国,急性心肌梗死患者数量预计将从2010年的800万增加到2030年的2300万[
研究流程:(a)时间戳事件序列和时间序列数据的顺序相似度计算,(b)横断面信息的相似度计算,(c)基于a和b部分计算的相似度加权和的患者相似度测量,(d)验证。AMI:急性心肌梗死;kNN:基于患者相似度测量的k-最近邻;然而,Eucli:基于欧氏距离的k近邻;LR: logistic回归;RF:随机森林;RNN:循环神经网络;LSTM:长短期记忆网络;DTW:动态时间扭曲。
时间戳事件序列和实验室测试时间序列数据均用于计算序列相似性。实验室测试数据有助于序列相似性计算,同时从多个测试值计算趋势相似性。
一个病人临床轨迹的案例研究。所有临床事件,包括实验室检查、放射检查和程序,均根据患者时间顺序列出。每项实验室测试的多重值组成时间序列数据,如图右侧折线图所示。
事件是对患者进行的临床过程,如血糖测试、放射学检查(如彩色超声)或手术(如经皮冠状动脉介入)。对于一系列具有时间戳信息的临床事件,称为事件序列
编辑距离用于计算两个事件序列之间的相似性,该相似性基于将一个序列转换为另一个序列所需的工作量[
例如,为了序列
对事件序列的序列相似度为
在哪里
时间序列相似性
在临床领域,时间序列可以定义为生物信号值的一致的单向变化,因此与患者状态的演变有关[
趋势相似度
在哪里
我们还采用了Haar小波分解方法来评估相似度。基于Haar小波的方法高度依赖于时间序列长度;因此,线性插值可以保证时间序列满足长度要求。采用离散Haar小波分解,每个时间序列由多个Haar小波基表示(图S3)
在哪里
使用动态时间翘曲或基于Haar小波分解计算实验室测试的多个测试值之间的趋势相似性。
横断面信息包括人口统计学特征(年龄、性别、薪酬类型和婚姻状况)、仅在入院时进行的实验室检查以及胸部x光和彩色超声检查的免费文本报告。
人口学特征向量以0或1表示
我们计算了仅在入院时进行的基于欧几里得距离的实验室测试的相似性。这些横断面实验室测试的特征相似性(S
自由文本报告在公共数据集中是英文的,在私人数据集中是中文的。对于中文报告,我们进行了三个步骤来提取特征:兴趣语料库构建、分词和特征重建(图S4)
患者相似度评分为特征相似度加权和。我们确定了主要特征,并为其分配了更大的权重,并将其余特征的权重设置为0。死亡率或再入院风险预测任务分别分配权重。当使用在该特征上计算的相似性来确定死亡或再入院预测的最近邻居时,该特征的重要性由预测性能确定。性能越好,特性的重要性就越高。例如,根据权重确定的样本集,预测指标患者的死亡风险为其top中结局状态发生的概率
我们通过多数投票方案确定了3个主要特征,它们具有最高的受试者工作特征曲线下面积(AUROC)值。我们优化了特征权重
我们做了几个
我们比较了预测性能
基于不同患者相似度构建基于相似度的预测模型。
使用相似 |
|
|
|
|
|
||||||
|
|
|
|
|
|
||||||
|
|
是的 | 是的 | 是的 | 没有 | 没有 | |||||
|
|
是的 | 是的 | 是的 | 没有 | 没有 | |||||
|
|
是的 | 是的 | 是的 | 没有 | 没有 | |||||
|
|
|
|
|
|
||||||
|
|
是的 | 没有 | 没有 | 是的 | 没有 | |||||
|
|
没有 | 是的 | 没有 | 没有 | 是的 | |||||
横断面信息相似性( |
是的 | 是的 | 是的 | 是的 | 是的 |
我们比较了每种方法的预测性能
我们通过试错的方法寻找模型的最优参数。最后,我们设置
由于我们的目的是提供早期预警,以便及时干预和调整治疗,因此将入院、第7天和出院3个时间点作为指标时间点。每个指数时间点的所有可用信息用于确定患者相似性并建立预测模型。为了确保稳健性,我们独立地运行了100次预测过程,并平均了性能。如果模型A的表现优于模型B至少95倍,则认为模型之间的表现差异具有统计学意义。采用AUROC和f1评分作为主要指标,同时计算精密度、敏感性和特异性。
我们使用了可免费获取的重症监护数据库重症监护医疗信息集市(mimi -III) [
本研究共纳入3010例主要诊断为国际疾病分类第九版修订代码410.01至410.91的患者。我们提取了入院时的年龄、性别、付款类型、婚姻状况、42项实验室检查(23个离散时间序列和19个横断面项目)、程序和放射报告(34个文本特征;表S2
本研究使用的电子病历数据来自中国北京某三级医院2014年至2016年的出院住院患者记录。个别住院记录被识别并作为唯一记录保存。总的来说,1846名主要诊断符合国际疾病分类(第十版)代码I21和I22的患者被纳入研究。在实验室检测中,103项实验室检测被用作横断面信息(入院时)。到第7天,27个实验室测试有2个或更多的测试值,其余的被用作横断面信息。在放电时,分别将63和40个实验室测试项目作为时间序列和横截面信息处理。对于放射报告,一组36个文本特征(表S2)
对于两组数据,很少有患者在入院后第一周进行胸部x线或彩色超声检查;因此,在使用入院后第一周之前的信息时,没有从放射报告中提取文本特征进行进一步的相似度计算。包括放射检查的事件序列也被排除在序列相似性计算之外,因为入院时发生的事件很少。此外,当对第7天进行预测时,共有164名住院时间少于7天的患者被排除在训练样本集中。使用住院期间的患者信息,将任何住院时间的患者包括在预测中。在私人数据集中,分别只有33名和52名患者在30天和90天内再次入院。因此,不需要时间来确定再入院。
急性心肌梗死患者在MIMIC-III数据集和私人数据集的基本特征。
特征 | mimi - iii数据集(n=3010), n (%) | 私有数据集(n=1846), n (%) | |
|
|
|
|
|
年龄≥60岁 | 2408 (80.0) | 1131 (61.3) |
|
男性的性别 | 1855 (61.6) | 1343 (72.8) |
|
结婚了 | 1583 (52.6) | 1815 (98.3) |
|
|
|
|
|
城镇职工基本 | N/A一个 | 1422 (77.0) |
|
医疗保险 | 2030 (67.4) | N/A |
|
|
|
|
|
实验室测试 | 1044886 (347) | 349563 (189) |
|
放射学检查 | 19171 (6) | 5827 (3) |
|
过程 | 19630 (7) | 13049 (7) |
|
|
|
|
|
急性心肌梗死再入院病例n (%) | 554 (18.4) | 100 (5.4) |
|
全因住院死亡率,n (%) | 245 (8.2) | 132 (7.2) |
|
住院天数,平均(标准差) | 10.0 (6.24) | 11.4 (5.85) |
一个N/A:不适用。
在预测死亡率时,所有
在MIMIC-III数据集上进行100轮独立结果预测的预测性能一个.
模型 | 死亡率 | 重新接纳 | ||
|
AUROCb | F1-score | AUROC | F1-score |
欧氏距离 |
0.756 (0.022) | 0.280 (0.030) | 0.592 (0.019) | 0.332 (0.019) |
逻辑回归 | 0.796 (0.024) | 0.336 (0.037) | 0.608 (0.022) | 0.347 (0.019) |
随机森林 | 0.834 (0.015) | 0.362 (0.033) | 0.579 (0.015) | 0.327 (0.020) |
长短期记忆网络 | 0.809 (0.022) | 0.356 (0.043) | 0.595 (0.020) | 0.339 (0.017) |
循环神经网络 | 0.814 (0.018) | 0.338 (0.039) | 0.590 (0.018) | 0.337 (0.018) |
|
0.816 (0.023) | 0.373 (0.047) | 0.566 (0.022) | 0.315 (0.027) |
|
0.746 (0.026) | 0.295 (0.035) | 0.536 (0.026) | 0.295 (0.048) |
|
0.878 (0.017) | 0.386 (0.041) | 0.623 (0.019) | 0.350 (0.018) |
|
0.882 (0.016) | 0.401 (0.044) | 0.620 (0.018) | 0.350 (0.018) |
|
0.883 (0.015) | 0.406 (0.050) | 0.620 (0.019) | 0.351 (0.019) |
一个均值:标准差。
bAUROC:受试者工作特征曲线下的面积。
热图显示了基于公共数据集(A和B)和私人数据集(C和D)的预测死亡率(A和C)和再入院率(B和D)模型之间的成对比较。每个单元格中的数字是在100次实验后,行中的模型比列中的模型性能更高的次数的百分比。如果数值大于或等于0.95,则认为性能显著提高,并且相应的单元格用颜色高亮显示。然而,Eucli:欧氏距离k -最近邻;然而,D:基于动态时间翘曲(DTW)的趋势相似度(即k -最近邻)的kNND);然而,H:基于haar趋势相似度(即k-nearest neighbor)的kNNH);然而,E: kNN建立在序列相似度(即k-nearest neighbor)上E);然而,嗯: kNN建立在序列相似度和基于haar的趋势相似度(即k-nearest neighbor)的基础上嗯);然而,艾德:基于序列相似度和基于dtw的趋势相似度(即k-nearest neighbor)的kNN艾德);LR: logistic回归;RF:随机森林;RNN:循环神经网络;LSTM:长短期记忆。
在预测死亡率时,
对于再入院预测,
所有预测住院患者死亡率(A和C)和再入院率(B和D)的模型的预测性能,根据受试者工作特征曲线(A和B)下的面积和f1评分(C和D)。星级(☆)表示最高的预测性能。入院时未对LSTM、RNN、KNN进行预测H,然而,D,然而,嗯,和KNN艾德因为当时没有可用的时间信息。然而,Eucli:欧氏距离k -最近邻;然而,D:基于动态时间翘曲(DTW)的趋势相似度(即k -最近邻)的kNND);然而,H:基于haar趋势相似度(即k-nearest neighbor)的kNNH);然而,E: kNN建立在序列相似度(即k-nearest neighbor)上E);然而,嗯: kNN建立在序列相似度和基于haar的趋势相似度(即k-nearest neighbor)的基础上嗯);然而,艾德:基于序列相似度和基于dtw的趋势相似度(即k-nearest neighbor)的kNN艾德);LR: logistic回归;RF:随机森林;RNN:循环神经网络;LSTM:长短期记忆。
预计基于电子病历数据的预测建模将推动个性化医疗和提高医疗质量,许多研究人员试图预测患者的临床结果,如死亡[
电子病案数据中的纵向信息包括有时间戳的事件序列和实验室检测时间序列,由于其丰富的医疗行为和疾病进展信息,对于预后预测具有丰富的信息和价值。然而,这两种类型的序列信息通常都是异构的、不规则的和不均匀的,这在数据预处理、特征提取和相似度测量方面提出了巨大的挑战。因此,我们使用两种策略分别计算时间戳事件序列和实验室测试时间序列的相似度。编辑距离,在分析文本字符串时已被广泛用于测量距离[
对于时间序列,相似性计算主要有两类算法:时域算法和基于变换的方法[
经典的时间序列处理模型,如循环神经网络和长短期记忆网络,无法使用事件序列信息,为了处理不同长度的时间序列,不可避免地要进行截断或0填充。然而,
先前的一些研究评估了模型的性能,并将其与在MIMIC-III数据集上进行的其他实验进行了比较。张等[
早期发现高危患者的终点是了解和改善预后的关键[
为了预测非计划再入院,当使用整个住院期间的所有数据时,我们的模型在两个数据集上表现最好。这一发现充分表明,患者相似性可以显著提高再入院预测的性能。然而,在我们的研究中发现,再入院预测的预测结果并不令人满意,在其他研究中也发现了这一结果[
这项研究有一些局限性。首先,趋势相似度也可以基于时间序列以异常状态的形式计算。这种方法需要在将来进行验证。第二,本研究中使用的患者信息不充分。心电图捕捉急性心肌梗死患者的生命体征和一种可以进行时间相似性计算的纵向信息。但是,私有数据集中没有此信息。因此,在进一步的研究中,应该收集心电图并用于相似度的测量。
在这项研究中,我们提出了一个完整的框架来衡量患者的相似性,使用序列和横断面信息。该方法成功地评估了序列相似性,帮助解决了不均匀电子病历数据相似性计算的挑战,并提高了预测患者结局的性能。
补充材料。
接收机工作特性曲线下面积
重症监护医疗信息集市三
国家自然科学基金(81971707、81671786)和北京市基于大数据的精准医疗先进创新中心(PXM2021_014226_000026)资助。我们非常感谢侯银晶医生(首都医科大学附属同仁医院,中国北京)的临床建议。
没有宣布。