这是一篇开放获取的文章,根据创作共用署名许可协议(http://creativecommons.org/licenses/by/4.0/)的条款发布,允许在任何媒介上不受限制地使用、分发和复制,前提是正确引用首次发表在JMIR生物信息学和生物技术上的原创作品。必须包括完整的书目信息,https://bioinform.www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。
静脉血栓栓塞(VTE)是一种可预防的常见血管疾病,据估计每年影响多达90万人。它与近期手术、癌症和住院等危险因素有关。通过自然语言处理(NLP)可以改善VTE监测对患者的管理和安全。NLP工具能够访问电子医疗记录,识别符合静脉血栓栓塞病例定义的患者,随后将相关信息输入数据库以供医院审查。
我们旨在评估IDEAL-X的VTE识别模型的性能(使用自适应学习的信息和数据提取;埃默里大学(Emory University)的一种NLP工具,通过从2012年至2014年收集的诊断成像记录中“读取”非结构化文本,自动对VTE病例进行分类。
在访问杜克大学和俄克拉何马大学健康科学中心(OUHSC)静脉血栓栓塞试点监测系统的成像记录后,我们使用IDEAL-X的静脉血栓栓塞识别模型对以前手工分类的静脉血栓栓塞病例进行分类。专家们审查了每条记录中技术人员的评论,以确定是否发生了静脉血栓栓塞事件。计算的性能指标(95% ci)包括准确性、敏感性、特异性以及阳性和阴性预测值。采用同质性卡方检验来评估各站点的性能测量差异,显著性水平为0.05。
IDEAL-X的VTE模型“读取”了来自杜克大学的1591条记录和来自OUHSC的1487条记录,总共有3078条记录。综合性能指标的准确性为93.7% (95% CI 93.7% ~ 93.8%),敏感性为96.3% (95% CI 96.2% ~ 96.4%),特异性为92% (95% CI 91.9% ~ 92%),阳性预测值为89.1% (95% CI 89% ~ 89.2%),阴性预测值为97.3% (95% CI 97.3% ~ 97.4%)。杜克大学的敏感性(97.9%,95% CI 97.8%-98%)高于OUHSC (93.3%, 95% CI 93.1%-93.4%;
IDEAL-X的静脉血栓栓塞模型准确地对来自北卡罗来纳州达勒姆和俄克拉荷马城两个独立卫生系统的试点监测系统的静脉血栓栓塞病例进行了分类。NLP是一种很有前途的工具,可用于设计和实施一个自动化的、具有成本效益的VTE国家监测系统。在全国范围内开展公共卫生监测对于衡量疾病负担和预防措施的影响至关重要。我们建议进行更多的研究,以确定如何将IDEAL-X集成到医疗记录系统中,从而进一步自动化监测过程。
静脉血栓栓塞(VTE)包括深静脉血栓形成(DVT)和肺栓塞,是一种常见但可预防的血管疾病。通过对风险评估、预防和治疗采取协调一致的方法,静脉血栓栓塞的疾病负担可以减少[
采用主动或被动方法进行传统静脉血栓栓塞监测具有挑战性,因为国际疾病分类用于识别静脉血栓栓塞的代码已被证明具有中等敏感性和阳性预测价值[
尽管多年来在开发新的数据库和档案格式以保存医疗记录方面取得了进展,但大多数医疗数据仍以非结构化文本的形式存储[
使用自然语言处理涉及的一些关键特性包括预处理[
尽管NLP的领域非常广阔,其特征和能力也在不断增长,但NLP在VTE监测中的应用范围很窄。一个具体的软件- ideal - x(信息和数据提取使用自适应学习;埃默里大学)-在之前的研究中使用非结构化文本从成像记录中识别VTE [
为了评估我们基于机器学习的NLP工具IDEAL-X开发的VTE识别模型的稳健性和适应性,并确定临床环境之间的差异如何影响其性能(作为将NLP应用于国家VTE监测的概念证明),我们在两个独立的医疗保健环境中评估了VTE模型的准确性——一个在北卡罗来纳州达勒姆,另一个在俄克拉荷马城。
杜克大学和俄克拉荷马大学健康科学中心(OUHSC)与疾病控制和预防中心合作,建立了静脉血栓栓塞的试点监测系统[
杜克大学和俄克拉荷马大学健康科学中心的信息收集和分析流程图。CTA:计算机断层血管造影;DVT:深静脉血栓形成;基于自适应学习的信息和数据提取女士:微软;PE:肺栓塞;PHI:个人健康信息;我们:超声波;V / Q:通气/灌注。
这项研究由杜克大学机构审查委员会和OUHSC机构审查委员会审查。这两个实体都认为这项研究不包括对人类受试者的研究,因此不受机构审查委员会的批准。
杜克大学的研究人员使用了北卡罗来纳州达勒姆县三家医院(杜克大学医院、杜克地区医院和达勒姆退伍军人事务医疗中心)VTE监测项目生成的数据集。数据集包括所有818个独立诊断为急性深静脉血栓、肺栓塞或两者均阳性的独特记录(符合监测系统的病例定义)。为了确定总共773个独特的阴性成像记录,研究人员回顾了(1)来自同一队列中也有阳性成像研究的患者的阴性成像记录(例如,来自CT血管造影阳性的患者的下肢超声阴性)和(2)通过VTE监测计划确定但通过手动评估记录确定没有DVT或肺栓塞的患者的阴性成像记录。杜克大学的研究小组手动提取了研究结果和结论
杜克大学数据集中的影像学记录包括(1)上肢超声图像,(2)下肢超声图像,(3)胸部CT血管造影扫描,(4)通气-灌注扫描。
OUHSC的调查人员要求INTEGRIS浸信会医疗中心和INTEGRIS西南医疗中心提供所有来自CT血管造影和压缩超声的成像记录,无论指征如何。据我们所知,这些记录是随机选择的,具有患者群体的代表性。这导致了一个包含1487个独特患者的数据集。OUHSC团队将PDF成像记录(超声和CT记录)转换为纯文本格式。然后,我们使用一种根据记录的格式约定定制的搜索算法来自动定位和划分
我们在本分析中使用的IDEAL-X的VTE识别模型已在埃默里大学之前的研究中使用[
两个研究地点(杜克大学和OUHSC)都将数据转换为IDEAL-X所需的格式,该格式由Microsoft Excel电子表格组成,其中包含以下四列用于数据输入
IDEAL-X的其他汇总输出包括记录总数、敏感性、特异性、真阳性和假阳性的数量以及真阴性和假阴性的数量。此外,对于二项分布数据,使用Clopper-Pearson方法计算95% ci [
杜克大学共收集了1591份影像学记录(上肢超声图像:n=223;下肢超声:n=729例;胸部CT血管造影:n=527;通气-灌注扫描:n=112)。OUHSC共收集了1487条成像记录(压缩超声图像:n=1333;胸部CT血管造影:n=149;通气-灌注扫描:n=5)。这为我们的团队提供了总共3078条记录供IDEAL-X评估。IDEAL-X包含或排除的成像记录数量(根据VTE的病例定义)以及手动复查的记录数量显示在
当按地点分层时,我们发现杜克大学和OUHSC之间的绩效指标在统计上存在显著差异。在杜克大学(
IDEAL-X(使用自适应学习的信息和数据提取)系统识别的符合静脉血栓栓塞病例定义的成像记录的分布与那些通过人工复查(金标准)识别的分布相比。给出了综合分布和按监测点分层的分布。
情况分类 | 通过人工审查进行分类 | |||||||||
|
结合 | 杜克大学 | 的OUHSC一个 | |||||||
|
情况下,n | Noncase n | 总分类,N | 情况下,n | Noncase n | 总分类,N | 情况下,n | Noncase n | 总分类,N | |
|
||||||||||
|
病例由IDEAL-X识别 | 1204 | 147 | 1351 | 801 | 104 | 905 | 403 | 43 | 446 |
|
由IDEAL-X识别的非case | 46 | 1681 | 1727 | 17 | 669 | 686 | 29 | 1012 | 1041 |
|
IDEAL-X总分类 | 1250 | 1828 | 3078 | 818 | 773 | 1591 | 432 | 1055 | 1487 |
|
||||||||||
|
病例由IDEAL-X识别 | 736 | 85 | 821 | 465 | 46 | 511 | 271 | 39 | 310 |
|
由IDEAL-X识别的非case | 28 | 1436 | 1464 | 10 | 431 | 441 | 18 | 1005 | 1023 |
|
IDEAL-X总分类 | 764 | 1521 | 2285 | 475 | 477 | 952 | 289 | 1044 | 1333 |
|
||||||||||
|
病例由IDEAL-X识别 | 403 | 24 | 427 | 274 | 20. | 294 | 129 | 4 | 133 |
|
由IDEAL-X识别的非case | 15 | 234 | 249 | 5 | 228 | 233 | 10 | 6 | 16 |
|
IDEAL-X总分类 | 418 | 258 | 676 | 279 | 248 | 527 | 139 | 10 | 149 |
|
||||||||||
|
病例由IDEAL-X识别 | 65 | 38 | 103 | 62 | 38 | One hundred. | 3. | 0 | 3. |
|
由IDEAL-X识别的非case | 3. | 11 | 14 | 2 | 10 | 12 | 1 | 1 | 2 |
|
IDEAL-X总分类 | 68 | 49 | 117 | 64 | 48 | 112 | 4 | 1 | 5 |
一个OUHSC:俄克拉荷马大学健康科学中心。
b包括来自杜克大学的112个通气-灌注扫描和来自俄克拉荷马大学健康科学中心的5个通气-灌注扫描。
IDEAL-X(信息和数据提取使用自适应学习)系统在监测点的性能。
性能测量 | 综合性能,% (95% CI) | 在杜克大学的表现,%(95%置信区间) | 在OUHSC的表现一个, % (95% ci) | ||||
|
|||||||
|
精度 | 93.7 (93.7 - -93.8) | 92.4 (92.3 - -92.5) | 95.2 (95.1 - -95.2) | |||
|
灵敏度 | 96.3 (96.2 - -96.4) | 97.9 (97.8 -98) | 93.3 (93.1 - -93.4) | |||
|
特异性 | 92 (91.9 -92) | 86.5 (86.4 - -86.7) | 95.9 (95.8 -96) | |||
|
PPVb | 89.1 (89 - 89.2) | 88.5 (88.4 - -88.6) | 90.4 (90.1 - -90.5) | |||
|
净现值c | 97.3 (97.3 - -97.4) | 97.5 (97.4 - -97.6) | 97.2 (97.1 - -97.3) | |||
|
|||||||
|
精度 | 95.1 (95 - 95.1) | 94.1 (94 - 94.2) | 95.7 (95.6 - -95.8) | |||
|
灵敏度 | 96.3 (96.2 - -96.4) | 97.9 (97.7 -98) | 93.8 (93.5 -94) | |||
|
特异性 | 94.4 (94.3 - -94.5) | 90.4 (90.1 - -90.5) | 96.3 (96.2 - -96.3) | |||
|
PPV | 89.7 (89.5 - -89.8) | 91 (90.8 - -91.1) | 87.4 (87.1 - -87.7) | |||
|
净现值 | 98.1 (98 - 98.1) | 97.7 (97.5 - -97.9) | 98.2 (98.1 - -98.3) | |||
|
|||||||
|
精度 | 94.2 (94.1 - -94.3) | 95.3 (95.1 - -95.4) | 90.6 (90 - 91) | |||
|
灵敏度 | 96.4 (96.2 - -96.5) | 98.2 (97.9 - -98.4) | 92.8 (92.2 - -93.2) | |||
|
特异性 | 90.7 (90.3 -91) | 91.9 (91.6 - -92.2) | 60岁(53.9 - -65.4) | |||
|
PPV | 94.4 (94.2 - -94.5) | 93.2 (92.9 - -93.4) | 97 (96.4 - -97.3) | |||
|
净现值 | 94 (93.6 - -94.2) | 97.9 (97.5 - -98.1) | 37.5 (34 - 41.6) | |||
|
|||||||
|
精度 | 65 (64.2 - -65.6) | 64.3 (63.5 -65) | 80 (67.4 - -87.9) | |||
|
灵敏度 | 95.6 (94.5 - -96.2) | 96.9 (95.7 - -97.5) | 75 (60 - 85.1) | |||
|
特异性 | 22.5 (21.3 -24) | 20.8 (19.7 - -22.4) | 100 (47.5 -100) | |||
|
PPV | 63.1 (62.3 - -63.8) | 62 (61.2 - -62.8) | 100年(78 - 100) | |||
|
净现值 | 78.6 (73.7 -82) | 83.3 (77.6 -87) | 50 (27.5 - -72.5) |
一个OUHSC:俄克拉荷马大学健康科学中心。
bPPV:阳性预测值。
cNPV:负预测值。
我们还回顾了假阴性结果,并在
记录不一致的原因。
文字原因 |
杜克大学记录,n (%) | OUHSC一个记录,n (%) | |
|
|||
|
没有血栓形成的证据 | 104 (100) | 4 (9.3) |
|
浅静脉血栓形成 | 0 (0) | 25 (58.1) |
|
慢性或残余深静脉血栓形成 | 0 (0) | 13 (30.2) |
|
不确定的 | 0 (0) | 1 (2.3) |
|
小计 | 104 (100) | 43 (100) |
|
|||
|
将可疑个案列为“阳性”个案 | 2 (11.8) | 9 (31) |
|
阳性和阴性结果在同一份报告中 | 2 (11.8) | 6 (20.7) |
|
无法识别的文本或符号,拼写错误 | 7 (41.2) | 2 (6.9) |
|
阳性报告被错误分类 | 6 (35.3) | 12 (41.4) |
|
小计 | 17 (100) | 29日(100) |
一个OUHSC:俄克拉荷马大学健康科学中心。
这项研究表明IDEAL-X是一种准确的NLP工具,可用于识别VTE病例。该系统通过从成像记录(VTE诊断最可靠的数据源)获取信息,实现VTE病例的自动化识别,可能会提高VTE监测的效率。我们的研究结果有助于Dantes等人发表的研究结果[
这种NLP模型的性能受到所使用的成像方式的影响。通气-灌注扫描的特异性和阳性预测值较低,其中95.7%(112/117)来自杜克大学系统。OUHSC的胸部CT血管造影特异性和阴性预测值较低。这些值可能会受到影响,因为我们没有收到所请求的样本(从非案例中只有10条记录就可以证明)。这导致病例患病率为93.2%(139/149),这不能代表参与的卫生系统中肺栓塞的患病率。
使用NLP对案例进行分类的一个特别优点是IDEAL-X根据案例状态对记录进行分类所需的时间。OUHSC记录(N=1487)的预处理时间约为5分钟,后处理时间<1分钟。相比之下,监视人员每次成像研究大约需要1分钟来阅读文本并根据案件状态进行分类,这意味着本研究中使用的记录分类可能需要52.5人小时。当考虑在连续的时间框架内跨许多设施实施监控时,节省的时间变得越来越有意义。
与其他常用的NLP工具相比,IDEAL-X相对简单,这些工具包括cTAKES(临床文本分析知识提取系统)、MetaMap、MedLEE(医学语言提取和编码系统)、GATE(文本工程通用架构)、NLTK(自然语言工具包)和OpenNLP。考虑到使用NLP的VTE监测系统处于设计和实现的初级阶段,我们还没有包括高级功能,如协参解析、关系提取和语义处理。然而,如果需要额外的细节来确定医生的隶属关系和组织的位置,或者理解长达一段话的文本(而不是1-2句话),这些特征可能是有必要的。
IDEAL-X除用于静脉血栓栓塞病例识别外,还用于提取正在接受放射治疗的非小细胞癌患者的治疗和预后信息[
其他NLP算法已经被开发出来并用于识别VTE病例。Hinz等[
IDEAL-X的一个主要限制是缺乏与EMR系统的集成;IDEAL-X需要人员手动提取成像记录,这是一个限制速度的步骤。的强制二元选项是另一个限制
未来的工作将致力于VTE监测的完全自动化。如何更好地集成NLP程序(如IDEAL-X)的一个例子是,将其包括在设施的临床数据处理中,以便在成像报告完成并发送账单后,也可以通过IDEAL-X运行(以及相关的预处理例程)。除了实时分类静脉血栓栓塞病例外,迈向完全自动化流程的下一步还需要收集人口统计学、临床和风险因素数据,以促进对疾病发病率数据的解释。其他未来的努力包括实现机器学习来微调IDEAL-X算法,以便它能够“学习”如何更准确地区分案例和非案例。来自产生假阳性结果的记录的示例文本可以添加到进一步训练IDEAL-X并提高其准确性。尽管使用这些信息提取软件工具有预期的好处,但在实现过程中仍然存在一定的障碍。这些障碍包括定制部署和本地化的成本,软件的专有性质,以及负责操作和维护系统的人员,确保医疗保健管理员接受好处,并保持遵守健康保险携带和责任法案和其他法规。
机器学习和NLP在疾病监测中的应用正在提高从emr中访问和分析非结构化文本的能力。它们的进一步广泛使用有望减少资源需求(即时间和金钱),同时提高跨站点数据收集标准化的能力。通过对静脉血栓栓塞进行监测,我们将有更好的数据来了解临床实践的变化(例如,直接口服抗凝剂使用的增加)是否正在减轻静脉血栓栓塞的负担。加强静脉血栓栓塞监测可以改善患者的管理、护理和安全性。同样,随着COVID-19大流行的出现,一个强大的国家监测系统将有助于迅速了解COVID-19与静脉血栓栓塞之间的关系[
计算机断层扫描
临床文本分析知识提取系统
深静脉血栓形成
电子病历
文本工程通用体系结构
使用自适应学习的信息和数据提取
医学语言提取与编码系统
自然语言处理
自然语言工具包
俄克拉荷马大学健康科学中心
静脉血栓栓塞
我们非常感谢疾病控制和预防中心健康质量和促进部门的郑帅博士,他在这项研究中使用IDEAL-X(使用自适应学习的信息和数据提取)的专业知识,并审查了这篇手稿的准确性。我们也感谢希瑟·霍伦对手稿的编辑审查。我们真诚地感谢埃默里大学允许我们在这个项目中使用IDEAL-X。此外,我们感谢INTEGRIS Health System的Lisa Hunter和Lori Black在进行本研究监测时的合作。本研究由美国疾病控制与预防中心(合作协议号:#5U36OE000002-01)支持。本报告中的发现和结论仅代表作者的观点,并不代表疾病控制和预防中心的官方立场。
没有宣布。