发表在gydF4y2Ba在gydF4y2Ba10卷gydF4y2Ba第九名gydF4y2Ba(2022)gydF4y2Ba: 9月gydF4y2Ba

本文的预印本(早期版本)可在gydF4y2Bahttps://preprints.www.mybigtv.com/preprint/37812gydF4y2Ba,首次出版gydF4y2Ba.gydF4y2Ba
在儿童电子病历中挖掘严重药物过敏反应病例:方法开发与应用gydF4y2Ba

在儿童电子病历中挖掘严重药物过敏反应病例:方法开发与应用gydF4y2Ba

在儿童电子病历中挖掘严重药物过敏反应病例:方法开发与应用gydF4y2Ba

原始论文gydF4y2Ba

1gydF4y2Ba国家儿童健康中心,首都医科大学附属北京儿童医院,中国北京gydF4y2Ba

2gydF4y2Ba博辉亿舒(北京)有限公司,中国北京gydF4y2Ba

*这些作者贡献相同gydF4y2Ba

通讯作者:gydF4y2Ba

王晓玲,文学硕士gydF4y2Ba

国家儿童健康中心gydF4y2Ba

北京市儿童医院gydF4y2Ba

首都医科大学gydF4y2Ba

南里石路56号gydF4y2Ba

西城区gydF4y2Ba

北京,100045gydF4y2Ba

中国gydF4y2Ba

电话:86 59617173gydF4y2Ba

传真:86 59616083gydF4y2Ba

电子邮件:gydF4y2Bawangxiaoling@bch.com.cngydF4y2Ba


背景:gydF4y2Ba重度药物超敏反应(Severe drug hypersensitivity reactions, DHRs)是指由药物引起的过敏反应,通常以严重的皮疹和内损为主要症状。目前,医院中严重dhr的报告仅通过由主管临床医生操作的自发报告系统(SRSs)进行。自动识别系统仔细检查临床记录并报告潜在的严重DHR病例。gydF4y2Ba

摘要目的:gydF4y2Ba本研究的目标是开发一种能够挖掘重症DHR病例的自动识别系统,发现更多DHR病例供进一步研究。将该方法应用于北京儿童医院9年的儿科电子病历数据。gydF4y2Ba

方法:gydF4y2Ba表型任务是作为一个文档分类问题来处理的。准备了DHR数据集,其中包含用于训练的标记文档。每个文件包含在这个数据集中的一次住院期间产生的所有临床记录。文档级标记对应DHR类型和负类别。在公开的2016年国家NLP临床挑战吸烟任务中,对策略进行了长文件分类评估。在这项工作中评估了四种策略:文档截断、层次表示、有效的自我注意和关键句选择。在DHR数据集上评估了域内和开放域预训练嵌入。执行自动网格搜索来优化统计分类器,以获得转换后数据的最佳性能。分析了性能最佳模型的推理效率和内存需求。运行了从EHR系统中数百万个文档中挖掘DHR案例的最有效模型。gydF4y2Ba

结果:gydF4y2Ba对于长文档分类,使用指导关键字的关键句选择效果最好,推理速度比层次表示模型快9倍。最佳模型在北京儿童医院电子病历系统中共发现1155例DHR病例。经临床专家复查,最终确定重症DHRs 357例。对于吸烟挑战,我们的模型达到了最先进的性能记录(94.1% vs 94.2%)。gydF4y2Ba

结论:gydF4y2Ba该方法从大量电子病历档案中发现357例DHR阳性病例,其中约90%被srs遗漏。在同一时期,srs仅报告了36例。病例分析还发现了更多与儿科严重DHRs相关的疑似药物。gydF4y2Ba

JMIR Med Inform 2022;10(9):e37812gydF4y2Ba

doi: 10.2196/37812gydF4y2Ba

关键字gydF4y2Ba



药物超敏反应(DHRs)是一种类似过敏的药物不良反应。dhr影响7%以上的人口,是药物上市后停药的一个重要原因[gydF4y2Ba1gydF4y2Ba].严重的DHRs,如过敏性休克、药物过敏性超敏综合征、Stevens-Johnson综合征和大疱性表皮松解症,在世界范围内已被观察到,每年的发病率为每百万人0.05 - 3人。由于死亡率在5%至30%之间,儿科人群(包括儿童、婴儿甚至新生儿)中的严重dhr占已报告病例的10%至20% [gydF4y2Ba2gydF4y2Ba,gydF4y2Ba3.gydF4y2Ba].gydF4y2Ba

目前,医院中严重dhr的报告仅通过由主管临床医生操作的自发报告系统(SRSs)进行。既往研究表明,srs中只有10% ~ 30%的严重药物不良反应被报告[gydF4y2Ba4gydF4y2Ba].即使遗漏的病例得到了妥善处理,只是没有登录到SRS系统,一份更彻底的报告将有助于改进药物指南。最近,常规收集的医疗数据,如电子健康记录(EHRs),越来越多地用于补充SRS并实现主动药物警戒。电子病历系统包含详细的数据,包括入院、出院、诊断、用药和实验室测试的时间戳。然而,严重DHR依赖于症状和体征进行检测,而这些症状和体征通常位于电子病历的自由文本区域,需要使用自然语言处理来提取信息。gydF4y2Ba

研究最充分的医学语言处理应用之一是表型(例如,自动评估表型特征,如吸烟状况)[gydF4y2Ba5gydF4y2Ba].患者严重dhr的自动识别也可以作为一项表型任务进行探索。在没有结构数据可用的情况下,临床记录的表型可以被制定为文档分类任务,这在自然语言处理领域已经得到了很好的研究。gydF4y2Ba

近期工作[gydF4y2Ba6gydF4y2Ba-gydF4y2Ba8gydF4y2Ba的研究报告称,临床文档太长,语境化语言模型无法处理。我们课题组整合了一家医院的医疗数据,并在前期建立了垂直数据仓库。不同于以往只处理出院总结的工作[gydF4y2Ba5gydF4y2Ba-gydF4y2Ba7gydF4y2Ba],此DHR任务处理由与1个住院病人就诊相关的所有临床记录组成的文件。出院总结的平均字数通常为数百字。然而,在这个DHR数据集中,平均单词长度高达几千个汉字,有些文档包含数万个汉字。因此,选择最佳的长文档分类策略对于实现我们的目标至关重要。gydF4y2Ba


管道设计gydF4y2Ba

这项工作将DHR案例的自动识别作为一个长文档分类问题来处理。出于培训目的,领域专家准备了一个包含文档级标记的语料库。gydF4y2Ba

图1gydF4y2Ba演示了提议的系统管道。首先,对4种针对公开吸烟任务的长文件分类策略进行了比较和评价。其次,应用DHR任务的最佳策略。在我们的DHR任务中,比较和评估了预先训练的中医文本嵌入模型。在DHR数据集上执行网格搜索来优化机器学习分类器以获得最佳的文档分类性能。最后,在一个辅助医疗电子病历中应用了最佳的9年数据管道。gydF4y2Ba

‎gydF4y2Ba
图1。本研究提出系统管道。DHR:药物过敏反应;EHR:电子健康记录。gydF4y2Ba
查看此图gydF4y2Ba

伦理批准gydF4y2Ba

该研究由中国北京儿童医院机构伦理委员会审查并批准(2019-k-5),并放弃知情同意。gydF4y2Ba

数据集和指标gydF4y2Ba

吸烟的任务gydF4y2Ba

吸烟挑战[gydF4y2Ba5gydF4y2Ba自动从病人的出院总结中确定他们的吸烟状况。502份出院总结呈现5种状态:既往吸烟者、当前吸烟者、吸烟者、非吸烟者和未知吸烟者。按照之前的工作,班级吸烟者被忽略了。gydF4y2Ba表1gydF4y2Ba展示了训练和测试数据的分布。gydF4y2Ba

表1。吸烟任务的训练和测试数据分布。gydF4y2Ba

过去抽烟gydF4y2Ba 当前吸烟者gydF4y2Ba 不抽烟的人gydF4y2Ba 未知的gydF4y2Ba 总计gydF4y2Ba
列车数据集gydF4y2Ba 36gydF4y2Ba 35gydF4y2Ba 66gydF4y2Ba 252gydF4y2Ba 389gydF4y2Ba
测试数据集gydF4y2Ba 11gydF4y2Ba 11gydF4y2Ba 16gydF4y2Ba 63gydF4y2Ba 101gydF4y2Ba
严峻DHR任务gydF4y2Ba
数据源gydF4y2Ba

北京儿童医院的信息系统允许对患者的病史和医生的记录进行数字记录,并通过网络立即提供给所有患者部门。前期在整合医疗数据的基础上,构建了垂直数据仓库。包含2012年1月1日至2020年12月31日315608例患者的431,972例住院记录,包括详细的诊断信息、用药信息、实验室检测、病程数据等。其中,住院记录代表一个住院过程。如果一个病人多次住院,同一个病人就会有多个住院记录。gydF4y2Ba

语料库建设gydF4y2Ba

呈现严重DHRs的阳性病例来自两个组:国家药品监督管理局报告系统记录的31例阳性病例和通过图表审查发现的183例阳性病例。重复数据删除后,收集阳性病例200例。每个阳性病例被分为4个子类别中的1个子类别。在北京儿童医院EHR系统中随机抽取400例阴性病例。这些病例被标记为阴性(NEG),并由医生手工检查,以确保他们没有出现严重的dhr。gydF4y2Ba

重度DHR的4个亚型的定义见gydF4y2Ba多媒体附件1gydF4y2Ba详见2016年中国国家药品监督管理总局药品审评中心发布的《药品不良反应医学术语使用指南》[gydF4y2Ba9gydF4y2Ba].gydF4y2Ba

训练和测试数据集gydF4y2Ba

这5类文档被随机抽样到训练和测试数据集中。训练和测试数据分布如图所示gydF4y2Ba表2gydF4y2Ba.正负比接近于吸烟任务中对应的比例。gydF4y2Ba

表2。严重药物超敏反应数据集的训练和测试数据分布。gydF4y2Ba

sjgydF4y2Ba一个gydF4y2Ba DIHSgydF4y2BabgydF4y2Ba 作为gydF4y2BacgydF4y2Ba 海尔哥哥gydF4y2BadgydF4y2Ba 负的gydF4y2BaegydF4y2Ba 总计gydF4y2Ba
训练数据集gydF4y2Ba 56gydF4y2Ba 44gydF4y2Ba 18gydF4y2Ba 32gydF4y2Ba 323gydF4y2Ba 473gydF4y2Ba
测试数据集gydF4y2Ba 18gydF4y2Ba 3.gydF4y2Ba 5gydF4y2Ba 7gydF4y2Ba 77gydF4y2Ba 110gydF4y2Ba

一个gydF4y2BaSJS: Stevens-Johnson综合征。gydF4y2Ba

bgydF4y2BaDIHS:药物性超敏反应综合征。gydF4y2Ba

cgydF4y2BaAS:过敏性休克。gydF4y2Ba

dgydF4y2BaEB:大疱性表皮松解症。gydF4y2Ba

egydF4y2Ba否定:消极的。gydF4y2Ba

评价指标gydF4y2Ba

根据之前的研究,使用微观平均F1分数来评估不同模型的性能[gydF4y2Ba6gydF4y2Ba].这个指标用于多类分类问题,测量精度和召回率之间的平衡,并给予每个类别相同的权重。gydF4y2Ba

长文档分类策略gydF4y2Ba

评估和比较了四种策略:文档截断[gydF4y2Ba10gydF4y2Ba],层次表示法[gydF4y2Ba6gydF4y2Ba,gydF4y2Ba11gydF4y2Ba],更有效的自我关注[gydF4y2Ba12gydF4y2Ba],以及关键句的选择[gydF4y2Ba7gydF4y2Ba,gydF4y2Ba8gydF4y2Ba,gydF4y2Ba13gydF4y2Ba,gydF4y2Ba14gydF4y2Ba].长文献分类的最佳策略是基于公开的2016年国家NLP临床挑战吸烟任务结果[gydF4y2Ba5gydF4y2Ba].本课题的研究结果可以与其他相关工作进行比较。gydF4y2Ba

文档截断gydF4y2Ba

应用具有长度限制的转换器模型的最直接方法是截断输入并选择第一个令牌块。这些模型通常要求长度限制为512字。gydF4y2Ba

更有效的自我关注gydF4y2Ba

自注意模型,如变压器的双向编码器表示(BERT),需要相对于输入序列长度的二次计算时间和空间。Longformer模型使用稀疏自注意而不是完全自注意来处理较长的文档(最多4096个令牌)。gydF4y2Ba

层次结构表示gydF4y2Ba

在层次结构方法中,首先构建句子表示,然后将其聚合为文档级表示。在之前关于临床记录的表型任务的工作中,文档表示是由每个句子的BERT块之上的采样层构建的[gydF4y2Ba6gydF4y2Ba].gydF4y2Ba

重点句子选择gydF4y2Ba

对于文档分类任务来说,几个关键的句子就足够了。在之前的工作中,研究了无监督方法生成关键句,但效果并不总是很好[gydF4y2Ba13gydF4y2Ba,gydF4y2Ba15gydF4y2Ba].在这项工作中,研究了从特定任务指南中提取的关键字。选取含有关键词的句子作为重点句。gydF4y2Ba

在吸烟任务中,我们将之前工作中的字母和字母作为关键字列表:香烟,烟雾,吸烟,吸烟者,吸烟,吸烟,烟草[gydF4y2Ba16gydF4y2Ba].gydF4y2Ba

对于DHR任务,对2组关键字进行了评估和比较。词频-逆文档频率(TF-IDF)算法作为一种无监督方法,计算了顶部特征词。那些包含数字、外文字母和特殊字符的单词被从这2000个单词中删除。共有163个得分高于0的特征词被添加到关键字列表中。gydF4y2Ba

临床记录中参考相应指南的部分与鉴别分类最相关。DHR数据集中的每个积极类别在相应的指南中都有很好的定义[gydF4y2Ba17gydF4y2Ba-gydF4y2Ba20.gydF4y2Ba].医学术语是从指南中精心挑选的。区分医学术语与一般文本不需要领域知识。这些关键字显示在gydF4y2Ba文本框1gydF4y2Ba中文及gydF4y2Ba文本框2gydF4y2Ba在英语。gydF4y2Ba

重度药物超敏反应任务中文指南关键词。AS:过敏性休克;DIHS:药物性超敏反应综合征;EB:大疱性表皮松解症;IVIG:静脉注射免疫球蛋白;SJS: Stevens-Johnson综合征;中毒性表皮坏死松解症。gydF4y2Ba
  1. 史蒂文斯—约翰逊综合征,过敏性休克,药物超敏反应综合征,大疱表皮松解症,,EB,十,sj, DIHSgydF4y2Ba
  2. 过敏,超敏,黏膜,红斑,松解,喘鸣,支气管痉挛,发绀,呼气流量峰值下降,肌张力减退,荨麻疹,血管性水肿,紫绀,低血容量性低血压,斑疹,斑丘疹,无菌性脓疱,紫癜,剥脱性皮炎,融合成片,松弛性水疱,表皮松解,大疱,表皮剥脱,叶状鳞屑,表皮剥离,猩红热样,麻疹样,弥漫性,黏膜侵蚀,大疱gydF4y2Ba
  3. 糖皮质激素,肾上腺素,甲基泼尼松龙,泼尼松,地塞米松,ivig,甲泼尼龙gydF4y2Ba
文本框1。重度药物超敏反应任务中文指南关键词。AS:过敏性休克;DIHS:药物性超敏反应综合征;EB:大疱性表皮松解症;IVIG:静脉注射免疫球蛋白;SJS: Stevens-Johnson综合征;中毒性表皮坏死松解症。gydF4y2Ba
重度药物超敏反应任务英文指南关键词。AS:过敏性休克;DIHS:药物性超敏反应综合征;EB:大疱性表皮松解症;IVIG:静脉注射免疫球蛋白;SJS: Stevens-Johnson综合征;中毒性表皮坏死松解症。gydF4y2Ba
  1. Stevens-Johnson综合征、过敏性休克、药物过敏性超敏综合征、大疱性表皮松解症、AS、EB、TEN、SJS、DIHSgydF4y2Ba
  2. 过敏、超敏、粘膜、红斑、表皮松解、喘息、支气管痉挛、紫绀、呼气流量峰值降低、肌张力障碍、荨麻疹、血管性水肿、低血容量低血压、黄斑、黄斑丘疹、无菌脓疱、紫癜、合流、松弛性水泡、大疱、剥脱性、鳞片、猩红热样、麻疹、弥漫性、黏膜糜烂、IVIGgydF4y2Ba
  3. 糖皮质激素,肾上腺素,强的松,强的松,地塞米松,甲基predgydF4y2Ba
文本框2。重度药物超敏反应任务英文指南关键词。AS:过敏性休克;DIHS:药物性超敏反应综合征;EB:大疱性表皮松解症;IVIG:静脉注射免疫球蛋白;SJS: Stevens-Johnson综合征;中毒性表皮坏死松解症。gydF4y2Ba
数据集与选定的文本gydF4y2Ba

通过甲骨文测试来评估关键句选择策略是否会影响成绩。这个oracle测试的执行如下:(1)对于每个包含任何关键字的文档,分配它的gold标签;(2)对于所有不包含关键字的文档,分配UNKNOWN标签(用于吸烟任务)或NEG标签(用于DHR任务)。gydF4y2Ba

如gydF4y2Ba表3gydF4y2Ba,关键句子的选择降低了吸烟任务两组数据的最大字数和平均字数。对于训练集和测试集,oracle micro-F1均为1.0,这意味着关键句选择策略不影响整体性能。gydF4y2Ba

DHR任务评估了两个关键字列表:TF-IDF关键字和指南关键字。如gydF4y2Ba表4gydF4y2Ba,关键句选择降低了DHR任务训练数据集和测试数据集的最大字数和平均字数。oracle测试表明,对于TF-IDF关键字,oracle micro-F1得分接近1.0。使用指导关键字,该策略在整个管道中引入的误差约为2% - 3%。gydF4y2Ba

表3。吸烟任务中原始文本和选定文本的统计gydF4y2Ba一个gydF4y2Ba.gydF4y2Ba

最大字数gydF4y2Ba 平均字数gydF4y2Ba 甲骨文小类gydF4y2Ba
火车gydF4y2Ba

原始gydF4y2Ba 3025gydF4y2Ba 766gydF4y2Ba - - - - - -gydF4y2BabgydF4y2Ba

选择gydF4y2Ba 194gydF4y2Ba 18gydF4y2Ba 1gydF4y2Ba
测试gydF4y2Ba

原始gydF4y2Ba 2529gydF4y2Ba 851gydF4y2Ba - - - - - -gydF4y2Ba

选择gydF4y2Ba 117gydF4y2Ba 18gydF4y2Ba 1gydF4y2Ba

一个gydF4y2Ba对于单词计数,所有被空格分隔符分隔的术语都被认为是单词。gydF4y2Ba

bgydF4y2Ba不适用。gydF4y2Ba

表4。在严重药物超敏反应任务中对原始文本和精选文本的统计gydF4y2Ba一个gydF4y2Ba.gydF4y2Ba
关键字gydF4y2Ba 最大平均计数gydF4y2Ba 平均字符数gydF4y2Ba 甲骨文小类gydF4y2Ba
火车gydF4y2Ba

原始gydF4y2Ba 27198gydF4y2Ba 4615gydF4y2Ba - - - - - -gydF4y2BabgydF4y2Ba

选择gydF4y2Ba


TF-IDFgydF4y2BacgydF4y2Ba 4681gydF4y2Ba 770gydF4y2Ba 0.99gydF4y2Ba


指导方针gydF4y2Ba 1926gydF4y2Ba 199gydF4y2Ba 0.98gydF4y2Ba
测试gydF4y2Ba

原始gydF4y2Ba 15454gydF4y2Ba 3963gydF4y2Ba - - - - - -gydF4y2Ba

选择gydF4y2Ba


TF-IDFgydF4y2Ba 3210gydF4y2Ba 687gydF4y2Ba 1gydF4y2Ba


指导方针gydF4y2Ba 636gydF4y2Ba 177gydF4y2Ba 0.97gydF4y2Ba

一个gydF4y2Ba对于药物过敏反应数据集,统计中文字符。gydF4y2Ba

bgydF4y2Ba不适用。gydF4y2Ba

cgydF4y2BaTF-IDF:术语频率逆文档频率。gydF4y2Ba

变形金刚gydF4y2Ba

在这项工作中,通过上下文化语言模型评估了域内和开放域预训练的嵌入。为了实现,SBERT库[gydF4y2Ba10gydF4y2Ba]用预先训练好的开放域或领域特定的语言模型计算文档嵌入。对这些预训练的模型没有进行微调。gydF4y2Ba

这项工作评估了开放域模型bert-base uncase [gydF4y2Ba21gydF4y2Ba]和领域特定模型ClinicalBERT和DischargeBERT [gydF4y2Ba20.gydF4y2Ba]查阅英文临床记录。gydF4y2Ba

该工作评估了开放域模型bert-base-chinese [gydF4y2Ba21gydF4y2Ba]和领域特定模型Medbert-kd-chinese [gydF4y2Ba22gydF4y2Ba]查阅中医临床记录。gydF4y2Ba

机器学习分类器gydF4y2Ba

机器学习分类器堆叠在深度学习变压器之上。每个机器学习分类器在训练数据集上进行10倍交叉验证。自动网格检索框架[gydF4y2Ba10gydF4y2Ba]搜索最优超参数。这项工作评估线性模型与随机梯度下降(SGD)学习和libsvm支持向量分类(SVC)。gydF4y2Ba


吸烟任务:长文档分类策略gydF4y2Ba

文档截断gydF4y2Ba

图书馆SBERT使用预先训练的模型BERT、ClinicalBERT和DischargeBERT实现了这一策略。如gydF4y2Ba表5gydF4y2Ba在美国,这些模型表现不佳。当长文件直接输入变压器时,只保留了前512个字的部分。gydF4y2Ba

表5所示。吸烟任务的表型结果(微平均F1)。gydF4y2Ba
变压器gydF4y2Ba 分类器gydF4y2Ba 微观平均F1 (%)gydF4y2Ba


原始文本gydF4y2Ba 选中的文本gydF4y2Ba
LongformergydF4y2Ba SGDgydF4y2Ba一个gydF4y2Ba 63.37gydF4y2Ba 78.22gydF4y2Ba
Bert-base-uncasedgydF4y2Ba SGDgydF4y2Ba 67.33gydF4y2Ba 90.01gydF4y2Ba
DischargeBERTgydF4y2Ba SGDgydF4y2Ba 63.37gydF4y2BabgydF4y2Ba 91.09gydF4y2Ba
ClinicalBERTgydF4y2Ba SGDgydF4y2Ba 60.40gydF4y2Ba 94.06gydF4y2Ba

一个gydF4y2BaSGD:随机梯度下降。gydF4y2Ba

bgydF4y2Ba考虑到数据集的大小,一些模型可能会得到相同的结果。gydF4y2Ba

更有效的自我关注gydF4y2Ba

Longformer模型使用稀疏自注意而不是完全自注意来处理较长的文档(最多4096个令牌)。然而,如图所示gydF4y2Ba表5gydF4y2Ba,它的表现并没有超过BERT基线。gydF4y2Ba

重点句子选择gydF4y2Ba

这项工作使用了Pedersen的字母和字母[gydF4y2Ba16gydF4y2Ba来选择重点句子。如gydF4y2Ba表5gydF4y2Ba,每个模型在所选文本上表现更好。领域特定的预训练语言模型ClinicalBERT(91.09%)和DischargeBERT(93.07%)优于开放领域模型bert-base-uncase(90.01%)。gydF4y2Ba

层次结构表示gydF4y2Ba

在层次结构方法中,首先构建句子表示,然后将其聚合为文档级表示。为了公平的比较,我们评估并报告了之前工作的结果[gydF4y2Ba6gydF4y2Ba]和我们自己的评估脚本。如gydF4y2Ba表6gydF4y2Ba,gydF4y2BafgydF4y2Ba的意思是gydF4y2Ba[的建筑gydF4y2Ba6gydF4y2Ba](94.2%)达到最先进的表现。gydF4y2Ba

如gydF4y2Ba表6gydF4y2Ba,我们的方法(94.1%)与性能最好的方法取得了相当的性能。其他早期工作吸烟任务(F1范围从77.0%到90.0%)没有达到相同的性能水平。gydF4y2Ba

关键句选择策略和层次表示策略取得了相当的性能。此外,还比较了它们的效率和内存需求。总结于gydF4y2Ba表7gydF4y2Ba,在拟议的管道中,GPU不需要用于训练机器学习分类器。层次表示模型需要一个特斯拉M40 GPU (Nvidia Corp)训练1天。我们的方法比推理的层次表示模型快9倍。采用文档截断和关键句选择相结合的策略,变压器模型对每个文档只处理1个块,因此没有减少关键句选择的推理时间。gydF4y2Ba

表6所示。我们的方法和以前工作的表型结果(微平均F1)gydF4y2Ba一个gydF4y2Ba吸烟的任务。gydF4y2Ba
变压器gydF4y2Ba 微观平均F1 (%)gydF4y2Ba
ClinicalBERT(我们的)gydF4y2Ba 94.1gydF4y2Ba
fgydF4y2Ba的意思是gydF4y2Ba[gydF4y2Ba6gydF4y2Ba]gydF4y2Ba 94.2gydF4y2Ba
共享任务第一名[gydF4y2Ba23gydF4y2Ba]gydF4y2Ba 90.0gydF4y2Ba
多数标签基线[gydF4y2Ba6gydF4y2Ba]gydF4y2Ba 81.0gydF4y2Ba
美国有线电视新闻网gydF4y2BabgydF4y2Ba[gydF4y2Ba24gydF4y2Ba]gydF4y2Ba 77.0gydF4y2Ba

一个gydF4y2Ba我们的方法和gydF4y2BafgydF4y2Ba的意思是gydF4y2Ba在测试数据集上使用相同的脚本进行评估。其他结果直接来自他们发表的报告。作为比较,结果的精度为0.1%。gydF4y2Ba

bgydF4y2BaCNN:卷积神经网络。gydF4y2Ba

表7所示。每个模型的运行时和内存需求。的训练时间和GPU要求gydF4y2BafgydF4y2Ba 的意思是gydF4y2Ba取自以前的工作[gydF4y2Ba6gydF4y2Ba].测试数据集上的推理时间在具有NVIDIA T4和4*cpu (NVIDIA Corp)的GPU服务器上进行评估。gydF4y2Ba
模型gydF4y2Ba 文档gydF4y2Ba 测试数据集上的推理时间(秒)gydF4y2Ba 培训时间(小时)gydF4y2Ba GPU内存gydF4y2Ba
fgydF4y2Ba的意思是gydF4y2Ba[gydF4y2Ba6gydF4y2Ba]gydF4y2Ba 文本gydF4y2Ba 35.52gydF4y2Ba 24gydF4y2Ba 16gydF4y2Ba
ClinicalBertgydF4y2Ba 文本gydF4y2Ba 0.46gydF4y2Ba - - - - - -gydF4y2Ba一个gydF4y2Ba - - - - - -gydF4y2Ba
+ MLClassifiergydF4y2Ba 选中的文本gydF4y2Ba 0.437gydF4y2Ba 1gydF4y2Ba - - - - - -gydF4y2Ba

一个gydF4y2Ba不适用。gydF4y2Ba

严峻DHR任务:堆叠变压器和分类器gydF4y2Ba

吸烟任务表明,选择关键句子可以改善长度限制下的自我注意变形器。在DHR任务中,使用各种转换器和分类器对该策略进行了评估。如Methods中所述,对2种关键词进行评估和比较。作为一种无监督方法,top TF-IDF [gydF4y2Ba8gydF4y2Ba]特征词用于关键句的选择。考虑到临床记录符合指南,关键词从DHR指南中抽取。gydF4y2Ba

如gydF4y2Ba表8gydF4y2Ba,导向性关键字总是提高性能,无论堆叠变压器和分类器。TF-IDF关键字只对SVC分类器有帮助。gydF4y2Ba

表8所示。重度药物超敏反应任务中不同变压器的表型结果(微平均F1)。gydF4y2Ba
变形金刚和分类器gydF4y2Ba Micro-averaged F1 (%)gydF4y2Ba

原始文本gydF4y2Ba 选中的文本gydF4y2Ba


TF-IDFgydF4y2Ba一个gydF4y2Ba 的指导方针gydF4y2Ba
Bert-base-chinesegydF4y2Ba

SVCgydF4y2BabgydF4y2Ba 80.91gydF4y2Ba 82.73gydF4y2Ba 87.27gydF4y2Ba

SGDgydF4y2BacgydF4y2Ba 80.00gydF4y2Ba 77.27gydF4y2Ba 86.36gydF4y2Ba
Medbert-kd-chinesegydF4y2Ba

SVCgydF4y2Ba 81.82gydF4y2Ba 83.64gydF4y2Ba 89.09gydF4y2Ba

SGDgydF4y2Ba 82.73gydF4y2Ba 73.64gydF4y2Ba 87.27gydF4y2Ba

一个gydF4y2BaTF-IDF:术语频率逆文档频率。gydF4y2Ba

bgydF4y2BaSVC:支持向量分类。gydF4y2Ba

cgydF4y2BaSGD:随机梯度下降。gydF4y2Ba

九年电子病历的应用gydF4y2Ba

最后,将最优配置应用于北京儿童医院电子病历9年的数据。共收到1155例警报。经2名临床医师和2名儿科药师按重度DHRs标准进行复查,共发现儿童重度DHRs 357例(gydF4y2Ba表9gydF4y2Ba过敏性休克(n=39)、药物超敏反应综合征(n=178)、Stevens-Johnson综合征(n=86)、大疱性表皮松解症(n=54)。在356例严重DHRs中,只有36例之前报告给SRS。约89.89%的病例漏报,导致药物监管机构和临床医生重视不足。这表明我们的方法可以积极识别严重的dhr,为儿童药物警戒提供额外的证据。gydF4y2Ba

病例分析表明,许多可疑药物可能导致严重的儿科DHRs。疑似导致过敏性休克的药物主要有pegaspargase注射液、l -天冬酰胺酶、头孢哌酮舒巴坦等。苯巴比妥、尼美舒利、头孢菌素类抗生素是导致药物性超敏反应综合征和Stevens-Johnson综合征的主要疑似药物。此外,拉莫三嗪、赖氨酸乙酰水杨酸、美罗培南与大疱性表皮松解症的发生密切相关。gydF4y2Ba

表9所示。拟管道电子病历发现的9年严重药物超敏反应病例分布情况。gydF4y2Ba
严重DHRgydF4y2Ba一个gydF4y2Ba SRS报告gydF4y2BabgydF4y2Ba的BCHgydF4y2BacgydF4y2BangydF4y2Ba 专家确认的DHR病例,(n)gydF4y2Ba


诊断为BCHgydF4y2Ba 在其他医院确诊gydF4y2Ba 总计gydF4y2Ba
作为gydF4y2BadgydF4y2Ba 4gydF4y2Ba 26gydF4y2Ba 13gydF4y2Ba 39gydF4y2Ba
DIHSgydF4y2BaegydF4y2Ba 16gydF4y2Ba 29gydF4y2Ba 149gydF4y2Ba 178gydF4y2Ba
sjgydF4y2BafgydF4y2Ba 7gydF4y2Ba 9gydF4y2Ba 77gydF4y2Ba 86gydF4y2Ba
海尔哥哥gydF4y2BaggydF4y2Ba 9gydF4y2Ba 8gydF4y2Ba 46gydF4y2Ba 54gydF4y2Ba
总计gydF4y2Ba 36gydF4y2Ba 72gydF4y2Ba 285gydF4y2Ba 357gydF4y2Ba

一个gydF4y2BaDHR:药物过敏反应。gydF4y2Ba

bgydF4y2BaSRS:自发报告系统。gydF4y2Ba

cgydF4y2Ba北京儿童医院。gydF4y2Ba

dgydF4y2BaAS:过敏性休克。gydF4y2Ba

egydF4y2BaDIHS:药物性超敏反应综合征。gydF4y2Ba

fgydF4y2BaSJS: Stevens-Johnson综合征。gydF4y2Ba

ggydF4y2BaEB:大疱性表皮松解症。gydF4y2Ba


主要研究结果gydF4y2Ba

结果表明,临床文献太长,无法进行文献分类基线。在长文档分类的4种策略中,层次表示和关键句选择在吸烟任务中表现最好。此外,关键句的选择比层次表示模型的推理速度快9倍。从特定任务指南中提取的关键字比无监督方法表现得更好。特定于领域的语言模型总是比一般的嵌入表现得更好。gydF4y2Ba

共有1155例病例被提醒,其中临床医生和药剂师确定了357例儿童严重DHRs。这些病例中只有36例被SRS报告。提示SRS检出率低至10.08%。自动检查临床记录和报告潜在严重DHR病例的管道可以帮助减少漏诊的阳性DHR病例数量,同时降低人工成本。gydF4y2Ba

病例分析还发现了更多与儿科严重DHRs相关的疑似药物。该分析有助于促进上市后药物风险评估,有利于合理用药和改进用药指南。gydF4y2Ba

与之前工作的比较gydF4y2Ba

我们的方法在吸烟任务中与表现最好的方法取得了相当的性能(94.1% vs 94.2%)。在DHR任务中,我们的方法发现了357例阳性病例,其中约90%被SRS遗漏。gydF4y2Ba

最近的研究表明,临床文件太长,语境化语言模型无法处理[gydF4y2Ba6gydF4y2Ba-gydF4y2Ba8gydF4y2Ba].不同于以往只处理出院总结的工作[gydF4y2Ba5gydF4y2Ba-gydF4y2Ba7gydF4y2Ba],此DHR任务处理由与1个住院病人就诊相关的所有临床记录组成的文件。出院总结的平均字数通常为数百字。然而,在DHR数据集中,平均单词长度高达几千个汉字,有些文档包含数万个汉字。gydF4y2Ba

这项工作评估和比较了4种策略:文档截断[gydF4y2Ba10gydF4y2Ba],层次表示法[gydF4y2Ba6gydF4y2Ba,gydF4y2Ba11gydF4y2Ba],更有效的自我关注[gydF4y2Ba12gydF4y2Ba],以及关键句的选择[gydF4y2Ba7gydF4y2Ba,gydF4y2Ba8gydF4y2Ba,gydF4y2Ba13gydF4y2Ba,gydF4y2Ba14gydF4y2Ba].这些作品都没有考虑到指南的使用。gydF4y2Ba

限制gydF4y2Ba

该方法需要注释约200例阳性病例进行监督训练。当应用于医院数据库中的大型电子病历存档时,仍然需要某些预处理步骤,以防止格式糟糕的文档出现故障。这种预处理步骤可能因医院系统而异。gydF4y2Ba

结论gydF4y2Ba

严重dhr的自动识别可以作为文档分类问题来处理。临床记录长文献分类的最佳策略是在任务特定的指导下选择关键句。DHR病例的报告不能仅仅依靠负责的临床医生。在同一时期的数据中,SRS系统报告了36例,而自动流程发现了357例。病例分析还发现了更多与儿科严重DHRs相关的疑似药物。gydF4y2Ba

致谢gydF4y2Ba

本工作由中国毒理学学会临床毒理学计划项目CST2020CT108、中国药品监督管理学会上市后药物风险评估计划项目DSM2021004、国家卫生与发展研究中心儿科用药综合评价临床技术培训计划项目CNHDRC-KJ-W-2021-58资助。资助者在进行这项研究时没有任何作用;数据的收集、管理、分析和解释;文稿的准备、审核、批准;或决定投稿发表。gydF4y2Ba

作者的贡献gydF4y2Ba

XLW承担了整个研究的框架设计和总体指导工作。数据收集由YCY、XCW、WC、YML、YFX负责。YCY和QYZ负责数据处理和文章撰写。QYZ和XLW提供了数据解释和方法建议。gydF4y2Ba

利益冲突gydF4y2Ba

没有宣布。gydF4y2Ba

‎gydF4y2Ba
多媒体附件1gydF4y2Ba

药物超敏反应类型及标准。gydF4y2Ba

DOCX文件,15 KBgydF4y2Ba

  1. 奈斯比特DJ。皮肤药物超敏反应:了解机制和诊断和预测试验的发展。毒理学2004 Jan 15;194(3):179-196。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  2. Gomes ER, Brockow K, Kuyucu S, Saretta F, Mori F, Blanca-Lopez N, ENDA/EAACI药物过敏兴趣小组。儿童药物过敏:来自EAACI药物过敏兴趣小组儿科工作组的报告。过敏2016 Feb;71(2):149-161。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  3. Rukasin CRF, Norton AE, Broyles AD。小儿药物过敏。Curr过敏哮喘代表2019年2月22日;19(2):11。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  4. Lopez-Gonzalez E, Herdeiro MT, Figueiras a .不良反应漏报的决定因素:一项系统综述。禁毒杂志2009;32(1):19-31。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  5. Uzuner O, Goldstein I, Luo Y, Kohane I.从医疗出院记录中识别患者吸烟状况。中国医学信息杂志2008;15(1):14-24 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  6. 马苏德,马苏德,马苏德,马克。临床记录的表型与改进的文献分类模型使用上下文神经语言模型。出来了。2019年10月30日在线预印本发布2019:1 [gydF4y2Ba免费全文gydF4y2Ba]gydF4y2Ba
  7. 黄凯,李志强,李志强。一种可解释的端到端微调方法用于长临床文本。出来了。2020年11月12日在线预印本发布2020:1 [gydF4y2Ba免费全文gydF4y2Ba]gydF4y2Ba
  8. 陈晓明,陈晓明,陈晓明。基于语言模型的主诉提取方法研究。出来了。2019年11月15日在线预印本发布2019:1 [gydF4y2Ba免费全文gydF4y2Ba]gydF4y2Ba
  9. 药物不良反应医学术语使用指南。北京:国家药品监督管理局;2016.gydF4y2Ba
  10. 雷蒙NG。句子- bert:使用连体bert -网络的句子嵌入。出来了。2019年8月27日在线预印本发布2019:1 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  11. 潘文杰,李志强,李志强。长文档分类的分层变换方法。出来了。2019年10月23日在线预印本发布2019:1 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  12. Beltagy IP, Cohan A. Longformer:长文档转换器。出来了。2020年4月10日在线预印本发布2020:1 [gydF4y2Ba免费全文gydF4y2Ba]gydF4y2Ba
  13. 丁明哲,杨华,唐杰。符号变换在长文本中的应用。Adv神经Inf过程系统33。URL:gydF4y2Bahttps://proceedings.neurips.cc/paper/2020/file/96671501524948bc3937b4b30d0e57b9-Paper.pdfgydF4y2Ba[2022-08-18]访问gydF4y2Ba
  14. Fiok K, Karwowski W, Gutierrez-Franco E, Davahli MR, Wilamowski M, Ahram T,等。文本指南:通过基于特征重要性的文本选择方法提高长文本分类的质量。IEEE Access 2021;9:105439-105450。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  15. Park H, Vyas Y, Shah K.使用变压器对长文档进行高效分类。出来了。预印本于2022年3月21日在线发布2021:1 [gydF4y2Ba免费全文gydF4y2Ba]gydF4y2Ba
  16. 使用带有词汇特征的监督学习和非监督学习来确定吸烟者的状态。URL:gydF4y2Bahttps://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.116.1948&rep=rep1&type=pdfgydF4y2Ba[2022-08-18]访问gydF4y2Ba
  17. 李欣,翟松,王强,王勇,尹杰,陈勇。过敏性反应应急管理指南建议。不良反应杂志2019;21(2):85-91。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  18. 过敏性疾病委员会。药物超敏反应综合征诊治专家共识。中华皮肤杂志2018;51(11):787-790。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  19. 中国皮肤病学会药物不良反应研究中心。Stevens-Johnson综合征/中毒性表皮坏死松解症的诊断和治疗专家共识。中华皮肤杂志2021年5月15日;54(5):376-381。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  20. Alsentzer E, Murphy J, Boag W, ww, Jin D, Naumann T.公开的临床BERT嵌入。出来了。2019年4月6日在线预印本发布2019:1 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  21. Turc I, Chang M, Lee K, Kristina T.读得好的学生学得更好:关于预训练紧凑模型的重要性。出来了。2019年8月23日在线预印本发布2019:1 [gydF4y2Ba免费全文gydF4y2Ba]gydF4y2Ba
  22. BERT模型在中国临床自然语言处理中的研究与应用。2021.URL:gydF4y2Bahttps://github.com/trueto/medbertgydF4y2Ba[2021-03-01]访问gydF4y2Ba
  23. Clark C, Good K, Jezierny L, Macpherson M, Wilson B, Chajewska U.用医用抽提系统识别吸烟者。中国医学杂志2008;15(1):36-39 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  24. 王勇,孙松,刘松,沈峰,王林,Atkinson EJ,等。一种采用弱监督和深度表征的临床文本分类范式。BMC Med Inform Decis Mak 2019年1月07日;19(1):1 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba


‎gydF4y2Ba
伯特:gydF4y2Ba来自变压器的双向编码器表示gydF4y2Ba
DHR:gydF4y2Ba药物过敏反应gydF4y2Ba
电子健康档案:gydF4y2Ba电子健康记录gydF4y2Ba
否定:gydF4y2Ba负gydF4y2Ba
SGD:gydF4y2Ba随机梯度下降gydF4y2Ba
SRS:gydF4y2Ba自发报告制度gydF4y2Ba
SVC:gydF4y2Ba支持向量分类gydF4y2Ba
TF-IDF:gydF4y2Ba术语频率-逆文档频率gydF4y2Ba


编辑:T Hao;提交08.03.22;同行评议作者:J Luo, L Chen;对作者04.05.22的评论;修订版本收到日期:06.07.22;接受12.08.22;发表13.09.22gydF4y2Ba

版权gydF4y2Ba

©余云翠,赵秋野,曹王,王小川,李彦明,谢岳峰,王小玲。最初发表于JMIR医学信息学(https://medinform.www.mybigtv.com), 13.09.2022。gydF4y2Ba

这是一篇开放获取的文章,根据创作共用署名许可协议(https://creativecommons.org/licenses/by/4.0/)的条款发布,允许在任何媒介上不受限制地使用、分发和复制,前提是正确引用了首次发表在JMIR医学信息学上的原创作品。必须包括完整的书目信息,https://medinform.www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。gydF4y2Ba


Baidu
map