发表在第八卷7号(2020): 7月

本文的预印本(早期版本)可在https://preprints.www.mybigtv.com/preprint/17176,首次出版
巴西结核病公共卫生系统中的数据集成:使用语义网建立互操作性

巴西结核病公共卫生系统中的数据集成:使用语义网建立互操作性

巴西结核病公共卫生系统中的数据集成:使用语义网建立互操作性

原始论文

1巴西圣保罗大学 奥卡洛斯工程学院生物工程研究生课程

2葡萄牙莱里亚莱里亚理工学院

3.科英布拉系统与计算机工程研究所,科英布拉,葡萄牙

4葡萄牙波尔图卫生技术和服务研究中心

5巴西圣保罗大学里贝尔斯普雷图医学院社会医学系

6社区卫生研究生课程,圣保罗大学,里贝贝普雷图,巴西

7学术结核病项目,里约热内卢联邦大学医学院,巴西里约热内卢

8印度巴特那国立理工学院计算机科学与工程系

通讯作者:

菲利普·卡瓦略·佩里森理学硕士

奥卡洛斯工程学院生物工程研究生课程

圣保罗大学

v. Trabalhador s o- carense, 400

o Carlos, 13566-590

巴西

电话:55 16 3373 9586

电子邮件:felipecp@alumni.usp.br


背景:卫生信息系统的互操作性是一项挑战,因为现有系统在其数据的技术和语义层面上存在异质性。缺乏关于互操作性的现有数据,扰乱了单位内和单位间的医疗业务,并给对现有数据进行研究带来了挑战。目标是交换数据,同时为来自不同来源的数据提供相同的含义。

摘要目的:为了找到解决这一挑战的方法,本文利用本体支持的语义Web技术,提出了一种针对巴西结核病治疗和随访场景的互操作性解决方案。

方法:根据基本形式本体的定义对本体的实体进行了分配。巴西结核应用程序被标记为来自结果本体的实体。

结果:开发了互操作性层,以便以结构化的方式检索具有相同含义的数据,从而实现语义和功能的互操作性。

结论:卫生专业人员可以利用从几个数据源收集的数据来提高其行动和决策的有效性,如在圣保罗州整合结核病数据的实际用例所示。

中华医学杂志,2020;8(7):1177 - 1177

doi: 10.2196/17176

关键字



背景

卫生信息系统的一个关键问题是它们缺乏互操作性[1]。系统不交换数据,即使交换了数据,数据也不具有相同的含义。这种情况可能导致服务操作中断、返工和对医疗术语的理解不足,这反过来又会影响医疗服务的质量,因为医疗差错和医疗费用增加了[2]。此外,可供科学研究使用的数据可能有限[3.]。

结核病是一种可治愈的疾病,但在2018年,它是全球十大死亡原因之一,造成150万人死亡,约1000万新病例[4]。巴西遵循世界卫生组织建议的直接观察短程治疗战略[5]。在巴西,至少有8个主要的结核病卫生信息系统,即SISTB、ILTB、Hygia Web、圣保罗州结核病病例通报和监测系统(TBWEB)、伤害信息通报系统(SINAN)、实验室环境管理器(sistema Gerenciador de Ambiente Laboratory [GAL])、SITE-TB和电子系统Único de Saúde (e-SUS) AB。在其中一些应用中,卫生专业人员必须重新引入相同的信息。当需要患者的历史信息时,需要手工处理。在之前的工作中,我们研究了其中3个系统的数据之间的信息质量,发现一致性和可靠性都很差[6]。

在今天的网络中,大多数可用的内容适合人类解释,因此不容易被其他机器和系统访问。语义网,由Berners-Lee等人定义[7],可以被指定为当前web的扩展,目的是在内容中添加逻辑,以表达信息的含义、属性以及不同类型数据之间存在的复杂关系,从而可以在不担心表示形式的情况下解释给定数据的含义[8]。目标是创建一种在万维网上表示数据的有效方法,以建立一个连接数据的全球数据库[9],通过使用本体对网页和现有关系数据库进行语义标记来提供共同的含义。因此,这项工作建议使用语义网和顶级本体来支持巴西公共卫生系统结核病的互操作性,作为其他标准的替代方案,如OpenEHR [10],主要是由于其灵活性、易于实施以及对现有卫生信息系统架构所需干预的程度较低。我们的工作重点是巴西结核病治疗和直接督导下短程化疗后续工作的具体情况。

互操作性

两个或多个系统透明地交换和使用信息的能力被定义为互操作性[11]。为此,必须遵循一些标准、语言和协议,这取决于希望实现的互操作性的类型。

根据医疗保健信息和管理系统协会,有四个层次的医疗信息技术互操作性:基础,结构,语义和组织[12]。基础互操作性允许来自一个信息技术系统的数据交换被另一个信息技术系统接收,并且不要求接收信息技术系统具有解释数据的能力。基本的互操作性方法包括从直接连接到数据库到使用例如web服务的面向服务的体系结构。结构互操作性是一个中间级别,它定义了数据交换的结构或格式(即消息格式标准),其中卫生保健数据从一个系统到另一个系统的统一移动,从而保留和不改变数据的临床或操作目的和含义。结构互操作性定义了数据交换的语法。它确保信息技术系统之间的数据交换可以在数据字段级别上进行解释。结构化互操作性基于企业服务总线的概念,使用消息格式标准。在卫生保健系统中,HL7是作为事实标准的参考[13]。医学数码影像及通讯(DICOM) [14]是关于设备和图像信息系统之间数据交换的另一个参考。NextGen Connect集成引擎[15]也是一个跨平台引擎,允许在系统和应用程序之间以许多受支持的标准(如HL7 V2、HL7 V3、HL7快速医疗保健互操作性资源、DICOM)双向发送消息。语义互操作性提供最高级别的互操作性,这是两个或多个系统或元素交换信息和使用已交换的信息的能力。语义互操作性既利用了数据交换的结构,也利用了数据编码(包括词汇表),以便接收信息技术系统能够解释数据。这种级别的互操作性支持护理人员和其他授权方之间通过可能不同的电子健康记录(EHR)系统和其他系统进行患者摘要信息的电子交换,以提高医疗保健服务的质量、安全性、效率和功效。OpenEHR [16]是关于卫生保健中的语义互操作性的参考。它是健康信息学中的一个开放标准规范,描述了电子病历中健康数据的管理、存储、检索和交换。最后,我们还可以考虑组织互操作性,这与不同的组织如何协作以实现相互同意的电子政府目标有关。有关机构须就合作及同步业务流程订立详细协议,以提供综合政府服务[17]。集成医疗保健企业(IHE)概要文件有助于集成系统的最佳实践并为组织互操作性提供基础,它提供了一个通用框架来理解和处理临床集成需求。IHE配置文件不仅仅是数据标准;它们描述了工作流程,这使得它们更适合卫生保健信息技术专业人员使用,也更适用于他们的日常活动[18]。

语义互操作性也可以通过语义Web实现。定义语义Web的基本块是标准数据模型、查询协议和一组参考词汇表。W3C标准和定义,如资源描述框架(RDF)、SPARQL协议和RDF查询语言,以及本体引用这些基本块,分别定义为描述语言和数据模型、获取RDF中存储的数据的查询协议,以及给定知识的形式化表示[19]。本体可以定义为特定领域知识的形式表示[20.],旨在制定一个严格而详尽的概念方案。反过来,Web本体语言是一种用于发布和共享本体的语义标记语言,旨在描述类及其之间的关系[21]。

在巴西的情况下,卫生部第2073/2011号法令规定了在统一卫生系统(SUS)和辅助卫生部门范围内使用互操作性标准[22以保证卫生信息系统的功能和语义互操作性。具体到结核病,结核病病例的随访涉及填写卫生部标准化的几种登记工具,如个人通报表(Formulário de notifica o Individual [FNI])、直接观察治疗记录、结核病病例治疗和随访记录,以及全国范围内的电子病历TBWEB、SINAN、SITE-TB、GAL和e-SUS AB。其他本地系统亦有参与,包括Hygia Web、SISTB [23]和医院的信息系统,分别是政府、州和地区的卫生信息系统。

SISTB存储和集中里贝赫普雷托市有关患者、治疗、检查和住院的信息。HygiaWeb是ribebe o Preto市的公共卫生管理软件,它连接了当地许多层次的医疗保健系统。TBWEB是圣保罗州政府为流行病学监测开发的软件。SINAN是一种在全国范围内使用的软件,用于通报国家政府规定的某些强制通报疾病的每一个新病例。GAL允许管理例程和监视进行考试的步骤,其中包含可能与存储在SISTB中的考试记录相关联的数据。SITE-TB是一个平台,支持通报所有不涉及通常用于耐药结核病的药物(即利福平、异烟肼、吡嗪酰胺和乙胺丁醇)的治疗处方。E-SUS AB是全国范围内的基础关注健康管理软件。

这些具有不同技术、数据格式和语义的众多系统给患者的随访带来了困难,因为它们可能造成重复、丢失和矛盾的信息[6]。

在下一节中,我们将介绍使用语义Web的互操作性领域中的一些关键工作。

相关工作

起初,洛佩斯和奥利维拉[24]使用了封闭和分布式筒仓的比喻,其中的健康数据是分散分布的,从而突出了处理这些数据的软件的可靠性。作者建议通过一个框架迁移到语义Web模型,这个框架是由同一作者理想化的,它不仅允许提取数据,还允许提取知识。Valle等[25],在一个类似的倡议中,提倡将语义网范例与市场上广泛使用的技术(如可扩展标记语言和Web服务)结合起来,以实现卫生领域的互操作性。作者为这种方法辩护,因为它促进了应用程序之间语法和语义互操作性的结合。

阿布舍克和辛格[26]提出了一个遵循基本形式本体(BFO)原则的针对印度结核病场景的本体。希特勒和雅诺维奇[27]强调了语义网的日益普及。这种增长是可能的,这要归功于语义Web范例的应用程序没有绑定到特定类型的知识或领域。相反,语义网支持的环境中,规程中隐含着跨学科性和异构性。从这个意义上说,越来越多的惯例和越来越多的人对这个主题感兴趣是合理的,无论他们来自学术界还是商业环境。

Ogundele等[28]开发了一个本体,用于表示、巩固和组织有关影响结核病患者治疗依从性行为的因素的知识。创建的资源库可用于在研究中使用的类似社区中寻找影响结核病治疗依从性的潜在因素,生成其风险指数,并帮助监测患者及其随访。

在处理术语级语法异构之前,必须先解决概念化之间的异构,这样才能有效地进行语义互操作性。在gonalalves等人的概念证明中[29],进行了一项实验,该实验提供了证据,证明心电图本体可以有效地用于支持涉及心电图的其他可互操作版本的设计,例如HL7注释心电图。作者还通过他们的结果证实,他们的方法也可以应用于其他领域。

库马尔(30.讨论了一些词汇表,以及如何使用它来实现应用程序之间的互操作性。然而,他也讨论了围绕使用语义Web的应用程序的隐私和互操作性的问题。此外,根据Zenuni等人[31],在本体中映射专有格式是一项复杂而紧张的任务,而本体的维护是其中一个微妙的点。

尽管存在这些挑战,但必须参考一些关键的实际案例研究。Belleau等[32]提出了Bio2RDF项目,该项目使用语义网工具对从众多数据库中提取的生物医学知识进行聚类。McMurray等[33]开发了一种区域医疗保健之间临床电子交换的概念模型。本体允许通过计算模型对模型和实例进行可视化,并用于使用不同的数据库验证收集的数据子集,尽管它仍然具有与研究兴趣相关的数据库。Jiang等[34]介绍了为巩固《国际疾病分类》第11版所建议的定义而开发的一种工具。他们通过涉及专家共识、协作和分布式验证以及支持的治理模型生成的分类允许对这些参数进行最佳调整。然后将这些分类与统一医学语言系统和系统化医学命名法-临床术语中的其他值进行比较。结果的汇编提交给专家进行评估和有效分配的可用性程度。最后,Abhishek和Singh [26]创建了一个本体论,以协助国家印第安人结核病控制和管理计划的管理人员做出决策。该本体的基础是BFO,其特征是元本体,允许对希望表示的领域的实体进行层次结构和正确的划分和分类。这种方法促进了使用同一元本体构建的其他本体之间的可能映射,并保证了基于语义Web规则语言的知识提取算法应用的语义一致性。在上述工作中演示了几个查询示例,证明了所采用的解决方案的鲁棒性。

下一节介绍了巴西公共卫生系统支持结核病的互操作性解决方案的建议。


语义Web解决方案的基石是其底层本体。因此,第一步是考虑临床结核概念的本体论的发展;现有系统FNI、TBWEB、SINAN、SISTB、HygiaWeb、e-SUS AB和GAL;以及与结核病和DOTS相关的概念。直接督导下的短程化疗是世界卫生组织建议的国际结核病控制战略,已被公认为一项高效率和具有成本效益的战略。如前所述,这是巴西政府采取的战略。

本体的实体在BFO的定义下进行分配,BFO是最初为生物医学等科学领域开发的顶级本体。BFO看到了将所有特定实体(个人)划分为连续和发生两个不相关的类别的现实。连续实体包括对象、属性和位置,与发生实体形成对比,后者包括过程和时间区域。过程在时间上发生,所以时间部分也有。相比之下,连续体在它们存在的任何时间都完全存在。因为它是一个基本的现实主义方法论的上层本体,并且具有高层次的表示,所以它允许在一个时间空间内映射几个实体、过程及其各自的功能和特征,比其他仅对这些情况进行快照的本体突出。考虑到我们对医学和管理领域的术语映射的兴趣,这样的顶级本体是一个很好的选择。图1提出了直接督导下的短程化疗在巴西卫生政策范围内的结果本体,以及图2表示其对象属性。

图1所示。直接观察短程治疗(DOTS)本体支持巴西公共卫生系统的互操作性。
查看此图
图2。与直接观察短程治疗(DOTS)相关的客体特性。
查看此图

阿布舍克和辛格[26]演示了为印度结核病情景创建的本体,作为本工作中呈现的本体发展的基础。当使用相同的框架来表示巴西场景时,本体-本体的映射得到了促进。这是因为BFO已经对这些术语进行了分类,使得意义抽象阶段变得微不足道,只需要具有相似意义的术语之间的关系。通过消除意义抽象的步骤,也消除了固有的主观性负担,这种负担可能导致一个本体论到另一个本体论的映射错误。图3-5是映射到BFO的概念的摘录。

考虑到定义的哲学复杂性和我们选择的全面性,BFO结构中术语的映射呈现出相当大的困难。很明显,在本体构造中指定的操作粒度可以随着工程师的需要而增长。然而,对于这项工作,最终的形式化显示在图3-5是作者之间达成共识的结果,并且被认为足以支持被提议系统之间的互操作性。

图3。第一部分将结核实体映射到基本形式本体(BFO)。
查看此图
图4。第二部分将结核实体映射到基本形式本体(BFO)。
查看此图
图5。翻译后的术语允许在应用程序之间交换数据。
查看此图

实现系统间互操作性和DOTS数据恢复的关键概念在图5。描述了患者的个人资料(地址、出生日期、自然人登记簿[Cadastro de Pessoas Físicas, CPF]、母亲姓名)和健康相关信息(国民健康卡、HYGIA ID、思南ID)。检索数据的传递性特征,加上本体提供的语义互操作性保证,使得来自参与应用程序的患者数据能够合并。这增加了需要做出战略和临床决策的卫生专业人员所获得的信息的相关性。

这个本体允许标记所有必要的数据,以实现前面提到的系统之间的互操作性。

数据可以通过在支持SPARQL语言的端点上的查询获得,也可以通过在语义上标记了本体(网站、文本文档、电子表格、RDF)的任何数据源获得。但是,在后一种情况下,需要处理这些数据,以充分利用SPARQL端点直接返回的数据中没有出现的信息。一个具有挑战性的问题涉及这个建议的解决方案与遗留数据库的兼容性。这种担忧是合理的,因为在几年的保健服务中积累的知识具有不可估量的价值。从这个意义上说,需要寻找一种替代方法来解决关系数据库管理系统的性能和兼容性问题。选择的工具是D2R服务器[3536],它允许基于给定本体建立虚拟数据库,并在遗留数据库上执行SPARQL查询,以RDF格式返回所需的信息,即最终值本身,并在语义Web范例中使用。该解决方案通过应用程序编程接口调用,以积极的方式减少了从遗留系统到语义Web的范式转换所造成的影响。使用这种方法,不需要对整个数据库进行处理,从而使其可用于基于web的语义应用程序。然后,这个框架允许在遗留应用程序和支持语义web的应用程序之间进行数据交换。


图6,实现了FNI、TBWEB、SINAN、SISTB、HygiaWeb、e-SUS AB、SITE-TB和GAL之间的互操作层,实现了透明的信息交换。互操作性层基于W3C预先制定的语义Web范例和标准。这种范式允许通过web服务以优化的方式从这些系统中为机器提取内容,为生成有用的决策信息提供了一系列可能性,正如Berners-Lee等人所指定的[7]。

图6。结核病治疗实施后的信息流;改编和改进自[3738]。DOT:直接观察治疗;e-SUS:电子系统Único de Saúde;FNI: Formulário de notificaparr o Individual;GAL: sistema Gerenciador de Ambiente实验室;SINAN:工伤通知信息系统;巴西圣保罗州结核病病例通报和监测系统。
查看此图

当患者出现一些与呼吸系统有关的症状时,就会寻求卫生服务。这种需求可能是自发的,也可能是定向的。自发需求是指病人自行寻找全科医生或肺炎科医生。以需求为导向的搜索是指患者由全科医生、初级保健医生或家庭医生转介到该专业。然后将患者转到初级保健(如果此时尚未开始寻找护理)。如果症状证实推定为结核病,则要求进行胸部x光检查和痰液检查,并安排医生预约。在获得检查结果后,患者将被转介到门诊,在那里开始治疗。直接观察治疗情况,所有随访数据存储在SISTB中。直接观察治疗是一项卫生政策,旨在密切监测治疗和患者的演变,以提高治疗的有效性和成功率。

为了实现互操作性,有必要使用前面提出的本体对参与系统进行语义标记。要做到这一点,HTML页面可以通过微数据框架进行标记[3940用特定的属性扩展HTML规范。另外,可以配置中间件(如D2R Server),将关系数据库公开为虚拟RDF数据集。

标签直接引用本体中使用的术语。之所以选择这种标记格式,是因为它允许搜索引擎轻松地从标记的字段中提取知识,因为HTML语言是web应用程序的通用基础。这种知识提取的最大优点是语义互操作性已经隐式地插入到页面上下文页面中,因为本体给出了标记数据链接到的每个逻辑结构,从而避免了为返回的数据分配意义的进一步工作。

在这些系统中,都需要一个活动的SPARQL端点服务,以便对存储在遗留数据库中的信息运行SPARQL查询。这样的端点可以由中间件提供,比如D2R服务器。这是提取在采用语义Web范例之前存储的数据以启用互操作性层的基础。

直接从标记页面提取信息是通过Any23库完成的,Any23库直接提取对象或文字及其标记(对应于本体)。使用提取的数据,可以实现几种类型的SPARQL查询,并将这些信息合并到本地数据库中以用于任何查询。

一个非常简单的SPARQL查询(其中返回所有患者的所有属性)被用作合并从标有各自本体的其他系统提取的数据的基础。

需要注意的是,这个查询可以在所有标记系统的数据上执行。这保证了返回的数据具有相同的含义,因为它们被标记为相同的本体,因此可以在系统之间互操作。

这种方法允许在任何系统上(通过HTTP请求或SPARQL端点)获取带有相同本体标记的数据。然后,如果需要,对返回的数据进行处理并将其纳入系统,或者可用于特别查询和统计,从而使卫生专业人员能够快速做出决策。从这个意义上说,语义互操作性和功能互操作性都在卫生信息系统所寻求的数据完整性和快速响应功能中起作用。

在这项工作范围内的所有卫生信息系统都有识别患者的共同数据(CPF、国民健康卡、出生日期)。也就是说,使用语义标记,可以返回指向特定患者的数据,并将它们聚合到单个结果中,或者只导入足够的数据以进行决策,如所示图7。这些记录的交集代表了当前患者健康状况的快照,证实了患者医疗保健的完整性。从几个卫生信息系统中检索这些信息,可以使卫生专业人员做出比使用孤立系统更详细的决定。从管理的角度来看,为完成人口研究而收集的数据也有所改进。由于获得更多关于大多数病人的信息,也促进了制定更专业、更有效的公共卫生政策。

图7。在SISTB和圣保罗州结核病病例通知和监测系统(TBWEB)上同时查询特定患者sinan_id=10的SPARQL查询结果。
查看此图

一个关键的挑战是实现与其他标准(如HL7、OpenEHR和IHE概要文件)的互操作性。在HL7的情况下,一种可行的方法是部署能够通过语义标记将提取的数据转换为HL7消息的中间件。x或V3.x)。普拉斯蒂拉斯和奥沙利文[41]发表了他们的工作,并开发了类似的中间件,以实现从个人健康记录到电子病历的数据互操作。但是,我们建议的中间件接收作为输入的语义标记应用程序的提取数据,构造消息,并将它们转发给收件人。在此场景中,必须努力在HL7标准推荐的预先指定字段中映射特定于领域的本体的实体。

这种工作类似于映射哪些实体匹配先前指定的OpenEHR原型。也就是说,为了使使用语义Web的系统与使用OpenEHR标准的系统进行互操作,有必要确保原型完全由本体的实体表示。由于将原型映射到本体的实体也是非常必要的,因此相互作用也是正确的。这些过程的例子是图8

作为以下提议架构的最新结果,可以有效地引用pelison等人的工作[42]。他们的工作展示了在巴西圣保罗州使用语义Web资源(如SPARQL查询和RDF)进行结核病数据集成的概念证明。通过联合查询,数据同时从TBWeb(州政府系统)和SISTB(主要在ribebe o Preto(巴西)市使用的区域结核病信息系统)获得。通过这样做,可以将来自两个源的数据与聚合的语义值组合在一起。

图8。使用语义网和其他标准(如HL7 FHIR和OpenEHR)的应用程序之间互操作性的体系结构。
查看此图

人口统计数据用于在地图上标注点,并比较数据集之间的值,这些数据集包括纬度、经度、怀孕情况、年龄、性别、通知城市、联邦统一(州)、学校教育和种族。用户能够使用地图界面中提供的过滤器获取有关结核病例通报的信息。根据已通报结核病病例的市政当局,将搜索结果绘制为热图。

这项工作是对概念的证明,它提醒人们注意制定解决办法的重要性,这些办法可以提高卫生领域的数据质量和卫生专业人员的日常活动。


主要研究结果

本研究提出了一个基于BFO元本体的本体来支持巴西结核病相关数据。基于bfo的本体的构建得益于这样一个事实,即它很容易与建立在同一框架上的其他本体相关联。这使得不同的本体以一种更容易的方式联系起来,因为它们的实体是根据同一元本体所倡导的语义系统地分层组织起来的。这种本体间关系具有巨大的潜力,因为它允许标记数据通过承载各自的语义值而在机构之间共享,并扩大了它们的多中心研究潜力。正如Abhishek和Singh所引用的那样,目前有一些计划来绘制与其他情况下结核病治疗相关的术语和构建本体论[26]。由于本工作是基于同一元本体进行的,并且由于本体之间的关系,标记系统之间的数据转换的可能性是可行的,并且对双方都很有趣,从而实现语义互操作性。

尽管像OpenEHR这样的解决方案将领域语义作为中心关注点,但它被优化为提供一个更加关注数据持久性的数据平台,而数据交换是次要关注点。OpenEHR使用大量复杂原型(即模型或模式)来获取临床信息,这些原型旨在提供最大的数据元素集。这种广度和深度不可避免地带来一定程度的复杂性。另一方面,语义Web通过使用本体作为模型来表示健康领域数据,从而提供了更大的灵活性。作为OpenEHR原型,本体可以被重用、扩展和适应特定的需求(加上必要的变更) [43并且可以很容易地应用到卫生信息系统中,而无需付出太多努力。通过使用为语义Web设计的工具(如虚拟图(或元组)存储库)为数据添加意义,并开发集成的应用程序编程接口来执行数据交换,降低了卫生信息系统中的干预水平,从而为功能和语义互操作性带来了更直接的好处。

在建筑的发展过程中,发现了一些挑战和未来研究成果的可能性。所有的本体都可以被修改,要么是因为领域定义的改变,要么是因为它们的结构的修正和其他被认为是本体正常运行所必需的调整。然而,这样的更改会直接影响被它标记的系统,并且需要特别注意被本体标记的数据。有必要控制本体版本,以允许本体生命周期的重建,并在其标记的版本中跟踪提取的数据的含义。因此,有必要找到最简单、最直观的重新调整方案,以便重新标记数据,并尽量减少对系统的负面影响。这一领域已经开展了一些工作,重点是预测本体变化的模式,如Javed等人所展示的[44]。

对于版本控制,我们还需要注意如何标记这些数据,因为在使用带有许多实体和术语的本体的系统中,这项任务需要付出相当大的努力。这样的自动标记只需要执行少量的工作并记录下来,可能需要在开发各自本体的领域中使用专门的标记。仍然有可能强调一些已经提出的倡议,以帮助开发人员至少以半自动的方式进行标记。其中,我们可以提到UCCA-App [45], MnM [46],以及SemTag和Seeker [47]。减少标记工作,无论是在最初还是在给定本体的新版本发布之后,都应该是未来工作的重点,以提供使用语义Web范例的简化系统维护。

构造本体的灵活性和它们所拥有的高层次抽象使得原型的映射过程相对简单,当一个人已经为负责管理标准存储库的基础拥有了一个公认的原型时。仍然需要强调的是,语义Web方法可以合并到几个IHE概要文件中,这样集成就可以发生在几个领域,足以拥有一个支持所有这些领域及其各自流程的本体。

在巴西,特别是卫生部正在开展的互操作性协议倡议面临着许多官僚主义和技术挑战。这意味着这些标准的实现本身包括对已经存在的应用程序进行重新编码、部署端点以实现功能互操作性、以及对负责该标准的机构(如OpenEHR)所接受的场景进行映射等方面的大量工作。这意味着使许多健康应用程序在语义和功能上实现互操作所需的时间要比语义Web方法长得多。语义Web本身的概念支持这种肯定,它允许更灵活的治理来开发其本体。语义Web的使用具有比其他互操作性标准(如前面提到的HL7和OpenEHR)更动态的域范围治理的优势。这样的动态有利于术语的演变和对新趋势的适应,这在健康领域是固有的循环,技术、新程序和临床方案每天都在发展。

考虑到这一架构,就有可能扩大由战略计划建立的Conecta SUS的倡议[48]由巴西政府国家卫生术语中心制作。Conecta SUS是Rijo等人提出的一种改善方案[49],作者展示并评估了巴西许多卫生机构缺乏互操作性。

结果显示了该体系结构的可行和实际用途,为任何医疗保健级别或专业的应用开辟了新的视野。

结论

在这项工作中,研究和实施了一个支持巴西结核病情景的本体。利用元本体BFO对术语进行分类,构建了该本体。这种形式化将允许将TB的巴西本体实体映射到其他也使用BFO作为模型并具有类似实体的本体之间,从而促进语义互操作性。在构建的本体基础上,开发了一个体系结构,以允许存储与结核病相关的健康数据的应用程序之间的功能互操作性。通过微数据属性标记应用程序,并创建本体的术语。该标记支持从每个应用程序中安装的端点上的单个SPARQL查询从多个应用程序中提取内容。值得一提的是,已经实现了在关系数据库和三元存储中运行SPARQL查询的解决方案,从而允许维护遗留数据库。本文中的示例展示了如何从具有相同注册的所有应用程序返回来自给定患者的数据。返回的数据保持了其含义,实现了语义和功能的互操作性。我们工作的一个限制是对涉及耐多药结核病、广泛耐多药结核病的实体进行测绘,以及对这些病例和合并症的通报申请(SITE-TB)。 Future work will include the map of these workflows and other support applications like the National Regulation System (SISREG) and demographic applications from the Brazilian Institute of Geography and Statistics (IBGE).

尽管使用遗留数据库很容易,但仍需要改进服务,以便在日常实践中促进该解决方案的实现。自动数据标记可能是一个研究兴趣领域,它有助于为数据赋予语义。短期内其他可行的例子是实现本体间和本体内映射服务,以及标准间消息总线和路由服务。第一种方法允许用多个本体版本标记数据,从而由使用不同本体的不同应用程序使用。第二个协议将允许使用语义web以外的范例和模式的应用程序之间的互操作性,例如HL7 FHIR和OpenEHR。

致谢

本研究得到了巴西科学、技术、创新和通信部国家信息环境保护委员会Científico e Tecnológico (CNPq)(流程:440758/2018-1)和巴西教育部和卫生部基金会Nível高级信息环境保护委员会(CAPES)(流程:88887.141211/2017-00)的支持。

利益冲突

没有宣布。

  1. Gambo I, Oluwagbemi O, Achimugu P.发展中国家缺乏互操作的卫生信息系统:影响分析。发展中国家卫生信息学杂志。URL:http://www.jhidc.org/index.php/jhidc/article/view/60[2020-02-03]访问
  2. 刘建军,刘建军,刘建军,等。医疗卫生领域的互操作性研究进展。国际创新与应用研究,2013;3(1):262-270 [j]免费全文
  3. 吴林,刘建军,李建军,李建军。科学数据的公共资产管理:基于数据共享的政府部门管理策略。中国生物医学工程学报,2013,31(2):551 - 562。[CrossRef
  4. 2019年全球结核病报告。世界卫生组织。URL:https://www.who.int/tb/global-report-2019[2020-02-03]访问
  5. Creswell J, Sahu S, Sachdeva KS, Ditiu L, Barreira D, Mariandyshev A,等。金砖国家的结核病:2015年后议程中领导力的挑战和机遇。公牛。世界卫生组织2014年6月1日;92(6):459-460。[CrossRef
  6. Yamaguti VH, Vicentine FB, de Lima IB, Zago L, Rodrigues LML, Alves D,等。结核病的数据质量:巴西圣保罗州两个门诊的案例研究。计算机科学学报,2017;21:897-903。[CrossRef
  7. 伯纳斯-李T,亨德勒J,拉西拉O.书。语义网:一种对计算机有意义的新形式的网络内容将引发一场新的可能性革命。《科学美国人》;2002:一个。
  8. Robu I, Robu V, Thirion B.健康科学图书馆员的语义网介绍。医学图书馆协会。?2006年,94(2):205。
  9. Laufer C. Guia de web semntica。Guia de web semntica。URL:https://nic.br/media/docs/publicacoes/13/Guia_Web_Semantica.pdf[2020-02-03]访问
  10. Pahl C, Zare M, Nilashi M, de Faria Borges MA, Weingaertner D, Detschew V,等。OpenEHR作为产科患者数据区域建模的开源解决方案的作用。生物医学信息学报(英文版);2015;55:174-187。[CrossRef
  11. 电气和电子工程师学会。IEEE标准计算机词典:IEEE标准计算机词汇汇编。网站1991年1月18日。[CrossRef
  12. HIMSS。什么是互操作性?医疗保健信息和管理系统学会。12月9日出版。2019.URL:https://www.himss.org/what-interoperability[2020-02-03]访问
  13. 关于Health Level Seven International | HL7 International国际健康7级。URL:http://www.hl7.org/about/index.cfm?ref=nav[2020-02-03]访问
  14. 并建置。DICOM标准。URL:https://www.dicomstandard.org/[2020-02-03]访问
  15. 次世代医疗保健。NextGen®连接集成引擎。URL:https://www.nextgen.com/products-and-services/integration-engine[2020-02-03]访问
  16. 什么是openEHR?OpenEHR——电子健康的开放行业规范、模型和软件。希尔德S,比尔t。https://www.openehr.org/about/what_is_openehr[2020-02-03]访问
  17. 李建军,李建军,李建军,等。公共部门互操作系统的研究进展。信息通信技术转型政府研究手册2009:175-195。[CrossRef
  18. 国内国际。配置文件。URL:https://www.ihe.net/Profiles/[2020-02-03]访问
  19. 的网站。URL:https://www.w3.org/TR/rdf-sparql-query[2020-02-03]访问
  20. 克雷格E.劳特利奇哲学百科全书。伦敦:劳特利奇;1998.
  21. OWL——语义Web标准。猫头鹰。URL:https://www.w3.org/OWL/[2020-02-03]访问
  22. 政府计划Eletrônico巴西。Padrões de Interoperabilidade de Governo Eletrônico。2018.URL:http://eping.governoeletronico.gov.br/[2020-02-03]访问
  23. Crepaldi N, orf o N, Yoshiura V, Villa T, Netto A, Alves D. Desenvolvimento e植入 系统信息 数据信息 o do acompanhamento de doentes de结核。里贝贝雷普雷图医院医学学院研究进展Clínicas da FMRPUSP 2017:13-17。[CrossRef
  24. 刘建军,刘建军。基于语义web的卫生系统互操作性框架。2011年发表于:第一届管理卫生系统互操作性和复杂性国际研讨会会议记录- MIXHS 11;2011;格拉斯哥,苏格兰。[CrossRef
  25. 李建军,李建军,李建军,李建军。基于语义Web服务的电子医疗服务研究。STI因斯布鲁克。URL:https://www.w3.org/2005/04/FSWS/Submissions/46/SWS4HC.pdf[2020-02-03]访问
  26. 辛格议员Abhishek K。基于本体论的印度结核病管理与控制决策支持。IJET 2016, 12月31日;8(6):2860-2877。[CrossRef
  27. Hitzler P, Janowicz K.语义网?互操作性、可用性、适用性。语义网。(1、2)2010;1:1-2。[CrossRef
  28. Ogundele OA, Moodley D, Pillay A, Seebregts C.影响撒哈拉以南非洲结核病治疗依从性行为因素的本体。PPA 2016年4月:669。[CrossRef
  29. 龚帕拉尔维斯B, Guizzardi G, Pereira Filho JG。利用心电参考本体实现心电数据的语义互操作。生物医学信息学报,2011;44(1):126-136。[CrossRef
  30. V KK。面向社交网络互操作性和隐私问题的语义Web方法。IJWSC 2014 Sep 30;5(3):13-17。[CrossRef
  31. 李建军,李建军,李建军,等。基于语义网络的医疗卫生信息系统研究。社会与行为科学学报;2015年7月;195:1990-1998。[CrossRef
  32. 刘建军,刘建军,李建军,等。基于生物信息学的生物信息学知识系统研究。生物医学信息学报,2008;41(5):706-716。[CrossRef
  33. 朱磊,陈华,陈辉。电子卫生信息交换的本体建模。生物医学信息学报(英文版);2015;56(6):169-178。[CrossRef
  34. 郭江,吴建军,张建军。基于语义网的ICD-11文本定义生成。2012年发表于:第四届生命科学语义网应用与工具国际研讨会论文集(SWAT4LS 11);2012;伦敦,英国。[CrossRef
  35. D2R服务器?在语义网上发布关系数据库。Bizer C, Cyganiak R.https://pdfs.semanticscholar.org/afd5/68bbc4d8c5212e13bfa2541296085c5ed45b.pdf[2020-02-03]访问
  36. D2RQ平台?作为虚拟RDF图访问关系数据库。D2RQ。URL:http://d2rq.org/[2020-02-03]访问
  37. pelison FC, Lopes Rijo RPC, Lima VC, de Lima RR, Martinho R, Cruz Correia RJ,等。基于语义网的可互操作系统的开发与评估,以加强结核病患者数据的管理。计算机科学学报,2017;21:791-796。[CrossRef
  38. Filho C, Dias T, Alves D. arqusamtipos: OpenEHR的官员没有控制结核病。里贝贝雷普雷图医院医学院研究进展Clínicas FMRPUSP。URL:http://revista.fmrp.usp.br/2013/suplementos/revista_IASIS2014.pdf[2020-02-03]访问
  39. Bizer C, Eckert K, Meusel R, m hleisen H, schuhacher M, Völker . RDFa、微数据和微格式在Web上的部署?A定量分析。计算机科学课堂讲稿:语义网?ISWC 2013:2013 - 2032。[CrossRef
  40. W3C。HTML微数据。URL:https://www.w3.org/TR/microdata/[2020-02-03]访问
  41. 结合本体和开放标准推导出个人和电子健康记录互操作性的中间层信息模型。J Med system 2017 Oct 28;41(12)。[CrossRef
  42. 彭丽娟,李建军,李建军。基于语义网的圣保罗州结核数据集成研究。计算机科学学报(英文版);2019;64:686-691。[CrossRef
  43. Pahl C, Zare M, Nilashi M, de Faria Borges MA, Weingaertner D, Detschew V,等。OpenEHR作为产科患者数据区域建模的开源解决方案的作用。生物医学信息学报(英文版);2015;55:174-187。[CrossRef
  44. 贾维德,杨建军,杨建军。本体变更管理与变更模式识别。[J] .数据语义学报,2013,22(2):119-143。[CrossRef
  45. Abend O, Yerushalmi S, Rappoport A. UCCAApp:基于句法和语义短语标注的web应用。2017,发表于:ACL学报,系统演示;2017;加拿大温哥华。[CrossRef
  46. Vargas-Vera M, Motta E, Domingue J, Lanzoni M, Stutt A, Ciravegna F.本体驱动的语义标记半自动和自动支持。知识工程与知识管理:本体与语义网,计算机科学讲义2002:379-391。[CrossRef
  47. 刘建军,刘建军,刘建军,等。基于语义标注的语义网自动引导。2003年发表于:第十二届万维网国际会议论文集- www.03;2003;纽约,美国。[CrossRef
  48. 国家术语中心Saúde。于2020年2月3日发布。国家术语分析中心saúde: planejamento estraticico 2018 ?2021.URL:http://portalarquivos2.saude.gov.br/images/pdf/2018/junho/14/planejamento-estrategico-centerms.pdf[2020-06-10]访问
  49. Rijo R, Martinho R, Oliveira A, Alves D, Reis Z, Santos-Pereira C,等。从商业角度分析巴西卫生组织的IT安全和互操作性。国际电子卫生和医疗通信杂志2020:2020。[CrossRef


拍频振荡器:基本形式本体。
论坛:Cadastro de Pessoas Físicas。
点:直接观察治疗,短期疗程。
e-SUS:电子系统Único de Saúde。
电子健康档案:电子健康记录。
FNI:Formulário de notifica o Individual。
加:系统环境实验室。
国内:整合医疗保健企业。
RDF:资源描述框架。
希:工伤通知信息系统。
结核病:肺结核。
TBWEB:圣保罗州肺结核病例通报和监测系统。


G·艾森巴赫编辑;提交24.11.19;R Martinho, V Della Mea的同行评审;对作者的评论31.12.19;收到17.02.20修订版本;接受22.03.20;发表06.07.20

版权

©Felipe Carvalho pelison, Rui Pedro Charters Lopes Rijo, Vinicius Costa Lima, Nathalia Yukie Crepaldi, Filipe Andrade Bernardi, Rafael Mello Galliez, afrnio Kritski, Kumar Abhishek, Domingos Alves。原发表于JMIR Medical Informatics (http://medinform.www.mybigtv.com), 06.07.2020。

这是一篇在知识共享署名许可(https://creativecommons.org/licenses/by/4.0/)条款下发布的开放获取文章,该许可允许在任何媒介上不受限制地使用、分发和复制,前提是原始作品(首次发表在JMIR Medical Informatics上)被适当引用。必须包括完整的书目信息,到http://medinform.www.mybigtv.com/上原始出版物的链接,以及版权和许可信息。


Baidu
map