JMIR J医疗互联网服务 医学互联网研究杂志 1438 - 8871 卡塔尔世界杯8强波胆分析 加拿大多伦多 v24i10e37978 36240003 10.2196/37978 原始论文 原始论文 开放环境下卫生保健研究的安全协作平台:访问控制的问责视角 蒂芙尼 Asprion 佩特拉 Bošnjak 利昂 皮门特尔 玛丽亚·达·格拉萨 Giluk 1 https://orcid.org/0000-0001-6484-5449 Young-Gab 学士,硕士,博士 1
计算机与信息安全与智能无人机融合工程系“, 世宗大学 广津区陵东路209号 首尔,05006 大韩民国 82 0269352424 alwaysgabi@sejong.ac.kr
https://orcid.org/0000-0001-9585-8808
计算机与信息安全与智能无人机融合工程系“, 世宗大学 首尔 大韩民国 通讯作者:Young-Gab Kim alwaysgabi@sejong.ac.kr 10 2022 14 10 2022 24 10 e37978 14 3. 2022 13 7 2022 2 8 2022 30. 8 2022 ©Giluk Kang, Young-Gab Kim。最初发表于《医疗互联网研究杂志》(//www.mybigtv.com), 14.10.2022。 2022

这是一篇开放获取的文章,根据创作共用署名许可(https://creativecommons.org/licenses/by/4.0/)的条款发布,允许在任何媒介上无限制地使用、分发和复制,前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。

背景

随着信息技术在卫生保健领域的应用,国家卫生机构越来越多地收集和存储各种电子卫生数据。由于这些电子健康数据可以推进现代医疗保健系统,使其更加智能,许多研究人员希望在他们的研究中使用这些数据。然而,使用电子健康数据会带来隐私和安全问题。支持卫生保健研究的分析环境也必须考虑许多要求。由于这些原因,各国通常为卫生保健提供研究平台,但一些数据提供者(如患者)仍然担心其电子卫生数据的安全性和隐私性。因此,需要一个更安全的医疗保健研究平台,保证电子医疗数据的效用,同时关注其安全性和隐私性。

客观的

本研究旨在实现一个健康医疗研究平台——健康医疗大数据平台(HBDP),该平台比以往的健康医疗研究平台更安全。HBDP使用基于属性的加密在开放环境中实现对存储的eHealth数据的细粒度访问控制和加密。此外,在HBDP中,平台管理员可以通过私有区块链执行适当的跟踪(例如,阻止非法用户)和监控。换句话说,HBDP支持访问控制的问责制。

方法

我们首先确定了医疗保健领域的潜在安全威胁。然后,我们定义了安全需求,以最小化已识别的威胁。特别是,这些需求是基于现有医疗保健研究平台中使用的安全解决方案定义的。然后,我们提出了HBDP,它满足定义的安全需求(即访问控制、存储的电子健康数据加密和问责制)。最后,我们实现了HBDP,以证明其可行性。

结果

本研究基于与威胁相关的具体场景,通过实现的HBDP进行非法用户检测的案例研究。因此,平台通过安全代理适当地检测到非法用户。此外,在对海量数据加密(例如,10万行,46列中有3个敏感列)进行列级加密、列级加密后的完全加密和包括列级解密的完全解密的经验评估中,我们的方法分别实现了大约3分钟、1分钟和9分钟。在区块链中,1Org和2Peers的平均延迟和吞吐量在读模式下达到约18秒和每秒49个事务(TPS),在写模式下达到约4秒和每秒120个事务(300 TPS)。

结论

HBDP通过基于属性的加密加密实现了细粒度的访问控制和eHealth数据的安全存储。它还通过区块链提供了不可抵赖性和问责制。因此,我们认为我们的提案为在医疗保健研究中使用电子健康数据提供了一个足够安全的环境。

区块链 基于属性的加密 电子健康数据 安全 隐私 云计算 卫生保健研究平台 问责制 物联网 互操作性 移动电话
简介 背景

物联网、云计算、大数据、区块链等现代技术的发展影响着人类生活的方方面面。首先,这些技术给医疗保健带来了变化。由于卫生保健系统的数字化,卫生保健服务和运营的质量也有所提高。此外,随着传感器的进步,卫生设施和国家卫生机构越来越多地收集物联网设备为医疗保健产生的电子健康数据。这些电子健康数据通常包括电子医疗记录(EMRs)和个人健康记录(PHRs),其中包含大量个人信息,如患者可能患有的任何疾病和患者的医疗记录号码。因此,一些电子健康数据主体表达了与使用电子健康数据有关的安全和隐私问题。因此,电子健康数据的使用目前受到许多法律法规的管制,包括《健康保险可携带性和责任法案》[ 1]、《一般资料保障规例》(GDPR) [ 2]及《加州消费者私隐法》[ 3.].然而,电子健康数据的安全性经常遭到破坏,为劫持用于医疗保健服务的电子健康数据而发起的网络攻击的数量正在上升[ 4].

然而,使用eHealth数据进行医疗保健研究有许多优点(例如,改善患者的治疗和处方,提高医疗保健系统的效率,扩大疾病知识),因此许多研究人员希望将其用于研究[ 5].然而,在构建医疗保健研究平台时,必须考虑到电子健康数据的互操作性、效用和数据链接,以及隐私法律(例如,健康保险携带与责任法案、GDPR和加州消费者隐私法案)和分析工具。此外,需要为电子卫生数据的开放研究环境采取安全和隐私措施(如匿名化和访问控制),并且必须遵守许多隐私法律。由于这些复杂的要求,大多数卫生保健发展研究平台是由国家政府领导的。例如,如 图1、韩国卫生福利部[ 6]运营着一个基于网络的封闭分析中心,该中心支持分析电子健康数据的研究环境。但是,由于不能通过远程或网络连接,研究人员必须访问分析中心。这个分析中心不仅不方便访问,而且由于网络的封闭性,编程错误只能通过书本来纠正,这也对有效分析电子健康数据提出了挑战。此外,研究人员要求的eHealth数据在使用后立即被删除,这降低了数据的效用。

英国国家卫生服务(NHS)还通过数据访问请求服务(DARS)向研究人员和临床医生提供电子健康数据[ 7].NHS DARS在数据访问环境中提供了Databricks、R Studio、Hue等多种分析工具,与韩国的研究分析中心不同,研究人员不需要亲自访问研究分析中心。NHS DARS还提供了许多安全解决方案(例如,双重身份验证、数据共享审计和匿名化),以确保电子健康数据的安全性和隐私性。此外,瑞士个性化健康网络为交换和使用电子健康数据进行研究提供了安全的基础设施[ 8].在瑞士个性化健康网络中,电子健康数据只能从可靠的医院和大学或虚拟专用网络(即环境)访问。研究人员必须接受基于网络的道德培训,并被要求完成2因素认证。然而,数据主体(即患者)仍然担心未经授权的数据重用和共享,他们希望参与电子健康数据访问决策[ 9].此外,即使eHealth数据被去识别和匿名化,通过其他大数据仍然有可能重新识别[ 10 11].换句话说,鉴于数据主体对其电子健康数据的安全和隐私的担忧,需要对医疗保健研究平台进行研究,以提供更安全的分析环境。

因此,我们提出了一个安全的医疗卫生研究平台,简称为医疗卫生大数据平台(HBDP)。在这项研究中,我们只考虑了一个安全和开放的研究环境,尽管医疗保健的研究平台有很多要求。HBDP使用一个私有的区块链来提供一个去中心化的持久日志数据库(DB),其中智能合约用时间戳记录平台上的用户活动。这有助于平台管理员对安全威胁进行适当的跟踪和监视。此外,HBDP还采用了基于属性的加密(ABE)技术,保证了eHealth数据的安全性和隐私性,防止内部人员泄露eHealth数据。据我们所知,这是第一个基于区块链和ABE的安全研究平台,其重点是问责制,以确保在开放环境中使用电子健康数据。本研究的主要贡献总结在 文本框1

韩国分析电子健康数据的访问程序。

本研究主要贡献。

主要贡献

我们提出了医疗保健大数据平台(HBDP),该平台在开放环境中使用基于属性的加密和私有区块链支持存储的电子健康数据的问责制、访问控制和加密。我们特别关注访问控制的问责制。我们还从安全的角度分析了以往的医疗卫生研究平台。

为了实现访问控制的问责制,设计了智能合约来实时记录HBDP上用户活动的成功或失败(例如,登录和使用eHealth数据)。特别是,该协议可以随时在HBDP中监控用户和检测非法用户。

为了证明和演示HBDP的可行性,我们使用Hyperledger Fabric (Linux基金会)实现了一个HBDP框架[ 12], OpenABE库(Zeutro) [ 13]、OpenStack (Open Infrastructure Foundation) [ 14],我们通过使用检测非法用户的案例研究来评估其安全性。

之前的工作 概述

为了分析之前的工作,我们首先收集并分析了用于电子健康数据互操作性的知名医疗保健标准。在分析标准后,我们使用术语“区块链”和“访问或数据共享或访问控制”以及“医疗保健”在IEEE Xplore, Wiley在线图书馆,ScienceDirect和MDPI中检索了与区块链相关的现有医疗保健研究。结果确定了IEEE Xplore的501篇论文,Wiley在线图书馆的943篇文章,ScienceDirect的2599篇文章,MDPI的24219篇文章。为了选择合适的研究,我们根据这些结果添加了一些过滤器(即发表于2018年至2022年,被≥5家期刊引用)。我们还审查了论文的摘要和标题。在这些工作的基础上,我们最终选择了9篇论文(即,IEEE Xplore: n= 4,44%;威利在线图书馆:n=2, 22%;ScienceDirect: n= 2,22%;MDPI: n=1, 11%)。

此外,我们在谷歌Scholar中使用“医疗保健研究平台”和“临床研究平台”检索了2015 - 2022年的医疗保健研究平台。结果显示,每个关键词分别约有84.9万篇和148万篇论文。为了确定合适的研究,我们还回顾了摘要和标题。特别地,我们检查了每个研究中的安全解决方案,最终选择了6篇论文。本节详细分析了通过这些过程确定的研究。

电子健康数据互操作性标准

长期以来,由于互操作性问题,例如表示方式(如词汇表和术语)、设备和数据格式的差异,电子健康数据仅限于在医疗保健提供者之间共享和访问。这些问题目前使卫生保健提供者难以确保对患者的护理连续性或分析卫生保健中的电子卫生数据。因此,许多医疗保健组织正在发布医疗保健中电子健康数据的互操作性标准。临床文件架构[ 15是由Health Level 7 (HL7)设计的用于临床文档交换的基于xml的标记标准。CDA规定了用于医疗保健系统之间交互的临床文档的结构和语义。CDA的核心是易于交换临床文件并使其可读。然而,基于cda的文档有使其复杂和困难的缺点。出于这个原因,CDA已经扩展为改进了复杂性和互操作性的统一CDA。快速医疗保健互操作性资源(FHIR) [ 16是一个标准,以确保卫生保健系统或服务的互操作性也是由HL7开发的。FHIR改进了以前开发的HL7版本2和3的局限性(例如,实现复杂性和结构化数据模型),以使医疗信息交换更容易。此外,它是基于表征状态传输体系结构开发的,因此很容易为移动电话、可穿戴设备和平板电脑以外的设备实现医疗服务。因此,FHIR是目前医疗保健中最流行的电子健康数据互操作性标准之一。观察性医疗结果伙伴关系(OMOP)通用数据模型(CDM) [ 17是由观察性健康数据科学和信息学管理的电子健康数据模型的开放社区标准。OMOP CDM通过构建数据模型和观测数据内容,解决了eHealth的互操作性问题。OMOP CDM对eHealth数据进行结构化,以提供公共数据模型,并通过OMOP将其转换为公共表示,以提供公共物理和逻辑互操作性模型。当通过OMOP CDM设计医疗保健数据库时,它可以使用标准化的分析工具,并帮助系统地分析电子医疗数据。它还提高了联合研究的效率。医学数码影像及通讯[ 18是医学成像(如磁共振成像、计算机断层扫描和x射线)互操作性的数据格式标准。DICOM定义了医学成像的格式,使各种成像设备捕获的医学图像可以传输和交换。DICOM通常通过图片存档和通信系统进行存储、处理和传输,目前在医疗保健领域最为人所知。跨企业文件共享[ 19]是集成医疗保健企业于2004年开发的电子健康数据的集成概要文件。特别是,XDS可以共享各种基于标准的临床文档,如HL7 CDA、通用字符串和二进制数据。换句话说,XDS代表一种全面和通用的技术。除了上述标准之外,许多卫生保健组织正在为电子卫生数据的互操作性制定各种标准。我们认为这些标准并不能提供电子卫生数据的完美互操作性,但在不久的将来仍可得到解决。因此,eHealth数据的互操作性是卫生保健研究平台的主要需求,但不是本研究的主要重点。

通过区块链安全共享电子健康数据

区块链具有许多优点(如数据完整性、去中心化和可编程智能合约),因此许多研究领域一直在尝试使用它。特别是,区块链已被广泛用于解决eHealth数据的完整性、可伸缩性和共享问题。然而,此外,由于隐私和安全问题,电子健康数据需要安全机制,如访问控制、加密和身份验证。因此,许多研究通常将这些安全机制与区块链一起使用。 表1展示了这些研究和HBDP的优缺点。杨等[ 20.]提出了一种架构,可以在现有的医疗保健系统中使用区块链。体系结构使用两个智能契约(即摘要契约和记录关系契约)记录了所有的选择、插入、删除等操作,以保证数据记录的完整性。该体系结构还通过访问控制列表执行访问控制。马丁等[ 21提出了一个基于区块链、以患者为中心的PHR管理系统。系统使用可信任的oracle执行代理重加密来安全地共享PHRs。此外,该系统使用声誉系统来跟踪神谕者的行为,并给出一个评级分数来识别行为不当的神谕者。因此,该系统可以让他们安全地获取、存储和共享医疗数据。张等[ 22]提出了基于区块链的临床数据共享架构。该体系结构使用FHIR标准和区块链来解决临床数据互操作性问题,称为FHIRChain。FHIRChain有助于实现医生之间的协同临床决策。它还允许在无信任和去中心化的环境中共享临床数据,并通过智能合约进行审计。沙纳兹等[ 23为使用智能合约的emr设计了基于角色的访问控制(RBAC)框架。他们专注于通过链下扩展机制解决区块链的可扩展性问题。

唐华等[ 24]提出了一个基于权限的系统架构,可以使用区块链共享eHealth数据。在此架构中,患者可以通过客户端应用程序加入区块链网络,并通过链码在区块链网络上更新他们的eHealth数据。他们还可以授予或撤销临床医生和研究人员使用其电子健康数据的许可。总之,该架构实现了以患者为中心的电子健康数据共享。费格罗亚等[ 25]为医疗保健射频识别系统的安全性使用了基于属性的访问控制。他们专注于使用区块链解决系统问题,如可伸缩性、同步和单点故障。最终,该系统提供了从合适位置使用医疗资产的访问控制。达拉米等[ 26]设计了一个名为MedChain的基于区块链的EMR管理系统。他们使用权威证明改进了阻塞时间和系统性能。他们还使用基于时间的智能合约来保护电子病历的隐私和监控。简而言之,它们使用身份验证技术、哈希函数和代理重新加密提供了安全的环境、数据完整性、可审计性和可访问性。考尔等人[ 27]提出了基于区块链的存储,用于安全共享和查询eHealth数据。考虑到非结构化eHealth数据,存储使用CouchDB。并将EMRs存储在区块链的下链和散列中,以保证EMRs的完整性,提高存储效率。郭等[ 28]提出了基于云的远程医疗系统的多权威ABE方案。特别是,该方案使用区块链保护电子健康数据(例如诊断意见)的完整性。此外,该方案易于更新和撤销访问策略。

大多数研究[ 20.- 28]只关注区块链,以确保医院之间安全共享和电子健康数据的完整性。它们通常通过区块链提到可追溯性和问责制,但它们并不代表监测和问责制的方法。但是,应该提供这些方法来确保安全的环境。在开放环境下的卫生保健研究平台中,问责制尤其重要。基于这些原因,与其他研究不同,HBDP侧重于描述基于区块链的检测方法,以确保问责。另外,在HBDP中,即使导出了eHealth数据,也不能保证数据的可用性,只能在HBDP中解密使用。如前所述,这项研究首次关注在开放环境中安全使用电子健康数据的问责制。

基于区块链的研究和医疗保健大数据平台(HBDP)的优缺点。

研究 系统名称 安全解决方案 强度 弱点
杨等[ 20. - - - - - -一个

加密

访问控制

现有卫生保健系统之间的互操作性

提议的体系结构只关注于读取健康记录,而没有讨论健康记录的共享。

马丁等[ 21 - - - - - -

加密

区块链

以患者为中心的PHRb提出了管理系统。

不适用于患者无法授权的紧急情况

张等[ 22 FHIRChain

审计

访问控制

没有SPoFc问题和细粒度访问控制

该体系结构只提供了健康数据跟踪的可能性。

沙纳兹等[ 23 - - - - - -

访问控制

该架构通过链下扩展解决了区块链的可扩展性问题。

提议的体系结构需要交易成本和访问控制费用。

唐华等[ 24 - - - - - -

访问控制

实现了以患者为中心的电子健康数据共享。

缺乏灵活和细粒度的访问控制

费格罗亚等[ 25 - - - - - -

访问控制

无SPoF问题和细粒度访问控制

该体系结构需要交易成本和访问控制费用。

达拉米等[ 26 MedChain

加密

身份验证

高效的共识机制,通过基于时间的智能合约保障隐私

没有使用PoA实现拟议系统的详细描述d

考尔等人[ 27 - - - - - -

授权

共享非结构化电子卫生数据和链下存储

不适用于患者无法授权的紧急情况

郭等[ 28 - - - - - -

加密

访问控制

的安e提出了一种适用于分布式远程医疗系统的方案。

没有给出确保模式可跟踪性的具体方法。

我们的 HBDP

加密

审计

访问控制

提出了访问控制问责的具体方法。

该平台只关注3个srf

一个不了。

b个人健康记录。

cSPoF:单点故障。

dPoA:权威证明。

eABE:基于属性的加密。

fSR:安全需求。

卫生保健研究平台

由于大数据分析技术的快速发展,在医疗保健研究中使用电子健康数据可以从根本上改善医疗保健。出于这个原因,一些研究提出了医疗保健研究平台,可用于使用电子健康数据进行研究。在本节中,我们将重点回顾这些研究平台的安全角度的文献。欧扎丁等[ 29]提出了一个数据仓库的设计,这是一个医疗保健研究和分析数据基础设施解决方案(HRADIS)。HRADIS侧重于用于集成不同电子卫生数据以提高卫生保健效率的基础设施。HRADIS包括用于RBAC的帐户管理框架,用于一些电子健康数据。伦恩等[ 30.]提出了一个基于云的数字健康研究平台,用于国家纵向队列研究。该平台收集和管理性少数和性别少数成年人的电子健康数据。在该平台中,所有微服务都在子网内,使用虚拟私有云,eHealth数据静态加密后安全存储在MySQL DB中。此外,平台采用开放的编程接口授权、基于SMS文本消息的双因素认证和日志服务来识别恶意用户,确保eHealth数据的安全性。阿什法克等[ 31]描述了瑞典哈兰的区域卫生保健信息平台。该平台基本上在瑞典法规和关于患者数据的GDPR范围内运行。在该平台上,只能通过区域IT防火墙保护的内部客户端访问eHealth数据。客户只能在瑞典伦理审查委员会批准的医疗保健项目中使用相关研究人员。特别是,该平台提供匿名的eHealth数据以确保隐私。康德等人[ 32]提出了一个基于开源的研究平台,以支持临床和转化研究,ITCBio。ITCBio平台支持角色和访问管理工具,以促进研究合作并确保安全。它还提供动态同意,使患者和研究人员之间能够进行持续和灵活的沟通。德摩尔等[ 33]描述了一个可扩展和可适应的平台,用于电子健康数据系统和临床研究系统的互操作性。他们还详细介绍了基于许多安全相关标准的安全体系结构。特别是,该体系结构支持各种安全解决方案,如身份管理和凭据委托。琼斯等人[ 34]提出了安全匿名信息链接数据库,该数据库确保了物理、技术和程序控制。安全匿名信息链接数据库提供加密通信,并防止电子健康数据被传输到用户设备之外。它还通过用户凭证和2因素身份验证令牌执行用户身份验证。

多项研究[ 29- 34提出了使用电子健康数据的医疗保健研究平台。然而,大多数研究都集中在高效的研究环境上。一些研究也没有详细描述安全解决方案,尽管电子健康数据的安全性和隐私性是医疗保健研究平台的主要考虑因素。此外,正如前面在背景部分提到的,电子健康数据主体仍然关注电子健康数据的安全性和隐私性。因此,有必要研究一个更安全的医疗保健研究平台,保证电子健康数据的可用性,同时关注其安全性和隐私性。下一节将提出一个安全的、可扩展的卫生保健合作研究平台,称为HBDP。

方法 概述

本研究为卫生保健研究设计了一个安全开放的环境。为了实现这一点,我们首先在医疗保健研究平台上识别潜在的安全威胁。其次,基于这些威胁,我们提出了安全医疗保健研究平台的安全需求(SRs)。最后,我们提出了一个安全的卫生保健合作研究平台,称为HBDP,可以提供一个安全的分析环境,同时满足这些要求。

卫生保健研究平台的安全威胁和需求 概述

卫生保健研究平台应正确理解和减轻安全威胁,以提供安全的分析环境。本节首先确定了医疗保健研究平台的潜在安全威胁。然后,我们定义了减轻这些威胁的sr。

安全威胁

在医疗保健研究平台上,可能会出现滥用和非法导出电子健康数据等各种安全威胁。然而,我们发现医疗保健领域的知名安全威胁是对医疗保健研究平台的威胁。换句话说,平台上可能会发生许多威胁,但我们明确地将重点放在可能频繁发生的威胁上。中概述了主要安全威胁的详细描述 文本框2

医疗保健研究平台上的主要安全威胁。

主要安全威胁

未经身份验证的用户:在医疗保健研究平台上,未经身份验证的用户试图攻击以获取经过身份验证的用户的凭据[ 35- 37].此外,攻击者可以使身份验证因素失效以访问eHealth数据[ 38].因此,医疗保健研究平台必须通过用户认证,确保只有通过认证的用户才能访问。

未经授权的用户:医疗保健研究平台必须确保通过适当的授权机制,只有经过批准的电子健康数据才能向授权用户提供[ 38 39].此外,在医疗保健研究平台上,甚至授权用户也可能滥用和非法共享电子健康数据。因此,医疗保健研究平台还需要一个安全解决方案来审计这些活动。

内部人员泄露电子健康数据:对医疗保健研究平台最大的安全威胁是内部人员泄露电子健康数据[ 35- 37 40].内部人员的一个主要例子是医疗保健研究平台的eHealth数据管理员。管理员可以很容易地泄漏eHealth数据,因为他们对这些数据具有一般授权。此外,内部人员很难被发现,因为他们被定义为医疗保健研究平台中的合适用户。由于这些原因,即使平台上的电子健康数据被非法泄露,也不能确保泄露数据的效用。

减轻这些威胁的sr

一个开放环境中的协作式医疗研究平台应该满足不同的sr,从而减轻多种类型的安全威胁。然而,在本研究中,我们只关注了3个sr,这3个sr与基于上述识别的威胁的安全医疗保健研究平台的访问控制问责制高度相关。有关特别指标的详细描述载于 文本框3

减轻安全威胁的安全需求。

用于减轻威胁的sr

SR 1(访问控制):访问控制是一个包括身份验证和授权的框架,这是主要的SR,也是医疗保健研究平台最重要的考虑因素。必须在此平台上执行,以便只有经过身份验证和授权的用户才能通过适当的设备使用eHealth数据。因此,许多现有的医疗保健研究平台使用各种方法提供认证或授权[ 29- 34].

SR 2(存储的电子健康数据加密):在医疗保健研究平台上,存储的电子健康数据加密可确保数据未被使用时的安全性和隐私性[ 30. 34].此外,即使电子健康数据被泄露,这些数据也不应该有用。因此,存储的电子健康数据的加密是最重要的sr之一。

SR 3(问责制):当经过认证和授权的用户通过医疗保健研究平台导出或使用eHealth数据时,平台管理员或eHealth数据提供商需要能够随时跟踪和搜索用户在平台上的所有活动。此外,平台管理员必须识别非法用户,并在出现安全问题时进行适当的跟踪或监控。由于这些原因,一些卫生保健研究平台提供记录系统或服务[ 30. 34].

其他sr:开放环境下的合作研究平台应满足各种其他sr。例如,为了保护电子健康数据的隐私,需要匿名化和去识别,因为这些数据是敏感和隐私的[ 31 32 34].安全通信也是必要的,以防止嗅探和篡改电子健康数据和网络数据包[ 30. 31 34].此外,需要为电子保健数据的完整性和可用性制定更多的sr [ 41].然而,如前所述,我们主要关注三个sr(即访问控制、存储的eHealth数据加密和问责制),以支持访问控制中的问责制。

提出HBDP 概述

HBDP使用ABE对电子健康数据进行隐私和访问控制。特别是,即使内部人员泄露数据,也可以通过列级加密来确保eHealth数据的私密性。该平台还使用智能合约在区块链中记录用户活动(例如登录和解密)。因此,区块链允许平台管理员识别非法用户并进行适当的跟踪和监控。换句话说,区块链作为一个实时的分布式日志系统运行,并确保记录的用户活动的完整性和不可否认性。在本节中,为了介绍HBDP,我们首先解释框架中的假设和主要组件。然后我们详细描述了HBDP的各个阶段。

假设

为了描述HBDP的框架和场景,我们首先定义了一些假设。特别地,我们提出了关于HBDP没有涵盖的其他sr(例如,安全通信、去身份识别、完整性和可用性)的假设。详细的假设概述于 文本框4

关于其他安全需求的假设。

假设

由于eHealth数据包含相当数量的个人身份信息,一般在平台上去身份化和匿名化后提供给用户。在向用户提供电子健康数据之前,还执行数据链接以提高其可用性。然而,这项研究没有涵盖去识别、匿名化和数据链接。因此,假定平台上的所有电子健康数据都已被去识别,并通过可信的第三方组织进行链接。此外,假定电子健康数据由平台上注册的机构提供。

本研究未涉及医疗大数据平台(HBDP)与用户之间的安全通信。因此,我们假设HBDP使用基于传输层安全协议的通信与用户进行安全通信,该通信用于internet和跨网络的安全通信。这个假设也适用于区块链网络上的通信。

假定用户是在HBDP上注册的特定机构的研究人员或医生。因此,他们在平台上注册时不需要证明自己是隶属于该机构的研究人员或医生,但在平台上执行用户访问eHealth数据的身份验证和授权。此外,我们还假设HBDP为研究人员提供了各种分析工具和方法,以有效地分析eHealth数据,并且用户分析过程记录在分布式账本上,包括使用的分析工具。

主要组件

我们提出了一个安全的医疗保健研究合作平台,以确保电子健康数据的隐私和安全,称为HBDP。 图2展示了我们提出的HBDP框架的简要概述。我们提出的框架有三个主要组成部分:用户、HBDP和区块链网络。中概述了主要组件的详细描述 文本框5

概述我们提出的医疗大数据平台框架。

建议架构的主要组成部分。

框架组件

用户:分析和使用电子健康数据来治疗患者或将其用于医疗保健研究的医生和研究人员是这一群体的代表。他们应该被要求拥有智能手机或带有GPS的指纹扫描仪等设备,以便在平台上进行身份验证和访问控制。

医疗大数据平台(HBDP): HBDP保证了电子健康数据的安全,并为用户提供了一个使用和分析数据的环境。该平台由云计算环境中的安全代理和数据库(db)组成。数据库配置为eHealth数据库和用户数据库。eHealth数据数据库存储eHealth数据。用户DB存储用户信息,如用户ID、散列密码和用户属性(如用户部门和职位)。安全代理是平台的关键组件。它使用基于属性的加密执行eHealth数据的加密和解密。它还要求区块链网络作为区块链客户端记录或获取用户活动。

区块链网络:区块链网络由单个智能合约、分布式账本和对等点组成。记录在区块链网络上的交易是不可变的,除非所有对等点的分类账都被修改。因此,区块链可以用作分布式日志记录系统,提供强大的问责制,因此我们使用区块链网络来跟踪HBDP上的用户活动。更具体地说,区块链与HBDP上的安全代理进行通信,并帮助确保平台的问责性和不可抵赖性。同行是在平台上注册的卫生机构和研究机构。它们可以支持对等点,也可以提交对等点,这取决于它们的系统性能。智能合约在分布式账本上记录带有时间戳的用户活动,这有助于区块链中的分布式账本充当HBDP的日志。

HBDP的各个阶段 概述

为了支持安全的分析环境,HBDP分为四个阶段(用户注册、存储、下载和使用)。每个阶段都配置为满足我们定义的sr(即,用户注册和下载阶段满足访问控制要求,存储阶段满足存储的eHealth数据加密要求,使用阶段实现问责制)。下面几节将详细描述每个阶段。

用户注册阶段

用户注册阶段是“访问控制”中的第一个认证操作,“访问控制”是医疗保健研究平台的sr之一。此阶段与用户ID和属性一起存储在HBDP上的用户DB中。 图3显示了用户注册阶段的顺序;本节将详细介绍。用户访问HBDP,输入用户ID、密码和属性(如部门和职位)。此时,我们假设该用户是由参与HBDP的机构授权的。然后,该平台上的安全代理将输入的用户信息插入到用户DB中。安全代理使用注册结果向用户请求设备注册。用户使用自己的设备访问平台,并输入注册的ID、密码和设备标识符。然后,用户设备请求安全代理注册它以及输入的ID和密码。安全代理使用接收到的ID和密码执行基于密码的身份验证。如果认证成功,设备ID值被插入到用户DB中,安全代理将设备注册的结果转发给设备。 After that, the user can access the HBDP at any time.

用户注册阶段。

存储阶段

可能经常发生试图泄漏HBDP存储的eHealth数据的情况。即使电子健康数据在这些尝试中不可避免地泄漏,也应确保数据的不可用性。为此,在存储阶段,如图所示 图4,安全代理在将eHealth数据存储在平台上之前,会使用在平台上注册的机构的位置对eHealth数据进行加密。

特别是,一些列是敏感列,可在分析电子健康数据期间为研究人员提供可用性,或可与其他大数据结合以识别个人。存储阶段是确保“存储的电子健康数据加密”的操作,这是医疗保健研究平台的sr之一。此阶段可确保即使eHealth数据被管理员或恶意攻击者在平台上非法共享或泄露,由于采用列级加密,也无法确保其可用性。此外,列级加密允许用户仅在其机构使用解密的eHealth数据,因为如果用户的实时位置与用户的机构不匹配,则eHealth数据的解密将失败。

存储阶段。

下载相

下载阶段是卫生保健研究平台sr“访问控制”中授权过程的前提。此阶段通过用户属性(例如,用户位置和部门)加密列级加密的eHealth数据的所有内容,使用户能够下载eHealth数据。因此,在下载阶段提供的数据是加密的,因此即使第三方获得它们也无法进行分析。下载阶段不是一个必要的阶段,但在进行协作研究时可以提高效率。例如,如果所有合作研究人员都在平台上获得授权,则研究人员将第一次分析后的eHealth数据发送给另一名研究人员进行合作。然后,另一名研究人员可以根据平台上分析的eHealth数据进行进一步的工作。 图5显示平台上的下载阶段。下面一段将详细描述下载阶段。

用户首先登录HBDP,然后在下载页面选择eHealth数据。然后,平台上的安全代理将用户请求的eHealth数据查询发送到eHealth数据DB。eHealth数据DB向安全代理提供列级加密的eHealth数据。之后,安全代理从用户DB请求用户信息,例如用户的属性和ID。用户DB将请求的用户信息提供给安全代理。安全代理使用所提供的用户信息再次加密列级加密的eHealth数据,并提供完全加密的eHealth数据。在下载阶段提供的eHealth数据是加密的,因此即使第三方获得它们也不可能进行分析。

下载阶段。

使用阶段

使用阶段执行“访问控制”,这是医疗保健研究平台的sr之一。这一阶段还确保了“问责制”,因为用户在平台上的使用活动会在分布式账本中使用时间戳进行记录。 图6显示使用阶段的顺序;以下各段将详细说明。

用户登录HBDP(即密码认证),上传加密后的eHealth数据。然后,平台上的安全代理向用户DB请求用户和设备信息,以进行解密和指纹验证。用户DB向安全代理提供用户属性和用户设备ID。安全代理使用设备ID值向用户设备请求指纹认证和实时定位。用户通过平台上注册的设备输入指纹,用于第二个用户身份验证。指纹认证通过后,设备将实时的GPS位置信息发送给安全代理。安全代理使用位置和用户属性解密用户上传的eHealth数据。特别是,此时将对加密的行执行完全解密,然后对列级加密的列(即敏感列)执行列级解密。当eHealth数据解密后,安全代理请求区块链对等体记录解密结果,并在区块链中标记时间戳。区块链对等体执行智能合约在分布式账本上记录解密结果,智能合约将解密结果插入分布式账本。 When the decryption result is recorded in the distributed ledger, the smart contract returns the execution result to the blockchain peers. The blockchain peers send the received execution result to the security agent. Finally, the security agent provides the decrypted eHealth data to the user, and the user is able to use the data only on the platform. In conclusion, for the user to use eHealth data on the HBDP, the data must be decrypted on the platform.

算法1和2是安全代理的伪代码。算法由基于密码的身份验证和eHealth数据的解密以及非法用户的检测组成。特别地,算法1 ( 图7)首先检查用户的ID是否被锁定;如果用户的ID没有被锁定,它将验证用户的凭据。然后,安全代理请求在区块链中记录用户登录活动的结果。

相比之下,算法2 ( 图8)首先对用户的实时位置进行基于指纹的认证。之后,安全代理通过用户信息(包括位置)使用创建的策略解密数据。最后,安全代理请求在区块链中记录用户使用活动的结果。特别是,在记录过程的结果之前,安全代理将检查分布式账本,以查找之前记录中最近连续失败的活动。

使用阶段。

算法1:安全代理认证伪代码。

算法2:安全代理使用的伪代码。

实现

为了演示和证明HBDP的可行性,我们实现了基于软件开发生命周期的框架的主要组件。软件开发生命周期通常配置为需求分析、设计、实现、测试和发展步骤。按照这些步骤,我们首先确定了SRs(请参阅卫生保健研究平台的安全威胁和需求部分中的SRs)。其次,这些组件是基于3个已确定的sr(即访问控制、存储的电子健康数据加密和问责制)设计的。第三,我们实现了这些组件。 文本框6详细显示配置和实现环境的规范。我们配置了区块链网络来检测非法用户,并配置了云环境来在HBDP中创建可扩展、协作和安全的环境。特别地,我们使用开源云操作系统OpenStack (Open Infrastructure Foundation)构建了云环境,然后使用基于Python的Flask框架(Python Software Foundation)开发了web服务器[ 42].我们还开发了用于用户认证的Android应用程序,用于检测和监控非法用户的安全代理,以及用于记录和管理用户活动的链码。第四,通过结果部分中的案例研究,使用HBDP的安全分析对组件进行测试。最后,在讨论部分对组件进行分析,以评估它们。

图9展示了我们的实现和主要组件之间的交互的概述。如前所述,我们的实现是一个概念验证,用于演示HBDP实现的特性。

在医疗保健研究平台上,云环境不仅以软件即服务的形式提供各种大数据分析工具,还提供研究人员可以协作的环境。云环境还提供可伸缩性和开放环境。

图10展示了HBDP的一些页面。 图10A是当用户通过输入注册用户ID和密码成功登录时显示的页面。成功登录的用户可以随时访问该平台并下载可在中所示页面上使用的eHealth数据 图10B。

实现环境的规范。

环境规范

处理器:Intel Xeon处理器E5620 2.40 GHz

内存:32gb

操作系统:Ubuntu Linux 18.04.5 LTS

智能手机:Galaxy S21 (SM-G991N)

语言:Go语言、Java、Python、c++

Docker引擎:版本20.10.7

OpenStack: 5.2.0版本(Stein)

MySQL: version 5.7.36

Android:版本11

Hyperledger Fabric: 1.4版

实现概述。

实施医疗大数据平台(HBDP)。

我们还开发了一个Android应用程序,使用指纹认证和实时位置信息。特别地,我们使用了Firebase (Firebase Inc) [ 43用来给安卓应用发送消息。 图11显示了实现的应用程序的一些页面 图11A,应用程序在平台上执行用户注册和设备注册。此外, 图11B为设备注册指纹认证和实时位置信息。最后, 图11当用户希望使用加密的eHealth数据时,C显示指纹身份验证请求。

此外,我们使用OpenABE库(Zeutro)来执行eHealth数据的加密和解密。电子健康数据是匿名的,来自韩国疾病控制和预防机构的公开数据。数据来自韩国国民健康与营养调查,包括身份证、性别、年龄、地区和收入。特别是,我们将实现中的敏感列定义为年龄和地区。 图12显示平台上每个阶段的eHealth数据。 图12A显示安全代理在平台上存储eHealth数据时使用列级加密。此外,当用户下载eHealth数据时,在使用存储在平台上的用户属性对列级加密的eHealth数据进行完全加密后,将提供这些数据,如所示 图12b .最后, 图12C显示解密的eHealth数据,平台上的授权用户可以使用这些数据。

通常,区块链中的块是由哈希值标识的,并且这些块是连接的,因为它们具有前一个块的哈希值。换句话说,除非所有参与者的区块都被修改,否则更改是不可能的。因此,在平台上,私有的区块链被用作分散的持久日志记录系统。我们使用Hyperledger Fabric (Linux基金会)构建了区块链网络,并设计了一个负责任的智能合约。 图13显示一个网页,用于检测使用分布式账本的非法用户(即,未经身份验证和未经授权的用户)。此页面帮助平台管理员搜索特定的用户活动,并在出现安全威胁时识别参与者并对其做出响应。简而言之,我们实现的分布式账本为HBDP提供了问责制和不可抵赖性。

Android应用程序。

医疗大数据平台中eHealth数据的加解密。

用于检测非法用户的网页。

结果 概述

为了证明概念,上一节实现了HBDP。本节描述了通过实现的HBDP进行安全分析的非法用户检测的案例研究。本节还介绍了几个已进行的实验的结果,这些实验显示了私有区块链和ABE密码术的效率。

非法用户检测案例研究 概述

除了上述安全威胁之外,在开放环境中的医疗保健研究平台上还可能出现许多安全威胁(例如,电子健康数据的误用和滥用)。因此,一个安全的医疗保健研究平台必须能够检测和跟踪威胁。本小节描述如何在开放环境中通过HBDP上的分布式账本检测两种典型的安全威胁——未经身份验证和未经授权的用户。此外,我们还提出了通过监控和访问控制过程检测其他安全威胁的可能性。

检测未认证用户

未经身份验证的用户尝试的最常见的攻击之一是暴力攻击。因此,在这个场景中,我们假设一个未经身份验证的用户通过窃取用户ID不断尝试登录(即对HBDP发起暴力攻击)。 图14显示检测平台上未经身份验证的用户的序列。下面几段将详细解释这个案例研究。

检测未经认证的用户。

攻击者首先窃取HBDP上使用的用户ID,然后连接到平台,输入窃取的用户ID和随机密码。接收用户ID和密码的安全代理从用户DB中检索用户信息,并执行基于密码的用户身份验证。之后,安全代理请求区块链对等体将登录结果记录在分布式账本中。区块链对等体通过执行智能合约记录登录结果,并将记录的结果发送给安全代理。安全代理接收到记录的结果,然后通知攻击者登录失败。攻击者接收到失败的登录结果,然后不断尝试使用被盗用户ID的随机密码登录。如果重复上述顺序,并且登录失败2次以上,则安全代理将阻止该用户ID。此外,安全代理请求指纹认证以解除对注册到HBDP的设备的用户ID的封锁。因此,平台用户将能够识别出有人试图非法登录。此外,安全代理将这些尝试转发给平台管理员,以帮助他们根据分布式账本详细分析非法登录尝试。

防止未经授权的用户误用(或滥用)电子健康数据

可以从HBDP下载的eHealth数据取决于用户所在的部门和职位。因此,未经授权的用户有可能从授权用户接收加密的eHealth数据。因此,我们假设未经授权的eHealth数据用户希望使用非法共享或泄露的eHealth数据。 图15显示检测非法共享eHealth数据的程序。以下各段将详细说明。

检测未授权用户。

未经授权的用户首先以错误的方式从授权用户获取加密的eHealth数据。非法用户登录HBDP后,上传非法共享的eHealth数据供登录平台后使用。接收eHealth数据的安全代理从用户DB中获取用户信息,并向注册的设备请求指纹认证。非法用户进行指纹认证。如果认证成功,设备将实时位置信息和签名一起发送给安全代理。然后,安全代理在验证签名后,使用接收到的属性和实时位置解密eHealth数据。但是,由于未授权用户的属性与用于加密eHealth数据的用户属性不匹配,因此eHealth数据解密失败。安全代理请求将解密结果记录在分布式账本上,然后在将未授权用户的活动记录在账本上后通知未授权用户解密失败。如果重复上述顺序并且解密再次失败,则安全代理将阻止用户ID。安全代理还将这些尝试发送给平台管理员,以帮助他们根据分类帐详细分析非法使用尝试。

在我们的实现中,可以检测和阻止各种安全威胁,以及未经身份验证和未经授权的用户。例如,即使攻击者试图通过窃取用户的ID和密码来解密eHealth数据,由于指纹认证失败,解密也是不可能的。此外,即使通过操作设备成功进行指纹验证,由于实时位置信息不正确,也无法解密。换句话说,HBDP确保了eHealth数据的安全性和隐私性。此外,由于所有用户在HBDP上的活动都记录在分布式账本中,平台管理员可以通过定期监控发现非法用户。特别是,即使要使用泄露的数据,也应该根据使用阶段在HBDP上对它们进行解密。因此,管理员可以通过监控发现这种行为。最后,即使恶意用户泄露,HBDP也不能通过列级加密确保eHealth数据的有用性。总之,HBDP可以为研究人员提供一个开放和安全的环境,在其中有效地分析电子健康数据。

HBDP的性能评估 概述

我们的主要概念是为医疗保健提出一个安全的研究平台,并检测使用分布式账本的非法用户。对于这个概念,我们在前一节中介绍了案例研究。然而,性能是证明系统效率的一个重要因素,因此我们将在本节简要介绍并描述实现的HBDP的性能评估。

加密的平均时间

为了测量平均时间,我们执行了10轮加密和解密,改变行数和敏感列,如 文本框7

图16显示每敏感列数对应的行数的平均加密和解密时间。 图16A显示基于行数的平均列级加密时间。在 图16A,如果最大行数为200,000,敏感列数为5,则最大平均时间约为10分钟。此外, 图16B显示用户从平台下载eHealth数据时,行数变化与每个加密敏感列数量变化的平均完全加密时间(请参阅下载阶段部分)。值得注意的是,由于这项工作对行进行加密,加密的敏感列的数量不会对完整加密时间产生很大影响。换句话说,加密时间不会随着加密敏感列数量的增加而显著增加。 图16C显示用户在HBDP上使用eHealth数据时的平均完全解密时间,包括行数与每个加密敏感列数的列级解密时间(请参阅使用阶段部分)。由于此工作执行两次解密,与完全加密相比,所需的解密时间显著增加。如果最大行数为200,000,敏感列数为5,则平均时间约为27分钟,因此对于实际情况,HBDP有一定的使用限制。但是,我们相信有几种方法可以解决这个问题。下面的小节将详细讨论这些方法。

密码学评估的仿真参数。

仿真参数

轮:10

行数:50,000、100,000和200,000

46列中的敏感列数:1、3和5

密码学的类型:列级加密,下载阶段列级加密后的完全加密,使用阶段包括列级解密在内的完全解密

平均加密时间。

区块链表演

私有的区块链是一个分布式日志系统,用于检测HBDP上的非法用户。因此,我们没有评估区块和查询时间,只关注区块链特性提供的可问责性和不可抵赖性。因此,在本节中,使用Hyperledger Caliper (Linux Foundation)来评估设计的智能合约的写入和读取时间[ 44].我们首先在区块链网络的分类帐上执行了5轮写入事务,每轮有1000个事务,速率分别为每秒100、150、200、250和300个事务(TPS),如图所示 文本框8.然后,我们以100、150、200、250和300 TPS的速率向分类帐的区块链网络执行5轮读取交易,在写入100笔交易后,每轮读取1000笔交易。特别是,此时,我们假设平台管理员搜索了100条以前用户活动的记录。

图17而且 图18显示执行的平均延迟和吞吐量。在 图17A, 1Org和1Peer在写模式下,300tps的时延<3秒,这比其他网络的时延要低得多。相反,具有1Peer写模式的1Org比其他网络具有更高的吞吐量(大约150 TPS),如图所示 图18a .带1Peer的1Org在读模式下的平均延迟约为14秒,吞吐量约为300 TPS中的63 TPS,如图所示 图17B和 图18B.对于处于读模式的2Orgs和2Peers,在300 TPS中,平均延迟和吞吐量分别达到大约19秒和47 TPS。结果表明,许多组织和对等体在读写模式下都达到了高时延和低吞吐量,因此在写模式下,时延和吞吐量成反比。

仿真参数的评价区块链。

仿真参数

轮:5

交易:每笔1000

事务率:100、150、200、250和300

事务模式:读写

网络:2Orgs + 2peer, 2Orgs + 1Peer, 1Org + 1Peer

订货方:独奏

平均事务延迟。

事务吞吐量。

讨论 主要研究结果

在“结果”部分,我们首先对HBDP进行了安全性分析。结果表明,HBDP提供了一个安全的环境。然后,我们给出了HBDP的加密平均时间和区块链性能来评估其效率。因此,某些性能(例如,取决于加密列数量的高解密时间)需要改进。因此,我们首先在本节讨论这些结果。然后介绍了HBDP的一些局限性。此外,我们将HBDP与之前的工作进行了比较。最后,我们描述了我们在区块链和物联网方面的进一步工作。

HBDP提供了一个安全的研究环境,但要提高效率还需要解决几个挑战。因此,本小节将详细讨论我们的结果和这些挑战。首先,为了证明HBDP中的问责性,我们介绍了通过实现的HBDP检测未经认证和未经授权用户的案例研究。此外,还介绍了通过访问控制和监控过程检测其他安全威胁的方法。结果表明,HBDP支持访问控制的问责制。

其次,随着敏感列数量的增加,列级加密和完全解密(包括列级解密时间)在我们的结果中显著增加。在实际环境中,该问题会给用户带来不便。为了解决这个问题,我们提出了一些解决方案。首先,当eHealth数据有许多敏感列时,可以通过将这些列合并为一列以执行加密和解密来实现高效的加密时间。其次,可以配置安全代理首先对某些列执行解密以显示eHealth数据,然后在后台进程中解密其他列。这种方法可能会使用户觉得与以前的方法相比,延迟是最小的。最后,在云环境中,可以配置多个安全代理来执行并行处理[ 45- 47].这种方法效率高,是应用最广泛的方法。不幸的是,我们的工作没有使用这些方法,但它们有望提供更好的加密时间。

最后,区块链中的读模式比写模式具有更高的延迟和更低的吞吐量,大约≥60%。一般来说,区块链性能在写模式下比在读模式下具有更高的延迟和更低的吞吐量,但我们的评估显示了相反的结果。这个结果可能是由于查找和读取100个事务的所有记录的过程造成的。尽管如此,区块链可以充分用作HBDP的分布式日志记录系统,因为它没有表现出较差的性能。为了证明这种有效性,我们的讨论可以通过与现有研究的性能比较评估进行扩展。但是,由于实现环境和配置的差异,我们没有进行性能比较。区块链性能通常受到对等体和orderers的角色配置、共识算法的差异以及区块链类型的影响。此外,即使智能合约执行相同的功能,性能也会根据智能合约的实现方式而有所不同。总之,我们认为在完全非等效环境下,性能比较是无用的。

限制

卫生保健研究平台必须提供高效的环境,因为HBDP的主要目的是分析电子卫生数据,然后将得到的值用于研究。对于这种环境,需要eHealth数据的互操作性、分析和可视化工具以及数据链接,但HBDP为eHealth数据实现了一些功能。因此,在我们未来的工作中,HBDP将提供一个高效的研究平台,提供各种分析和可视化工具(如Hadoop、Tableau和Spark),即软件即服务。

此外,在本研究中,HBDP只关注三个sr(即访问控制、存储的eHealth数据加密和问责制),但需要各种附加sr(如去识别)来实现更安全的环境。此外,即使在对电子卫生数据进行去识别之后,仍然存在重新识别的可能性。因此,我们未来的工作还应提供其他sr和方法,通过提前进行再识别评估来降低再识别的风险[ 48 49].

最后,本研究的主要范围是卫生保健研究平台的访问控制和问责制,因此HBDP没有确保电子卫生数据的完整性和可用性。在HBDP中,通过在分布式账本上写入eHealth数据的散列,可以确保完整性,但不能完全保证完整性。因此,HBDP需要解决方案来确保电子健康数据的完整性和可用性,以建立一个完整的医疗保健研究平台。可用性和完整性通常可以通过现有的加密技术(例如,各种类型的防火墙、消息身份验证代码、入侵检测系统和哈希函数)来确保。我们也认为一些研究[ 50- 54]有助于建立一个高效的卫生保健研究平台。

与之前工作的比较

对于HBDP的讨论,本节将HBDP与基于已定义sr的现有医疗保健研究平台进行比较。 表2表明HBDP和以前的研究平台满足特定的sr。首先,访问控制(即身份验证和授权方法)在所有研究中都得到了部分解决[ 29- 34HBDP中也提到了这一点。特别是一些研究[ 31 32 34]通过相关当局或合同的直接批准,允许访问电子卫生数据。然而,这种访问控制既麻烦又复杂,而且有可能过度限制数据的使用。一些研究[ 29 34]使用RBAC进行访问控制,但是RBAC不能轻易地提供细粒度的访问控制。相比之下,ABE加密通常实现细粒度的访问控制,因为管理员可以使用各种属性创建详细的安全策略[ 55- 57].ABE最近也能够实现灵活的访问控制[ 58 59].因此,与现有的医疗保健研究平台不同,HBDP通过我们使用ABE加密的物联网设备的各种传感数据实现了细粒度的访问控制。此外,两项为存储的电子健康数据提供加密的研究是由Lunn等人[ 30.],琼斯等[ 34和HBDP。需要这种加密来防止内部人员和恶意攻击者的非法泄露。即使是匿名的电子健康数据在存储在研究平台上时也必须加密,如果电子健康数据泄露,重新识别就变得困难和无用。最后,问责制是一种审计跟踪,帮助平台管理员在发生安全事件时采取适当的行动,并通过监控减轻安全威胁。然而,在Lunn等人的研究中,测井系统是以集中形式实现的[ 30.]和琼斯等人[ 34].集中式系统在系统不可用时难以操作日志服务,并且攻击者可能会破坏日志的完整性。HBDP通过区块链使用去中心化形式的日志记录系统,因此,即使有一个节点不可用,日志记录仍然是可能的,并确保日志的完整性,因为所有对等点都拥有分布式账本。此外,与以前的平台不同,我们提出了详细的非法用户检测方法,以证明HBDP中的问责性。

医疗大数据平台(HBDP)与相关研究比较

SRs一个 研究
欧扎丁等[ 29 伦恩等[ 30. 阿什法克等[ 31 康德等人[ 32 德摩尔等[ 33 琼斯等人[ 34 我们的
老1b
身份验证
授权
细粒度访问控制
老2c-encryption (eHealth数据的加密级别和内容) ✓(完整数据和医疗报告) ✓(敏感数据和可识别数据) ✓(敏感数据和医疗状况)
老3d
权力下放
集中
非法用户检测方法

一个SR:安全需求。

b访问控制。

c存储的电子健康数据的加密。

d问责制。

私人区块链

电子卫生数据主体希望通过直接参与电子卫生数据访问决策来加强其权利。他们还关心电子健康数据的隐私和安全。然而,当他们直接参与访问决策时,有可能扼杀或不适当地限制电子健康数据在研究中的可用性(例如,研究人员使用电子健康数据的请求被推迟很长时间或被无条件拒绝)。因此,必须通过其他方式保障主体的权利。通过区块链的分布式账本,我们希望提供商可以监督,但不直接参与访问决策。例如,eHealth数据主体可以通过平台上的分布式账本随时轻松搜索其eHealth数据的使用历史和用户,并在出现任何问题时反对使用。此外,由于区块链记录的历史难以更改,预计它将获得eHealth受试者更大的信任。虽然我们没有实施这一监督职能,但我们期望进一步的研究将有助于解决对使用电子卫生数据的关切,并提高电子卫生数据主体的权利。

物联网设备的互操作性

来自各种传感器和物联网设备的电子健康数据正在迅速增加,并在许多卫生设施中收集。这些电子健康数据在用于研究时可以改善公共健康,并提供高质量的定制医疗服务,因此必须在卫生保健研究平台上提供。一般情况下,物联网设备由物联网平台连接和管理。然而,由于物联网平台上的各种互操作性问题,目前很难共享或使用收集的电子健康数据。特别是,由于每个物联网平台对物联网设备有不同的访问控制方法和安全策略,因此无法保证安全互操作性。因此,我们未来的研究将通过确保HBDP上物联网平台的安全互操作性,为研究人员提供各种详细的电子健康数据。

结论

在医疗保健研究中使用电子健康数据提供了巨大的潜力和优势。然而,eHealth数据包含更多的个人信息,比其他大数据更加敏感,因此必须保证eHealth数据的隐私性和安全性,才能用于研究。此外,电子健康数据主体仍然担心现有医疗研究平台内未经授权的数据重用和共享。因此,我们为医疗保健研究设计了一个更安全的合作平台,称为HBDP。该平台使用私人区块链和ABE加密技术确保电子健康数据的隐私性和安全性。私有区块链作为一个分散的持久日志DB运行,其中HBDP上发生的所有活动都用时间戳记录下来。因此,区块链(即分布式账本)中的记录可以帮助平台管理员和用户发现并响应HBDP上未经认证和未经授权的用户。即使电子健康数据从平台泄露,ABE加密也能确保隐私,并使用情景信息实现详细和细粒度的访问控制。此外,我们开发并测试了HBDP、区块链网络,以及使用Hyperledger Fabric、OpenStack和OpenABE库的Android应用程序,以展示该平台的可行性。我们还通过案例研究描述了非法用户(即未经认证和未经授权的用户)的检测。 As this study focused only on a secure environment for health care research, some future work is needed to provide an efficient and complete research platform. Nevertheless, we believe that the HBDP will provide a sufficiently secure environment for the use of eHealth data in health care research.

缩写 安倍

基于属性的加密

CDA

临床文件架构

清洁发展机制

通用数据模型

dar

查阅资料要求服务

DB

数据库

DICOM

医学数字成像与通信“,

EMR

电子病历

FHIR

快速医疗保健互操作性资源

GDPR

一般保障资料规例

HBDP

健康大数据平台

HL7

健康等级7

HRADIS

医疗保健研究和分析数据基础设施解决方案

物联网

物联网

国民健康保险制度

国民保健制度

OMOP

观察性医疗结果伙伴关系

PHR

个人健康记录

RBAC

基于角色的访问控制

安全性要求

TPS

每秒事务数

XDS

跨企业文档共享

本工作得到韩国政府资助的韩国国家研究基金(2021R1A2C2012635)的支持。

本文由GK编写并执行实现。YGK负责监督和协调调查工作。

没有宣布。

《健康保险携带和责任法案》 美国卫生与公众服务部 2022-01-10 https://www.hhs.gov/hipaa/for-professionals/security/laws-regulations 一般资料保护规例 Intersoft咨询 2022-01-10 https://gdpr-info.eu 加州消费者隐私法 加州司法部 2022-01-10 https://oag.ca.gov/privacy/ccpa 年代 搜索引擎优化 Y E Y 关于电子健康数据安全和隐私的全面调查 国际环境与公共卫生 2021 09 14 18 18 9668 10.3390 / ijerph18189668 34574593 ijerph18189668 PMC8465695 奥基夫 厘米 鲁宾 DB 个人隐私与公共利益:保护卫生研究中的机密性 地中海统计 2015 10 15 34 23 3081 103 10.1002 / sim.6543 26045214 韩国医疗保健研究平台 卫生和福利部 2022-01-10 https://hcdl.mohw.go.kr 数据访问请求服务(DARS) 国家卫生服务数字系统 2022-01-10 https://digital.nhs.uk/services/data-access-request-service-dars 瑞士个性化健康网络(SPHN)主页 瑞士个性化健康网络 2022-07-18 https://sphn.ch 特金 C 克罗斯比 B 邓恩 K 价格 G 马斯顿 E 克劳福德 C 奥哈拉 摩根 C Levermore 吓唬 年代 Modhwadia 年代 Attwood J 津贴 年代 丹尼斯顿 正义与发展党 Gkoutos G 老虎 R 伐木工人 一个 Ignatowicz 一个 范宁 H Sapey E 先锋数据中心 患者、护理人员和医护人员对匿名数据使用的看法和对NHS数据选择退出的认识 参与决议 2021 06 14 7 1 40 10.1186 / s40900 - 021 - 00281 - 2 34127076 10.1186 / s40900 - 021 - 00281 - 2 PMC8201435 J G Y 大数据生命周期中的安全和隐私:一项调查和公开挑战 可持续性 2020 12 17 12 24 10571 10.3390 / su122410571 Naveed Ayday E 克莱顿 电子战 Fellay J 甘特 CA Hubaux J 马林 英航 X 基因组时代的隐私 ACM计算调查 2015 09 48 1 6 10.1145 / 2767007 26640318 PMC4666540 Hyperledger织物 Hyperledger基金会 2022-01-10 https://www.hyperledger.org/use/fabric Zeutro / openabe GitHub 2021 1 28 2022-01-10 https://github.com/zeutro/openabe 世界上部署最广泛的开源云软件 Openstack 2022-01-10 https://www.openstack.org 道林 RH Alschuler l 波伊尔 年代 毕比 C Behlen 调频 拜伦 光伏 Shabo (Shvo) 一个 HL7临床文档架构,第2版 美国医学信息学协会 2006 01 01 13 1 30. 9 10.1197 / jamia.m1888 本德 D Sartipi K HL7 FHIR:用于医疗保健信息交换的一种敏捷的RESTful方法 第26届IEEE基于计算机的医疗系统国际研讨会论文集 2013 第26届IEEE计算机医疗系统国际研讨会 2013年6月20-22日 葡萄牙的波尔图街头 OMOP公共数据模型 观察性健康数据科学与信息学 2022-01-10 https://www.ohdsi.org/data-standardization/the-common-data-model 医学数字成像与通信主页 医学数字成像与通信“, 2022-01-10 https://www.dicomstandard.org Noumeir R Renaud B IHE跨企业文档共享成像:互操作性测试软件 源代码生物医学 2010 09 21 5 1 9 10.1186 / 1751-0473-5-9 20858241 1751-0473-5-9 PMC2954912 G C Marstein 一个基于区块链‐的体系结构,用于保护电子健康记录系统 并发计算实践专家 2019 08 04 33 14 e5479 10.1002 / cpe.5479 马汀 毫米 Battah AA Yaqoob 沙拉 K Jayaraman R Al-Hammadi Y 佩斯克 年代 Ellahham 年代 区块链,让病人控制他们的医疗记录 IEEE访问 2020 8 193102 15 10.1109 / access.2020.3032553 P 白色 J 施密特 直流 楞次 G FHIRChain:应用区块链安全、可扩展地共享临床数据 计算结构生物技术 2018 16 267 78 10.1016 / j.csbj.2018.07.004 30108685 s2001 30037 - 0 - 0370 (18) PMC6082774 Shahnaz 一个 Qamar U 哈立德 一个 使用区块链进行电子健康记录 IEEE访问 2019 7 147782 95 10.1109 / access.2019.2946373 Tanwar 年代 帕尔克 K 埃文斯 R 用于医疗保健4.0应用的基于区块链的电子医疗记录系统 J通知安全应用程序 2020 02 50 102407 10.1016 / j.jisa.2019.102407 菲格罗亚 年代 Anorga J Arrizabalaga 年代 基于区块链分散应用的RFID系统中基于属性的访问控制模型 电脑 2019 07 31 8 3. 57 10.3390 / computers8030057 Daraghmi E Daraghmi Y 年代 MedChain:基于区块链的医疗记录访问和权限管理系统设计 IEEE访问 2019 7 164595 613 10.1109 / access.2019.2952942 考尔 J 王妃 R 卡尔拉 N 基于区块链的框架,用于安全存储、共享和查询电子医疗保健记录 并发计算实践专家 2021 05 20. 33 20. e6369 10.1002 / cpe.6369 R H D C 壮族 C Z 灵活高效的基于区块链的ABE方案,具有远程医疗系统中按需医疗的多权限 IEEE访问 2019 7 88012 25 10.1109 / access.2019.2925625 Ozaydin B Zengul F 猛烈的一击 N 费尔德曼 党卫军 医疗保健研究和分析数据基础设施解决方案:用于医疗保健服务研究的数据仓库 J医疗互联网服务 2020 06 04 22 6 e18579 10.2196/18579 32496199 v22i6e18579 PMC7303827 卢恩 Lubensky 亨特 C Flentje 一个 Capriotti Sooksaman C 哈尼特 T 柯里 D 尼尔 C Obedin-Maliver J 一个数字健康研究平台,用于在国家纵向队列研究(PRIDE研究)中社区参与、招募和保留性和性别少数成人 美国医学信息协会 2019 08 01 26 8 - 9 737 48 10.1093 /地点/ ocz082 31162545 5509461 PMC6696499 阿什法克 一个 朗恩 年代 尼尔森 H 埃里克森 晶澳 Kwatra J 图7 ZM评选 Slutzman Wallenfeldt T 欧博迈亚 Z 安德森 PD Lingman 数据资源概况:瑞典哈兰地区医疗保健信息平台 流行病学 2020 06 01 49 3. 738 9 f 10.1093 / ije / dyz262 31930310 5701527 康德 J Moreno-Conde 一个 Salas-Fernandez 年代 Parra-Calderon CL ITCBio,一个临床和转化研究平台 AMIA年度诉讼程序 2019 2019 673 80 32308862 PMC7153134 德摩尔人 G Sundgren 卡尔拉 D 施密特 一个 Dugas Claerhout B Karakoyun T Ohmann C Lastic P Ammour N 库什 R 杜邦公司 D Cuggia 丹尼尔 C Thienpont G Coorevits P 使用电子健康记录进行临床研究:EHR4CR项目的案例 J生物医学信息 2015 02 53 162 73 10.1016 / j.jbi.2014.10.006 25463966 s1532 - 0464 (14) 00226 - 3 琼斯 KH 福特 DV 汤普森 年代 里昂 R 英国安全研究平台上SAIL数据库的简介 流行数据科学 2019 11 20. 4 2 1134 10.23889 / ijpds.v4i2.1134 34095541 S2399490819011340 PMC8142954 辛格 一个 Chatterjee K 电子医疗系统的安全与隐私问题研究 J告知优化科学 2020 02 02 40 8 1709 29 10.1080 / 02522667.2019.1703265 Hathaliya JJ Tanwar 年代 关于医疗保健4.0中的安全和隐私问题的详尽调查 第一版Commun 2020 03 153 311 35 10.1016 / j.comcom.2020.02.018 阿尔瓦雷斯 医疗保健行业的安全趋势 IBM 2017 2 2022-07-25 https://www.ibm.com/downloads/cas/PLWZ76MM Newaz 人工智能 Sikder 正义与发展党 拉赫曼 Uluagac 作为 关于现代医疗系统安全和隐私问题的调查 ACM跨计算医疗保健 2021 07 31 2 3. 1 44 10.1145 / 3453176 al - janabi 年代 Al-Shourbaji Shojafar Shamshirband 年代 针对医疗保健应用的无线身体区域网络的主要挑战(安全和隐私)的调查 埃及信息学J 2017 07 18 2 113 22 10.1016 / j.eij.2016.11.001 艾哈迈德 一个 拉蒂夫 R 拉蒂夫 年代 阿巴斯 H 足总 基于物联网的多云电子医疗环境中的恶意内部攻击:系统文献综述 Multimed Tools应用 2018 1 20. 77 17 21947 65 10.1007 / s11042 - 017 - 5540 - x Nasiri 年代 Sadoughi F Tadayon Dehnad 一个 基于物联网的医疗保健系统安全需求调查研究 医学学报 2019 12 27 4 253 8 10.5455 / aim.2019.27.253 - 258 32055092 目标- 27 - 253 PMC7004290 瓶框架 托盘项目 2022-01-10 https://flask.palletsprojects.com/en/2.0.x 重火力点主页 重火力点 2022-01-10 https://firebase.google.com 超级账本/卡尺 GitHub 2022 8 8 2022-01-10 https://github.com/hyperledger/caliper Y Z 并行计算:回顾和展望 第五届信息科学与控制工程国际会议论文集 2018 第五届信息科学与控制工程国际会议 2018年7月20日至22日 郑州,中国 Y T 年代 X l H Vasilakos AV 大数据的并行处理系统:一项调查 Proc IEEE 2016 11 104 11 2114 36 10.1109 / jproc.2016.2591592 年龄 Z 马哈茂德 Sadeeq Abdulrazzaq 恐龙 H 云计算资源对重载并行处理方法的影响 IOSR J计算工程 2020 22 3. 30. 41 西蒙 通用电气 Shortreed SM 绿青鳕 变化中 Penfold RB Rossom 钢筋混凝土 Waitzfelder 桑切斯 K 林奇 FL 评估和最大限度地减少来自医疗记录的研究数据中的再识别风险 EGEMS(清洗DC) 2019 03 29 7 1 6 10.5334 / egems.270 30972355 PMC6450246 布兰森 J N J 蒙日 W Probst C El伊玛目 K 评估根据EMA政策0070和加拿大卫生部法规匿名的临床研究报告的再识别风险 试用 2020 02 18 21 1 200 10.1186 / s13063 - 020 - 4120 - y 32070405 10.1186 / s13063 - 020 - 4120 - y PMC7029478 J 年代 高效的公共完整性检查云数据共享与多用户修改 IEEE INFOCOM 2014 - IEEE计算机通信会议论文集 2014 IEEE INFOCOM 2014 - IEEE计算机通信会议 2014年4月27日至5月2日 加拿大安大略省多伦多 10.1109 / infocom.2014.6848154 Y C X H μ Y X 有效地对云存储系统的数据完整性进行公开验证,避免不可区分性混淆 IEEE Trans通知法医安全 2017 3. 12 3. 676 88 10.1109 / tifs.2016.2631951 P D Y Tyagi SK 库马尔 N 区块链基于数据的云数据完整性保护机制 未来一代计算系统 2020 01 102 902 11 10.1016 / j.future.2019.09.028 伊斯兰教的先知 Toeroe Khendek F 云中的可用性:最先进的技术 网络计算应用 2016 01 60 54 67 10.1016 / j.jnca.2015.11.014 Endo PT 罗德里格斯 Goncalves 通用电气 凯尔纳 J Sadok DH Curescu C 云中的高可用性:系统回顾和研究挑战 J Cloud compp 2016 10 18 5 1 16 10.1186 / s13677 - 016 - 0066 - 8 Goyal V Pandey O Sahai 一个 水域 B 基于属性的加密,用于加密数据的细粒度访问控制 第13届ACM计算机与通信安全会议论文集 2006 CCS06:第13届ACM计算机与通信安全会议2006 2006年10月30日至11月3日 美国弗吉尼亚州亚历山大 10.1145/1180405.1180418 G J 基于属性的分层加密,实现云存储服务的细粒度访问控制 第17届计算机与通信安全ACM会议论文集 2010 CCS '10:第17届ACM计算机与通信安全会议2010 2010年10月4日至8日 美国伊利诺伊州芝加哥市 10.1145/1866307.1866414 C 壮族 R Y Y T Choo 基米-雷克南 为电子医疗保健云使用基于属性的加密进行细粒度数据库字段搜索 J医学系统 2016 11 40 11 235 10.1007 / s10916 - 016 - 0588 - 0 27653042 10.1007 / s10916 - 016 - 0588 - 0 J W Y H J 云计算中基于属性的灵活细粒度数据存储 IEEE传输服务计算 2017 9 1 10 5 785 96 10.1109 / tsc.2016.2520932 王ydF4y2Ba Z J RH HASBE:一种基于属性的分层解决方案,用于云计算中灵活和可扩展的访问控制 IEEE Trans通知法医安全 2012 04 7 2 743 54 10.1109 / tifs.2011.2172209
Baidu
map