发表在第22卷第六名(2020): 6月

本文的预印本(早期版本)可在https://preprints.www.mybigtv.com/preprint/16757,首次出版
公共卫生监测系统中身份识别记录的隐私保护联系:评价研究

公共卫生监测系统中身份识别记录的隐私保护联系:评价研究

公共卫生监测系统中身份识别记录的隐私保护联系:评价研究

原始论文

1伯内特研究所,墨尔本,澳大利亚

2莫纳什大学人口健康与预防医学学院,澳大利亚墨尔本

3.澳大利亚墨尔本,墨尔本大学,墨尔本医学院,HaBIC研究技术部,全科医学科

4澳大利亚悉尼新南威尔士大学柯比研究所

5哥伦比亚大学梅尔曼公共卫生学院,美国纽约州纽约

6悉尼性健康中心,澳大利亚悉尼

7澳大利亚墨尔本阿尔弗雷德医院传染病科

8墨尔本大学多尔蒂研究所和人口与全球卫生学院,澳大利亚墨尔本

通讯作者:

阮龙,MCom

伯内特研究所

商业路85号

墨尔本,3004

澳大利亚

电话:61 468689589

电子邮件:long.nguyen@burnet.edu.au


背景:建立了澳大利亚协调加强哨点监测协作机制,以监测关键人群血液传播病毒(bbv)和性传播感染(STIs)的国家检测和检测结果。ACCESS从哨点卫生服务(包括全科、性健康和传染病诊所)以及进行大量BBV/STI检测的公共和私人实验室提取鉴定数据。ACCESS的一个重要特点是能够准确地将参与地点内部和之间的个人一级记录联系起来,因为这使该系统能够产生可靠的流行病学措施。

摘要目的:本研究的目的是评估ACCESS中GRHANITE软件的使用,以提取和链接来自参与诊所和实验室的未识别数据。GRHANITE根据在现场的患者电子医疗记录(EMRs)中捕获的患者识别数据生成不可逆的散列链接密钥。生成数据链接密钥的算法使用概率链接原则来考虑潜在患者标识符的可变性和完整性,每个EMR生成最多四种链接密钥类型。链接过程中的错误可能源于标识符的不完善或缺失,从而影响系统的完整性。因此,必须评估所建立的联系的质量,并评估持续公共卫生监测联系的结果。

方法:虽然ACCESS数据被去识别,但我们创建了两个金标准数据集,其中可以确认真实匹配状态,以便与GRHANITE linkage Tool不同方法产生的记录链接结果进行比较。我们在可能的情况下报告了敏感性、特异性、阳性和阴性预测值,并通过比较相关EMRs的HIV和丙型肝炎抗体结果的历史来估计特异性。

结果:将GRHANITE链接工具应用于3700份临床医疗记录的小型金标准数据集时,灵敏度为96%至100%,特异性为100%。此数据集中的医疗记录包含非常高水平的数据完整性,可以在记录链接中使用姓名、出生日期、邮政编码和医疗保险号码。在一个更大的金标准数据集中,包含诊所和病理服务的86,538份医疗记录,数据完整性水平较低,6种不同记录链接方法中的4种敏感性在94%至95%之间,估计特异性在91%至99%之间。

结论:这项研究的结果表明,GRHANITE链接工具可用于准确链接未识别的患者记录,并可放心地用于ACCESS等系统中的公共卫生监测。

中国医学网络学报2020;22(6):e16757

doi: 10.2196/16757

关键字



背景

澳大利亚血液传播病毒和性传播感染协调加强哨点监测协作(ACCESS)对重点血液传播病毒和性传播感染的诊断检测和其他护理事件进行监测[12]。ACCESS从实验室和诊所网络中提取已识别的患者数据,包括那些管理bbv和性传播感染风险较高人群的高病例量患者的实验室和诊所,包括同性恋、双性恋和其他男男性行为者以及注射毒品者。ACCESS的主要目标是衡量和报告关键指标,如发病率和患病率(按正比例衡量),以监测和支持澳大利亚减少BBV和性传播感染引起的发病率和死亡率传播的努力[3.-5]。

ACCESS(以及类似的哨点监测系统)面临的一个关键挑战是,如果个人参加多个医疗服务,则可能无法准确测量患者的结果,从而导致潜在的报告偏差。例如,检测频率的标记,BBV/STI预防和管理的重要指标[3.-5],如果个人在多个服务机构进行测试,可能会被低估。ACCESS服务内部和服务之间的个人准确联系,可以更准确地衡量(1)与澳大利亚BBV和STI国家战略有关的关键指标,以及(2)旨在减少BBV和STI影响的干预措施的效果。

跨站点识别ACCESS记录的链接依赖于专门的健康数据提取软件GRHANITE,该软件安装在参与的诊所和实验室。GRHANITE与患者数据库接口,安全提取排队咨询、人口统计学、BBV和STI临床和病理数据[6]。在从ACCESS站点传输数据之前,GRHANITE会创建一个唯一的记录ID来识别电子医疗记录(EMR),并使用患者识别信息生成与该记录相关的不可逆哈希编码链接键。记录编号及连接键会连同病人的临床及病理资料一并转移至安全的资料库,而非个人识别码,以保障病人的私隐[7]。然后生成一个链接ID [8]当同一名患者使用名为GRHANITE联动工具的配套软件通过匹配联动键在不同的emr之间进行联动时[9]。

目标

GRHANITE联动工具已被验证可执行大规模种群级记录联动[10]根据传统的个人可识别数据链接机制,实现类似的敏感性和特异性数据链接配置文件[9]。鉴于ACCESS中临床和实验室站点的可用个人识别数据存在差异,本文的重点是通过应用不同的方法在ACCESS中使用GRHANITE链接工具来评估链接结果的质量。为了评估GRHANITE联动工具用于持续公共卫生监测,我们使用该工具与来自ACCESS数据的金标准联动数据集测量了记录联动的结果。


通过GRHANITE进行协调增强哨点监测数据提取和链接的澳大利亚合作

电子病历

通常,当患者首次到医疗机构就诊时,将在该机构的患者数据库中创建EMR,其中包含患者的识别信息,包括姓名、出生日期、联系详细信息和Medicare号码(用于Medicare计费的澳大利亚政府发行的医疗保健卡号)。大多数诊所还会在EMR中记录其他人口统计信息,如首选语言、出生国家和土著背景。

每个人的EMR都有一个由患者数据库生成的唯一医疗记录号,将患者的所有咨询、检查和处方记录链接起来。如果患者的详细信息发生变化且没有更新,可能会在同一家机构为一个患者创建多个EMR,从而导致创建一个新的EMR;如果病人使用化名;或者如果病人去了一家允许匿名或免费检测的诊所。

澳大利亚协作加强哨点监视的数据提取

数据从参与ACCESS的临床站点提取,其中包括提取时数据库中每个患者的EMR。GRHANITE为每个EMR生成一个新的唯一记录ID和最多四个不可逆的哈希编码链接键。患者EMR中的个人识别信息(如姓名、出生日期、医疗保险号码)通过高级加密传输,以生成记录ID和链接密钥[7]。GRHANITE提取了记录ID和链接键,以及与BBV和STI护理相关的患者人口统计数据、咨询、测试请求、病理和处方信息,但没有识别信息。实验室的数据提取类似;然而,只有与诊断和护理相关的BBV和STI检测记录以及一组有限的人口统计学变量可供提取(图1).

图1所示。澳大利亚协同增强哨点监视合作中的数据提取:使用GRHANITE去识别电子医疗记录并创建链接密钥。
查看此图
澳大利亚协调加强哨点监视合作的记录联系

GRHANITE用于创建链接键的数据组件包括以下患者标识符:医疗保险号码的5位数字、出生日期、性别、名、姓和居住邮政编码。然而,并不是所有的emr都以相同的方式记录相同的患者标识符集。例如,一个病人的名字可能被记录为威廉在一家诊所,有完整的出生日期和比尔在另一家诊所只记录了出生年份。GRHANITE利用数据预处理来删除不需要的字符和单词,并使用澳大利亚国家昵称列表来解析昵称。然后使用语音编码(双变音位),它允许基于姓氏和名字的拼写错误进行模糊匹配。还支持调换出生日期和月份。预处理后,将标识符组合,然后使用秘密种子密钥和加密散列加密,以生成GRHANITE保护隐私的加密散列链接密钥[79]。

GRHANITE为每个EMR创建多达四个链接键,使用在每个站点记录的识别信息的组合(文本框1) [11]。例如,如果没有为患者记录Medicare号码,则需要5个Medicare数字的链接键(文本框1:链接键类型1、2和4)无法创建,导致通过GRHANITE提取的emr只有一个链接键(文本框1:联动键3不需要医保号;图1).

GRHANITE生成的联动键类型。

联动键及基本识别信息组成:

  • 类型1:5个医疗保险数字;出生日期;和性
  • 类型2:5个医疗保险数字;邮政编码;名字的前三个字符;出生年份
  • 类型3:姓氏和名字(任何一种顺序都可以),使用模糊匹配;出生日期及月/日(允许调换)
  • 类型4:姓氏和名字(任何一种顺序都可以),使用模糊匹配;5个医保数字
文本框1。GRHANITE生成的联动键类型。

应用GRHANITE联动工具

在ACCESS中应用链接工具时,记录链接过程中有三个步骤。第一步基于至少一个链接键匹配查找emr对,并记录用于匹配每个记录对的链接键类型。第二步使用匹配记录对中的其他可用数据检查链接的强度,以接受或拒绝中所述的链接记录表1.第三步为接受的匹配对分配标识符(链接ID),将所有匹配的记录标记为属于同一个人(图2).

表1。GRHANITE联动工具接受匹配的方法。
联系方法 描述
接受所有 接受由链接工具确定的所有记录链接
出生年份匹配 如果出生年份匹配,只接受记录链接
性匹配 如果性别匹配,只接受记录链接
出生年份和性别匹配 如果出生年份和性别匹配,只接受记录链接
两个或多个链接键一个 仅当在两个或多个链接键类型上匹配时接受记录链接
联动键类型3 +性别匹配b 只接受与链接键类型3匹配且与性别匹配的记录链接

一个鉴于4个链接键类型中的3个是使用医疗保险号码生成的,此方法要求医疗保险号码出现在EMR中(文本框1).

b此方法仅依赖于类型3的链接键,它不要求医疗保险号码出现在EMR中。

图2。澳大利亚协同加强哨点监测合作中的记录链接:使用GRHANITE链接工具识别和接受匹配。
查看此图

评估记录链接

创建金标准数据集

为了评估ACCESS中的记录链接,我们使用确定性记录链接方法生成了两个金标准数据集,其中可以识别真实的匹配状态[12]。评估中所述的六种联系方法的结果表1,使用GRHANITE联动工具来匹配金标准数据集中的记录,在可能的情况下,我们测量了敏感性、特异性以及阳性和阴性预测值。

PrEPX金标准数据集

PrEPX是维多利亚州的一项人群水平干预研究,在该研究中,符合条件的个人可以获得艾滋病毒暴露前预防,该研究使用ACCESS数据监测参与者的BBV和STI检测[13]。2016年7月至2018年3月期间,参与ACCESS的8个临床站点和1个医院诊所招募了PrEPX参与者。入组时,按顺序分配一个PrEPX研究ID,并将其与每个参与者的入组诊所EMR号码一起记录在研究数据库中。在PrEPX登记后,如果参与者在研究期间到网络内的不同诊所就诊,则新诊所的EMR号码也会记录在研究数据库中。ACCESS获得了伦理许可,可以从参与的诊所提取EMR号码,以匹配在诊所之间移动的参与者的记录。为了创建金标准数据集,EMR根据诊所EMR号、诊所名称和诊所就诊日期进行匹配。金标准包括在研究期间只到一家诊所就诊的每位PrEPX参与者有一条记录,以及通过研究ID链接到多个诊所就诊的每位PrEPX参与者有多条记录(图3).

图3。电子病历在PrEPX中的数据流及金标准数据集的确定性关联。
查看此图
病理结果金标准数据集

第二个更大的金标准数据集是根据2009年1月至2018年4月期间参与ACCESS的7家诊所和4家实验室提取的emr生成的。要被纳入该数据集,患者必须至少有一个样本从ACCESS诊所之一发送到ACCESS实验室之一。实验室为标本分配了一个唯一的实验室标本ID,当实验室将病理结果反馈给诊所时,该标本ID也被记录在诊所中。为了创建金标准数据集,使用实验室标本ID、出生年份和测试日期匹配临床和实验室记录。我们允许测试日期有7天的差异,因为在医疗记录中,同一样本的记录日期通常会有所不同。金标准数据集中只包含匹配的记录,并使用任意分配的链接标识符(图4).

病理结果金标准数据集中的EMR可能与许多其他EMR相匹配,原因有以下几种:个人可能有多个标本被送往多个实验室进行检测,个人可能去过不同的诊所,因此实验室将相同的检测结果发送到多个诊所,或者个人可能由于个人标识符过时或不完整而在实验室或诊所有多个EMR。

图4。病理数据流导致了电子病历和金标准数据集的确定性关联。
查看此图
数据分析
灵敏度

灵敏度的计算方法是使用GRHANITE联动工具确定的正确链接的emr数量占金标准数据集中链接emr总数的百分比。

特异性

在PrEPX金标准数据集中,特异性计算为使用GRHANITE联动工具正确识别为未联动的单个emr数量占未联动emr总数的百分比。计算阳性预测值(PPV)和阴性预测值,以提供真匹配和漏匹配的概率。

鉴于ACCESS数据的去识别性质,不可能在病理结果金标准数据集中包括不匹配的标本id,因为没有办法确认它们是否属于不同的个体(正确不匹配),因此不可能计算特异性。因此,为了评估特异性,我们评估了按时间顺序排列的HIV和丙型肝炎检测记录的一致性,以确定不应该相互关联的emr。通过识别结果不一致的相关emr,可以确定PPV(抗体结果一致的相关记录的比例)。然后使用PPV和每种连锁方法的敏感性来估计特异性,总结于图5

图5。在已知阳性预测值和敏感性时估计特异性。
查看此图
用不一致的病理结果测量不正确的匹配

感染后,随后进行的任何艾滋病毒或丙型肝炎抗体检测应始终返回阳性结果。使用病理结果金标准数据集仅提供少量艾滋病毒和丙型肝炎结果;因此,使用用于创建金标准数据集的同一诊所和实验室站点的所有可用emr,获得了链接emr数据集。创建了两个数据集,一个包含任何HIV western blot或抗体结果,另一个包含任何丙型肝炎抗体结果。在记录链接之前包含不一致结果的emr被排除在样本中,以免与记录链接导致的不一致相混淆。然后使用所有六种方法链接每个数据集中的记录(表1)的GRHANITE联动工具。由于只有在初始阳性结果后才能确定不一致的检测结果,因此从样品中删除了没有阳性结果历史的相关emr。因此,在HIV和丙型肝炎数据集中,只有在初始HIV western blot阳性或丙型肝炎抗体结果阳性后包含抗体结果的关联emr被保留用于评估。

为了计算PPV,在检测结果为阳性后至少7天,检查相关emr的阴性抗体结果,然后将其归类为不匹配。如果大多数随后的抗体检测结果为阴性,则初始结果和随后的任何阳性结果都被认为是不正确匹配的记录。


使用PrEPX金标准数据集记录链接

PrEPX金标准数据集在56个emr中确定了28个连接,表明28名研究参与者在PrEPX研究期间曾参加过两个不同的临床地点。其余3644份emr来自研究期间只去过一家诊所的参与者,因此没有任何相关记录。

超过99%的emr在9个位点中有8个位点具有所有四种链接密钥类型,这表明产生这些链接密钥的患者识别信息在诊所中几乎完全记录。在11%(8/76)的emr中,一个站点缺少生成链接类型1、2和4(都需要医疗保险编号)所需的数据(表2).

在所有连接方法中,除了需要两个或多个连接键的方法外,来自28个参加两个位点的个体的所有emr对都正确连接(灵敏度100%)。在需要两个或多个链接键进行匹配的方法中,没有识别出一对链接键(灵敏度为96%)。使用所有链接方法的特异性为100%,数据集中其余3644个emr中没有任何一个被错误链接(表3).

表2。按链接键类型和站点分列的PrEPX金标准数据集中电子医疗记录的百分比。
网站 电子病历数量N 具有链接键的电子病历的百分比


类型1,n (%) 类型2,n (%) 类型3,n (%) 类型4,n (%)
网站1 76 68 (89) 68 (89) 76 (100) 68 (89)
网站2 853 853 (100.0) 853 (100.0) 853 (100.0) 853 (100.0)
网站3 1087 1087 (100.00) 1084 (99.72) 1087 (100.00) 1087 (100.00)
网站4 582 582 (100.0) 582 (100.0) 582 (100.0) 582 (100.0)
网站5 40 40 (100.0) 40 (100.0) 40 (100.0) 40 (100.0)
网站6 135 135 (100.0) 135 (100.0) 135 (100.0) 135 (100.0)
网站7 106 106 (100.0) 103 (99.2) 106 (100.0) 106 (100.0)
网站8 314 314 (100.0) 314 (100.0) 314 (100.0) 314 (100.0)
网站9 507 507 (100.0) 507 (100.0) 507 (100.0) 507 (100.0)
总计 3700 3692 (99.78) 3686 (99.62) 3700 (100.00) 3692 (99.78)
表3。评估指标来源于在PrEPX金标准数据集上使用GRHANITE联动工具。
联系方法 灵敏度(N=56), N (%) 特异性(N=3644), N (%) 阳性预测值(N=56), N (%) 负预测值(N=3644), N (%)
接受所有 56 (100) 3644 (100.00) 56 (100) 3644 (100.00)
出生年份匹配 56 (100) 3644 (100.00) 56 (100) 3644 (100.00)
性匹配 56 (100) 3644 (100.00) 56 (100) 3644 (100.00)
出生年份和性别匹配 56 (100) 3644 (100.00) 56 (100) 3644 (100.00)
两个或多个链接键 54 (96) 3644 (100.00) 54 (100)一个 3644 (99.90)b
联动键类型3 +性别匹配 56 (100) 3644 (100.00) 56 (100) 3644 (100.00)

一个N = 54。

bN = 3646。

使用病理结果金标准数据集记录链接

在病理结果金标准数据集中使用GRHANITE联动工具,在86538个emr中创建了50484个联动记录,其中最多有6个emr被确定为属于同一个人。

共有99.69%(86,273/86,538)的emr包含至少一种链接密钥类型,73.51%(63,610/86,538)的记录中存在所有四种链接密钥类型,这表明患者数据库中患者识别信息的完成度总体上非常高。然而,21.62%(18,709/86,538)的emr只有连接密钥类型3可供匹配。97.42%(7914/8124)来自一个公共实验室的EMRs中缺少一种或多种连接类型1、2和4(都需要医疗保险编号),53.95%(5967/ 11060)来自性健康诊所,48.25%(1403/2908)来自私人实验室,23.42%(6134/ 26186)来自另一个公共实验室(表4).

对于前4种链接方法,GRHANITE链接工具在病理结果金标准数据集中正确链接了94%至95%的emr,而在需要两个或多个链接键才能形成匹配的情况下,则下降到66%(57,330/86,538)。表5).在最后的链接方法中,只有在链接键类型3(不需要医疗保险号码)和性别匹配时才接受配对,89%(76,928/86,538)的记录被正确链接。

表4。病理学金标准数据集中按链接键类型和站点划分的电子医疗记录的百分比。
网站 电子病历数量N 没有链接键的电子医疗记录数量,n (%) 具有链接键的电子病历的百分比



类型1,n (%) 类型2,n (%) 类型3,n (%) 类型4,n (%)
诊所1 3165 0 (0.00) 3083 (97.41) 3077 (97.22) 3165 (100) 3083 (97.41)
诊所2 6342 0 (0.00) 6031 (95.10) 6015 (94.84) 6342 (100) 6031 (95.10)
诊所3 2514 0 (0.00) 2493 (99.16) 2489 (99.01) 2513 (99.96) 2492 (99.12)
诊所4 9679 0 (0.00) 9351 (96.61) 9322 (96.31) 9676 (99.97) 9350 (96.60)
诊所5 1369 1 (0.07) 1357 (99.12) 1356 (99.05) 1368 (99.93) 1357 (99.12)
诊所6 2489 5 (0.20) 2315 (93.01) 2288 (91.92) 2484 (99.80) 2315 (93.01)
诊所7(性健康) 11060年 9 (0.08) 5097 (46.08) 5094 (46.06) 11049 (99.90) 5095 (46.07)
第一实验室(公共) 26186年 241 (0.92) 23705 (90.53) 20059 (76.60) 25465 (97.25) 23227 (88.70)
实验二(公共) 8124 8 (0.10) 215 (2.65) 210 (2.58) 8116 (99.90) 215 (2.65)
第三实验室(私人) 2908 1 (0.03) 1706 (58.67) 1509 (51.89) 2907 (99.97) 1710 (58.80)
实验四(私立) 12702年 0 (0.00) 12205 (96.09) 12203 (96.07) 12700 (99.98) 12203 (96.07)
总计 86538年 265 (0.31) 67558 (78.07) 63622 (73.52) 85785 (99.13) 67078 (77.51)
表5所示。评价指标来源于对病理结果金标准数据集使用GRHANITE联动工具。
联系方法 金本位(N=86,538) 艾滋病毒的结果 丙型肝炎结果

灵敏度,n (%) N 阳性预测值,n (%) 估计特异性,(%) N 阳性预测值,n (%) 估计特异性,(%)
接受所有 82345 (95.15) 1427 1245 (87.25) 90.52 3908 3866 (98.93) 99.32
出生年份匹配 82212 (95.00) 1412 1234 (87.39) 90.71 3817 3777 (98.95) 99.34
性匹配 81689 (94.40) 1257 1143 (90.93) 93.20 3810 3775 (99.08) 99.42
出生年份和性别匹配 81560 (94.25) 1263 1152 (91.21) 93.42 3775 3741 (99.10) 99.43
两个或多个链接键 57330 (66.25) 257 256 (99.6) 99.74 2809 2795 (99.50) 99.67
联动键类型3 +性别匹配 76928 (88.90) 1090 984 (90.28) 92.98 3626 3596 (99.17) 99.49

用不一致试验结果估计特异性

在衍生的HIV数据集中,包含初始阳性Western blot结果的所有链接方式的链接emr数量在1090到1427之间,除非需要两个或多个链接键。需要两个或多个链接键进行匹配的链接方法导致了257个链接emr。前四种连锁方法的PPV在87% - 91%之间,估计特异性在90% - 93%之间。当由于不同的连接方法而连接较少emr时,PPV和特异性都得到改善(表5).

在衍生的丙型肝炎数据集中,使用前4种链接方法,超过3700个链接emr包含初始的丙型肝炎抗体阳性结果,当需要两个或更多链接键时,该记录下降到2809个。PPV大于98.9%,所有6种连锁方法的估计特异性超过99% (表5).


主要研究结果

本文描述了一个在大规模健康监测系统中使用隐私保护软件工具的概率记录链接系统的综合评估。结果表明,该软件提供了一个高度可靠和准确的系统,通过生成依赖于可用识别信息的链接密钥来链接常规收集的emr。记录关联的优化包括在敏感性(正确识别属于同一个人的记录)和特异性(确保属于不同人的记录不关联)之间取得适当的平衡,以及在不妨碍研究结果解释的情况下最适合研究设计目标和研究人群的方法。

当应用于相对较小的PrEPX金标准数据集时,联动工具的高性能与PrEPX试验中emr的数据完整性有关,而病理学结果金标准数据集的数据完整性(表24).PrEPX的参与者必须有一个医疗保险号码才能注册,并每月进行三次随访,这使得诊所的工作人员有多次机会记录任何缺失的身份信息[13]。在底层标识符是健壮的并且重复最小化的情况下,错过匹配的概率可以忽略不计。此外,对于PrEPX金标准数据集,所有链接方法的特异性均为100%,这表明链接工具不会错误地链接一小部分emr样本中的记录,其中不太可能存在具有相似身份细节(姓名、出生日期和医疗保险号码)的个人。

当链接工具应用于更大的病理结果金标准数据集时,灵敏度在89%至95%之间,其中链接方法依赖于单个链接键匹配。但是,使用要求记录链接两个或多个链接键类型的方法,灵敏度降低到66%。这是由于22%的emr只有一个可用于链接的链接键类型,这主要是因为医疗保险号码不可用。将实验室记录纳入病理结果金标准数据集可能会导致敏感性降低,因为患者标识符错误,如错误标记和记录实验室样本[14],与临床电子病历中个人标识符的完整性进行比较。在最后的链接方法中,emr对仅在链接键类型3(不需要医疗保险号码)和性别匹配时才链接,结果是89%的敏感性。分析中包含了这种方法,以模拟当医疗保险号码不可用时联动工具的性能。在澳大利亚进行评估是很重要的,因为ACCESS中相当一部分参与站点是由辖区政府资助的,并且不记录患者的医疗保险号码[15]。

限制

评估GRHANITE联动工具的主要挑战是,考虑到ACCESS中emr的不可识别性质,开发金标准数据集。研究人员很少有机会获得金标准数据集,在大型行政健康数据源之外执行链接验证,我们的86,538条记录的金标准数据集与其他已发表的研究可比较[16]。金标准要求记录有足够的补充信息,以便进行确定匹配,这样我们就可以确定匹配的属于同一个人,不匹配的属于不同的个人。因此,为了生成金标准的数据集,我们可以用来准确计算链接工具的灵敏度和特异性的记录数量有限。尽管病理结果金标准数据集包含超过80,000条记录,但评估的一个局限性是无法正确识别不匹配的emr,这意味着特异性不能直接测量。然而,鉴于ACCESS的重点是BBV和STI的监测,我们能够通过检查HIV和丙型肝炎相关检测结果的一致性来评估病理结果数据集中的特异性。正如预期的那样,关联特异性与敏感性呈负相关。此外,使用不一致的抗体结果,我们假设任何不一致的结果都可归因于不正确的记录链接,而不是实验室检测结果的错误。然而,鉴于HIV western blot和HIV和丙型肝炎抗体检测的高度敏感性和特异性,任何检测错误都将是最小的。艾滋病毒和丙型肝炎数据集之间观察到的PPV和估计特异性的差异可能归因于(1)艾滋病毒和丙型肝炎基础实验室检测的敏感性和特异性的差异,以及(2)匿名艾滋病毒检测的潜在更高比例,因为公共实验室不要求艾滋病毒检测的全名[15]。

除了通过检查艾滋病毒和丙型肝炎相关检测结果的一致性确定的假阳性记录联系之外,在个人具有共同的患者标识符的情况下,例如双胞胎,还有可能发生其他假阳性。鉴于ACCESS数据的不确定性质,如果没有实际确定的人口统计值,就无法确定这些小众案例。这些假阳性的微小影响预计不会影响使用ACCESS进行公共卫生监测的主要目的。对于其他需要较低水平的假阳性记录链接的研究项目,特别是如果已知包含高比例的个人共享共同的患者标识符,那么使用仅接受基于多个链接键匹配的链接方法将最大限度地减少假阳性。此外,确保其他提取数据的一致性,如性别、出生年份、艾滋病毒和丙型肝炎检测史,可以将假阳性记录的关联水平降低到可接受的水平。

结论

评估记录联系是评估监测和研究系统的效用的一个重要部分,用于回答人口层面的关键研究问题或使用联系数据准确描述人口层面的趋势。我们的研究结果表明,GRHANITE链接工具适用于准确链接个人的护理事件,并支持ACCESS执行患者医疗记录隐私保护链接的能力。

致谢

作者想要感谢ACCESS团队成员的贡献,他们不是这项研究的共同作者,包括:Lisa Bastian, WA Health;新南威尔士州计划生育部门的黛博拉·贝特森;多尔蒂研究所的斯科特·鲍登;阿德莱德大学的Mark Boyd;Allison Carter,悉尼新南威尔士大学(UNSW) Kirby研究所;澳大利亚全国艾滋病毒感染者协会的Aaron Cogle;新南威尔士州积极生活公司的简·科斯特洛;国家血清学参考实验室Wayne Dimech;伯内特研究所的詹妮弗·迪特默;澳大利亚艾滋病组织联合会Jeanne Ellard; Christopher Fairley, Melbourne Sexual Health Centre; Lucinda Franklin, Victorian Department of Health; Jane Hocking, University of Melbourne; Jules Kim, Scarlet Alliance; Scott McGill, Australasian Society for HIV Medicine; David Nolan, Royal Perth Hospital; Prital Patel, Kirby Institute, UNSW Sydney; Stella Pendle, Australian Clinical Laboratories; Victoria Polkinghorne, Burnet Institute; Thi Nguyen, Burnet Institute; Catherine O’Connor, Kirby Institute, UNSW; Philip Reed, Kirkton Road Centre; Norman Roth, Prahran Market Clinic; Nathan Ryder, NSW Sexual Health Service Directors; Christine Selvey, NSW Ministry of Health; Michael Traeger, Burnet Institute; Toby Vickers, Kirby Institute, UNSW Sydney; Melanie Walker, Australian Injecting and Illicit Drug Users League; Lucy Watchirs-Smith, Kirby Institute, UNSW Sydney; Michael West, Victorian Department of Health.

作者还感谢所有参与ACCESS, PrEPX或两者的诊所,以及他们的现场调查人员提供的数据来支持这些分析:David Baker,东悉尼医生;苏珊·博伊德,普拉兰市场诊所;维多利亚传染病参考实验室Mike Catton;丹尼尔·柯林斯《阿尔弗雷德》;文森特·科内利斯,墨尔本性健康中心;波琳·坎迪尔,立刻!;菲利普·坎宁安,SydPath,圣文森特病理学;西安·爱德华兹,普拉兰市场诊所;克里斯托弗·K·费尔利和墨尔本性健康中心;罗伯特Finlayson; Taylor Square; George Forgan-Smith, Era Health; John Gall, Era Health; Helan Lau, Prahran Market Clinic; Peter Locke, PRONTO! clinic; Anna McNulty, Sydney Sexual Health Centre; Richard Moore, Northside Clinic; Emma Paige, The Alfred; Matthew Penn, PRONTO! clinic; Claire Pickett, Ballarat Community Health Centre; William Rawlinson, South Eastern Area Laboratory Services, NSW Health Pathology; Norman Roth, Prahran Market Clinic; Hans-Gerhard Schneider, Alfred Health; BK Tee, The Centre Clinic; Amanda Wade, Geelong Hospital; Jeff Willcox, Northside Clinic.

这篇论文的工作是与抗逆转录病毒治疗及其对阳性和阴性男性的影响(TAIPAN)合作进行的,我们要感谢TAIPAN研究的成员,他们不是这篇论文的合著者,包括:安德鲁·卡尔,悉尼圣文森特医院;阿尔弗雷德健康公司的詹妮弗·霍伊;新南威尔士大学柯比研究所的凯西·佩图梅诺斯;朱利安·埃利奥特,阿尔弗雷德健康公司;大卫·坦普尔顿,柯比研究所;新南威尔士大学公共卫生与社区医学学院滕lilaw;伯内特研究所的大卫·威尔逊;安德鲁·格鲁里奇,新南威尔士大学柯比研究所;大卫·库珀,新南威尔士大学柯比研究所;莫纳什大学的Alisa Pedrana; James McMahon, Alfred Health; Garrett Prestage, Kirby Institute; Martin Holt, Centre for Social Research in Health, UNSW; Christopher K. Fairley, Melbourne Sexual Health Centre; Neil McKellar-Stewart, ACON Health Sydney; Simon Ruth, Thorne Harbour Health, Phillip Keen, Kirby Institute; Craig Cooper, Positive Life NSW; Brent Allan, Living Positive Victoria; John Kaldor, Kirby Institute, UNSW.

作者还想感谢PrEPX研究团队,包括首席研究员Edwina Wright, Alfred Health和研究协调员Brian Price;泸西拉尔;约翰·t·洛克伍德;安妮·麦;克里斯蒂娜张;朱迪思·阿米肖,阿尔弗雷德健康公司。

ACCESS是伯内特研究所、柯比研究所和国家参考实验室之间的合作伙伴关系。ACCESS由澳大利亚卫生部资助。ACCESS还获得了来自特定研究的资助,包括欧共体维多利亚,欧共体澳大利亚和PrEPX。伯内特研究所感谢维多利亚州运营基础设施支持计划的支持。

利益冲突

MH和MS已从Gilead Sciences、AbbVie和Bristol Myers Squibb获得了研究者发起的资金,用于与这项工作无关的研究。MH, RG, MS和BD由国家卫生和医学研究委员会提供奖学金。

  1. Callander D, Moreira C, El-Hayek C, Asselin J, van Gemert C, Watchirs Smith L,等。监测性传播感染和血液传播病毒的控制情况:澳大利亚协调加强哨点监测协作协议。JMIR Res Protoc 2018 11月20日;7(11):e11028 [免费全文] [CrossRef] [Medline]
  2. 范格默特C,盖伊R, Stoove M, Dimech W, El-Hayek C, Asselin J,等。澳大利亚性传播感染和血源性病毒协调加强哨点监测合作的病理实验室监测:队列研究方案JMIR Res Protoc 2019 8月8日;8(8):e13625 PMCID: PMC6786847。[CrossRef]
  3. 澳大利亚政府。卫生部,2018。2018-2022年第三次国家乙肝战略https://www.health.gov.au/internet/main/publishing.nsf/Content/ohp-bbvs-1//文件/玫瑰- b -第三nat -战略- 2018 - 22. - pdf[2019-10-21]访问
  4. 澳大利亚政府。卫生部,2018。2018-2022年第四次国家性传播感染战略https://www.health.gov.au/internet/main/publishing.nsf/Content/ohp-bbvs-1//文件/美元sti -四- nat -战略- 2018 - 22. - pdf[2019-10-21]访问
  5. 澳大利亚政府。卫生部,2018。第八项国家艾滋病毒战略(2018-2022)https://www.health.gov.au/internet/main/publishing.nsf/Content/ohp-bbvs-1// $文件/ hiv -八- nat -战略- 2018 - 22. - pdf[2019-10-21]访问
  6. 从澳大利亚初级保健记录中收集和解释显示格式病理测试结果的系统机制。电子健康通报2011;6(2):e18 [免费全文]
  7. lilaw S, Boyle D. GRHANITE安全数据链接和信息共享。在:谷物H,编辑。HIC 2008年会议:澳大利亚卫生信息学会议;中心的人,2008年8月31日- 9月2日,墨尔本会议中心。澳大利亚:澳大利亚卫生信息学会有限公司;2008:159 - 165。
  8. 兰德尔SM,费兰特AM,博伊德JH,鲍尔JK,塞门斯JB。对大型真实世界数据集的隐私保护记录链接。J Biomed Inform 2014 Aug;50:205-212 [免费全文] [CrossRef] [Medline]
  9. Boyle DIR, Rafael N. BioGrid Australia和GRHANITE:隐私保护主题匹配。种马健康技术信息2011;168:24-34。[Medline]
  10. 博伊尔DI,范思哲VL,邓巴JA, Scheil W, Janus E,燕麦JJ, MAGDA研究组。国家妊娠糖尿病登记的首次记录评估结果:糖尿病风险筛查、登记和随访中的挑战。PLoS One 2018;13(8):e0200832 [免费全文] [CrossRef] [Medline]
  11. 墨尔本大学HaBIC研究信息技术单元。使用GRHANITE客户端2017年3月V4.0生成的GRHANITE哈希。墨尔本:墨尔本大学HaBIC研究信息技术单元;2017.URL:http://www.grhanite.com/downloads/Using_GRHANITE_Hashes_generated_by_GRHANITE_Client_V4_0.pdf[2020-04-03]访问
  12. Zhu Y, Matsuyama Y, Ohashi Y, Setoguchi S.何时进行概率联动与确定性联动?模拟研究。J Biomed Inform 2015 Aug;56:80-86 [免费全文] [CrossRef] [Medline]
  13. 柯瑞安,麦A, Stoove M, Price B, Fairley CK, Ruth S,等。澳大利亚维多利亚州HIV暴露前预防(PrEP)人群水平干预研究方案:PrEPX研究。前线公共卫生2018;6:151 [免费全文] [CrossRef] [Medline]
  14. 紧急护理研究所。: ECRI研究所;2016.患者识别错误。卫生技术评估信息服务,特别报告网址:https://www.ecri.org/Resources/HIT/Patient%20ID/Patient_Identification_Evidence_Based_Literature_final.pdf[2019-10-21]访问
  15. ASHM检测门户。2011年11月国家HIV检测政策v1.2http://testingportal.ashm.org.au/resources/Australian_National_HIV_Testing_Policy_v1-2.pdf[2019-10-21]访问
  16. Harron K, Goldstein H, Wade A, mueller - pebody B, Parslow R, Gilbert R.国家电子医疗保健数据的关联、评估和分析:在儿科重症监护中提供强化血流感染监测的应用PLoS One 2013;8(12):e85278 [j]免费全文] [CrossRef] [Medline]


访问:澳大利亚协调加强哨点监视合作
BBV:血源性病毒
EMR:电子病历
新南威尔士州:新南威尔士
PPV:阳性预测值
STI:性传播感染
大班:抗逆转录病毒药物治疗及其对阳性和阴性男性的影响
新南威尔士大学:新南威尔士大学


G·艾森巴赫(G Eysenbach)编辑;提交21.10.19;D Bandara, K Bosh, N Sundar Rajan, K Goniewicz同行评审;对作者03.12.19的评论;订正版本收到25.01.20;接受21.02.20;发表24.06.20

版权

©Long Nguyen, Mark Stoové, Douglas Boyle, Denton Callander, Hamish McManus, Jason Asselin, Rebecca Guy, Basil Donovan, Margaret helard, Carol El-Hayek。最初发表于《医疗互联网研究杂志》(//www.mybigtv.com), 2020年6月24日。

这是一篇开放获取的文章,根据创作共用署名许可(https://creativecommons.org/licenses/by/4.0/)的条款发布,允许在任何媒介上无限制地使用、分发和复制,前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。


Baidu
map