发表在18卷第七名(2016): 7月

随机对照试验是(G)旧标准吗?从临床智能到规范分析

随机对照试验是(G)旧标准吗?从临床智能到规范分析

随机对照试验是(G)旧标准吗?从临床智能到规范分析

的观点

1比利时根克市Ziekenhuis Oost-Limburg麻醉科、重症监护、急诊医学、疼痛治疗科

2比利时根克市Ziekenhuis Oost-Limburg肺内科

3.RapidMiner,上海,中国

4贝尔格莱德大学组织科学学院,塞尔维亚贝尔格莱德

*所有作者贡献相同

通讯作者:

Sven Van Poucke博士

麻醉科、重症监护科、急诊医学科、疼痛治疗科

Ziekenhuis Oost-Limburg

6 . Schiepse Bos

Genk 3600

比利时

电话:32 +32475269857

传真:32 89327905

电子邮件:svanpoucke@gmail.com


尽管科学发现的步伐在加快,但目前的临床研究事业并不能充分解决迫切的临床问题。鉴于临床试验的限制,对于大多数临床问题,唯一可用于辅助决策的相关数据是基于观察和经验。我们的目的有三个方面。首先,我们描述了波普尔“证伪主义”科学认识论指导下的医学研究的经典背景。其次,我们讨论了随机对照试验的挑战和不足,并提出了基于大数据的观察性研究的潜力。第三,我们涵盖了在临床研究中使用观察性(回顾性)数据的几个障碍。我们得出的结论是,随机对照试验没有消亡的风险,但统计学、机器学习和大数据分析方面的创新可能会产生一个全新的探索和验证生态系统。

中国医学网络杂志2016;18(7):e185

doi: 10.2196 / jmir.5549

关键字



尽管科学发现的步伐不断加快,但目前的临床研究事业并没有完全解决日常临床问题,如“在这种情况下,在疾病的这个阶段,对特定患者来说,什么是最适当的行动方案?”“(1].从临床医生的角度来看,最丰富的决策信息是基于观察和经验。2].随着大量健康相关数据的积累,治疗效果量化的方法已经迅速发展,并受到统计学、机器学习和大数据分析方面最新创新的推动[3.].最近的技术允许使用(接近)实时临床决策支持工具,在没有发表证据的情况下,能够对未回答的临床问题进行量化和优先排序[4].

尽管现有数据丰富,将数据拟合到模型中以解释观察可能是合理的,似乎与临床经验一致,但自然规律或理论的推导是不合理的。从认识论的观点来看(卡尔·波普尔),科学应该努力描述简单而合乎逻辑的理论系统,这些理论系统在实现任何预测之前都是可测试的[5].经典的演绎科学从一个假设或理论开始,然后推导出可能的结论和陈述。随着精准医疗作为一种新兴的疾病治疗和预防方法的引入,出现了一个问题,简单而合乎逻辑的理论系统是否是对来自多种疾病患者群体的复杂、高维数据进行预测分析的唯一选择[6].

已经提出了各种方法来预测未来的结果或使用观测数据预测趋势[7].由于成本和时间消耗较低,观测数据研究可能看起来很有吸引力,但它通常被认为不如前瞻性研究。在大数据和物联网时代,“观测”数据是丰富的,可以被认为是历史足迹,对训练和测试模型有价值,可以使用新的数据输入对性能进行定量评估[8].

这篇观点论文的目的是强调统计学、机器学习和大数据分析方面的一些创新,并与目前临床试验中使用的金标准试验:随机对照试验(RCT)进行比较。因此,我们将分三个部分讨论这一问题:随机对照试验的挑战和不足,大数据观察性研究的潜力,以及临床研究中观察性(回顾性)数据的挑战和困难。


半个多世纪前,随机对照试验被引入医学[9].试验是在一个零假设下开始的,即没有决定性的证据表明正在试验的干预措施或药物优于现有的治疗方法。在前瞻性随机对照试验中,研究人员在参与者产生任何感兴趣的结果之前构思和设计试验、招募参与者并收集基线数据。从一个群体中选择个体来估计整个群体的特征。干预是在评估参与者的资格和招募后,但在研究干预之前随机分配的。如果设计得当,随机对照试验可以分离混杂因素,并允许研究人员确定输入和观察到的现象之间的因果关系。这使得随机对照试验成为循证医学(EBM)的金标准[10].弗雷明汉心脏研究是一个大型、富有成效的前瞻性队列研究的历史例子[11].

相比之下,人们普遍认为随机对照试验的证据往往基于狭窄的患者纳入标准,阻碍了对真实临床情况的推广[12].因此,随机对照试验不能确保将其结果转化为对一般人群的实际利益[13].此外,通常不清楚哪些假设是假设的一部分。通常,研究人员最终会从一组个体中得出集中倾向,这一衡量标准往往不能代表单个患者。

随机对照试验或次优化设计的随机对照试验的局限性有时被忽视或忽略[14].当随机对照试验缺乏方法学严谨性时,必须谨慎解释结果[1516].此外,随机对照试验的费用和持续时间可能令人望而却步,从而推迟了对新治疗方式的接受[17].随机对照试验的兴趣结果也应是共同的;否则,观察到的结果数量就会变得太少,不具有统计学意义(与可能偶然出现的病例难以区分)。

此外,出于伦理考虑,某些干预措施可能不适合进行随机对照试验。同样,当一种干预措施被广泛应用时,临床医生不愿意尝试其他替代方案。例如,心肺复苏时机对脑和心肌功能恢复的影响无法通过对照试验进行研究。然而,这类研究可以使用倾向评分分析和基于大数据的分层等技术来设计[1819].

随着人口老龄化,越来越多的患者有多种合并症,这些合并症通常被排除在随机对照试验之外。相比之下,来自电子医疗记录的大数据提供了来自真实世界的信息[19].基于这些数据的研究可能更适用于日常实践中遇到的患者。

即使是设计良好并成功实施的RCT,许多临床问题仍未得到解答,因为RCT的结果可能不适合每个患者。这个问题是个性化精准医疗的主要关注点[6].一个明显的例子是,在过去的几十年里,围手术期管理在安全性方面有所提高,导致围手术期主要并发症(<1%至3%)的发生率降低,如围手术期中风或死亡。尽管如此,即使是1%的发病率,每年也会影响到全球200万人。这些毁灭性的并发症在随机对照试验中很少被研究,因为其低发生率需要纳入大量患者[20.].大数据分析可能会促进对这些罕见终点的研究,从而为改善临床实践提供潜在的机会[21].

在过去的20年里,循证医学试图解决随机对照试验的局限性。循证医学通常被定义为“认真、明确和明智地使用目前最好的证据,在对个别病人的护理作出决定”[22].循证医学的目的是为临床工作提供更强大的科学基础,从而实现医疗保健的一致性、效率、有效性、质量和安全。循证医学的理论理想,即每个临床问题都将基于多个rct的荟萃分析和系统回顾,面临着多种局限性。EBM的早期例子可以在英国胸科学会1990年的哮喘指南中找到,该指南是通过共识制定的,基于随机试验和观察性研究的结合[23].

二十年的热情并不能阻止一些人认为EBM运动处于危机之中,原因有很多[2:(1)以证据为基础的“质量标志”已被既得利益者滥用,(2)证据量,特别是临床指南,已变得难以管理,(3)在临床实践中统计上显著的效益可能是边际的,(4)不灵活的规则和技术驱动的提示可能会产生这样的护理管理驱动而不是病人为中心(5)循证指南往往不能很好地反映复杂的多重疾病。

值得注意的是,在任何“证据强度”排名中都没有提到分析学的最新进展[24].这与2015年诺贝尔经济学奖得主安格斯·迪顿(Angus Deaton)的呼吁极为相似,他呼吁人们在随机试验所能提供的东西上更加谦虚,强烈反对一刀切的心态。25].


慢性疾病的负担在全球范围内迅速增加,引发了从延迟干预到预测、预防和个性化医疗的范式转变[2627].大数据范式和数据挖掘的成功故事使人们更广泛地认识到医疗保健的潜在影响和利益(包括人力和经济)。2012年,全球数字医疗数据量估计在500pb左右,预计到2020年将达到25000 pb,其中约80%是非结构化数据[28].

数据的爆炸式增长为改善医疗保健提供了大量机会,通过设计不同任务的数据驱动模型:(1)公共卫生:入院率、流行病、医院能力等的预测;(2)死亡率、再入院率、治疗效果等的早期风险预测;(3)慢性疾病控制:药物剂量优化、治疗依从性等;(4)诊断:医学成像中的决策支持系统等。

在临床环境下进行预测建模,收集数据,制定统计模型,做出预测,并在获得额外数据时验证(或修订)模型,这可能成为根据每个患者的个人特征定制医疗的关键(精准医疗计划[6])。

最近一份关于学习型卫生保健系统潜力的报告表明,随机对照试验并没有死,但如果我们要弥合现代医学的证据差距,就需要其他方法[29].观察性研究可以以较低的成本快速提供有用的结果,并且不会通过实验暴露使患者处于危险之中。电子健康记录的发展和严格的结果测量提供了加速使用观察性研究的潜力。这可能需要教育和研究的范式转变。

回顾性数据通过描述性统计分析进行历史评估,得出临床智力(图1).预测分析与临床情报和商业情报风格的情报在模型的使用上有所不同,模型捕捉并表示数据中的隐藏模式和交互。

临床决策,曾经完全由经验(来自定性回顾性分析的智慧)和回顾性临床智力(来自定量回顾性分析的智慧),现在可以通过预测和规定分析的知识进行升级,预测个体患者水平的未来事件(图1).

大数据被定义为大容量、高速度、高多样性和高精度的信息资产,需要新的处理形式来增强决策、洞察发现和流程优化[30.].尖端的大数据技术允许异构医疗数据的集成和可扩展分析。此外,最近的计算和数学进步已经能够有效地使用机器学习和数据挖掘方法,以揭示不同参数和临床结果之间的隐藏关系[13].这种进化被认为是预测、预防和个性化医学发展的主要因素之一。大数据可能会提高rct相对较低的筛选入组患者比例,优化常规临床实践研究结果的泛化(外部有效性)。

临床医学中的数据可用性可以被看作是广泛的(来自大量人群)和深度的(每个患者的大量数据)。广泛的数据可以分析公共卫生保健的各种趋势(例如,每种疾病或每家医院的入院人数),并可用于医院的质量指标(例如,再入院率)、新引进的药物或健康运动。换句话说,广泛的二手数据为卫生保健的关键操作提供了必要的原材料。政府卫生部门的计划和优先事项以及基于历史疾病特征的临床决策都依赖于二手数据。例如,几乎每一个严重败血症研究的基础科学资助申请都将拟议的工作与来自行政记录的全国范围流行病学结合起来[2731].有关重症监护病房医疗保健过度使用的政策关切,如临终关怀费用过高和重症监护病房使用的无法解释的地理差异,取决于二级数据分析[3233].我们对种族或民族和基于保险的差异的理解,以及重症监护的价值,大多来自次级数据分析[34].

与广泛数据的探索直接相关的是,促进了收集、整合和公开这些数据以供分析的倡议。这类最大的开放数据库之一是国家住院患者数据库,这是美国医疗保健研究机构和优质医疗保健成本与利用项目[35].州住院患者数据库(2001-2010年)包括来自美国46个州的约3.3亿名出院住院患者。这些数据在个人层面上跟踪所有医院的入院情况,并基于数据跟踪诊断和程序数据国际疾病分类,第九版,临床修订编码。此外,每次入院的人口统计和管理数据(如性别、年龄、入院月份、住院时间和以美元计价的总费用)也会被跟踪。开放这些数据引发了医疗保健预测分析方面的许多研究工作,这些研究发表在美国国家卫生服务研究和医疗保健技术信息中心的网站上。

然而,广泛的数据并不是在患者层面进行临床相关研究(例如,死亡风险、程序有效性评估)的最佳信息来源,因为这些数据在大多数情况下是为了行政和报销目的而产生的,不足以详细描述特定患者的复杂医疗状态和结果。

另一方面,深度数据在多个尺度上(如基因组学、蛋白质组学、药物、实验室测试、共病、症状)提供了每个患者的更高水平的时间细节。如果分析得当,这些数据有可能提供有价值的临床见解,并可能从根本上改变实践,改善患者的结果[6].一个很好的例子是对肺动脉导管使用的重新评估,这曾经是几乎每个医疗重症监护病房患者治疗的普遍特征,但通过对一项临床试验的巧妙重新分析,对这种使用进行了重新研究[36].

开放深度数据进行分析的重要性已得到广泛认可。最受欢迎和最详细的数据来源之一是重症监护多参数智能监测(MIMIC)临床数据库,其中包含2001年至2012年在贝斯以色列女侍医疗中心(波士顿,马萨诸塞州,美国)收治的58,976名重症监护病房入院(内科、外科、冠状动脉护理和新生儿)的数据,超过48,000名不同的患者[37].MIMIC-III数据库包含高度详细和异构的数据(实验室检测、生命体征、症状、医学成像、注释、波形等)。MIMIC-III数据库中的数据可供其他研究人员使用,不存在隐私问题,促进了研究的可重复性。这个数据库的开放带来了许多有希望的研究成果[3839].

图1。从临床情报到规范分析。BI商业智能;ICU:重症监护室。
查看此图

观察性研究着眼于过去某个时间点的医疗事件,并检查暴露于可疑风险或治疗与研究开始时确定的结果之间的关系。快速简便地开发具有良好性能的预测模型面临着几个挑战,特别是对于复杂的临床问题。

这导致潜在数据使用量与实际数据使用量之间存在很大差距[2731].回顾性数据库提出了一系列方法上的挑战,其中一些是该数据源所特有的[40].

相关性并不意味着因果关系

预测分析在现实生活临床实践中完全适用的主要障碍之一(以及对观察性研究的不信任)是演化模式(模型)的可信度。尽管建模能够量化大型数据源的相关性,但在大多数情况下相关性并不意味着因果关系(即使确定了显著的相关性)。在这方面有两个主要的谬误:Cum hoc ergo propter hoc,拉丁语的意思是“用这个,因此因为这个”,以及事后的,因而是理所当然的,拉丁语的意思是“在此之后,因此因为此。”基于已识别的相关性得出误导性结论的主要原因是不正确的样本或特征选择,这导致忽视了实际的混杂因素。也就是说,通常对大数据样本进行回顾性研究,但这些样本并没有描述所有潜在的混杂因素[4142].另一方面,人口分层导致同质和描述良好的群体(例如,相同的年龄组、性别、病史、目前的健康状况和生命体征),也会导致数据量不足,因为医学现象的复杂性和大量的潜在混杂因素。因此,当仔细选择一个群体时,在大多数情况下,缺乏数据会成为一个问题,阻碍了准确和稳定的预测模型的发展。在这些情况下,在确定真正的因果关系时出现了一个额外的问题:“维度的诅咒”或休斯现象[43].维数的诅咒表明,在固定数量的训练样本中,预测能力随着维数的增加而降低,这意味着在高维空间中识别的模式可能是偶然发生的。因此,需要大量的数据来确保给定的样本能很好地描述总体。

总之,理论上可以选择足够的样本和特征空间,很好地描述所观察到的医学现象,并最终导致因果关系和见解。然而,在回顾性数据中找到这样的样本是非常具有挑战性的,在报告和解释回顾性研究的预测结果时,必须充分解决这个问题。

数据科学与领域专业知识的融合

即使回顾性研究的定义很好(与样本和特征相关),如果医学界对模型和结果有信心,成功的预测分析和尖端机器学习算法的应用通常需要不同语言(例如Python或R)的大量编程技能。这将建模从领域专家迁移到数据科学家,往往缺乏必要的领域专业知识,反之亦然。此外,数据分析是高度创造性的过程,没有进行此类研究的详细建议。数据挖掘的跨行业标准流程描述了进行这项研究的高级步骤,该流程将分析项目的生命周期分解为六个阶段:业务理解、数据理解、数据准备、建模、评估和部署[44].然而,每个问题的规范阻碍了在操作层面上开发标准化的分析过程。这最终导致高度准确的预测模型的缓慢开发、采用和开发,特别是在医疗实践中,错误会产生重大后果(包括人力和财务)[45].显然,领域专家和数据科学家之间密切和持续的合作将解决这个问题,但这并不总是可行的。在最近的研究中,许多人试图克服这个问题。其中一个方向是通过医学本体论(如疾病本体论[46], snomed [47],以及治疗口面部疼痛[48]),以及与数据驱动模型的整合[4950].这种方法旨在实现数据-知识融合,并减少对数据科学领域专家额外专业化的需求,反之亦然。另一种方法是开发可视化分析工具,以实现更快的学习曲线和强大的分析,可以由领域专家进行[4551].

数据异质性和质量

特别是,可能提供有意义的临床结论或新假设的深层医学数据是高度异构的:实验室检测、病史、共病(多重诊断)、药物处方、蛋白质相互作用网络、基因组序列、医学成像、注释、波形等等。除了不同的数据格式外,数据还具有时间戳、时间、上下文依赖性,并在不同的粒度级别上定义。这就提出了一个具有挑战性的问题,即如何从所有可用数据源中提取信息和有意义的模式,即使使用了尖端的大数据技术,可以有效地存储和操作这些数据,并使用预测方法,可以对相互依赖的数据进行时间建模[52].人们提出了各种方法来解决这些问题,例如集成在同构数据源上分别构建的模型的结果,以及在公共数据表示上的问题(数据)空间和学习模型之间的映射[53].然而,这些策略的每一步都会丢失信息并传播不确定性,因此大数据和异构数据的潜力只能得到部分利用。此外,在确定的患者群体的背景下解释这些发现是至关重要的(泛化性)。如果使用多个数据源构建数据库,则必须强调数据源与各个护理站点之间是否适当地进行了必要的链接,同时考虑到跨数据源和时间戳(数据链接)在编码和报告方面的差异。随着大数据集的增长,回顾性数据面临着新的兴趣,因为出现了与数据质量和来源有效性相关的问题。由于记录数据的质量或完整性经常未知,“垃圾输入,垃圾输出”(或GIGO)通常用于描述由于错误,不完整[38]或不精确的数据。

验证和再现性

尽管许多研究报告了生物医学数据预测建模的前沿性能,但当应用于初始实验设置之外时,进化模型往往表现出不稳定或无法令人信服的性能。

其中一些原因是实验中使用的验证措施具有误导性;具体的算法实现和数据并不总是可用的;实验环境没有得到充分的描述,因此,科学论文中报告的结果不能在其他环境中再现。

选择适当的验证措施高度依赖于建立模型的数据的性质。由于这些数据集中的大多数在正类和负类的大小之间存在不平衡,分类精度是一个毫无意义的性能测量。为此,我们使用了其他的评价标准,如受试者工作特征曲线下的面积和精度召回曲线下的面积。所有这些都是基于真阳性、假阳性、真阴性和假阴性数量的基本概念[5455].

此外,为了在未来(在看不见的情况下)现实地估计模型的性能,实验设置将需要完善,并防止过拟合(模型在训练数据上表现良好,但在看不见的情况下测试时表现出较差的泛化性能)。如前所述,找到最适合手头数据的预测模型通常是基于试验和错误,并假设有多个参数设置的多个模型进行比较。试验次数和模型的复杂性与模型过拟合的概率呈正相关。

这就是为什么参数优化和多模型测试也应该使用数据的替代分区(验证数据集)进行监控。验证模型的常用技术是交叉验证或自举验证[56].交叉验证通常用于选择最优的复杂性水平(最大的预测能力而不过度拟合)。

其他方法侧重于估计实验和观察性研究中因果效应的异质性,并对人群亚组间治疗效果差异的大小进行假设检验。这些方法通常适用于相对于观察到的单位数量而言,一个单位具有多个属性,且治疗效果与单位属性之间关系的功能形式未知的情况[19].

最后,利用剩余的数据分区估计模型的错误率[57].因此,当应用于新数据集时,测试数据代表了对模型正确性的现实评估。此外,在选择用于验证和最终模型性能评估的数据时,特别注意是非常重要的(因为模型只能在数据的一个子集上进行良好的适应和泛化,因此未来预期的所有类型的数据都必须出现在模型的最终评估中)。

当建模正确时,准确的预测模型有能力随着时间的推移进行调整和改进。这种进化产生的人工智能可能有潜力衡量和优化治疗效果和依从性[58].

可解释性

在构建一个系统或现象的有用表示的过程中,可解释性(可理解性或理解能力)经常被回忆起来。这在医学领域尤其重要,因为即使有最好的诊断评估和高度准确的预测模型,也必须在医学专家的参与下谨慎地作出决定。如果模型是可解释的,医学专家可以将预测模型提供的信息放在特定的环境中(减少潜在的混杂因素影响的危险),并更好地了解预测模型识别的现象的原因。这将最终导致做出明智的决定,并向规定性分析迈出一步。然而,在模型复杂性和模型可解释性之间有一个明确的权衡。此外,可解释性取决于旁观者:很难在预测模型之间进行一些客观的比较。模型可解释性还与特征的数量以及特征所提供的信息有关。作为可解释性度量,特性的数量是显而易见的。维度越高,人类分析特征和模式的相对影响就越复杂,这些特征和模式在决策中可能很重要。因此,使用减少的特征集可能会导致更多可解释的模型(例如,通过向后特征消除或向前特征构建)。 The basic principle of all predictive methods for decreasing the number of features is to extract factors from features, by mapping (transforming) the feature space to a low-dimensional space, while keeping as much of the original variance of the features as possible.

另一方面,无论维度如何,特征所提供的上下文信息都是重要的。如果一个模型基于有限数量的特征,但人类解释器认为该模型是一个黑盒,那么该模型是不可解释的。可解释性需要更多地思考预测模型的结果如何有助于解释潜在现象[59].正因为如此,最先进的预测算法,通常提供高度准确的模型(例如,神经网络或支持向量机),通常被认为对现实生活中的医疗应用没有用处。这对基于逻辑回归、朴素贝叶斯或决策树等更简单、更可解释的算法构建高度准确的预测模型提出了额外的挑战。不幸的是,可解释性和准确性通常是同时存在的,这增加了预测建模过程中特征选择和构造的重要性。

天下没有免费的午餐

许多预测算法已经被开发出来,但没有证据表明任何算法在每种情况下都优于所有其他算法。“没有免费的午餐”理论为这一说法提供了有力的支持。60,研究人员证明,没有哪种预测算法在每个数据集上都优于其他算法,但人们总能找到最适合某个数据集的算法。特别是在医疗保健预测分析中,“没有免费的午餐”理论的结果提出了一个非常具有挑战性的问题,即找到最适合手头数据的算法。这与医学现象的复杂性、上下文依赖性、数据异质性、高维性、类别不平衡等直接相关。对于其中许多具体问题,已经开发出各种有效的预测方法。例如,lasso逻辑回归可以有效地降低初始数据集的维数[61],同时保留甚至提高了对未见数据的预测性能。支持向量机[62]有效地避免过拟合,并允许通过内核工程合并领域知识。神经网络和深度学习方法能够拟合高维数据,并对数据中的时空关系建模[63].此外,集成方法[64]用于提高单个算法的性能。通过利用生成的模型之间的多样性,它们在处理小样本量、高维数和复杂数据结构方面显示出许多优势。这些模型可以由建立在不同数据子样本上的同一个模型聚合,也可以由建立在同一样本上的不同模型聚合,也可以由前两种技术的组合聚合。这个类中一些流行的算法是bagging [65],随机森林[66], boosting [67]和自举聚合。

然而,所有提到的模型都有自己的缺点,并没有理论保证模型在特定应用中的成功。为特定数据集寻找最佳模型的问题受到数据预处理(特征选择、特征构建等)的影响。变量(特征)选择的目标有三个方面:提高预测器的预测性能,提供更快、更具成本效益的预测器,以及更好地理解生成数据的底层过程[68].这需要特征构建、特征排序、多元特征选择、高效搜索方法和特征有效性评估方法。

隐私问题

另一个经常被认为是在医疗保健中成功应用预测分析的障碍的问题是缺乏数据。数据缺乏的原因有几个:罕见疾病、数据收集过程漫长而昂贵、个人敏感信息的保密性。隐私问题往往限制了机构之间共享数据的潜力,从而建立更准确和可靠的模型。

然而,有许多技术可以帮助克服这一问题,并实现数据共享,而不必担心在未经患者许可的情况下识别患者。隐私保护的过程始于传统的匿名化技术,它将个人和医院的身份映射成加密形式。此外,住院时间和持续时间通常以相对形式显示(从首次入院算起的天数),而删除了确切日期。即使这些技术可以大大降低识别患者的风险,最先进的预测技术理论上仍然可以基于程序、诊断和其他无法加密的数据来识别人,如果它们是协作构建和评估预测模型的基础的话。因此,大数据的隐私受到特别关注。这些问题通常通过安全多方计算来成功解决[6970],其中各站点合作建立全球预测模型,而不共享数据本身,并通过随机化,通过添加一些受控噪声来额外掩盖数据[7172].


随机对照试验作为一种科学实验方法的价值不容置疑。我们相信,基于现有的最佳替代技术,从非随机研究中估计治疗效果,远比忽视现有数据的潜在丰富性更为合理[13].非随机数据至少可以提供潜在因果关系的指标,最终触发随机实验的启动。

一个不断变化的分析方法生态系统已经开放,并可用于探索和验证。观察性研究可以补充随机对照试验,产生假设,为未来的随机对照试验确定问题,并确定临床条件[73].在大数据分析中,基于有偏见的数据或受到外部和内部有效性威胁的可疑分析得出结论,应不断监测,以确保研究衡量的是它所设定的目标,并且结果可以从研究推广到读者的患者。

因此,数据科学界有巨大的责任来消除在医疗保健中使用预测建模的恐惧,方法是在人类是首选决策者的环境中解释预测建模的概念。最后,数据科学家需要熟悉数据可视化作为信息共享的渠道。数据驱动研究将人工智能和机器学习纳入统计,并支持在海量数据集中识别模式。结果的验证和解释是数据可视化的重要步骤。

利益冲突

没有宣布。

  1. 范波克,M,哈季奇,2015,医疗保健大数据:为谁敲响丧钟?重症监护2015;19:171 [免费全文] [CrossRef] [Medline
  2. 格林哈尔T,豪维克J,马斯克里N.循证医学:危机中的运动?BMJ 2014 Jun 13;348(Jun 13):g3725-g3725 [免费全文] [CrossRef] [Medline
  3. Raghupathi W, Raghupathi V.医疗保健中的大数据分析:前景和潜力。健康科学与科学系统2014;2:3 [免费全文] [CrossRef] [Medline
  4. Longhurst C, Harrington R, Shah N. A“绿色按钮”用于在护理点使用汇总患者数据。卫生Aff 2014 july 8;33(7):1229-1235 [免费全文] [CrossRef
  5. 温克勒·r·波普尔和组学。植物科学进展2016 Feb 19;7(195):1-3 [免费全文] [CrossRef
  6. 麦卡锡·m·奥巴马(McCarthy M. Obama)承诺捍卫健康法,推广“精准医疗”。英国医学杂志2015年1月21日;350:h385 [免费全文] [Medline
  7. Dinov ID。建模和解释大医疗保健数据的方法挑战和分析机会。Gigascience 2016;5:12 [免费全文] [CrossRef] [Medline
  8. Janke A, Overbeek D, Kocher K, Levy P.探索预测分析和大数据在急诊护理中的潜力。Ann急诊医学2015 Feb;67(2):227-236 [免费全文] [CrossRef] [Medline
  9. [没有列出作者]。链霉素治疗肺结核。Br Med J 1948 Oct 30;2(4582):769-782 [免费全文] [Medline
  10. Schulz K, Altman D, Moher D. CONSORT 2010声明:报告平行组随机试验的更新指南。安实习医学2010年6月1日;152(11):726-732。[CrossRef] [Medline
  11. 马文德,李维,王涛。弗雷明汉心脏研究与心血管疾病流行病学:历史视角。柳叶刀2014 Mar 15;383(9921):999-1008 [免费全文] [CrossRef] [Medline
  12. Britton A, McKee M, Black N, McPherson K, Sanderson C, Bain C.随机试验适用性的威胁:排除和选择性参与。卫生服务资源政策1999年4月;4(2):112-121。[CrossRef] [Medline
  13. Booth C, Tannock I.随机对照试验和基于人群的观察性研究:医学证据演变的合作伙伴。中华癌症杂志2014年2月4日;11 (3):551-555 [免费全文] [CrossRef] [Medline
  14. 野鼠LR,韭菜JT。科学错误发现率的估计和顶级医学文献的应用。生物统计2014 Jan;15(1):1-12 [免费全文] [CrossRef] [Medline
  15. 罗伯茨L,艾哈迈德I,霍尔S,戴维森A.为减轻疾病的代祷。Cochrane Database Syst Rev 2009 Apr 15(2):CD000368 [免费全文] [CrossRef] [Medline
  16. 史密斯GCS,佩尔JP。降落伞用于预防重力挑战相关的死亡和重大创伤:随机对照试验的系统回顾。英国医学杂志2003 Dec 20;327(7429):1459-1461 [免费全文] [CrossRef] [Medline
  17. Eapen Z, Vavalle J, Granger C, Harrington R, Peterson E, Califf R.拯救美国及其他地区的临床试验:行动呼吁。Am Heart杂志2013年6月;165(6):837-847。[CrossRef] [Medline
  18. 倾向评分估计的不确定性:变量选择和模型平均因果效应的贝叶斯方法。美国统计杂志2014年1月1日;109(05):95-107 [免费全文] [CrossRef] [Medline
  19. 张震。大数据与临床研究:专注于中国大陆危重病医学领域。定量成像医学外科2014年8月27日;4(5):426-429 [免费全文
  20. 马舒尔G, Shanks A, Kheterpal S.非心脏,非神经手术后围手术期卒中与相关死亡率。麻醉学2011年6月;114(6):1289-1296。[CrossRef] [Medline
  21. 李志强,李志强,李志强,等。使用管理索赔数据库的“大数据”建模预测脊柱手术并发症的发生。中华骨关节外科杂志2016年5月18日;98(10):824-834。[CrossRef] [Medline
  22. 萨克特DL,罗森博格WMC,格雷JAM,海恩斯RB,理查德森WS。循证医学:它是什么,它不是什么。英国医学杂志1996 Jan 13;312(7023):71-72 [免费全文] [Medline
  23. 英国胸科学会,伦敦皇家内科医学院研究单位,国王基金中心,国家哮喘运动。成人哮喘管理指南:I:慢性持续性哮喘。BMJ 1990;301(6753):651-653 [免费全文] [Medline
  24. 郑国强,王志强,王志强,王志强。将循证医学引入整形和重建外科。Plast Reconstr Surg 2009 Apr;123(4):1385-1389 [免费全文
  25. 《大逃亡:健康、财富和不平等的起源》。普林斯顿,新泽西州:普林斯顿大学出版社;2013年12月5日:717-721。
  26. Hood L, Friend S.预测性,个性化,预防性,参与性(P4)癌症医学。2011年3月8日(3):184-187。[CrossRef] [Medline
  27. Golubnitschaja O, Kinkorova J, Costigliola V.预测、预防和个性化医疗作为“地平线2020”的核心:EPMA立场文件。中国机械工程学报2014;26 (1):1 [免费全文] [CrossRef] [Medline
  28. 王志强,王志强,王志强,等。医疗保健成败?自然2011年2月17日;470(7334):327-329。[CrossRef] [Medline
  29. 福利T,费尔迈克尔F.改进基础数据焦点小组。:学习型医疗保健系统;2015.URL:http://www.learninghealthcareproject.org/section/evidence/12/69/improving-the-underlying-data-focus-group[访问2016-06-29][WebCite缓存
  30. De Mauro A, Greco M, Grimaldi M.基于大数据本质特征的正式定义。图书馆更新2016年4月04日;65(3):122-135。[CrossRef
  31. 赫瑞pcsak G, Duke J, Shah N, Reich C, Huser V, Schuemie MS,等。观察健康数据科学和信息学(OHDSI):观察研究人员的机会。种马健康技术信息2015;216:574-578 [免费全文] [Medline
  32. Angus D, Linde-Zwirble W, Lidicker J, Clermont G, Carcillo J, Pinsky MR.美国严重脓毒症的流行病学:发病率、结局和相关护理费用的分析。重症监护医学2001七月;29(7):1303-1310。[Medline
  33. Seymour C, Iwashyna T, Ehlenbach W, Wunsch H, Cooke CR.医院级重症监护使用差异。卫生服务决议2012年10月;47(5):2060-2080 [免费全文] [CrossRef] [Medline
  34. Erickson S, Vasilevskis E, Kuzniewicz M, Cason BA, Lane RK, Dean ML,等。种族和民族对重症监护室患者预后的影响:一项涉及社会经济地位和复苏偏好的综合研究。重症监护医疗2011 Mar;39(3):429-435 [免费全文] [CrossRef] [Medline
  35. 王晓峰,王晓峰,王晓峰。预测美国住院病人的住院费用:一项回顾性分析。BMC Health Serv Res 2015 9月;15:372 [免费全文] [CrossRef] [Medline
  36. Sandham JD, Hull RD, Brant RF, Knox L, Pineo GF, Doig CJ,加拿大重症监护临床试验组。高危外科病人使用肺动脉导管的随机对照试验。中华实用医学杂志2003年1月2日;32(1):1 -14。[CrossRef] [Medline
  37. Scott DJ, Lee J, Silva I, Park S, Moody GB, Celi LA,等。访问公共MIMIC-II重症监护关系数据库,用于临床研究。BMC Med Inform Decis Mak 2013;13:9 [免费全文] [CrossRef] [Medline
  38. 贾思敏,陈涛,陈志杰,陈志强。基于数据驱动的肝素给药优化方法研究。重症监护医学2014年9月40日(9):1332-1339 [免费全文] [CrossRef] [Medline
  39. 李孟杰,马绍德,李文杰,等。一种基于生理时间序列动态的病人监测和结果预测方法。IEEE生物医学杂志2015年5月;19(3):1068-1076 [免费全文] [CrossRef] [Medline
  40. mother B, Brooks J, Clark M, Crown W, Davey P, Hutchins D,等。回顾性数据库研究清单。ISPOR工作组关于回顾性数据库的报告健康状况2003;6:90-97 [免费全文
  41. 抽样误差与标准误差的比较。英国医学杂志2015;351:h3577 [免费全文] [CrossRef
  42. 异质性和因果关系。Am Stat 2005年5月;59(2):147-152。[CrossRef
  43. 关于统计模式识别器的平均精度。IEEE信息理论,1968年1月;14(1):55-63。[CrossRef
  44. CRISP-DM模型:数据挖掘的新蓝图。J数据仓库2000;5(4):22 [免费全文
  45. Van Poucke S, Zhang Z, Schmitz M, Vukicevic M, Laenen MV, Celi LA,等。使用可视化开放数据分析平台对危重患者进行可扩展的预测分析。PLoS One 2016年1月5日;11(1):e0145791 [免费全文] [CrossRef] [Medline
  46. 王志强,王志强,王志强,等。疾病本体论2015更新:一个扩展和更新的人类疾病数据库,用于将生物医学知识与疾病数据联系起来。Nucleic Acids Res 2015 Jan;43(数据库issue):D1071-D1078 [免费全文] [CrossRef] [Medline
  47. 李德华,刘永飞,全慧。一种SNOMED CT临床数据集的编码方法。BMC Med Inform Decis Mak 2010;10:53 [免费全文] [CrossRef] [Medline
  48. Ceusters W, Michelotti A, Raphael KG, Durham J, Ohrbach R.口腔面部疼痛分类的下一步展望-第1部分:本体论的作用。口腔康复杂志2015年12月;42(12):926-941。[CrossRef] [Medline
  49. 张gq, Sahoo SS, Lhatoo SD。从分类到癫痫本体论和信息学。癫痫症2012年7月;53增刊2:28-32 [免费全文] [CrossRef] [Medline
  50. 马兰迪,李志强,陈志强,等。本体在ENCODE DCC中的应用与使用。数据库(牛津)2015;2015:1-11 [免费全文] [CrossRef] [Medline
  51. 奥尔德姆P,霍尔S,伯顿G.合成生物学:绘制科学景观。PLoS One 2012;7(4):e34368 [免费全文] [CrossRef] [Medline
  52. Wolstencroft K, Owen S, Krebs O, Nguyen Q, Stanford N, Golebiewski M,等。SEEK:一个系统生物学数据和模型管理平台。BMC系统生物学2015;9:a [免费全文] [CrossRef
  53. Schütz C, Neumayr B, Schrefl M.异构信息的集成和重用:公共仓库元模型中的异构同构数据仓库建模。2012年美洲信息系统会议,AMCIS 2012。卷5。2012年发表于:第18届美洲信息系统会议;2012年1月;西雅图第18页网址:http://www.scopus.com/inward/record.url?eid=2-s2.0-84877877956&partnerID=40&md5=72a28a4e162af460481c9a4e845f98c0
  54. Ozenne B, Subtil F, Maucort-Boulch D.在罕见病中,精确-召回曲线克服了受体工作特征曲线的乐观性。中国临床流行病学杂志2015 Aug;68(8):855-859。[CrossRef] [Medline
  55. 刘志强,张志强,张志强,等。生物序列分类的自动特征构建与选择。PLoS One 2014;9(7):e99982 [免费全文] [CrossRef
  56. Borra S, Di Ciaccio a .测量预测误差:交叉验证,bootstrap和协方差惩罚方法的比较。计算统计数据分析2010年12月;54(12):2976-2989。[CrossRef
  57. 杨晓明,张晓明。基于数据挖掘的数据挖掘方法。应用统计2011:374。
  58. Lo-Ciganic W, Donohue JM, Thorpe JM, Perera S, Thorpe CT, Marcum ZA,等。使用机器学习检查药物依从性阈值和住院风险。医学护理2015年8月;53(8):720-728。[CrossRef] [Medline
  59. Féraud R, Clérot F.一种解释神经网络分类的方法。神经网络2002 Mar;15(2):237-246。[Medline
  60. 学习算法之间缺乏先验区别。神经计算1996 Oct;8(7):1341-1390。[CrossRef
  61. 张勇,毕斯瓦。一种改进的logistic贝叶斯LASSO检测罕见单倍型-环境相互作用及其在肺癌中的应用。癌症通报2015;14(增刊2):11-16 [免费全文] [CrossRef] [Medline
  62. 孔艳,曲东,陈霞,龚艳,闫安。自组织映射(SOM)和支持向量机(SVM)模型预测人表皮生长因子受体(EGFR/ ErbB-1)抑制剂。梳状化学高通量筛选2016;19(5):400-411。[Medline
  63. 郑勇,张志强,张志强,等。边缘空间深度学习:体积图像解析的高效架构。IEEE跨医学影像2016年3月7日;35(5):1217-1228。[CrossRef] [Medline
  64. 杨鹏,杨华,周波,朱玛雅。生物信息学集成方法研究进展。CBIO 2010 Dec 01;5(4):296-308 [免费全文] [CrossRef
  65. 吴敏,廖林,罗霞,叶霞,姚勇,陈鹏,等。使用步态信号动力学参数和集成学习算法分析和分类与儿童发展相关的步幅模式。Biomed Res Int 2016;2016:9246280 [免费全文] [CrossRef] [Medline
  66. 傅刚,丁勇,Seal A,陈波,孙勇,Bolton E.基于元路径语义网络分析的药物靶间相互作用预测。BMC生物信息学2016年4月;17:160 [免费全文] [CrossRef] [Medline
  67. 金晓东,李志强,胡晓东。高维生物数据的稀疏分类器集成。中国生物医学工程学报,2015;12(2):167-183。[Medline
  68. Guyon I, Elisseeff A.变量和特征选择的介绍。J机器学习,2003年3月3日;
  69. 李文杰,李志强,李志强。一种有效的保护隐私的关联规则挖掘算法。入职:Theeramunkong T,编辑。知识发现和数据挖掘的进展:第13届亚太会议,曼谷,泰国,2009年4月27-30日,会议论文集(人工智能讲义)。柏林:施普林格;2009:515 - 524。
  70. 王芳,王志强,王志强。基于logistic回归模型的儿科再入院分类。见:AMIA年度研讨会论文集。2014年发表于:美国医学信息学协会;2014年11月15日至19日;华盛顿,1072页。
  71. 张志伟,张志伟。一种基于分布式隐私保护的决策支持系统。ACM Trans Manage Inf Syst 2013 10月01日;4(3):1-15。[CrossRef
  72. Radovanovic S, stigric G, Delibasic B, Van Poucke S, Obradovic Z. A数据和知识驱动随机化技术在医院再入院预测中的隐私保护数据丰富。2016年5月发表于:SIAM数据挖掘国际会议(SDM);2016年5月;迈阿密,佛罗里达。
  73. 宋金伟,郑kc .观察性研究:队列和病例对照研究。Plast Reconstr Surg 2010 12月;126(6):2234-2242 [免费全文] [CrossRef] [Medline


循证医学:循证医学
模拟:重症监护中的多参数智能监测
个随机对照试验:随机对照试验


G·艾森巴赫(G Eysenbach)编辑;提交21.01.16;L Celi, I Brooks, J Luo同行评议;对作者06.04.16的评论;修订版本收到01.06.16;接受21.06.16;发表06.07.16

版权

©Sven Van Poucke, Michiel Thomeer, John Heath, Milan Vukicevic。最初发表于《医疗互联网研究杂志》(//www.mybigtv.com), 2016年7月6日。

这是一篇开放获取的文章,根据创作共用署名许可(http://creativecommons.org/licenses/by/2.0/)的条款发布,允许在任何媒介上无限制地使用、分发和复制,前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。


Baidu
map