JMIR J医疗互联网服务 医学互联网研究杂志 1438 - 8871 冈瑟Eysenbach 卡塔尔世界杯8强波胆分析JMIR出版公司,多伦多,加拿大 v14i5e132 23022989 10.2196 / jmir.2169 审查 使用非劣效性检验评价远程医疗和电子医疗服务:系统评价 Eysenbach 冈瑟 莱斯利 陈志明 Garg 阿米特 Kummervold 每手中, 博士学位 1
北方研究所 Postboks 6434 Forskningsparken 从法国ø9294 挪威 47 41435795 47 77629401 peregil@norut.no
2
约翰森 Jan-Are K 博士学位 2 3. Skrøvseth 斯坦康 博士学位 4 永利 罗尔夫 医学博士 2 3.
1 北方研究所 从法国ø 挪威 2 特罗姆瑟大学健康科学学院临床医学系 从法国ø 挪威 3. 北挪威大学医院成瘾和专门精神科服务部 从法国ø 挪威 4 北挪威大学医院,挪威综合护理和远程医疗中心 从法国ø 挪威 Sep-Oct 2012 28 09 2012 14 5 e132 10 05 2012 31 05 2012 15 07 2012 04 09 2012 ©Per Egil Kummervold, Jan-Are K Johnsen, Stein Olav Skrøvseth, Rolf Wynn。最初发表于《医疗互联网研究杂志》(//www.mybigtv.com), 2012年9月28日。 2012

这是一篇开放获取的文章,根据创作共用署名许可(http://creativecommons.org/licenses/by/2.0/)的条款发布,允许在任何媒介上无限制地使用、分发和复制,前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。

背景

在远程医疗和电子保健领域内,越来越多的研究被设计为非劣性研究,旨在表明远程医疗/电子保健解决方案并不亚于传统治疗病人的方式。

客观的

目的是回顾和总结非劣效性研究在该领域的现状,描述这种方法的优势和缺陷。

方法

根据定义的标准搜索PubMed,从2008年6月至2011年6月期间确定了16篇相关文章。

结果

大多数研究与精神病学和急诊医学领域有关,大多数发表在与这些领域有关的期刊或一般科学或一般医学期刊上。所有的研究都声称是非劣效性研究,但16项研究中有7项测试了统计差异作为非劣效性的代理。

结论

这些研究的方法质量各不相同。我们讨论了远程医疗和电子健康领域内未来非劣效性研究的最佳程序,以及这种方法最合适的情况。

non-inferiority e-health 远程医疗
简介

在远程医疗和电子保健领域,往往需要证明一种新的解决方案/应用在治疗质量或疗效方面与传统或既定的治疗方法相同。证明新解决方案在治疗质量或疗效方面的优越性并不总是必要的,因为远程医疗/电子保健解决方案/应用程序可能具有其他类型的优势,包括节省旅行时间或节省成本。因此,在许多情况下,测试新解决方案不比传统解决方案差似乎就足够了。从这一推理思路可以预料到,在远程医疗和电子保健领域内发表的研究越来越多,这些研究采用了非劣性设计,即旨在表明新的远程医疗解决方案的质量并不比现有治疗病人的方法低。

在本研究中,我们对已发表的文献进行了系统回顾,发现16项研究[ 1- 16"电子卫生是医学信息学、公共卫生和商业交叉领域的一个新兴领域,指通过互联网和相关技术提供或增强的卫生服务和信息" [ 17并声称使用非自卑测试。我们评估了该领域的现状以及已发表研究的优缺点。

审查旨在遵循PRISMA声明中概述的标准[ 18],但并非所有观点都是相关的,因为这不是一个元分析。

为什么失败的优越感测试不等同于非优越感测试?

要理解一个无关紧要的结果究竟意味着什么,一个很好的起点是考虑天文学家卡尔·萨根的名言:“缺乏证据并不是缺乏证据”[ 19].

考虑一个实验,我们评估一种基于视频的远程医疗服务t。我们决定测试这种服务是否优于传统的临床治疗c。为了简单起见,我们只关注一个方面,即患者的血糖水平。

我们做单面 t测试平均血糖水平以检查T是否优于C,但我们最终得到了a P值大于0.05。换句话说,我们得到了一个不重要的结果。不幸的是,从统计学的角度来看,这只不过是一次失败的优越感测试。这并不是优越感不存在的证据。我们唯一确定的是,我们的测试无法证明任何优越性。

理解这一点最简单的方法是,通过减少参与者的数量,我们更有可能得到一个无关紧要的结果。很明显,参与者数量的减少并没有使群体更加平等。这只会导致研究的质量较低,也就很难发现新的服务是否更好。

在试验中包括更多的人将增加发现优势的机会(如果存在的话)。然而,每当我们最终得到一个无关紧要的结果时,我们仍然面临着萨根的观察,即证据的缺失并不是证据的缺失。

如果最终目标是证明服务T不比服务C差,那么达到这个目的的唯一方法是首先定义“劣”的含义。请注意,“自卑”是一个经验定义。当在医学试验中比较两组时,我们永远不会得到完全相同的结果,我们定义的边际值应该基于临床对有意义的边际值的考虑,而不是基于我们衡量它们的能力。

因此,在非劣效性试验中,我们首先定义低于C的边界(M)被视为非劣效性。如何设置这个边距在“方法”中讨论。然后我们继续测试T是否真的优于这个边缘。

方法 统计方面的考虑

在确保新仿制药获得批准的过程中,等效性测试已成为一项必不可少的统计工具[ 20.].等效性测试可以表明仿制药与它将要取代的药物没有什么不同,而不必直接将新药与安慰剂进行比较。从技术上讲,非劣效性测试只不过是单方面的等效性测试,需要更少的参与者才能获得相同的能力。

正如引言中所描述的,优越性测试失败不足以得出非劣效性的原因有很多,其中一个原因是样本太小 (即缺乏动力),或者这项研究无法发现现实世界的差异 (即缺乏检测敏感性).

为了证明 非劣性,我们需要定义测试组比控制组差时的裕度。我们称之为 非保证金让M表示这个值。如果我们让T代表新测试服务的功效,C代表对照的功效,非劣效性可以表示为:C−T < m。这是非劣效性试验的备用假设。对应的零假设是H0:C−t≥m [ 21].根据CONSORT陈述,执行非劣性检验的推荐方法是构造一个两面的90%置信区间(因为α原则上可能不同于5%,CI的精确定义是1-2α),如果区间的上限小于M,则拒绝原假设,即认为非劣性已被证明[ 22].

边际(M)的设置必须在试验开始时完成,在临床试验中,边际(M)应与专家发现的临床相关性相关。韦勒克( 20.]强调在每个项目中都必须仔细考虑M的设置,但提到日常经验表明,大多数人会认为C和T之间的10%(严格)和20%(自由)的差异是相同的量级。这也类似于FDA建议的建立生物等效性的阈值[ 23].

然而,不仅C和T之间的差异与设置m相关。裕度的设置还必须以一种方式进行,即保留一定量的主动对照对非治疗/安慰剂(C- p)的实际效果。在生物医学中,人们讨论了M相对于C-P的小到什么程度,并提到了介于50-80%之间的值[ 21 24].将M设得太小可能会导致证明试验(T)不劣于对照(C),但同时在临床上并不优于不治疗(P)。

在一个普通的试验中,一个显著的结果确实自动证明了发现差异的能力——通常称为试验的能力 检测灵敏度.非劣效性试验没有内在的分析敏感性。即使我们得到了证明C−T < M的显著结果,也不能证明这两种处理有效果。事实上,在我们的工具没有检测到任何东西的情况下,我们最终也会得到C−T < m。在不可能包括安慰剂的情况下,必须根据历史数据建立分析敏感性。

综上所述,以下因素在非劣效性试验中至关重要:

1.寻找m.m的临床相关定义应独立于方差和样本量等因素。虽然有人建议M可以在C的10-20%之间,但这需要为每个项目单独设置,并且必须在试验前完成。临床上认为M应该更低并不是错误。

2.确保M保留了主动控制与不处理之间的主要作用。M值应至少为C-P的50%。

3.通过加入安慰剂或利用历史数据来确保检测灵敏度。

是否有可能找到M的正式测定,以及是否有可能使用历史数据来证明分析敏感性,这两个问题仍然在统计学家中热烈讨论[ 25].

搜索策略和选择

纳入标准为应用公认的远程医疗或电子医疗定义的英文文章[ 17并将非劣效性测试作为他们方法的一部分。搜索词意在反映这些标准。在PubMed上搜索,发现了36篇符合搜索标准的文章 表1

为了在文章标题或摘要中没有明确定义为远程医疗或电子保健的交叉领域中纳入特定的技术渠道(如视频会议、互联网)。检索结束后,对文章进行手动扫描,排除不符合纳入标准的文章。18篇文章被排除在外,因为它们显然与远程医疗或电子保健无关(在大多数情况下,这是由于带有“视频”或“互联网”字样的摘要造成的)。另外一篇文章被排除在外,因为主要文章只有日文,另一篇文章被排除在外,因为它只提到了其他非劣效性试验的摘要。剩下16篇文章供进一步分析( 表2).该策略概述于 图1

在收录的文章中,2008年3篇,2009年3篇,2010年5篇,2011年5篇(截至2011年6月)。在2008年之前没有符合纳入标准的文章发表。

策略流程图。

查询条件说明。

搜索条件
(不劣或不劣或不劣或(“不劣”)或(“不劣”))和(远程医疗[标题/摘要]或视频会议[标题/摘要]或视频[标题/摘要]或视频会议[标题/摘要]或在线[标题/摘要]或互联网[标题/摘要]或电子健康[标题/摘要]或电子健康[标题/摘要])
评审过程

在对这些文章的回顾中,两位审稿人(作者1和作者2)确定了非劣性边界是如何设置的以及设置非劣性边界的原因。他们还注意到是否进行了实际的非劣效性测试,或者是否进行了差异测试。最后,他们记录了如何保证检测灵敏度。

结果

纳入的文章中有6篇涉及精神治疗(创伤后应激障碍、广泛性焦虑障碍、抑郁症),4篇涉及特别与急诊医学相关的医疗程序(血管通路、除颤、高级生命支持),1篇涉及泌尿学领域,1篇涉及术后康复,1篇涉及内分泌学,1篇涉及血液学,2篇涉及医学传播学。就论文发表地点而言,只有一篇发表在远程医学杂志上,五篇发表在急诊医学杂志上,两篇发表在精神病学杂志上,一篇发表在骨科外科杂志上,一篇发表在内分泌学杂志上,六篇发表在一般科学或一般医学杂志上。

非劣性边际的设置

在这16篇被回顾的文章中,使用了各种定义劣缘的方法( 表2).在两篇文章中[ 2 6]时,劣势边际设置为与主效应偏差10%。在四篇文章中[ 5 8 9 14],与验证问卷的绝对值有关。在其中一篇文章中[ 5),科恩的 d= 0.5用于设置某些措施的劣效限。科恩的 d在另一篇文章中也使用了[ 3.],但这里的裕度设置为0.2。

在一篇文章中[ 1],边界定义为0.15SD。另一篇文章[ 10]将非劣效性边际定义为两组比例之间的10个百分点的差异。

两项研究提到了参照组得分置信区间的下限。其中之一[ 16]采用90%置信区间;另一个[ 4]使用95%置信区间。在一篇文章中[ 11],劣缘设置为RR = 0.95。

在其余四项研究中[ 7 12 13 15),作者并没有试图设定一个自卑的界限。

给出设置特定裕度的原因

五篇文章[ 2 5 8 9 14]提及专家咨询或临床相关性为设定边际的主要来源,而其中两个[ 2 9]还指出,该值与先前研究中设定的值相似。

在一篇文章中[ 6],有人认为10%是医学试验的典型值。一篇文章[ 1]指出,非劣效性边界的设置是根据Cohen的[ 26小、中、大效应量的常规标准。

一篇文章[ 3.]只是说明差额的定义是有关的,而四项条款[ 4 10 11 16)并没有提供理由。

在其余文章中[ 7 12 13 15,作者没有设定一个具体的边际。

自卑感测试

另一个问题是,是否确实进行了非劣效性测试,即是否测试了目标效应大于非劣效性边际。这可以通过检查均数差的整个置信区间是否高于非劣性边缘或通过计算a来实现 P价值。

其中九篇文章[ 1 3. 5 6 8- 11 14]涉及非劣等性与非劣等性边界的测试。除[ 3.发现了一个重要的结果。

其中七篇文章[ 2 4 7 12 13 15 16而是测试差异。当这没有提供显著的结果时,他们声称非劣效性。

确保检测灵敏度

其中四项研究[ 2 13- 15]进行了前后设计,并能够检测到开始和结束分数之间的显著差异。这意味着这些研究具有检测敏感性。在一些研究中[ 1 5 6- 9 16],使用了几个之前验证过的问卷之一-远程医疗期间的患者沟通评估(PACT) [ 1]、利博维茨社交焦虑量表[ 5]、快速了解爱滋病病毒预测资讯[ 6]、临床医师PSTS量表[ 7]、状态特质愤怒表达量表-2 (STAXI-2) [ 8]、临床医师PSTS量表[ 9]、Novaco愤怒量表总分(NAS-T) [ 9],以及AHA PALS核心案例测试清单[ 16].由于这些问卷之前显示了显著的结果,可能有人认为这确保了检测的敏感性。有人认为[ 4]属于同一类别,因为在其他研究中,在评估抗凝剂时通常使用在治疗范围内的天数。

在[ 3.],作者纳入了非劣效性测试,但没有得到显著的结果。差异试验将显示治疗组的结果明显更差,因此,尽管间接地,该研究确实具有分析敏感性。在[ 10- 12],我们无法识别验证检测敏感性的尝试。

文章包括在审查。

参考 保证金 推理 测试
Agha等人,2009 [ 1 0.15 SD 科恩指导
陈金等人,2008 [ 2 均值的10% 临床+既往研究 区别
德弗里斯等人,2010 [ 3. 科恩的 d= 0.2 定义
Harper & Pollock, 2011 [ 4 不清楚:a) 5%以内,b)下限95% CI 没有给出原因 区别
Hedman等人,2011 [ 5 绝对值+科恩值 d= 0.5 临床+既往研究
Merchant等人,2009 [ 6 均值的10% 典型的医学试验
Morland等人,2011 [ 7 没有设置 不相关的 区别
莫兰等人,2010 [ 8 绝对值 临床
Morland等人,2009 [ 9 绝对值 临床+既往研究
Mpotos等人,2011 [ 10 10个百分点的比例差异 没有给出原因
芒格等人,2008 [ 11 RR = 0.95 没有给出原因
Péres-Ferre等,2010 [ 12 没有设置 没有给出原因 区别
罗宾逊等人,2010 [ 13 没有设置 不相关的 区别
罗素等人,2011 [ 14 绝对值 临床
Titov等,2010 [ 15 没有设置 不相关的 区别
Weeks & Molsberry, 2008年[ 16 下界90% CI 没有给出原因 区别
讨论

正如结果所示,非劣效性试验的执行方式存在相当大的差异。列入的16篇文章应该包括大多数声称是远程医疗和电子健康领域内的非劣效性试验的研究,但一些未被PubMed索引的研究可能被遗漏了。虽然这种学习方法似乎越来越受欢迎,但它仍处于起步阶段。目前大多数非劣效性试验的应用都是在生物医学领域,正如我们所展示的,只有少数例子用于远程医疗和电子健康领域。虽然生物医学中的非劣效性试验可以作为一种启发,但各领域之间的差异使得很难复制生物医学试验中使用的方法。下面,我们将讨论非劣效性试验的一些核心要素,以及它们如何应用于远程医疗和电子健康的研究。

设置裕量

为了证明某物是相等的或不劣的,我们需要定义什么是相等或非劣的。这主要是一个临床问题,主要应该由该领域的专家进行评估。参考了一些非常粗略的指导方针,在文献中,10-20%的值似乎被认为是相当相等的。临床相关性不能仅由这个值来决定。在某些情况下,10%的差异会产生巨大的影响,而在其他情况下,这个值与临床无关。在我们的综述中,只有5篇文章提到了临床相关性的概念。

还有其他准则指出,应设置边际,以便保留对照(C)和非治疗(P)之间的大部分效果。在不包括非治疗组的试验中,研究人员必须根据以前的试验估计C-P的效果。这不是许多远程医疗/电子健康试验所拥有的奢侈品。

证明非

当进行传统的假设检验时,a P高于显著性水平的值不能提供零假设为真的证据。它只是意味着证据不够强,不足以以足够的信心拒绝零假设。事实上,有可能一项研究的结果是 P高于显著性水平的值将对未来的元分析做出积极贡献,以证明存在差异。我们的审查最令人惊讶的结果是,几乎一半(16篇文章中有7篇)的文章似乎忽视了这一事实。他们实际上进行了差异测试,他们关于非劣效性的主要论点是差异测试给出了一个不显著的结果。

检测灵敏度

在生物医学领域普及非劣效性和平等测试的主要驱动力之一是,它可以在不包括非治疗群体的情况下进行循证医学。在某些情况下,引入安慰剂可能在伦理上是不可接受的。在其他情况下,这主要是节省费用的问题。公平地说,越来越多地使用非劣效性测试和平等测试与所谓的解释性或实用性试验的增长有关,在这些试验中,主要问题不是治疗是否有效,而是治疗是否值得在临床环境中使用。 27 28].

理想情况下,检测敏感性应由先前的试验或多个先前试验的荟萃分析来证明。很难在远程医疗/电子保健领域复制这种方式的研究,我们的综述中检查的研究都没有这样做。然而,16项研究中有7项确实使用了之前验证过的问卷,在许多情况下,这种替代方法实际上可能已经足够了。

还有四项研究包括安慰剂/无治疗。对于简单地证明检测灵敏度,这是绝对足够的。然而,这有点违背了平等和非劣效性测试的最初目的,即能够在没有安慰剂/无治疗组的情况下进行。

该综述还确定了三项研究,这些研究的文章中没有明确的迹象表明已建立了检测敏感性。然而,作者可能在没有报告的情况下进行了这些程序。

建议

正如分析所显示的那样,在实践中使用非劣效性测试的基本原理可能令人生畏,特别是对于这种类型的分析的新手。我们建议作者密切关注非劣效性测试的扩展CONSORT指南,以确保它们适用于所讨论的研究[ 22].我们相信莫兰等人的一篇文章[ 8]提供了一个很好的例子,说明了如何执行和报告一篇非劣势文章。莫兰等[ 9]也提供了关于非劣效性试验设计的更详细的方法学讨论。

与任何统计分析选择一样,进行非劣效性研究需要严格遵守协议,以避免钓鱼式地获取积极结果,这将极大地影响II型错误的概率。特别是,在研究开始前必须设定非劣效性边际。在调查数据后设置边际意味着调查者基本上可以得到任何想要的结果。同样,如果研究人员进行了标准的优势试验,但发现结果不显著,则该研究绝不应转化为非劣势研究。确定非劣效性的意图必须从一开始就很明确。

当检测敏感性的证据很少时,例如基于很少的研究进行分析,非劣效性检测可能不是最佳选择。检测敏感性对于进行适当的非劣效性研究至关重要,因为如果没有它,研究最终可能证明干预并不比什么都不做差(即没有伤害)。在这种情况下,应该考虑是否另一种类型的设计更合适,例如经济评估。

结论

非劣效性测试显然在远程医疗和电子医疗中占有一席之地。然而,证明某物(如差值)不存在总是比证明它存在要艰巨得多。正如我们在回顾中所讨论的,非劣效性试验并不是解决这一根本挑战的神奇捷径。

虽然这篇综述中包括的几个试验质量很高,但这篇综述也揭示了对进行非劣效性试验的陷阱明显缺乏认识。我们建议更严格地遵守非劣效性测试的基本原则。我们讨论了一些应该特别注意的问题,包括不要将失败的差异试验误认为非劣效性证明的重要性,以及设置临床相关的非劣效性边界的重要性。

这项研究是由PEK构思和设计的。所有作者都分析了数据并撰写了论文。

没有宣布。

这项工作不需要伦理声明。本研究未获得直接资助。在本文写作期间,作者个人都是由他们所在的机构支付薪水的(尽管没有为这篇论文的写作留出或给出具体的薪水)。

大官 Z Schapira RM 赞美 PW 麦克纳特 G 乐得胃 戴斯。莱纳姆: 远程医疗中患者对医患沟通的满意度 Telemed J E Health 2009 11 15 9 830 9 10.1089 / tmj.2009.0030 19919189 Chenkin J 年代 黄齐的 T 班迪耶拉 G 程序可以在网上学习:超声引导血管通路训练的随机研究 新兴医学学院 2008 10 15 10 949 54 10.1111 / j.1553-2712.2008.00231.x 18778380 ACEM231 德弗里斯 W 特纳 纳米 先生 公斤 Bierens JJ 科斯特 RW 教练引导的自动体外除颤训练与三种基于dvd的替代训练方法的比较 复苏 2010 08 81 8 1004 9 10.1016 / j.resuscitation.2010.04.006 20483519 s0300 - 9572 (10) 00232 - 7 哈珀 P 波洛克 D 通过国内国际标准化比值检测和互联网提供决策支持,改善患者抗凝血控制 实习医生 2011 04 41 4 332 7 10.1111 / j.1445-5994.2010.02282.x 20546057 IMJ2282 海德曼 E 安德森 G Ljotsson B 安德森 E 变皱 C Mortberg E Lindefors N 基于互联网的认知行为疗法vs.认知行为群体疗法治疗社交焦虑障碍:一项随机对照非自卑试验 《公共科学图书馆•综合》 2011 6 3. e18001 10.1371 / journal.pone.0018001 21483704 PMC3070741 商人 钢筋混凝土 克拉克 迈耶 KH Seage三世 GR DeGruttola VG 贝克尔 BM 视频是快速人体免疫缺陷检测中传递检测前信息的有效方法 新兴医学学院 2009 02 16 2 124 35 10.1111 / j.1553-2712.2008.00326.x 19120050 ACEM326 PMC2633421 海因斯 正义与发展党 麦金托什 Resick 巴勒斯坦权力机构 甜菜 公里 通过远程医疗为退伍军人提供群体认知加工治疗:一个试点队列 J创伤应激 2011 08 24 4 465 9 10.1002 / jts.20661 21793047 格林 CJ 罗森 CS Foy D 赖利 P 海岸 J Frueh 公元前 远程医疗对患有创伤后应激障碍的农村退伍军人的愤怒管理治疗:一项随机非自卑试验 临床精神病学 2010 07 71 7 855 63 10.4088 / JCP.09m05604blu 20122374 格林 CJ 罗森 C 墨登 PD Frueh 公元前 农村作战老兵创伤后应激障碍远程心理治疗随机非劣效性临床试验设计中的问题 蔑视临床试验 2009 11 30. 6 513 22 10.1016 / j.cct.2009.06.006 19576299 s1551 - 7144 (09) 00111 - 6 Mpotos N Lemoyne 年代 Calle 巴勒斯坦权力机构 Deschepper E 瓦尔克 先生 公斤 在自我学习站中结合视频指导和语音反馈以获得基本生命支持技能:一项随机非自卑试验 复苏 2011 07 82 7 896 901 10.1016 / j.resuscitation.2011.02.024 21444145 s0300 - 9572 (11) 00135 - 3 芒格 斯托达德 GJ 温纳 基于“增大化现实”技术 巴赫曼 JW Jurige JH l 贝克 戴斯。莱纳姆: 通过电子医学与传统医学处方PDE-5抑制剂的安全性 Mayo clinic Proc 2008 08 83 8 890 6 10.4065 / 83.8.890 18674473 s0025 - 6196 (11) 60765 - 9 Perez-Ferre N Galindo 费尔南德斯 医学博士 Velasco V Runkle 德拉克鲁兹 乔丹 马丁Rojas-Marcos P Del Valle l Calle-Pascual 艾尔 妊娠期糖尿病远程护理后的结果并不低于传统的门诊就诊 内分泌 2010 2010 386941 10.1155 / 2010/386941 20628517 PMC2902054 罗宾逊 E 季托夫 N 安德鲁斯 G 麦金太尔 K Schwencke G Solley K 网络治疗广泛性焦虑症:一项比较临床医生和技术人员协助的随机对照试验 《公共科学图书馆•综合》 2010 5 6 e10942 10.1371 / journal.pone.0010942 20532167 PMC2880592 罗素 TG Buttrum P R Jull 遗传算法 全膝关节置换术后基于互联网的门诊远程康复:一项随机对照试验 美国骨关节外科杂志 2011 01 19 93 2 113 20. 10.2106 / JBJS.I.01375 21248209 93/2/113 季托夫 N 安德鲁斯 G 戴维斯 麦金太尔 K 罗宾逊 E Solley K 互联网治疗抑郁症:一项比较临床医生和技术人员协助的随机对照试验 《公共科学图书馆•综合》 2010 5 6 e10939 10.1371 / journal.pone.0010939 20544030 PMC2882336 戴斯。莱纳姆: Molsberry DM 与面对面教学相比,通过视频会议进行儿科高级生命支持再培训:一项有计划的非劣效性试验 复苏 2008 10 79 1 109 17 10.1016 / j.resuscitation.2008.05.008 18617310 s0300 - 9572 (08) 00501 - 7 Eysenbach G 什么是电子医疗? J医疗互联网服务 2001 3. 2 E20 10.2196 / jmir.3.2.e20 11720962 PMC1761894 莫赫 D Liberati 一个 Tetzlaff J 奥特曼 DG 棱镜组 系统评价和元分析的首选报告项目:PRISMA声明 科学硕士 2009 07 21 6 7 e1000097 10.1371 / journal.pmed.1000097 19621072 PMC2707599 萨根 C 魔鬼出没的世界:科学是黑暗中的蜡烛 1996 纽约 兰登书屋 韦勒克年代 检验等效性和非劣性的统计假设。第二版 国际统计评论 2012 80 188 10.1111 / j.1751-5823.2012.00179_12.x RBSr 马萨罗 JM 沙利文 LM 非劣等性试验:设计概念和问题-统计学中学术顾问的遭遇 地中海统计 2003 01 30. 22 2 169 86 10.1002 / sim.1425 12520555 比亚乔 G Elbourne 博士 奥特曼 DG 可以排除 SJ 埃文斯 SJ 配偶集团 非劣效性和等效性随机试验的报告:CONSORT声明的扩展 《美国医学会杂志》 2006 03 8 295 10 1152 60 10.1001 / jama.295.10.1152 16522836 295/10/1152 食品和药物管理局 行业指引 2001 2012-09-21 马里兰州罗克维尔市 药物评价与研究中心 建立生物等效性的统计方法 http://www.fda.gov/downloads/Drugs/.../Guidances/ucm070244.pdf 6 aquslp02 琼斯 B 贾维斯 P 刘易斯 晶澳 Ebbutt 房颤 评估等效性的试验:严格方法的重要性 BMJ 1996 07 6 313 7048 36 9 8664772 PMC2351444 詹姆斯挂 SJ Tsong YL型 劳伦斯 J 奥尼尔 RT 主动对照试验中非劣效性检验的一些基本问题 地中海统计 2003 01 30. 22 2 213 25 10.1002 / sim.1315 12520558 科恩 J 行为科学的统计权力分析 1988 山谷,新泽西州 L. Erlbaum事务所 公里 汤普森 博士 实用试验:这是一种有用的护理研究方法吗? 临床护士 2008 06 17 11 1401 2 10.1111 / j.1365-2702.2008.02297.x 18482137 JCN2297 制品 JH 哈默尔 MB 实用的试验-指导更好的病人护理 N英语J医学 2011 05 5 364 18 1685 7 10.1056 / NEJMp1103502 21542739
Baidu
map