卡塔尔世界杯8强波胆分析|卡塔尔世界杯4强波胆分析

JMIR

J Med Internet Res

医学互联网研究杂志

14388871

卡塔尔世界杯8强波胆分析JMIR出版公司

加拿大多伦多

v15i7e150

23880072

10.2196 / jmir.2770

审查

慢性疾病患者家庭远程监控干预的系统回顾和荟萃分析:对其方法学质量的关键评估

Eysenbach

冈瑟

Armfield

奈杰尔

Malliarou

玛丽亚（女名）

Kitsiou

Spyros

博士学位 1

HEC蒙特利尔

3000年，chemin de la Côte圣凯瑟琳

蒙特利尔，QC, h3t2a7

加拿大 1514 340 6000 ext 2653 1 514 340 6132 spyros.kitsiou@hec.ca

http://orcid.org/0000-0002-5281-321X

削减

的家伙

博士学位 1 Jaana

如

博士学位 2 3.

¹ 加拿大卫生保健信息技术研究主席 HEC蒙特利尔

蒙特利尔,质量控制

加拿大 ² 特尔弗管理学院渥太华大学

渥太华,

加拿大 ^3. 商学院黎巴嫩美国大学

贝鲁特

黎巴嫩

通讯作者:Spyros Kitsiou spyros.kitsiou@hec.ca

07 2013

23 07 2013

15 7

e150

13 06 2013 05 07 2013 10 07 2013 10 07 2013

©Spyros Kitsiou, Guy par， Mirou Jaana。原载于医学互联网研究杂志(//www.mybigtv.com)， 2013年7月23日。

2013

这是一篇在知识共享署名许可(http://creativecommons.org/licenses/by/2.0/)下发布的开放获取文章，该许可允许在任何媒介上不受限制地使用、分发和复制，前提是原始作品首次发表在《医学互联网研究杂志》上，并适当引用。必须包括完整的书目信息，到//www.mybigtv.com/上原始出版物的链接，以及版权和许可信息。

背景

在过去十年中，对慢性病患者家庭远程监测干预的系统评价和荟萃分析有所增加，对临床医生、政策制定者和其他卫生保健利益相关者越来越重要。虽然最近出现了对其方法严谨性和综合方法的一些批评，但尚未对其质量进行正式评估。

客观的

这篇重要综述的主要目的是评估先前研究慢性病背景下家庭远程监测干预效果的综述的方法、质量和报告特点。

方法

以电子方式检索Cochrane图书馆的Ovid MEDLINE、效果评价摘要数据库(DARE)和卫生技术评估数据库(HTA)，以查找1966年1月至2012年12月间发表的相关系统评价。潜在的评价由三名评论者独立筛选和评估。从每个纳入的综述中提取与所用方法有关的数据，并由两名审稿人检查其准确性。一个经过验证的质量评估工具R-AMSTAR被用作指导评估过程的框架。

结果

24篇评论，其中9篇是荟萃分析，从200多次引用中确定。文献检索显示，近年来在这一领域发表的综述数量大幅增加，尽管大多数综述集中于研究家庭远程监护对充血性心力衰竭患者的影响，但研究者的兴趣也扩展到其他慢性疾病，如糖尿病、高血压、慢性阻塞性肺病和哮喘。然而，由于内在的方法问题，这些评论中有很多似乎缺乏最佳的科学严谨性。此外，评论的总体质量似乎并没有随着时间的推移而提高。虽然所有或几乎所有评价都满意地满足了若干标准，例如建立包含和排除标准的先验设计，在多个数据库中使用电子搜索，以及报告研究特征，但还有其他重要领域需要改进。重复数据提取、人工搜索高度相关的期刊、纳入灰色和非英语文献、评估纳入研究的方法学质量和证据质量是很少执行的关键方法学程序。此外，在综合研究结果时发现的某些方法上的局限性影响了一些综述的结果和结论。

结论

尽管现有的方法指南可用于指导系统评价和荟萃分析的正确实施，并消除潜在的偏见风险，但这些知识尚未完全整合到家庭远程监测领域。应进一步努力改进该领域系统评价和荟萃分析的设计、实施、报告和出版。

元分析作为主题以系统评价为主题家庭远程控制远程医疗遥测质量评估偏倚风险慢性疾病心脏衰竭糖尿病高血压肺病

介绍

糖尿病、心血管疾病和呼吸系统疾病等慢性病的流行继续对几乎所有卫生保健系统构成重大和长期的挑战，要求在病人护理的管理和提供方面进行根本变革[ 1- 3.]。家庭远程监测(HT)代表了一种很有前途的方法，使临床医生能够在远离医院的情况下更频繁、更长时间地跟踪慢性病患者[ 4- 6]。HT是远程医疗的一种特殊形式，包括使用远程访问信息和通信技术(例如，遥测设备、智能传感器、手持或可穿戴技术)及时将症状、生理和疾病相关数据从患者家中传输到支持临床决策的远程监测中心[ 4， 5， 7]。HT的潜在目标是为医生和护士提供准确和及时的必要信息，以便在预定的随访或急诊期间更早地远程检测任何异常健康参数和与疾病相关的并发症。这样就可以在病情恶化和并发症发生之前及时进行干预，从而使住院和使用更多资源成为必要。

多年来，在欧洲、加拿大、澳大利亚、美国和世界其他地区的国家电子卫生战略的背景下，已经进行了许多努力和研究举措，以检验HT作为一种潜在的节省成本的方法对慢性病患者的有效性(例如，[ 8， 9])。美国退伍军人健康管理局广泛的家庭远程医疗服务[ 10]和英国的全系统示范(WSD)计划[ 11]是一些例子。然而，更广泛的推广和使用高温应用的好处尚未完全实现[ 12]。卫生当局是否有信心和接受支持和报销治疗慢性病的高温疗法服务，在很大程度上取决于实地获得可靠和有力的科学证据[ 13]。

系统评价(SRs)和荟萃分析(MAs)是强大的研究工具，已经建立在健康科学领域，最近在医学信息学领域，作为循证实践的基石[ 14， 15]。他们严格遵循一套严格的科学指导方针，并使用严格的可重复的方法来识别、选择、评估和综合临床研究结果，以最大限度地减少在解决特定研究问题时出现偏倚的可能性[ 16]。SRs和ma在卫生保健领域变得越来越重要，它们对政策制定者、临床医生和研究人员的价值得到了广泛认可[ 17]。如果实施得当，它们可以为决策者提供相关信息，并作为发展循证实践和临床指南的基础。

然而，SRs和ma的质量和内部效度取决于与审查行为有关的许多方面以及选择纳入的实证研究的质量。文献检索、选择、评估和证据合成方法的缺陷和不足可能导致无效的结论，对患者护理和决策者有重大影响。因此，研究人员提出并采用了评估工具，以便在几个临床领域(例如，[ 17- 21])。

在过去十年中，关注慢性疾病患者HT干预的综述有所增加。虽然最近出现了一些对其方法严谨性和方法的批评(例如，[ 6， 11， 22， 23])，目前还没有对它们的科学质量进行正式评估。本文试图通过评估慢性疾病背景下HT干预的SRs和MAs的方法、质量和报告特征来填补这一空白，以确定可能影响其内部有效性的偏倚风险。在研究和呈现先前综述中发现的方法缺陷时，我们并不打算举例说明作者的无能。事实上，许多被收录的评论的作者都是公认的权威专家，而且大多数被收录的论文都为在一个相对较新的学科中建立证据提供了基础。然而，我们确实相信，在这一特定领域的科学进步不会通过积累毫无争议的发现来实现，而是通过持续的建设性批评、激烈的辩论和创造意识的过程来实现。 24]。为此，我们的目标是建设性地告知其他学者，并通过为未来的HT评论提供重点和方向以进一步改进来加强知识发展。

方法纳入和排除标准概述

所有的纳入和排除标准都是先验定义的。根据研究选择标准(研究类型、患者、干预措施和结果)对检索中确定的引文进行资格评估。

研究类型

只有在同行评议期刊或Cochrane图书馆发表的考虑HT影响的既往SRs和ma才有资格纳入。在筛选过程中，为了确定一篇已发表的文章是否符合这些综述类型，我们依据Cochrane Collaboration [ 25]。我们特别认为，如果一项审查包括:(1)一套明确制定的研究目标或研究问题，具有预先确定的相关实证研究的资格标准;(2)一种明确的、可重复的方法;(3)一种系统的搜索策略，试图确定所有符合资格标准的研究;(4)对纳入研究的特征和发现进行系统的展示、分析和综合。根据用于总结和综合来自主要研究的现有证据的方法，系统综述可以分为定性/叙述或定量(即荟萃分析)。在我们的样本中，我们同时包含了ma和叙事性sr。自我描述为系统的评论，无论是在论文的标题、摘要还是方法中，也包括在内。无论审查的质量或全面性如何，都使用了这些标准。我们排除了会议记录、综述摘要、社论和未发表的作品。

患者类型和干预措施

为了符合纳入标准，综述必须调查HT干预对患有以下慢性疾病之一的患者的有效性:充血性心力衰竭、高血压、糖尿病或呼吸系统疾病。他们还必须包括初步(经验性)研究，这些研究涉及患者使用信息和通信技术，以便从患者住所向医疗保健服务中心的临床医生(如护士、医生或专职卫生专业人员)及时传输和远程监测生命体征(如动脉血压、心率)、生物特征和疾病相关数据(如血糖水平、症状、药物使用)。将HT与其他独立的多学科远程患者监测干预(如结构化电话支持、远程诊断或远程咨询)的效果进行调查和综合(即不作区分)的sr排除在外。

结果

只有综合并呈现了HT的临床、结构(如服务的利用)、行为(如对患者行为的影响)或经济效应的主要或次要结果，才纳入先前的综述。侧重于其他方面，如高温疗法的技术可行性的审查被排除在外。

搜索策略

我们对Cochrane图书馆的Ovid MEDLINE、效果评价摘要数据库(DARE)和卫生技术评估数据库(HTA)(从1966年到2012年12月)进行了文献检索，以确定所有相关的评价。在Cochrane图书馆，我们使用四个关键词(远程监控，远程医疗，远程医疗，远程家庭护理)进行了搜索。在Ovid MEDLINE上，我们将相同的关键词与以下每个术语结合使用:系统综述、元分析和综述。任何搜索都不受语言限制。

选择相关评论

如图所示图1，我们最初的搜索结果是240条参考文献。这些参考文献的标题和摘要由三位作者独立检查，以确定可能与本研究领域相关的文章。任何分歧都通过讨论解决，直至达成协商一致意见。根据纳入标准，185篇文献被认为不相关并被排除。其余55篇被确定为可能相关，并检索了这些参考文献的完整副本以作进一步评估。这些文章的参考文献列表是手工检查的，以识别最初搜索中没有捕获的潜在相关评论。这个过程产生了16个额外的参考文献。有几篇综述因涉及其他形式的远程医疗干预而被排除(n=24)，其中包括针对多病理患者的初步研究(n=8)，或综述了与HT有效性无关的主题(n=2)。其他研究被排除，因为它们不是SRs或MAs (n=10)， 2篇综述被排除，因为它们是用英语以外的语言发表的。多媒体附录1提供被排除的引用的完整列表。最终纳入这一关键性综述的SRs数量为24例[ 26- 49]。请注意，一篇综述最初是作为Cochrane Collaboration综述发表的[ 31]，后来它的一个删节版出现在一本杂志上[ 50]。在我们的评估中，我们使用了前一份出版物，因为它更详细。

信息提取

一位审稿人(SK)通过使用为本研究目的而开发的电子提取表格，以非盲的方式从每份综述中提取明确的细节。所有提取的数据均由2位审稿人(GP和MJ)检查其准确性，任何分歧均通过共识进行调解。所寻求的信息包括与综述特征有关的一般细节(例如，作者人数、通讯作者来源、出版年份、期刊特征、资金来源)以及关于综合现有证据方法的使用和解释的更具体细节(例如，元分析和定性技术)。

方法质量评估

24篇综述的方法学质量由2位审稿人(SK和GP)使用修订的多系统评价评估(R-AMSTAR)工具以非盲法格式独立评估[ 51]。任何分歧都通过协商一致得到调和。选择R-AMSTAR的基础是，它是一种经过验证的工具，可以通过评估(1)先验设计、(2)重复研究选择和数据提取、(3)全面的文献检索、(4)灰色文献的纳入、(5)纳入/排除研究的列表、(6)纳入研究的概况、(7)纳入研究的科学质量的文件评估，对SRs和ma进行深入评估。(8)在形成结论时适当使用科学质量，(9)适当使用方法将研究结果结合起来，(10)评估发表偏倚的可能性，以及(11)适当记录利益冲突。后面将更详细地描述这些领域中的每一个。

图1

描述SRs和MAs选择过程的流程图。

结果检讨简介

图2显示了HT干预措施的SRs和MAs随时间的趋势。我们的发现表明，第一篇综述发表于2003年[ 32]。很明显，在2007年之前发表的评论很少。但从那时起，HT审查的数量大幅增加。

如图所示表1，最大的综述(n=10)集中在HT对充血性心力衰竭患者的影响[ 26- 35]。4篇综述(17%)认为高血压患者[ 36- 39];4篇综述(17%)检查了慢性阻塞性肺疾病(n=2)、囊性纤维化(n=1)和哮喘(n=1)等呼吸系统疾病患者的HT [ 40- 43];另外4篇综述(17%)关注的是糖尿病患者[ 44- 47]。最后，我们的样本包括2个综合SRs(8%)，研究了HT对各种慢性疾病(如心力衰竭、高血压、糖尿病和呼吸系统疾病)的影响[ 48， 49]。纳入这些综述是因为对每种情况分别报道了高温疗法的影响。

除了3篇评论外，所有评论都发表在同行评议的期刊上。三个最常见的来源是远程医疗与远程医疗杂志(n = 3), 远程医疗和电子保健(n=3) 临床实践评估杂志(n = 2)。五篇评论[ 27， 31， 42， 46， 48报告是对先前评论的更新。大多数文章的通讯作者来自北美，其中10位来自加拿大，4位来自美国。6篇评论来自欧洲(4篇来自英国，1篇来自希腊，1篇来自意大利)，3篇来自澳大利亚，1篇来自台湾。六个评论由一个多国研究小组组成。

大多数评论是由2个或更多的作者进行的，只有2个[ 35， 42都是单独撰写的。大多数审查(63%)由政府组织或卫生保健机构资助。其中5个项目获得了来自行业或学术机构的额外资金。不到一半的综述将原始研究的结果合并为MA，大多数综述(63%)使用定性方法综合现有证据。ma被引用的频率(平均103.6,SD 108.2, 95% CI 13.1-194.1)高于sr(平均61.1,SD 77.2, 95% CI 18.37-103.90)，但差异无统计学意义( P= .287)。

评价的方法学质量

纳入综述的方法学质量结果见表2。我们概述了R-AMSTAR工具涵盖的所有41个质量标准，并给出了满足每个标准的评审文章的百分比。多媒体附录2提供每个审查的详细分析。我们以小写字母列出所有令人满意的准则[ 51]。在下面的部分中，我们将对每个R-AMSTAR域中的主要发现进行分析。

图2

每年发表的HT系统综述和荟萃分析的数量。

表1

评审简介。

慢性疾病	参考	一年	检讨类型	城市数量^一个	期覆盖	纳入研究总数(rct数)^d）
心脏衰竭
	乔杜里等人[ 26］	2007	老^b	94	1966 - 2006	9 (9)
	Clark等[ 27］	2007	妈^c	323	2002 - 2006	5 (5)
	Clarke等[ 28］	2011	妈	23	1969 - 2009	13 (13)
	Dang等[ 29］	2009	老	30.	1966 - 2009	9 (9)
	Giamouzis等[ 30.］	2012	老	4	2001 - 2011	12 (12)
	英格利斯等[ 31］	2010	妈	173	2006 - 2008	14 (14)
	Louis等[ 32］	2003	老	199	1966 - 2002	24日(6)
	Maric等[ 33］	2009	老	53	截至2007年	41 (12)
	Polisena等[ 34］	2010	妈	50	1998 - 2008	21 (11)
	濑户( 35］	2008	老	48	截至2007年	8 (4)
高血压
	AbuDagga等[ 36］	2010	老	18	1995 - 2009	15 (10)
	Jaana等[ 37］	2007	老	13	1966 - 2006	14 (3)
	Omboni等[ 38］	2011	妈	7	直到2010年	12 (12)
	Verberk等[ 39］	2011	妈	6	没有报告	9 (9)
呼吸道条件
	Bolton等[ 40］	2011	老	16	1990 - 2009	6 (2)
	Cox等[ 41］	2012	老	1	1998 - 2011	8 (1)
	Franek等[ 42］	2012	老	4	2000 - 2010	5 (3)
	Jaana等[ 43］	2009	老	49	1966 - 2007	14 (3)
糖尿病
	Farmer等[ 44］	2005	妈	127	1966 - 2004	26日(16)
	Jaana等[ 45］	2007	老	70	没有报告	17 (11)
	MAS ( 46］	2009	妈	-	2007 - 2009	8 (8)
	Montori等[ 47］	2004	妈	120	1982 - 2003	8 (8)
涵盖各种慢性疾病的社会保障报告
	parparet al [ 48］	2010	老	44	1966 - 2008	大厨:17 (13);高血压:13 (5);哮喘:8 (6);糖尿病:24 (21)
	parparet al [ 49］	2007	老	274	1990 - 2006	大厨:16 (7);高血压:14 (3);呼吸疾病:18 (4);糖尿病:17 (12)

^一个根据谷歌学者截至2013年3月28日。

^bSR:叙述性/定性的系统评价。

^c马:荟萃分析。

^d随机对照试验。

表2

满意地满足每个R-AMSTAR标准的审查的百分比。

标准	描述	是的,%
1.问	研究的设计是在进行评价之前确定的(即先验设计)。	One hundred.
问1. b	有一个关于纳入标准的声明。	One hundred.
问1.摄氏度	有一个PICO研究问题/声明。	67
2.问	至少有2个独立的数据提取器，如声明或暗示。	42
问2. b	有一项声明承认或认识到协商一致处理分歧的程序。	46
问2.摄氏度	提取者之间的分歧得到了适当的解决，如声明或暗示。	38
3.问	检索至少2个电子来源(如Medline和EMBASE)。	96
问3. b	该报告包括年份和检索的数据库。	92
问3.摄氏度	说明关键词和/或MESH术语。	92
问3. d	除了电子数据库(PubMed, EMBASE, Medline)之外，检索还通过查阅当前的内容，如评论、教科书、专业注册表或特定研究领域的专家，或通过审查所发现的研究中的参考文献来补充。	79
问3. e	对期刊进行“手动搜索”或“手动搜索”(即，识别高度相关的期刊，并对其全部内容进行手动逐页搜索，以寻找潜在的合格研究)。	13
4.问	作者们表示，他们搜索的报告与出版物类型无关。	8
问4. b	作者声明他们是否排除了任何报告(从系统评价中)，基于他们的出版状态，语言等。	83
问4.摄氏度	“非英语”论文被翻译。	4
问4. d	没有语言限制，也不承认非英语冠词。	21
5.问	提供了纳入研究的表格/列表/或图表;参考书目是不够的。	92
问5. b	被排除研究的表格/列表/图表在文章中或补充来源(即在线)中提供。(被排除的研究是指那些根据标题和/或摘要认真考虑，但在阅读正文后被拒绝的研究。)	25
问5.摄氏度	作者令人满意地/充分地陈述了排除认真考虑的研究的原因。	63
问5. d	读者能够追溯包括和排除的研究在任何地方的文章参考书目，参考，或补充来源。	25
6.问	纳入研究的特征以汇总形式(如表格)提供，原始研究的数据提供了参与者、干预措施和结果。	88
问6. b	作者提供了所分析研究中相关特征的范围(例如，年龄、种族、性别、相关社会经济数据、疾病状况、持续时间、严重程度或报告的其他疾病)。	83
问6.摄氏度	所提供的信息似乎是完整和准确的(即，这里有一个可以容忍的主观性范围)。读者是否感到疑惑?如果是，说明需要的信息和理由)。	88
7.问	提供了一种先验的评估方法(例如，对于有效性研究，如果作者选择仅包括随机、双盲、安慰剂对照研究或分配隐藏作为纳入标准);对于其他类型的研究，替代项目将是相关的。	38
问7. b	纳入研究的科学质量似乎是有意义的(即使用高、低或a、B、C等量表)。	33
问7.摄氏度	讨论/承认/意识到证据的水平	21
问7. d	证据质量根据特征工具进行评级/排名(特征工具是一种创建的工具，用于对证据水平进行排名，例如GRADE)。	21
8.问	在分析和SR的结论中考虑了方法严谨性和科学质量的结果。	25
问8. b	在制定建议时，明确说明了方法严谨性和科学质量的结果。	25
问8.摄氏度	将结论整合/推动临床共识声明。	N/A
问8. d	这一临床共识声明推动了临床实践指南的修订或确认。	N/A
9.问	作者提供了一份标准声明，用于决定所分析的研究是否足够相似，可以合并。	0
问9. b	对于合并的结果，进行检验以确保研究是可合并的，以评估其同质性(即，卡方检验的同质性，I²）.	38
问9.摄氏度	人们认识到异质性或缺乏异质性。	38
问9. d	如果存在异质性，则采用“随机效应模型”，并/或考虑联合的基本原理(即临床适宜性)(即联合是否合理)，或明确说明。	25
问9. e	如果同质性存在，作者陈述一个基本原理或统计检验。	0
10.问	承认发表偏倚或文件抽屉效应。	21
问10. b	发表偏倚的评估包括图形辅助(如漏斗图，其他可用的测试)。	13
问10.摄氏度	统计检验(如艾格回归检验)。	0
11.问	作者提供了一份支持来源的声明。	79
问11. b	没有利益冲突。	50
问11.摄氏度	作者在主要纳入研究中提供了支持或利益冲突的意识/声明。	4

先验设计(Q1)

在开始检索、收集和数据提取之前，我们样本中的所有综述都建立了其综述设计(Q1.a)和研究选择的资格标准(Q1.b)。然而，根据方法学家和PRISMA声明推荐的“PICO”框架(人口、干预、比较、结果)，大多数综述缺乏清晰的研究问题/目标框架[ 16， 52]。虽然在所有纳入的综述中都明确说明了患者群体或慢性疾病和被审查的干预措施，但较少的病例中明确了比较组(对照组)和被评估干预措施的结果:分别为25%和67%。仅3篇综述文章(15%)确定了针对所有4种PICO成分的精心制定的研究目标。总的来说，大多数(67%)的综述报告了患者群体、干预措施和感兴趣的临床结果，因此，被判断为令人满意地涵盖了Q1.c项。

重复研究选择和数据提取(Q2)

筛选主要研究的过程在大多数情况下(67%)是独立进行的，至少由2名审稿人进行。然而，据报道，在不到一半的综述(Q2.a)中，从主要研究中提取的数据是独立进行的，并且是重复的。根据方法学家的建议，评估资料抽取的准确性，以对照至少一个样本的初步研究[ 53]，我们在1ma [ 28] 1项随机对照试验(RCT)的数据提取与原始发表之间的差异[ 54充血性心力衰竭住院的结果对照组与实验组之间的事件总数反向记录。因此，估计的汇总效应似乎略高，而I²异质性缩小点估计(RR 0.73 [0.62-0.87]) P= .0004;我²=0 vs RR 0.78 [0.65-0.93] P= 04;我²= 46%)。没有报告在此MA中重复数据提取。

在24篇评论中，11篇(46%)陈述了是否存在共识程序或第三方评论者来解决任何分歧(Q2.b)， 9篇(38%)包含了关于评论者之间现有分歧的适当解决的声明(Q2.c)。总的来说，如下所示多媒体附录2，只有三分之一的审查令人满意地涵盖了这一领域中包括的所有标准。关于数据提取过程中所采用的方法，如使用试点表格/编码表，为避免重复计算已发表报告而采取的步骤，以及从原始研究的作者那里收集额外信息所使用的方法的补充信息很少。

搜索全面性(Q3)

对领域3(包括5个标准)的分析显示，几乎所有的综述(96%)使用至少2个电子数据库来搜索主要研究(Q3.a)。最流行的数据库是Medline(100%)、Cochrane Library(70%)和EMBASE(60%)。总的来说，22篇综述(92%)报告了检索的年份和数据库(Q3.b);22个(92%)表示使用的关键字(Q3.c);19人(79%)表示通过查阅已发现研究中的参考文献来补充搜索(Q3.d)。只有3篇(13%)综述(Q3.e)对高度相关的期刊进行了人工检索，以确定符合条件的研究。14篇综述(58%)使用QUOROM/PRISMA流程图以图形方式描述和描述搜索和选择相关文章的步骤顺序。然而，只有5篇评论(21%)提供了至少1个主要数据库的完整电子搜索策略，以便人们可以重复搜索或评估其全面性。如图所示多媒体附录2，只有2次审查(8%)在该特定领域满足R-AMSTAR仪器的所有5项标准。

灰色文献的收录(Q4)

有趣的是，大多数评论都集中在发表在英语期刊上的同行评议的初步研究上。在我们数据库中的24篇文章中，只有2篇(8%)考虑了灰色文献的纳入，并搜索了原始研究，而不考虑其发表类型(Q4.a)。在20篇综述(83%)中，作者表示他们根据发表状态(如摘要、会议论文集和语言)排除了初步研究(Q4.b)。只有一篇综述(4%)报告翻译了非英语论文(问题4.c)，而5篇综述(21%)报告在搜索和纳入研究时没有应用语言限制(问题4.d)。

所提供的纳入和排除的研究(Q5)

大多数综述(92%)提供了纳入研究的列表(Q5.a)，但只有25%的综述在文章或补充来源(如在线附录)中报告了排除研究的列表(Q5.b)。因此，只有6篇综述(Q5.d)可追溯纳入和排除的研究。在15篇(63%)文章中，作者明确报告了排除研究的主要原因(Q5.c)，随后报告了与每个排除标准相关的文章数量。后一项的检讨结果令人满意，检讨提供了类似prisma的流程图[ 52]。

纳入研究的特点(Q6)

来自参与者、干预措施和结果的原始实证研究的研究水平数据以汇总形式呈现，如21篇综述(88%)中的表格(Q6.a)。所有这些表格的资料似乎都是完整的(问题6.c)。在20篇综述(83%)中，作者在表中纳入了来自主要研究的相关PICO特征的范围(例如，患者的平均年龄、随访时间、疾病严重程度)(Q6.b)。

初级研究的质素评估(问题七)

24篇综述中有9篇(38%)对初步研究的方法学质量或偏倚风险进行了正式评价。在所有这些研究中，作者提供了一种先验的评估方法，要么以质量量表/综合评分清单的形式，要么以预定义的偏倚风险标准的形式(Q7.a)。总而言之，8个评论(33%)以有意义的格式记录了每个研究的质量评估的最终结果，即以等级/分数或每次评论满意地涵盖的标准总数的形式(Q7.b)。在一个特别的评论中[ 40]，作者表示，根据Cochrane协作标准进行了偏倚风险评估，但对每个单独研究的评估结果没有记录。在评估主要研究质量的9篇综述中，只有5篇根据研究设计(如RCT、观察性)和单个研究的科学质量或偏倚风险对研究的证据水平或结果进行了评级(Q7.c)。所有5篇综述(21%)使用各种特征工具来评估证据的总体质量(Q7.d)。最普遍的是GRADE工具，在3篇综述中使用。

表3和 4总结不同的方法、工具和策略([ 55- 61])，用于评估纳入的初步研究的质量和证据的总体质量。基于这些方法的组合，我们将评论分为两大类。第一组侧重于评估每项研究的方法学质量，但没有考虑证据的整体质量，而第二组进行了两项评估。证据质量考虑了纳入研究的内部有效性评估(质量或偏倚风险)和设计(例如，随机对照试验，观察性研究)，以及其他潜在方面(例如，结果的一致性和直接性)，以评价或表明我们可以确信的程度，估计的效应大小或审查的最终结论关于HT干预的有效性在每个结果或单个研究中是正确的[ 55]。

表3

用于初级研究质量评估的方法和工具-第1组。

集群1	乔杜里2007 [ 26］	Clark 2007 [ 27］	Cox 2012 [ 41］	农民2005 [ 44］
评估重点	研究设计(D)学习质量(Q)	研究设计(D)学习质量(Q)	学习质量(Q)	学习质量(Q)
(评估重点)评估方法	(D)仅纳入随机对照试验(Q) j ni量表[ 56]及约克中心准则[ 57］	(D)仅纳入随机对照试验(Q)科克伦标准[ 58］	(Q)低洼及黑色音阶[ 59］	(Q)贾达量表[ 60];仅用于评估随机对照试验
评税主任人数	NR^一个	2	2	NR
评估员蒙蔽?	NR	NR	NR	NR
裁决或协商一致程序	NR	是的	是的	NR
按领域对每项研究的结果进行交叉制表	没有	是的	是的	没有
学习质量总分	是的	N/A^b	是的	是的

^一个尼科布:没有报道。

^bN / A:不适用的。

表4

用于初步研究质量评估的方法和工具-第2组。

集群2	博尔顿2011 [ 40］	Franek 2012 [ 42］	英语口语2010 [ 31］	Polisena 2010 [ 34］	2009年12月[ 46］
评估重点	学习质量(Q)证据质量(E)	学习质量(Q)证据质量(E)	研究设计(D)学习质量(Q)证据质量(E)	学习质量(Q)证据质量(E)	研究设计(D)学习质量(Q)证据质量(E)
(评估重点)评估方法	(Q)科克伦标准[ 58］(E)牛津循证医学中心——证据水平	(Q) CONSORT语句清单在随机对照试验中的修改(e)职系[ 55］	(D)仅纳入随机对照试验(Q)科克伦标准[ 58］(e)职系[ 55］	(Q)和(E) Hailey等仪器的自适应[ 61］	(D)仅纳入随机对照试验(Q)对Goodman提出的证据等级等级的调整(e)职系[ 55］
评税主任人数	2	NR	2	2	NR
评估员蒙蔽?	NR^一个	NR	NR	NR	NR
裁决或协商一致的程序到位	是的	NR	NR	NR	NR
按领域对每项研究的结果进行交叉制表	没有	是的	是的	没有	是的
学习质量总分	N/A^b	N/A	N/A	是的	N/A
证据质量排序	在研究	在结果	在结果	在研究	在结果

^一个尼科布:没有报道。

^bN / A:不适用的。

值得注意的是，除了通过仪器正式评价初步研究的质量或偏倚风险的综述外，还有3篇综述[ 29， 43， 48]使用了评定量表[ 62来判断所纳入研究的证据强度。根据该量表，在考虑两个重要因素后，可以确定证据的强度，并在9个等级水平中的1个等级中适当排名(按降序出现):(1)每个主要研究采用的设计类型(例如，大RCT，小RCT，队列);(2)基于一系列科学严密性条件的研究的有效性，包括研究质量。然而，这三次审查都没有进行或考虑上述比额表建议的后一个组成部分。在分析和制定结论的过程中，所有3篇综述仅根据每项研究的研究设计“标签”对证据进行分层排序。他们没有批判性地评价或考虑到实际情况特性这些个体研究最终会影响偏倚的风险。因此，与非随机对照试验、队列研究等相比，大样本和小样本随机对照试验在证据层次上的排名更高。

在制定结论时适当使用纳入研究的科学质量(Q8)

在正式评估初步研究的科学严谨性的9篇综述(见问题7)中，有6篇将方法学质量的结果纳入最终结论(问题8.a)和为未来研究提出的建议(问题8.b)。总的来说，75%的综述在没有考虑或反映纳入研究的潜在偏倚风险的情况下得出了关于HT治疗慢性患者有效性的结论。重要的是，没有一篇纳入的综述将质量评估的结果(问题7中的项目)纳入到综述的实际分析中，以探讨如果将高偏倚风险的研究纳入或排除在分析之外，结论可能会受到何种影响。

用于合并研究结果的方法的适宜性(Q9)

我们数据库中的大多数综述(63%)使用叙述性综合对主要研究的结果进行定性汇总。然而，所选择的方法背后的基本原理和作者用来指导他们的决定的方法一般没有提到。在15份叙述性报告中，8份(53%)提供了关于为什么选择定性综合证据而不是荟萃分析的陈述[ 26， 29， 33， 37， 40- 42， 48]。所有这些综述的主要原因一般都是围绕纳入研究之间存在的“异质性”。然而，方法、标准或具体规则(例如，基于PICO框架的逻辑模型)被用来客观地支持meta分析不合适或不明智，因为主要研究在临床或方法学上过于多样化。

在15个SRs中，只有3个(20%)提供了一个分析计划，其中包含了在合成过程的每个阶段使用的方法、工具或总体框架的信息[ 26， 29， 48]。在其余的审查中，没有具体说明决策过程的逻辑和作者为初步研究分配权重以得出最后结论所依据的标准。此外，绝大多数(93%)的SRs使用原始研究中报告的原始数据的变体(例如百分比、平均差异、 P值和计数)。只有一个[ 26]将提取的数据转化为共同的统计度量(例如，风险比)，以便在观察到的治疗效果和感兴趣的主要结果之间进行更透明和直接的比较。

如图所示表5， SRs的作者使用了四种不同的方法来定性地组织和综合现有的证据。最常用的方法(在10个研究报告中)是“报告结果”法，即根据原始研究中评估和报告的最常见结果对结果进行分析和综合。四篇综述采用“证据水平”方法，其中纳入研究的研究设计作为分层的基础，并按降序排列现有证据(例如，大型随机对照试验、小型随机对照试验、队列研究和病例对照研究)。其中两种方法将“证据水平”与“报告结果”方法结合在一起，而第三种方法使用“计票”来呈现每个研究中干预效果的方向(例如，积极，消极和相互矛盾的证据)。在我们检查的两个SRs中，作者根据远程监测干预的主要模式(例如，体征和症状的自动监测和基于电话触摸板的HT模式)对研究进行了分组和分析。

在24篇综述中，有9篇综述使用元分析方法定量地结合了主要研究的结果。然而，没有一个MAs明确说明在研究问题的背景下使用了什么标准来客观地支持所分析的HT试验在临床和方法上足够相似，可以进行定量结合(Q9.a)。在一个MA [ 34]，有人指出，当大量的统计异质性(1²≥50%)，这种异质性不能用亚组分析来解释。然而，从方法论的角度来看(如后面所述)，过度依赖I²可能特别具有误导性，因此，使用统计异质性和I²作为决定MA是否合适的唯一标准，是一个相当有问题的策略[ 63- 65]。在MA中汇总和提供治疗估计的决定不符合统计检验，而应基于任何异质性的临床和方法学相关性(例如，患者年龄、疾病严重程度、随访时间、使用的技术和研究设计)。

如图所示表5，在每个MA中使用的效应测量的汇总统计通常与调查结果的类型和原始试验中的可用数据(即二分类、计数或连续)相关。通过正式的统计检验(Q9.b)，评估和量化所有MAs中每个感兴趣的结果在研究中HT效应的一致性。最常见的方法是8ma ( 表5)涉及到I的使用²统计量，由卡方检验(Cochran’s Q统计量)得出。但豁免一人[ 39]，只报告了计算出的I的范围²其余的MAs报告了森林样地或文章文本内的精确结果，并提供了对每个调查结果的异质性估计的解释(Q9.c)。

我的²统计( 66， 67]衡量一组治疗效果估计中总变异性的大致比例，这些变异性可归因于所纳入研究之间的实际临床或方法学差异，而不是抽样误差。它的取值范围从0到100%，通常使用阈值(如25%、50%和75%)来推断试验结果之间不一致的程度[ 67， 68]。然而，模拟表明，I²统计量与Q统计量具有类似的功率和精度缺点[ 64， 65]。因此，在包含少量试验(例如，k<15)且精度较差(即，少量患者和事件)的MAs中，它可能产生不可靠的估计。为此，有关指引[ 68]和方法学家[ 64， 66， 67， 69， 70]建议研究人员在解释结果时应调查、呈现和考虑I的95%置信区间(CI)²估计，以便充分反映其周围的不确定性(证据的强度)。也就是说，就治疗效果而言，试验之间可能存在的真正差异程度的范围。然而，在我们的数据库中，没有一个MAs报告执行了这一统计程序。虽然纳入的激素疗法试验数量一直低于12项，而且由于登记患者数量少，大多数试验的准确性较差，但关于纳入试验中激素疗法效果的一致性或不一致性的推断是基于I²仅仅是点估计。

鉴于这种方法学上的限制对MAs的可靠性在结果解释和统计模型选择方面的潜在负面影响[ 70， 71])，我们试图进行事后分析，以经验评估所提供异质性的不确定性程度(1)²)的估计。按照建议[ 69]，我们使用非中心χ进行所有计算²的方法，该方法在Stata(12.1版)的heterogi模块中实现[ 72]。总的来说，我们可以计算出I²统计数据及其相关的95% ci(除一个MA外)[ 39]， 4项及以上研究共22项结果。基于对每个MA中使用的统计方法的应用和解释的仔细评估，我们确定了以下方法问题。

6个月[ 27， 28， 31， 34， 44， 47，其中I²估计某一特定结果的统计量为0% ( 表6)，一个常见的推论是不存在异质性或试验之间的异质性很低。因此，临床HT效应强度的方向和分布被解释为在所有纳入的试验中是一致的。然而，95% ci反映了这些异质性估计的不确定性，在所有这些ma中尤其广泛，从低到高异质性不等。如图所示表6， 95% CI的上限进入了大异质性(I²≥50%)，在3 ma时也均超过或达到75%范围(异质性较强)，而区间下限均低至0%。这表明，由于普遍缺乏证据，很难确定地对研究结果的相似性或可比性做出任何强有力的推论和结论性陈述。考虑到所有这些ma中包含的试验的精度很低，有可能I²估计数已被掩盖及缩减[ 73]。因此，不应排除或低估HT试验之间存在一些中度甚至相当大的异质性。

我们发现的第二个方法学问题与相反的问题有关，即对异质性的高估。在4个MAs的5个森林样地[ 28， 38， 46， 47]，其中I的点估计²是中等(例如，33.8%)还是相当大(例如，1%)²≥50%)( 表6)，一个常见的推论是，由于真正的差异，在试验的HT效应大小之间存在高度甚至实质性的不一致。然而，如表6，在所有这些ma中，I的95% CI的下限²点估计进入小异质性的范围(I²≤25%)，反映了大异质性的证据可能不足以支持观察到的I的重要性²价值。对异质性的高估和对I的过度依赖²在一项研究中，研究人员得出 47]用尽亚组分析的所有可能性，并屈服于一个缺乏支持的事后分析，以寻求异质性的原因，而在另一篇综述中，它阻止了作者进行MA [ 34]。

最后，一个稍微微妙但却很重要的方法错误涉及在MA中通过重复计算其研究小组而高估研究的问题[ 24， 74， 75]。具体来说，我们的数据库中有一个MA [ 38比较了HT与常规治疗对高血压患者的影响，其中包括一项随机对照试验[ 76]，其中有1个对照组(常规护理247例患者)和2个干预组:(1)血压HT与网络培训服务(246例患者)，(2)血压HT与通过网络交流的药剂师辅助护理(237例患者)。作者选择在他们的MA中处理这个特定试验的方式，对于所有报告的结果，是通过重复计算其对照组，在每个森林图中包括两次。然而，这样做的结果是，这个特殊的试验被压倒了。一次统计493名患者，一次统计484名患者。因此，它的有效样本量看起来是977，而实际上真正的样本量是730。这对这一特殊综述的结果构成了重要的效度威胁，因为该试验在所有感兴趣的森林样地中都被赋予了相当大的权重。

使用的统计模型中，6个(67%)进行了随机效应分析，3个进行了固定效应分析(Q.9c)。后两项研究[ 28， 31]使用了固定效应模型，即使一些潜在的温和证据(例如，I²>30%)到实质性(例如，1²研究间存在异质性。然而，为什么固定效应模型仍然被认为是合适的，这是不合理的。在大多数评论中，指导研究人员选择两种统计模型之一的基本原理、标准或一般假设没有规定。在9个ma中，只有2个(22%)提供了明确的声明来证明用于计算汇总效应的统计模型的合理性[ 27， 31]。这两篇综述都是由同一组研究人员撰写的，重点关注HT和结构化电话支持(单独)与常规护理对充血性心力衰竭患者的影响。然而，有趣的是，尽管作者所陈述的原因或假设几乎相同，但每次综述中所选择的模型却不同。

发表偏倚(Q10)

该问题中包含的三个标准侧重于用于评估发表偏倚可能性的元分析方法，即研究结果的发表或不发表取决于主要研究结果的方向。在我们的综述中纳入的9个MAs中，5个在评估中考虑了发表偏倚(Q10.a)，只有3个在已发表的文章中呈现了实际的漏斗图(Q10.b)。在这5个MAs中，作者依靠视觉检查和解释漏斗图。任何ma (Q10.c)均未使用评估偏倚存在的正式统计检验(例如，Egger回归检验)。考虑到每次综述中纳入的试验数量较少，这是合理的。理论上，这样的测试需要相当数量的初步研究，才能有足够的能力发现偏倚;很少被满足的标准。然而，没有一个MAs承认与目视检查漏斗图相关的主观性的巨大风险[ 70， 77]以及当研究数量较少(例如，k<10)或异质性显著时，该方法在检测偏倚(更不用说发表偏倚)方面的不足[ 78， 79]。因此，在所有情况下，关于存在或不存在强烈发表偏倚的陈述都比所允许的证据更有力。

利益冲突(问题11)

在我们的样本中，大多数评审(79%)明确披露了评审过程中获得的所有支持来源。在50%的调查中，至少有一名或多名调查人员直接隶属于在各自审查结果中具有竞争利益的实体，或与实体有其他积极参与，例如HT解决方案提供商(Q10.b)。只有一篇综述(4%)检查并报告了所纳入实证研究的作者是否存在潜在的利益冲突(Q10.c)。

表5

在SRs和MAs中使用的方法来综合来自原始研究的现有证据。

方法		评论	n
定性的方法(n = 15)
	报告结果	［ 30.， 32， 35- 37， 40- 43， 45， 49］	11
	证据水平(研究设计)	［ 29， 32， 37， 48］	4^一个
	计票(干预效应)	［ 29］	1^一个
	远程控制模式	［ 26， 33］	2
整合的方法(n = 9)
摘要统计信息
	风险比(对于二分类数据)	［ 27， 28， 31， 34］	4
	风险差异(对于二分类数据)	［ 27］	1^b
	平均差(连续数据)	［ 38， 39， 46］	3.
	标准化平均差(连续数据)	［ 44， 47］	2
非均质性
	用统计检验方法评估异质性	［ 27， 28， 31， 34， 38， 39， 44， 46， 47］	9
	报告Cochran 's Q统计量(卡方检验)异质性	［ 27， 28， 31， 44， 46， 47］	6
	报道我²异质性检验	［ 27， 28， 31， 34， 38， 39， 46， 47］	8
统计模型
	随机效应荟萃分析	［ 27， 34， 38， 47］	4
	固定效应荟萃分析	［ 28， 31， 44］	3.
荟萃分析诊断
	亚组分析	［ 34， 46， 47］	3.
	敏感性分析	［ 31， 38］	2

^一个包括使用两种不同方法的评论。

^b同样的回顾使用了两种不同的汇总统计。

表6

的置信区间²ma的估计。

	作者(年)	试验次数	我²	低区间(95% CI)	高区间(95% CI)	统计模型	评估结果
心脏衰竭
	Clark 2007 [ 27］	5	0	0	79	随机效应	全因死亡率
	Clarke 2011 [ 28］
		10	51	0	76	固定效果	全因死亡率
		6	59	0	83	固定效果	全因住院
		6	0	0	75	固定效果	CHF-related住院
		4	82	52	93	固定效果	全因急诊
	英语口语2010 [ 31］
		11	0	0	60	固定效果	全因死亡率
		8	0	0	68	固定效果	全因死亡率随访6个月
		8	78	56	89	固定效果	全因住院
		6	85	70	93	固定效果	全因住院随访6个月
		4	39	0	79	固定效果	CHF-related住院
		4	39	0	79	固定效果	chf相关住院随访6个月
	Polisena 2010 [ 34］
		6	0	0	75	随机效应	全因死亡率
		4	5	0	85	随机效应	全因住院
高血压
	Omboni 2011 [ 38］
		11	65.8	35	82	随机效应	收缩压改变
		11	56.6	15	78	随机效应	舒张压改变
		6	77．9	44	91	随机效应	控制血压
		5	79.1	50	91	随机效应	抗高血压药物的数量
糖尿病
	农民2005 [ 44］	9	0	0	65	固定效果	血糖控制- HbA1c的变化
	2009年12月[ 46］
		7	65	20.	84	随机效应	血糖控制- HbA1c的变化(所有研究)
		4	45	0	82	随机效应	血糖控制- HbA1c的变化(亚组分析)
	Montori 2004 [ 47］
		8	33.8	0	71	随机效应	血糖控制- HbA1c的变化
		7	0	0	71	随机效应	血糖控制- HbA1c的变化(事后亚组分析)

讨论主要研究结果

这篇重要的综述首次对已发表的研究HT对慢性疾病患者影响的综述进行了正式和全面的质量评估。我们应用R-AMSTAR工具严格检查每个综述的方法严谨性和报告特征，并在该特定工具的11个领域内进行了仔细评估，以确定可能影响其内部有效性的推断或结果中的偏倚风险(即系统错误)。为此，R-AMSTAR被用作指导和支持我们评估的一般框架，而不是为每次审查计算质量分数的特定工具。这样的评分可能并不总是反映每一篇综述的真实科学质量，而且有证据表明，由于可能存在假阳性或假阴性，在判断是否信任个别分析时，使用这些评分可能会出现问题[ 58]。

我们的文献检索结果表明，与其他临床领域相比，该领域的SRs和MAs是相当新的(例如，[ 18， 80])。第一篇综述发表于2003年，主要针对充血性心力衰竭患者。从那时起，特别是在过去6年中，发表的综述数量大幅增加，同时审稿人的重点也扩大到包括其他慢性疾病，如慢性阻塞性肺病、高血压和糖尿病。尽管如此，最大的评论仍然集中在充血性心力衰竭患者身上。

根据我们的评估，我们发现随着最近对高温疗法干预的评论的增加，由于内在的方法问题，这些文章中有相当一部分似乎缺乏最佳的科学严谨性。此外，他们的整体素质似乎并没有随着时间的推移而提高。尽管重要的方法指引广泛提供和传播[ 52， 81]，可以用来指导系统评价过程并消除潜在的偏见风险，但似乎这些知识尚未完全整合到HT领域。虽然所有或大多数评价满意地满足了一些标准(例如，建立先验设计(100%)，报告纳入/排除标准(100%)和研究特征(88%)，使用多种电子搜索和数据库(96%))，但还有其他重要领域需要改进。未来的SRs和MAs应该考虑这些领域，以促进科学进步，提高快速发展的高温疗法领域的研究严谨性。正如R-AMSTAR仪器的应用和我们的分析所表明的那样，许多综述没有执行关键的方法学程序来降低偏倚风险(例如，重复数据提取(42%)，纳入灰色文献(8%)和非英语文献(21%)，纳入研究的方法学质量评估(38%))，并且一些综述在研究结果的综合方面存在局限性，这可能会影响其结果和结论的有效性。我们将在下面解释这些问题的潜在影响，并为该领域的未来审查提供建议。

搜索策略

虽然大多数综述使用了2个以上的电子数据库来检索相关研究，但很少使用其他重要的方法来减少偏倚和增强检索策略。只有2篇综述试图识别灰色文献中的主要研究，绝大多数将所有搜索限制在英语文章中，尽管已经证明，在专门关注英语出版物的SRs和ma中可能会引入偏见[ 82， 83]。所有综述都明确地报告了为选择初步研究而建立的先验的纳入和排除标准，但大多数综述没有提供被排除研究的参考文献清单，这是方法学家和PRISMA声明所建议的[ 16， 52]。这些方法学问题表明，对现有证据的审查可能有限，并且存在选择和语言偏差的高风险。我们对引文模式进行的书目分析证实了这些担忧。事实上，由于在检索过程中应用的各种语言、出版类型和日期限制，我们数据库中包含的绝大多数综述在识别已发表研究方面都存在不足。Inglis等人的Cochrane综述[ 31]，在其他关于心力衰竭的SRs和MAs中进行了最全面的搜索，提供了具体的证据( 多媒体附录3）.具体地说，这些作者确定了3个相关试验，其中2个用英语以外的语言发表(一个用德语，一个用意大利语)。德国的这篇论文是同行评议的，是其他综述确定的所有试验中最大的随机对照试验(502例患者)。然而，在2007年以后发表的任何其他综述中都没有包括它，另外2个作为摘要发表的随机对照试验也没有包括它，因为几乎所有的综述都将其搜索限制在英文出版物中，没有考虑灰色文献。为了尽量减少选择和语言偏差的风险，未来的HT审查应避免应用此类限制，因为这些限制与srr和MAs的概念不一致，其目的是对所有可用的经验证据提供彻底和公正的概述。

纳入HT研究的差异

在过去的十年中，HT作为一个研究领域有了长足的发展。然而，从概念的角度来看，SRs和ma的作者在他们使用的术语(例如，“远程医疗”)方面似乎缺乏共识[ 47]，“远程医疗”[ 44]，“远程医疗”[ 41]、"远程保健和远程监测" [ 29])，最重要的是，干预措施的类型和技术符合高温疗法的标准。例如，乔杜里等人[ 26[]在他们的评论中认为，没有明确的理由排除护士和病人之间使用一对一电话的电话干预，而其他评论者则持相反的观点(例如，[ 31， 32， 48， 49]。我们的批判性评估方案，特别是对引用模式的检查，揭示了在某些干预措施的纳入、分类和分析方面，所纳入的综述之间存在一些不一致的观点。大多数审查强烈倾向于纳入基于遥测设备的干预措施，这些设备通过通信网络提供自动或基于信息的监测和传输生理体征或症状(见多媒体附录3）.然而，在纳入和分析其他干预措施方面，综述之间存在重要分歧，如独立电话支持(52,63)、自动电话、免费计算机语音应答系统(13,31)、可视电话(70)、基于电视的支持(4)、视频会议(46)和基于网站的支持(35)。

下面的例子很好地说明了目前存在的问题及其对HT审查结果和直接比较结果的影响。一项随机对照试验被纳入了三篇关于治疗心力衰竭的HT的综述[ 28， 29， 31]， ma 2例，SR 1例，由常规护理对照组和2个干预组组成。第一组干预被分配到结构化电话支持，而第二组被分配到不涉及任何自动监测或传输生命体征和症状的可视电话。两篇评论[ 28， 29认为可视电话干预是家庭远程监控，而第三个不认为[ 31]。第三篇综述选择处理本研究的方式是将两个干预组合并为一个，并将其定量分析为结构化电话支持。这表明，对高温合金及其核心性质的定义尚未达成共识。未来的研究应该通过提出和验证一种分类法来解决这一重要问题，该分类法将捕获不同类型/形式的HT，并使试验之间能够进行可靠的比较。

纳入研究的质量评估

先前综述结果的有效性及其结论的可信度在很大程度上取决于纳入研究的质量。有充分证据显示，初步研究的科学质素并不总是足够，而方法上的缺陷如未加以识别和考虑，可能会夸大或降低研究评估的结果[ 84- 86]。现行指引[ 52， 58建议审稿人在每次审评中必须进行两种不同的质量评估:原始研究的方法学质量(或偏倚风险)和证据质量[ 55]来表明我们在多大程度上可以确信对每个结果的效果估计或最终结论是正确的。也存在各种策略[ 58]，可用于将这些评估的结果纳入审查的分析和结论。不幸的是，我们在HT特定领域的发现相当令人失望，并引起了重要的关注。在24篇综述中，只有9篇(38%)评价了纳入研究的方法学质量，其中5篇(21%)评价了现有证据的总体质量。此外，只有4篇综述在其最终结论中考虑了质量评估的结果。因此，不能排除有偏见的研究夸大或低估了先前对HT的评价结果的可能性。

数据综合方法的选择和论证

关于选择最适合解决综述研究问题的数据合成方法的决定需要深思熟虑和临床判断，并应基于明确的临床和方法标准，尽可能减少主观性[ 68]。根据我们的评估结果，用于指导和支持研究人员决定以叙述或定量方式综合现有证据的基本原理和标准并不总是显而易见的。在15个定性SRs中，8个(53%)提供了不进行MA的一些解释，但即使在这些病例中，用于确定研究在临床或方法学上不够相似的标准也没有透露。在他们这方面，HT的MAs没有提供一个基本原理或声明，说明使用什么标准来支持合并统计研究的决定，这些研究可能在患者的严重程度阶段、家庭远程监测方法、实施设置和其他重要方面有所不同。这一发现表明，大多数审稿人可能会基于方法论偏好或先前的经验，而不是明确的临床相关标准，将主观性最小化，将叙事综合或元分析作为“默认操作”。然而，若能明确指明用于指导选择特定综合方法的任何方法或具体规则(例如，基于PICO框架的逻辑模型)，将有助于今后的审查解决这一问题[ 6， 22]。

研究的定性综合

采用叙述性或定性综合的作者应明确描述支撑证据综合过程每个阶段的分析计划，以便阐明和支持用于得出最终结论的逻辑。提交一份分析计划是至关重要的，并且应该成为未来HT的SRs中方法部分的组成部分，因为它澄清了合成过程，提高了审查的透明度和可靠性，并作为防止因不适当地强调一项研究的结果而产生的偏见的保障[ 87- 89]。这种分析计划除其他外，必须采用适当的技术，以便在选择纳入的研究中将原始数据转换为共同的统计或数值度量(例如，风险比、平均差异)[ 87]。这将允许审稿人对效应大小进行有意义的总结，从而促进在所研究的效应范围内进行稳健和透明的比较。不幸的是，大多数叙事性社会报告未能满足这些标准，在大多数情况下，综述作者倾向于过度依赖报道 P值，这些值有误导的臭名昭著的记录，特别是在小规模的初级研究的情况下，这些研究有很大的研究内方差(即精度差)，并且没有足够的动力来获得显著的结果[ 74]。鉴于将不显著的结果误解为无效果的证据的固有风险，该领域未来的SRs最好通过估计每个主要研究的效应量来综合现有数据(正如其中一个SRs [ 26])而不是报道 P值。

在meta分析中测量HT效应的不一致性

在HT干预的MAs中使用的统计方法的主要目的之一是评估纳入研究结果之间的离散性，即研究间效应量的异质性，以评估研究结果的一致性。鉴于观察到的异质性，重要的是调查和解释，只要可能，是什么导致了它，以增加科学认识和临床相关性。关于第一个目标，我们样本中的所有9个MAs都严格遵守推荐的指南，并通过计算Cochran ' s Q, I, I, I来正式评估HT研究结果的变异性(异质性)²，或者在大多数情况下都是异质性统计。这尤其令人鼓舞，反映了一种与医疗保健领域的其他ma大体一致的良好做法[ 17]。然而，这些指标的局限性[ 64- 67， 70， 71以及围绕I的不确定性²可以用95%置信区间表示的点估计在任何纳入的ma中都没有被考虑。因此，在大多数情况下，关于试验之间的高温疗法效应不一致程度的坚定主张或推论比所允许的证据更有力。也许这种限制可以归因于这样一个事实，即在超过一半的ma中使用的Review Manager (RevMan)软件没有向用户提供计算I的置信区间的功能²。其他研究人员也强调了这一问题，并希望该软件的未来更新将使置信区间成为I的一个组成部分²异质性计算[ 73]。

该领域的未来MAs应继续使用统计数据来衡量观察到的效应的统计显著性和异质性的比例。然而，必须考虑到这些度量的局限性。与所有显著性检验一样，Q统计量也有同样的注意事项，在解释时应根据分析中纳入的HT研究的数量谨慎进行[ 70]。我的²是不精确的，因此，I²应始终谨慎报告和解释估算值，因为它们对于反映与实际异质性与观测效应总变异的估计比率有关的不确定性是有价值的[ 69]。当纳入MA的主要研究数量有限(例如，k<15)且研究内方差较大时，I²应谨慎解释估计，而任何关于观测到的高温效应的一致性的强烈陈述“应避免或适当缓和，无论结果如何”[ 70]。此外，当高温效应的大小变化很大时，如某些ma的某些结果(例如，[ 31， 38])，结果的差异应该成为MA讨论的主要焦点，而总结效应应该不那么重要，甚至根本不重要[ 74]。

固定效应与随机效应的选择

当结合来自各种HT研究的数据时，一个主要的难题是决定是进行固定效应还是随机效应的meta分析。这一决定尤其重要，因为模型的选择可能会影响对效应大小的估计，并最终影响对结果的解释[ 79， 90]。HT干预的固定效应MA是基于以下前提:纳入综述的所有研究在功能上是相同的，并且正在估计一个共同的(固定的)治疗效果[ 74， 91]。也就是说，没有真正的区别;所有可能影响观察到的效应大小的因素，如干预的性质(如技术的复杂程度、数据传输的频率、家访和教育支持)在所有研究中的功能都是相同的。因此，在结果中观察到的任何研究之间的差异(即统计异质性)只能归因于抽样误差。另一方面，随机效应MA的前提是，在纳入的HT研究中，观察到的治疗效果估计并不相同，但遵循一定的分布。也就是说，由于真正的差异(例如，干预的性质)以及抽样变异性(机会)，它们在不同的研究中有所不同。研究可能在参与者的混合(例如，严重程度的阶段)、质量或干预措施的实施等方面有所不同。因此，每项研究都在估计不同的潜在影响。因此，固定效应MA提供了对“一般”治疗效果的估计，而随机效应MA产生的汇总结果提供了对“平均”治疗效果的估计[ 74， 90]。同样值得注意的是，从统计学的角度来看，当研究间方差(统计异质性)为0%时，随机效应分析减少，与固定效应分析重合，无论如何都显示出相似的效果。然而，在存在研究间异质性的情况下，固定效应荟萃分析提供的汇总结果过于精确，置信区间比随机效应荟萃分析窄[ 90]。正如我们接下来要介绍的，这可能会导致总体效应的统计显著性水平虚假降低，并可能错误地暗示存在“共同”治疗效果，而实际上不同研究的治疗效果确实存在差异[ 79， 90]。

我们的评估结果显示，随机效应模型总结了不同研究的干预效应分布，具有更广阔的前景，似乎是HT干预中最可取的统计模型。事实上，从临床角度来看，固定效应模型的“一刀切”方法似乎很难证明是正确的。在大多数情况下，HT干预的参与者和背景特征在许多实际方面存在差异，这可能对结果产生影响[ 22]。在所有纳入的试验中，技术、患者、项目特征和偏倚风险等影响因素在功能上是相同或相等的，这是不可信的。在过去的15年中，传统疗法和常规疗法都发生了巨大的变化，这些时间变化可能影响了纳入试验的结果，导致更大的异质性。然而，2 ma对心力衰竭的影响[ 28， 31]应用了固定效应模型，尽管试验之间存在功能差异，并且存在中度(例如，I²>30%)到实质性(例如，1²>75%)观察到的效应存在统计学异质性。使用固定效应模型而不是随机效应模型影响了他们的结果，因为它产生了更紧密的置信区间和伪低水平的高温效应统计显著性。具体来说，在Cochrane综述中，使用固定效应模型对全因住院的效应估计显示， P= 0.02)，支持HT的患者减少9% (RR 0.91, 95% CI 0.84-0.99)。而随机效应模型产生了一个不显著的( P= 0.22)效应大小相同，置信区间更宽(RR 0.91, 95% CI 0.78-1.06)，平均反映了HT积极效应背后的不确定性。同样，在Clarke等人的MA中[ 28]，使用固定效应模型对死亡率的效应估计显示了显著的( P= 0.02)，使死亡率降低23% (RR 0.77, 95% CI 0.61-0.97)。然而，随机效应模型产生了更为保守和不显著的( P =0.30)效应大小平均为17%，置信区间更宽(RR 0.83, 95% CI 0.58-1.19)，再次反映了HT的潜在效应可能并不总是在所有患者和环境中都是积极的。考虑到这两个ma中包含的HT试验的临床和方法学差异，固定效应模型的使用似乎是违反直觉的，应该重新审视导致其选择的先验假设，特别是在检测到统计异质性之后[ 74]。未来HT干预的MAs应遵循方法学指南，并明确描述用于选择固定效应和随机效应meta分析的基本原理和标准。此外，当使用随机效应方法时，汇总结果应适当地解释为高温疗法干预的“平均”效果[ 90， 91]，就像在一个MAs中所做的那样[ 34在我们的样本中。

限制

如果我们将批判性综述方法应用于我们自己的综述，我们意识到在评估纳入的SRs和ma的方法学质量的过程中面临许多挑战，这些挑战可能反过来影响我们的研究结果。首先，我们的评估是在每次审查中明确或含蓄地报告的信息的基础上进行的。因此，在所有的方法学质量或偏倚风险评估中，评估者所做判断的准确性在很大程度上依赖于报告审查的充分性。有可能作者们进行了更严格的审查。然而，由于意识到期刊施加的篇幅限制，并且考虑到报告其综述的主要发现的竞争性要求，他们可能决定省略一些被认为是微妙的或不太重要的方法信息。也有可能是同行评议过程本身导致了文本的缩写，以满足篇幅限制。为缓解这一问题，对未来的综述的一个建议是在电子版中提供关于综述方案的基本细节，就像今天一些同行评议期刊的做法一样，以帮助理解所考虑的系统综述过程。另一方面，对发表科学技术领域的科学论文和硕士论文感兴趣的同行评议期刊应该腾出空间发表在线补充材料，并采用适当的机制，一旦发现错误或其他重要缺陷，就可以标记先前工作的问题并允许对其进行更正[ 24]。此外，科研团体必须准备好验证评审的结果，以便在必要时纠正它们，并且结果必须以有利于这一过程的方式发表[ 24]。我们进行了一项事后分析，发现在发表了纳入综述的16种期刊中，有10种(63%)允许发表在线附录，但只有3种提供了附录或补充文件。

其次，重要的是要注意，我们评估的结果仅限于符合方法部分中描述的纳入标准的综述。虽然我们的文献检索发现了一些“叙述性综述”，这些综述关注的是HT干预对各种慢性疾病患者的有效性，但当这些综述不被自我认定为系统性的或不具有SR或MA的基本特征时，它们被排除在我们的研究之外。正如R-AMSTAR仪器和我们的分析所反映的那样，这种严格的选择过程可能导致了对高温疗法评价方法质量的高估。同样被排除的还有几篇综述，这些综述对HT干预措施以及其他各种“远程监测”干预措施(例如，结构化电话支持和独立视频咨询)进行了全面和混合的概述，但在分析结果时没有明确区分它们。因此，我们的研究结果不能推广到将HT作为远程患者监测的许多其他多学科干预措施之一的综述中，尽管大多数人都同意，突出的方法缺陷具有重要的相关性，并且也适用于这些综述。

结论

本研究首次尝试评估HT干预的既往SRs和ma的整体质量。用于识别相关评论的搜索策略的全面性，与研究选择、数据提取和质量评估相关的重复过程，以及使用能够进行深入质量评估的有效工具，是本研究方法学合理性的关键指标。

在过去的十年中，在HT领域发表的SRs和ma的数量大幅增加，为广泛的卫生保健利益相关者提供了广泛的“大规模证据”基础，这些证据来自对HT对慢性疾病患者的临床、行为、结构和经济影响的多项初步研究的综合。然而，尽管已经发展了大量的知识，但付款人和护理提供者的广泛接受以及将HT作为一种有效的患者管理方法的整合仍然存在问题。这主要是因为现有的知识库仍然显示出一些重要的方法上的弱点和研究差距。

最重要的是，我们的关键评估显示，现有的SRs和ma的整体质量和严格性是高度可变的，随着时间的推移没有改善的迹象。大量的综述包含几个常见的方法缺陷，这些缺陷损害了它们的内部有效性，限制了它们在临床、教育、研究和政策目的方面的有用性。因此，关于HT对慢性疾病管理的有效性的一系列问题仍然没有答案，包括哪种是病例管理和远程监测的理想和最有效的组合，哪种行为改变技术和模式最有效，干预措施的有效性是否受到参与者人口统计和环境的影响，以及从经济角度来看HT是否是一种有效和可行的解决方案。因此，我们建议今后在这一领域的审查应严格遵守现有的方法准则，从而提高其总体严谨性及其报告方面。更准确地说，它们至少应包括以下要素:(1)明确陈述的研究问题，明确描述患者群体、干预措施、比较干预措施和结果;(2)全面而明确的搜索策略;(3)对初步研究的有效性进行正式评估(即偏倚风险评估)，并适当尝试探讨高偏倚风险的研究对HT估计效应的影响;(4)更严格的数据合成方法，对所使用的技术或统计数据进行透明的描述和证明。

总之，我们希望本研究能够通过帮助作者最大限度地减少各种偏倚风险和避免以前的方法缺陷，从而有助于提高远程医疗领域以及更广泛的远程医疗领域的sr和ma的整体质量。尽管如此，我们认为，在高温疗法领域建立更严格、更有力的证据需要研究人员、临床医生、资助者、期刊编辑和同行评议人员付出前所未有的努力。这些努力包括但不限于让具有临床和方法学专业知识的个人参与SRs和MAs的实施;对期刊发表的一般说明进行修订，其中包含具体指南或方法和报告建议的链接;在同行评议过程中，让具有社会责任报告和社会责任评估方法经验和知识的个人参与;采用允许更新或更正在线出版材料的机制，以解决出版后发现的重要缺陷甚至错误。

多媒体附录1

排除的物品清单。

多媒体附录2

R-AMSTAR对每次审查方法严谨性的评估。

多媒体附录3

心力衰竭患者家庭远程监护干预的系统综述和荟萃分析的引用分析。

缩写

年级

分级的建议，评估，发展和评价

家庭远程控制

妈

荟萃分析

皮科

人口，干预，比较，结果

棱镜

系统评价和荟萃分析的首选报告项目

QUOROM

荟萃分析报告的质量

R-AMSTAR

对多个系统评价的修订评价

个随机对照试验

随机对照试验

老

系统综述

感谢加拿大研究主席计划为本研究提供资金支持。

没有宣布。

世界卫生组织

2010年全球非传染性疾病现状报告:描述非传染性疾病的全球负担、风险因素和决定因素 2011

瑞士日内瓦

世界卫生组织

1 176

源泉>

Loncar

2002年至2030年全球死亡率和疾病负担预测

科学硕士 2006 11 3. 11 e442

10.1371 / journal.pmed.0030442

17132052

06 - plme ra - 0071 r2

PMC1664601

肖

我

Sicree

类风湿性关节炎

Zimmet

2010年和2030年全球糖尿病患病率估计数

糖尿病治疗临床实践 2010 01 87 1 4 14

10.1016 / j.diabres.2009.10.007

19896746

s0168 - 8227 (09) 00432 - x

Meystre

年代

远程监控的现状:文献评论

打电话给J E Health 2005 02 11 1 63 9

10.1089 / tmj.2005.11.63

15785222

削减

Poba-Nzaou

Sicotte

家庭远程监测慢性病管理:经济评估

国际技术评估卫生保健 2013 04 29 2 155 61

10.1017 / S0266462313000111

23514722

S0266462313000111

安加

克勒

亚伯拉罕

心力衰竭患者的远程医疗和远程管理

《柳叶刀》 2011 08 20. 378 9792 731 9

10.1016 / s0140 - 6736 (11) 61229 - 4

21856487

s0140 - 6736 (11) 61229 - 4

Roine

Ohinmaa

一个

Hailey

评估远程医疗:文献的系统回顾

医疗协会 2001 09 18 165 6 765 71

11584564

PMC81454

简

格芬

米

戈登

加拿大健康信息网委托进行的一项研究 2013-07-11 远程医疗福利和采用——将加拿大各地的人们和提供者联系起来 https://www.infoway-inforoute.ca/index.php/component/docman/doc_download/188-avantages-et-adoption-de-la-telesante-rapport-complet

6 i280zh4k

Stroetmann

卡

Artmann

Stroetmann

最后的欧洲进度报告:欧洲委员会信息社会和媒体总局，信息和通信技术保健股 2013-07-11 欧洲国家正在建设国家电子卫生基础设施 http://www.ehealth-strategies.eu/report/eHealth_Strategies_Final_Report_Web.pdf

6 i28v9qh1

市长

一个

瑞安

Kobb

福斯特

Edmonson

韦克菲尔德

兰开斯特

护理协调/家庭远程医疗:系统地实施卫生信息学、家庭远程医疗和疾病管理，以支持慢性病退伍军人患者的护理

打电话给J E Health 2008 12 14 10 1118 26

10.1089 / tmj.2008.0021

19119835

卡特赖特

米

Hirani

Rixon

Beynon

米

娃娃

鲍尔

巴德斯利

米

Steventon这个

一个

克纳普

米

亨德森

罗杰斯

一个

桑德斯

菲茨帕特里克

巴洛

纽曼

整个系统验证评估团队

远程医疗对12个月以上生活质量和心理结果的影响(全系统演示者远程医疗问卷研究):一项实用的集群随机对照试验中患者报告结果的嵌套研究

BMJ 2013 346 f653

23444424

PMC3582704

帕尔默

米

史蒂芬

Iakovidis

我

乔治•

欧洲委员会的观点:远程医疗有利于病人。慢性病管理和远程患者监测

卫生保健系统和社会，欧洲卫生 2009 15 1 13 15

欧洲委员会

远程医疗造福患者、卫生保健系统和社会 2008

2013-07-11

http://eur-lex.europa.eu/LexUriServ/LexUriServ.do?uri=COM:2008:0689:FIN:EN:PDF

6 i28mwsnd

烹饪

Mulrow

海恩斯

系统评价:为临床决策综合最佳证据

Ann实习医生 1997 03 1 126 5 376 80

9054282

Mulrow

系统评价的基本原理

BMJ 1994 09 3. 309 6954 597 9

8086953

PMC2541393

Liberati

一个

奥特曼

Tetzlaff

Mulrow

Gøtzsche

个人电脑

埃尼迪斯

摩根大通

克拉克

米

审视中国

Kleijnen

莫赫

关于报告评价卫生保健干预措施的研究的系统审查和荟萃分析的PRISMA声明:解释和阐述

科学硕士 2009 07 21 6 7 e1000100

10.1371 / journal.pmed.1000100

19621070

PMC2707010

莫赫

Tetzlaff

Tricco

交流

桑普森

米

奥特曼

系统评价的流行病学和报告特点

科学硕士 2007 03 27 4 3. e78

10.1371 / journal.pmed.0040078

17388659

06 - plme - ra - 0453 - r3

PMC1831728

Jadad

基于“增大化现实”技术

莫赫

米

Browman

全科医生

布克

Sigouin

富恩特斯

米

史蒂文斯

哮喘治疗的系统评价和荟萃分析:关键评价

BMJ 2000 02 26 320 7234 537 40

10688558

PMC27295

Papageorgiou

帕帕多普洛斯

妈

Athanasiou

正畸学系统评价的方法学和质量特征评价

颅面矫正术 2011 08 14 3. 116 37

10.1111 / j.1601-6343.2011.01522.x

21771267

20.

凯利

特拉弗斯

一个

Dorgan

米

斯莱特

罗

黑洞

评估急诊医学文献系统综述的质量

Ann emerging Med 2001 11 38 5 518 26

10.1067 / mem.2001.115881

11679863

s0196 - 0644 (01) 50890 - 2

麦克唐纳

坎菲尔德

Fesperman

科幻小说

达姆

1998 - 2008年泌尿科文献发表的系统评价的方法学质量评价

J Urol 2010 08 184 2 648 53

10.1016 / j.juro.2010.03.127

20639030

s0022 - 5347 (10) 03254 - 4

Gurne

Conraads

Missault

马伦

Vachierys

莱托

范Mieghem

Droogne

Pouleur

交流

Troisfontaine

Huez

年代

Nellessens

Peperstraete

Blouardo

Vanhaecke

Raes

比利时心力衰竭工作组

心衰远程监护研究综述

Acta心功能杂志 2012 08 67 4 439 44

22997998

卡萨斯

摩根大通

邝

易卜拉欣博士

年代

慢性心力衰竭的远程监测:尚未准备好进入黄金时段

Cochrane数据库系统 2011 2011 ED000008

10.1002/14651858. ed000008

21833931

森

夸大证据:荟萃分析中的重复计算及相关问题

BMC医学研究方法 2009 9 10

10.1186 / 1471-2288-9-10

19216779

1471-2288-9-10

PMC2653069

绿色

年代

希金斯

JPT

Alderson

克拉克

米

Mulrow

奥克斯曼

希金斯

摩根大通

绿色

年代

介绍

Cochrane干预措施系统评价手册 2008

新泽西

约翰威利父子有限公司

1 9

乔杜里

如果

菲利普斯

有限公司

斯图尔特

党卫军

里格尔

Mattera

晶澳

Jerant

房颤

Krumholz

嗯

慢性心力衰竭患者的远程监护:一项系统综述

J卡失败 2007 02 13 1 56 62

10.1016 / j.cardfail.2006.09.001

17339004

s1071 - 9164 (06) 01173 - 0

PMC1910700

克拉克

类风湿性关节炎

英格利斯

去

足总

克莱兰德

詹

斯图尔特

年代

慢性心力衰竭患者的远程监控或结构化电话支持方案:系统回顾和荟萃分析

BMJ 2007 05 5 334 7600 942

10.1136 / bmj.39156.536968.55

17426062

bmj.39156.536968.55

PMC1865411

克拉克

米

沙阿

一个

沙玛

对充血性心力衰竭患者远程监护研究的系统回顾:一项荟萃分析

J电信公司 2011 17 1 7 14

10.1258 / jtt.2010.100113

21097564

jtt.2010.100113

见鬼

年代

Dimmick

年代

Kelkar

评估老年心力衰竭患者使用家庭远程医疗远程监测的证据基础

打电话给J E Health 2009 10 15 8 783 96

10.1089 / tmj.2009.0028

19831704

30.

Giamouzis

Mastrogiannis

Koutrakis

Karayannis

帕里

Rountas

Adreanides

Dafoulas

通用电气

Stafylas

个人电脑

Skoularigis

贾科梅利

年代

将

Triposkiadis

远程监护在慢性心力衰竭中的应用:系统综述

Cardiol Res practice 2012 2012 410820

10.1155 / 2012/410820

22720184

PMC3375160

英格利斯

克拉克

类风湿性关节炎

去

足总

球

Lewinter

Cullington

斯图尔特

年代

克莱兰德

詹

慢性心力衰竭患者的结构化电话支持或远程监测方案

Cochrane数据库系统 2010 8 CD007228

10.1002/14651858. cd007228.pub2

20687083

路易

特纳

车载信息

米

Baksh

一个

克莱兰德

JGF

远程监护治疗心力衰竭的系统综述

心脏衰竭 2003 10 5 5 583 90

14607195

S1388984203001600

很

Kaan

一个

Ignaszewski

一个

李尔王

心衰远程监护技术的系统综述

心脏衰竭 2009 05 11 5 506 17

10.1093 / eurjhf / hfp036

19332417

hfp036

Polisena

Tran

西门

赫顿

麦吉尔

年代

帕尔默

斯科特

再保险

充血性心力衰竭的家庭远程监测:系统回顾和荟萃分析

J电信公司 2010 16 2 68 76

10.1258 / jtt.2009.090406

20008054

jtt.2009.090406

濑户

心衰远程监护与常规护理的成本比较:系统综述

打电话给J E Health 2008 09 14 7 679 86

10.1089 / tmj.2007.0114

18817497

AbuDagga

一个

雷斯尼克

他

Alwan

米

血压远程监测对高血压预后的影响:文献综述

打电话给J E Health 2010 09 16 7 830 8

10.1089 / tmj.2010.0015

20815751

Jaana

米

削减

Sicotte

高血压家庭远程监测:目前的证据和对未来研究的建议

疾病管理与健康结果 2007 15 1 19 31

Omboni

年代

Guarda

一个

家庭血压远程监测和血压控制的影响:随机对照研究的荟萃分析

我是Hypertens 2011 09 24 9 989 98

10.1038 / ajh.2011.100

21654858

ajh2011100

Verberk

·凯塞尔

AG)

梭

远程医疗是高血压管理的一项有价值的工具，是一项系统回顾和荟萃分析

血压监测仪 2011 06 16 3. 149 55

10.1097 / MBP.0b013e328346e092

21527847

博尔顿

水域

皮尔斯

年代

埃尔温

EPSRC和MRC大挑战团队

益处证据不足:COPD家庭远程监测系统综述

J评估临床实践 2011 12 17 6 1216 22

10.1111 / j.1365-2753.2010.01536.x

20846317

考克斯

艾莉森

晶澳

Rasekaba

荷兰

囊性纤维化的远程医疗:系统综述

J电信公司 2012 03 18 2 72 8

10.1258 / jtt.2011.110705

22198961

jtt.2011.110705

Franek

慢性阻塞性肺疾病(COPD)患者的家庭远程保健:基于证据的分析

卫生技术评估师 2012 12 11 1 58

23074421

PMC3384362

Jaana

米

削减

Sicotte

呼吸系统疾病的家庭远程监测:系统综述

我管理得很好吗 2009 05 15 5 313 20.

19435399

11123

农民

一个

吉布森

橙汁

Tarassenko

尼尔。

一个

远程医疗干预支持糖尿病患者血糖自我监测的系统综述

Diabet地中海 2005 10 22 10 1372 8

10.1111 / j.1464-5491.2005.01627.x

16176199

DME1627

Jaana

米

削减

糖尿病患者的家庭远程监护:观察效果的系统评估

J评估临床实践 2007 04 13 2 242 53

10.1111 / j.1365-2753.2006.00686.x

17378871

JEP686

医疗咨询秘书处

2型糖尿病家庭远程监护:基于证据的分析

卫生技术评估师 2009 9 24 1 38

23074529

PMC3377533

Montori

虚拟机

Helgemoe

Guyatt

“大酒店”

迪安

梁

太瓦

史密斯

·库

远程医疗对1型糖尿病和血糖控制不足的患者:一项随机对照试验和荟萃分析

糖尿病护理 2004 05 27 5 1088 94

15111526

削减

Moqadem

Pineau

St-Hilaire

家庭远程监护在糖尿病、哮喘、心力衰竭和高血压患者中的临床效果:系统综述

J Med Internet Res 2010 12 2 e21

10.2196 / jmir.1357

20554500

v12i2e21

PMC2956232

削减

Jaana

米

Sicotte

慢性病家庭远程监测的系统评价:证据基础

美国医学信息协会 2007 14 3. 269 77

10.1197 / jamia.M2270

17329725

M2270

PMC2244878

英格利斯

克拉克

类风湿性关节炎

去

足总

斯图尔特

年代

克莱兰德

詹

心力衰竭规划的哪些组成部分是有效的?对8323例慢性心力衰竭患者进行结构化电话支持或远程监护作为主要治疗手段的系统回顾和荟萃分析:Cochrane综述摘要

心脏衰竭 2011 09 13 9 1028 40

10.1093 / eurjhf / hfr039

21733889

hfr039

龚

Chiappelli

Cajulis

面向对象

Avezova

Kossan

咀嚼

Maida

从系统评价到循证卫生保健的临床建议:临床相关性分级的多系统评价修订评估(R-AMSTAR)的验证

开口凹痕J 2010 4 84 91

21088686

PMC2948145

莫赫

Liberati

一个

Tetzlaff

奥特曼

棱镜组

系统评价和元分析的首选报告项目:PRISMA声明

科学硕士 2009 07 21 6 7 e1000097

10.1371 / journal.pmed.1000097

19621072

PMC2707599

怀特洛克

林

周

Shekelle

罗宾逊

卡

在复杂的系统评审中使用现有的系统评审

Ann实习医生 2008 05 20. 148 10 776 82

10.7326 / 0003-4819-148-10-200805200-00010

18490690

148/10/776

Dar

莱利

查普曼

Dubrey

西南

莫里斯

年代

罗森

Roughton

米

考伊

先生

伦敦西北部典型老年心力衰竭人群家庭远程监护的随机试验:家庭hf研究的结果

心脏衰竭 2009 03 11 3. 319 25

10.1093 / eurjhf / hfn050

19174529

hfn050

PMC2645059

阿特金斯

最好的

布里斯

巴勒斯坦权力机构

埃克尔斯

米

Falck-Ytter

Flottorp

年代

Guyatt

“大酒店”

港口

泛滥平原

亨利

山

年代

Jaeschke

愣

Liberati

一个

Magrini

梅森

米德尔顿

Mrukowicz

奥康奈尔

奥克斯曼

菲利普斯

Schunemann

沪江

Edejer

Varonen

这次访问

通用电气

威廉姆斯

Zaza公司

年代

职系工作小组

分级证据的质量和建议的力度

BMJ 2004 06 19 328 7454 1490

10.1136 / bmj.328.7454.1490

15205295

328/7454/1490

PMC428525

尤尼

奥特曼

症

米

卫生保健中的系统评价:评价对照临床试验的质量

BMJ 2001 07 7 323 7303 42 6

10.1136 / bmj.323.7303.42

11440947

PMC1120670

审查和传播中心

对有效性研究进行系统评价 2001

纽约

约克大学

希金斯

JPT

奥特曼

希金斯

摩根大通

绿色

年代

评估纳入研究的偏倚风险

Cochrane干预措施系统评价手册 2008

新泽西

约翰威利父子有限公司

187 241

波动

上海

黑色的

为评估卫生保健干预措施的随机和非随机研究的方法学质量创建清单的可行性

[J]流行病与社区卫生 1998 06 52 6 377 84

9764259

PMC1756728

Jadad

基于“增大化现实”技术

摩尔

类风湿性关节炎

卡罗尔

詹金森

雷诺兹

Gavaghan

人尽其才

沪江

评估随机临床试验报告的质量:是否有必要采用盲法?

对照临床试验 1996 2 17 1 1 12

10.1016 / 0197 - 2456 (95) 00134 - 4

8721797

0197 - 2456 (95) 00134 - 4

Hailey

Ohinmaa

一个

Roine

最近远程医疗评估的研究质量和效益证据

J电信公司 2004 10 6 318 24

10.1258 / 1357633042602053

15603628

Jovell

Navarro-Rubio

医学博士

科学证据的评价

医学临床(Barc) 1995 12 2 105 19 740 3.

8523956

埃尼迪斯

摩根大通

Patsopoulos

Rothstein

人力资源

避免在森林地块中进行meta分析的原因或借口

BMJ 2008 06 21 336 7658 1413 5

10.1136 / bmj.a117

18566080

336/7658/1413

PMC2432114

Huedo-Medina

结核病

Sanchez-Meca

Marin-Martinez

Botella

评估meta分析的异质性:Q统计量还是I2指数?

Psychol方法 2006 06 11 2 193 206

10.1037 / 1082 - 989 x.11.2.193

16784338

2006-07641-005

洛克

施瓦彻尔

卡彭特

小

舒马赫

米

在评估异质性时过度依赖I(2)可能会产生误导

BMC医学研究方法 2008 8 79

10.1186 / 1471-2288-8-79

19036172

1471-2288-8-79

PMC2648991

希金斯

摩根大通

汤普森

在荟萃分析中量化异质性

地中海统计 2002 06 15 21 11 1539 58

10.1002 / sim.1186

12111919

希金斯

摩根大通

汤普森

Deeks

奥特曼

测量荟萃分析中的不一致性

BMJ 2003 09 6 327 7414 557 60

10.1136 / bmj.327.7414.557

12958120

327/7414/557

PMC192859

Deeks

希金斯

奥特曼

希金斯

摩根大通

绿色

年代

分析数据并进行Meta分析

Cochrane干预措施系统评价手册 2008

新泽西

约翰威利父子有限公司

243 296

埃尼迪斯

摩根大通

Patsopoulos

Evangelou

荟萃分析中异质性估计的不确定性

BMJ 2007 11 3. 335 7626 914 6

10.1136 / bmj.39343.408449.80

17974687

335/7626/914

PMC2048840

埃尼迪斯

摩根大通

meta分析中异质性和偏倚检验的解释

J评估临床实践 2008 10 14 5 951 7

10.1111 / j.1365-2753.2008.00986.x

19018930

JEP986

埃尼迪斯

摩根大通

Patsopoulos

Evangelou

荟萃分析中异质性估计的不确定性

BMJ 2007 11 3. 335 7626 914 6

10.1136 / bmj.39343.408449.80

17974687

335/7626/914

PMC2048840

HETEROGI: meta分析中量化异质性的Stata模块[计算机程序] 2005

2013-07-16

2006年1月25日修订

统计软件组件S449201，波士顿学院经济系

http://econpapers.repec.org/software/bocbocode/s449201.htm

6 ia5ramkq

Thorlund

Imberger

约翰斯顿

公元前

沃尔什

米

阿瓦德

撒贝恩

Gluud

审视中国

Wetterslev

大型荟萃分析中异质性(I2)估计及其95%置信区间的演变

《公共科学图书馆•综合》 2012 7 7 e39471

10.1371 / journal.pone.0039471

22848355

玉米饼- d - 12 - 03154

PMC3405079

伯伦斯坦

米

篱笆

希金斯

Rothstein

元分析简介 2009

新泽西州霍博肯,

约翰威利父子公司

奥尔蒂斯·德·几内亚

一个

韦伯斯特

斯台普斯

虚拟对团队运作影响的元分析

信息与管理 2012 10 49 6 301 308

10.1016 / j.im.2012.08.003

绿色

烹饪

拉斯顿

菲什曼

巴勒斯坦权力机构

卡茨

卡尔森

卡雷尔

Tyll

拉森

海尔哥哥

汤普森

家庭血压监测、网络沟通和药剂师护理对高血压控制的有效性:一项随机对照试验

《美国医学会杂志》 2008 06 25 299 24 2857 67

10.1001 / jama.299.24.2857

18577730

299/24/2857

PMC2715866

Terrin

施密德

刘

在漏斗图的实证评估中，研究人员无法直观地识别发表偏倚

临床流行病学杂志 2005 09 58 9 894 901

10.1016 / j.jclinepi.2005.01.006

16085192

s0895 - 4356 (05) 00082 - x

刘

埃尼迪斯

摩根大通

Terrin

施密德

Olkin

我

误导漏斗图的案例

BMJ 2006 09 16 333 7568 597 600

10.1136 / bmj.333.7568.597

16974018

333/7568/597

PMC1570006

Kavvoura

颗

埃尼迪斯

摩根大通

遗传关联研究中的荟萃分析方法:对其潜力和缺陷的回顾

哼麝猫 2008 02 123 1 1 14

10.1007 / s00439 - 007 - 0445 - 9

18026754

崔

Halpern

上海

马利克

Jadad

基于“增大化现实”技术

有轨电车

先生

困境

检查麻醉文献中的证据:对系统评价的批判性评价

Anesth Analg 2001 03 92 3. 700 9

11226105

科克伦协作组

希金斯

摩根大通

绿色

年代

Cochrane干预措施系统评价手册 2008

英国奇切斯特

约翰威利父子有限公司

症

米

Zellweger-Zahner

施耐德

米

破车

Lengeler

在什么

用英语和德语发表的随机对照试验中的语言偏差

《柳叶刀》 1997 08 2 350 9074 326 9

10.1016 / s0140 - 6736 (97) 02419 - 7

9251637

s0140 - 6736 (97) 02419 - 7

格雷戈勒

戴德里安

勒洛里

选择纳入meta分析的出版物的语言:是否存在巴别塔偏见?

临床流行病学杂志 1995 1 48 1 159 163

10.1016 / 0895 - 4356 (94) 00098 - b

7853041

0895 - 4356 (94) 00098 - b

症

米

尤尼

巴特利特

Holenstein

Sterne

在系统评价中，综合文献检索和试验质量评估有多重要?实证研究

卫生技术评估 2003 7 1 1 76

12583822

莫赫

范教授

琼斯

一个

烹饪

Jadad

基于“增大化现实”技术

莫赫

米

特格韦尔

克拉森

随机试验报告的质量是否会影响meta分析中报告的干预效果评估?

《柳叶刀》 1998 08 22 352 9128 609 13

10.1016 / s0140 - 6736 (98) 01085 - x

9746022

s0140 - 6736 (98) 01085 - x

舒尔茨

查尔默斯

我

海斯

奥特曼

偏见的经验证据。对照试验中与治疗效果估计相关的方法学质量维度

《美国医学会杂志》 1995 02 1 273 5 408 12

7823387

Popay

罗伯茨

Sowden

一个

Petticrew

米

时候

罗杰斯

米

布里顿

系统评价中叙事综合的指导。来自ESRC方法程序版本1的产品 2006

http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.178.3100&rep=rep1&type=pdf

罗杰斯

米

Sowden

一个

Petticrew

米

时候

罗伯茨

布里顿

Popay

在系统评价中进行叙述综合的测试方法指南:促进烟雾报警器所有权和功能的干预措施的有效性

评价 2009 01 01 15 1 49 73

10.1177 / 1356389008097871

时候

布里顿

Popay

罗伯茨

Petticrew

米

罗杰斯

米

Sowden

一个

检验叙述综合方法的发展:对实施烟雾警报器干预措施的研究的示范审查

证据与政策:研究、辩论与实践期刊 2007 08 01 3. 3. 361 383

10.1332 / 174426407781738029

莱利

理查德·道金斯

希金斯

摩根大通

Deeks

随机效应meta分析的解释

BMJ 2011 342 d549

21310794

莱利

理查德·道金斯

盖茨

年代

尼尔森

Alfirevic

在Cochrane妊娠和分娩回顾中，统计方法可以得到改进

临床流行病学杂志 2011 06 64 6 608 18

10.1016 / j.jclinepi.2010.08.002

21109399

s0895 - 4356 (10) 00284 - 2