这是一篇在知识共享署名许可(http://creativecommons.org/licenses/by/2.0/)下发布的开放获取文章,该许可允许在任何媒介上不受限制地使用、分发和复制,前提是原始作品首次发表在《医学互联网研究杂志》上,并适当引用。必须包括完整的书目信息,到//www.mybigtv.com/上原始出版物的链接,以及版权和许可信息。
在过去十年中,对慢性病患者家庭远程监测干预的系统评价和荟萃分析有所增加,对临床医生、政策制定者和其他卫生保健利益相关者越来越重要。虽然最近出现了对其方法严谨性和综合方法的一些批评,但尚未对其质量进行正式评估。
这篇重要综述的主要目的是评估先前研究慢性病背景下家庭远程监测干预效果的综述的方法、质量和报告特点。
以电子方式检索Cochrane图书馆的Ovid MEDLINE、效果评价摘要数据库(DARE)和卫生技术评估数据库(HTA),以查找1966年1月至2012年12月间发表的相关系统评价。潜在的评价由三名评论者独立筛选和评估。从每个纳入的综述中提取与所用方法有关的数据,并由两名审稿人检查其准确性。一个经过验证的质量评估工具R-AMSTAR被用作指导评估过程的框架。
24篇评论,其中9篇是荟萃分析,从200多次引用中确定。文献检索显示,近年来在这一领域发表的综述数量大幅增加,尽管大多数综述集中于研究家庭远程监护对充血性心力衰竭患者的影响,但研究者的兴趣也扩展到其他慢性疾病,如糖尿病、高血压、慢性阻塞性肺病和哮喘。然而,由于内在的方法问题,这些评论中有很多似乎缺乏最佳的科学严谨性。此外,评论的总体质量似乎并没有随着时间的推移而提高。虽然所有或几乎所有评价都满意地满足了若干标准,例如建立包含和排除标准的先验设计,在多个数据库中使用电子搜索,以及报告研究特征,但还有其他重要领域需要改进。重复数据提取、人工搜索高度相关的期刊、纳入灰色和非英语文献、评估纳入研究的方法学质量和证据质量是很少执行的关键方法学程序。此外,在综合研究结果时发现的某些方法上的局限性影响了一些综述的结果和结论。
尽管现有的方法指南可用于指导系统评价和荟萃分析的正确实施,并消除潜在的偏见风险,但这些知识尚未完全整合到家庭远程监测领域。应进一步努力改进该领域系统评价和荟萃分析的设计、实施、报告和出版。
糖尿病、心血管疾病和呼吸系统疾病等慢性病的流行继续对几乎所有卫生保健系统构成重大和长期的挑战,要求在病人护理的管理和提供方面进行根本变革[
多年来,在欧洲、加拿大、澳大利亚、美国和世界其他地区的国家电子卫生战略的背景下,已经进行了许多努力和研究举措,以检验HT作为一种潜在的节省成本的方法对慢性病患者的有效性(例如,[
系统评价(SRs)和荟萃分析(MAs)是强大的研究工具,已经建立在健康科学领域,最近在医学信息学领域,作为循证实践的基石[
然而,SRs和ma的质量和内部效度取决于与审查行为有关的许多方面以及选择纳入的实证研究的质量。文献检索、选择、评估和证据合成方法的缺陷和不足可能导致无效的结论,对患者护理和决策者有重大影响。因此,研究人员提出并采用了评估工具,以便在几个临床领域(例如,[
在过去十年中,关注慢性疾病患者HT干预的综述有所增加。虽然最近出现了一些对其方法严谨性和方法的批评(例如,[
所有的纳入和排除标准都是先验定义的。根据研究选择标准(研究类型、患者、干预措施和结果)对检索中确定的引文进行资格评估。
只有在同行评议期刊或Cochrane图书馆发表的考虑HT影响的既往SRs和ma才有资格纳入。在筛选过程中,为了确定一篇已发表的文章是否符合这些综述类型,我们依据Cochrane Collaboration [
为了符合纳入标准,综述必须调查HT干预对患有以下慢性疾病之一的患者的有效性:充血性心力衰竭、高血压、糖尿病或呼吸系统疾病。他们还必须包括初步(经验性)研究,这些研究涉及患者使用信息和通信技术,以便从患者住所向医疗保健服务中心的临床医生(如护士、医生或专职卫生专业人员)及时传输和远程监测生命体征(如动脉血压、心率)、生物特征和疾病相关数据(如血糖水平、症状、药物使用)。将HT与其他独立的多学科远程患者监测干预(如结构化电话支持、远程诊断或远程咨询)的效果进行调查和综合(即不作区分)的sr排除在外。
只有综合并呈现了HT的临床、结构(如服务的利用)、行为(如对患者行为的影响)或经济效应的主要或次要结果,才纳入先前的综述。侧重于其他方面,如高温疗法的技术可行性的审查被排除在外。
我们对Cochrane图书馆的Ovid MEDLINE、效果评价摘要数据库(DARE)和卫生技术评估数据库(HTA)(从1966年到2012年12月)进行了文献检索,以确定所有相关的评价。在Cochrane图书馆,我们使用四个关键词(远程监控,远程医疗,远程医疗,远程家庭护理)进行了搜索。在Ovid MEDLINE上,我们将相同的关键词与以下每个术语结合使用:系统综述、元分析和综述。任何搜索都不受语言限制。
如图所示
一位审稿人(SK)通过使用为本研究目的而开发的电子提取表格,以非盲的方式从每份综述中提取明确的细节。所有提取的数据均由2位审稿人(GP和MJ)检查其准确性,任何分歧均通过共识进行调解。所寻求的信息包括与综述特征有关的一般细节(例如,作者人数、通讯作者来源、出版年份、期刊特征、资金来源)以及关于综合现有证据方法的使用和解释的更具体细节(例如,元分析和定性技术)。
24篇综述的方法学质量由2位审稿人(SK和GP)使用修订的多系统评价评估(R-AMSTAR)工具以非盲法格式独立评估[
描述SRs和MAs选择过程的流程图。
如图所示
除了3篇评论外,所有评论都发表在同行评议的期刊上。三个最常见的来源是
大多数评论是由2个或更多的作者进行的,只有2个[
纳入综述的方法学质量结果见
每年发表的HT系统综述和荟萃分析的数量。
评审简介。
慢性疾病 | 参考 | 一年 | 检讨类型 | 城市数量一个 | 期覆盖 | 纳入研究总数(rct数)d) |
|
|
|
|
|
|
|
|
乔杜里等人[ |
2007 | 老b | 94 | 1966 - 2006 | 9 (9) |
|
Clark等[ |
2007 | 妈c | 323 | 2002 - 2006 | 5 (5) |
|
Clarke等[ |
2011 | 妈 | 23 | 1969 - 2009 | 13 (13) |
|
Dang等[ |
2009 | 老 | 30. | 1966 - 2009 | 9 (9) |
|
Giamouzis等[ |
2012 | 老 | 4 | 2001 - 2011 | 12 (12) |
|
英格利斯等[ |
2010 | 妈 | 173 | 2006 - 2008 | 14 (14) |
|
Louis等[ |
2003 | 老 | 199 | 1966 - 2002 | 24日(6) |
|
Maric等[ |
2009 | 老 | 53 | 截至2007年 | 41 (12) |
|
Polisena等[ |
2010 | 妈 | 50 | 1998 - 2008 | 21 (11) |
|
濑户( |
2008 | 老 | 48 | 截至2007年 | 8 (4) |
|
|
|
|
|
|
|
|
AbuDagga等[ |
2010 | 老 | 18 | 1995 - 2009 | 15 (10) |
|
Jaana等[ |
2007 | 老 | 13 | 1966 - 2006 | 14 (3) |
|
Omboni等[ |
2011 | 妈 | 7 | 直到2010年 | 12 (12) |
|
Verberk等[ |
2011 | 妈 | 6 | 没有报告 | 9 (9) |
|
|
|
|
|
|
|
|
Bolton等[ |
2011 | 老 | 16 | 1990 - 2009 | 6 (2) |
|
Cox等[ |
2012 | 老 | 1 | 1998 - 2011 | 8 (1) |
|
Franek等[ |
2012 | 老 | 4 | 2000 - 2010 | 5 (3) |
|
Jaana等[ |
2009 | 老 | 49 | 1966 - 2007 | 14 (3) |
|
|
|
|
|
|
|
|
Farmer等[ |
2005 | 妈 | 127 | 1966 - 2004 | 26日(16) |
|
Jaana等[ |
2007 | 老 | 70 | 没有报告 | 17 (11) |
|
MAS ( |
2009 | 妈 | - | 2007 - 2009 | 8 (8) |
|
Montori等[ |
2004 | 妈 | 120 | 1982 - 2003 | 8 (8) |
|
|
|
|
|
||
|
parparet al [ |
2010 | 老 | 44 | 1966 - 2008 | 大厨:17 (13);高血压:13 (5);哮喘:8 (6);糖尿病:24 (21) |
|
parparet al [ |
2007 | 老 | 274 | 1990 - 2006 | 大厨:16 (7);高血压:14 (3);呼吸疾病:18 (4);糖尿病:17 (12) |
一个根据
bSR:叙述性/定性的系统评价。
c马:荟萃分析。
d随机对照试验。
满意地满足每个R-AMSTAR标准的审查的百分比。
标准 | 描述 | 是的,% |
1.问 | 研究的设计是在进行评价之前确定的(即先验设计)。 | One hundred. |
问1. b | 有一个关于纳入标准的声明。 | One hundred. |
问1.摄氏度 | 有一个PICO研究问题/声明。 | 67 |
2.问 | 至少有2个独立的数据提取器,如声明或暗示。 | 42 |
问2. b | 有一项声明承认或认识到协商一致处理分歧的程序。 | 46 |
问2.摄氏度 | 提取者之间的分歧得到了适当的解决,如声明或暗示。 | 38 |
3.问 | 检索至少2个电子来源(如Medline和EMBASE)。 | 96 |
问3. b | 该报告包括年份和检索的数据库。 | 92 |
问3.摄氏度 | 说明关键词和/或MESH术语。 | 92 |
问3. d | 除了电子数据库(PubMed, EMBASE, Medline)之外,检索还通过查阅当前的内容,如评论、教科书、专业注册表或特定研究领域的专家,或通过审查所发现的研究中的参考文献来补充。 | 79 |
问3. e | 对期刊进行“手动搜索”或“手动搜索”(即,识别高度相关的期刊,并对其全部内容进行手动逐页搜索,以寻找潜在的合格研究)。 | 13 |
4.问 | 作者们表示,他们搜索的报告与出版物类型无关。 | 8 |
问4. b | 作者声明他们是否排除了任何报告(从系统评价中),基于他们的出版状态,语言等。 | 83 |
问4.摄氏度 | “非英语”论文被翻译。 | 4 |
问4. d | 没有语言限制,也不承认非英语冠词。 | 21 |
5.问 | 提供了纳入研究的表格/列表/或图表;参考书目是不够的。 | 92 |
问5. b | 被排除研究的表格/列表/图表在文章中或补充来源(即在线)中提供。(被排除的研究是指那些根据标题和/或摘要认真考虑,但在阅读正文后被拒绝的研究。) | 25 |
问5.摄氏度 | 作者令人满意地/充分地陈述了排除认真考虑的研究的原因。 | 63 |
问5. d | 读者能够追溯包括和排除的研究在任何地方的文章参考书目,参考,或补充来源。 | 25 |
6.问 | 纳入研究的特征以汇总形式(如表格)提供,原始研究的数据提供了参与者、干预措施和结果。 | 88 |
问6. b | 作者提供了所分析研究中相关特征的范围(例如,年龄、种族、性别、相关社会经济数据、疾病状况、持续时间、严重程度或报告的其他疾病)。 | 83 |
问6.摄氏度 | 所提供的信息似乎是完整和准确的(即,这里有一个可以容忍的主观性范围)。读者是否感到疑惑?如果是,说明需要的信息和理由)。 | 88 |
7.问 | 提供了一种先验的评估方法(例如,对于有效性研究,如果作者选择仅包括随机、双盲、安慰剂对照研究或分配隐藏作为纳入标准);对于其他类型的研究,替代项目将是相关的。 | 38 |
问7. b | 纳入研究的科学质量似乎是有意义的(即使用高、低或a、B、C等量表)。 | 33 |
问7.摄氏度 | 讨论/承认/意识到证据的水平 | 21 |
问7. d | 证据质量根据特征工具进行评级/排名(特征工具是一种创建的工具,用于对证据水平进行排名,例如GRADE)。 | 21 |
8.问 | 在分析和SR的结论中考虑了方法严谨性和科学质量的结果。 | 25 |
问8. b | 在制定建议时,明确说明了方法严谨性和科学质量的结果。 | 25 |
问8.摄氏度 | 将结论整合/推动临床共识声明。 | N/A |
问8. d | 这一临床共识声明推动了临床实践指南的修订或确认。 | N/A |
9.问 | 作者提供了一份标准声明,用于决定所分析的研究是否足够相似,可以合并。 | 0 |
问9. b | 对于合并的结果,进行检验以确保研究是可合并的,以评估其同质性(即,卡方检验的同质性,I2). | 38 |
问9.摄氏度 | 人们认识到异质性或缺乏异质性。 | 38 |
问9. d | 如果存在异质性,则采用“随机效应模型”,并/或考虑联合的基本原理(即临床适宜性)(即联合是否合理),或明确说明。 | 25 |
问9. e | 如果同质性存在,作者陈述一个基本原理或统计检验。 | 0 |
10.问 | 承认发表偏倚或文件抽屉效应。 | 21 |
问10. b | 发表偏倚的评估包括图形辅助(如漏斗图,其他可用的测试)。 | 13 |
问10.摄氏度 | 统计检验(如艾格回归检验)。 | 0 |
11.问 | 作者提供了一份支持来源的声明。 | 79 |
问11. b | 没有利益冲突。 | 50 |
问11.摄氏度 | 作者在主要纳入研究中提供了支持或利益冲突的意识/声明。 | 4 |
在开始检索、收集和数据提取之前,我们样本中的所有综述都建立了其综述设计(Q1.a)和研究选择的资格标准(Q1.b)。然而,根据方法学家和PRISMA声明推荐的“PICO”框架(人口、干预、比较、结果),大多数综述缺乏清晰的研究问题/目标框架[
筛选主要研究的过程在大多数情况下(67%)是独立进行的,至少由2名审稿人进行。然而,据报道,在不到一半的综述(Q2.a)中,从主要研究中提取的数据是独立进行的,并且是重复的。根据方法学家的建议,评估资料抽取的准确性,以对照至少一个样本的初步研究[
在24篇评论中,11篇(46%)陈述了是否存在共识程序或第三方评论者来解决任何分歧(Q2.b), 9篇(38%)包含了关于评论者之间现有分歧的适当解决的声明(Q2.c)。总的来说,如下所示
对领域3(包括5个标准)的分析显示,几乎所有的综述(96%)使用至少2个电子数据库来搜索主要研究(Q3.a)。最流行的数据库是Medline(100%)、Cochrane Library(70%)和EMBASE(60%)。总的来说,22篇综述(92%)报告了检索的年份和数据库(Q3.b);22个(92%)表示使用的关键字(Q3.c);19人(79%)表示通过查阅已发现研究中的参考文献来补充搜索(Q3.d)。只有3篇(13%)综述(Q3.e)对高度相关的期刊进行了人工检索,以确定符合条件的研究。14篇综述(58%)使用QUOROM/PRISMA流程图以图形方式描述和描述搜索和选择相关文章的步骤顺序。然而,只有5篇评论(21%)提供了至少1个主要数据库的完整电子搜索策略,以便人们可以重复搜索或评估其全面性。如图所示
有趣的是,大多数评论都集中在发表在英语期刊上的同行评议的初步研究上。在我们数据库中的24篇文章中,只有2篇(8%)考虑了灰色文献的纳入,并搜索了原始研究,而不考虑其发表类型(Q4.a)。在20篇综述(83%)中,作者表示他们根据发表状态(如摘要、会议论文集和语言)排除了初步研究(Q4.b)。只有一篇综述(4%)报告翻译了非英语论文(问题4.c),而5篇综述(21%)报告在搜索和纳入研究时没有应用语言限制(问题4.d)。
大多数综述(92%)提供了纳入研究的列表(Q5.a),但只有25%的综述在文章或补充来源(如在线附录)中报告了排除研究的列表(Q5.b)。因此,只有6篇综述(Q5.d)可追溯纳入和排除的研究。在15篇(63%)文章中,作者明确报告了排除研究的主要原因(Q5.c),随后报告了与每个排除标准相关的文章数量。后一项的检讨结果令人满意,检讨提供了类似prisma的流程图[
来自参与者、干预措施和结果的原始实证研究的研究水平数据以汇总形式呈现,如21篇综述(88%)中的表格(Q6.a)。所有这些表格的资料似乎都是完整的(问题6.c)。在20篇综述(83%)中,作者在表中纳入了来自主要研究的相关PICO特征的范围(例如,患者的平均年龄、随访时间、疾病严重程度)(Q6.b)。
24篇综述中有9篇(38%)对初步研究的方法学质量或偏倚风险进行了正式评价。在所有这些研究中,作者提供了一种先验的评估方法,要么以质量量表/综合评分清单的形式,要么以预定义的偏倚风险标准的形式(Q7.a)。总而言之,8个评论(33%)以有意义的格式记录了每个研究的质量评估的最终结果,即以等级/分数或每次评论满意地涵盖的标准总数的形式(Q7.b)。在一个特别的评论中[
用于初级研究质量评估的方法和工具-第1组。
集群1 | 乔杜里2007 [ |
Clark 2007 [ |
Cox 2012 [ |
农民2005 [ |
评估重点 | 研究设计(D) |
研究设计(D) |
学习质量(Q) | 学习质量(Q) |
(评估重点) |
(D)仅纳入随机对照试验 |
(D)仅纳入随机对照试验 |
(Q)低洼及黑色音阶[ |
(Q)贾达量表[ |
评税主任人数 | NR一个 | 2 | 2 | NR |
评估员蒙蔽? | NR | NR | NR | NR |
裁决或协商一致程序 | NR | 是的 | 是的 | NR |
按领域对每项研究的结果进行交叉制表 | 没有 | 是的 | 是的 | 没有 |
学习质量总分 | 是的 | N/Ab | 是的 | 是的 |
一个尼科布:没有报道。
bN / A:不适用的。
用于初步研究质量评估的方法和工具-第2组。
集群2 | 博尔顿2011 [ |
Franek 2012 [ |
英语口语2010 [ |
Polisena 2010 [ |
2009年12月[ |
评估重点 | 学习质量(Q) |
学习质量(Q) |
研究设计(D) |
学习质量(Q) |
研究设计(D) |
(评估重点) |
(Q)科克伦标准[ |
(Q) CONSORT语句清单在随机对照试验中的修改 |
(D)仅纳入随机对照试验 |
(Q)和(E) Hailey等仪器的自适应[ |
(D)仅纳入随机对照试验 |
评税主任人数 | 2 | NR | 2 | 2 | NR |
评估员蒙蔽? | NR一个 | NR | NR | NR | NR |
裁决或协商一致的程序到位 | 是的 | NR | NR | NR | NR |
按领域对每项研究的结果进行交叉制表 | 没有 | 是的 | 是的 | 没有 | 是的 |
学习质量总分 | N/Ab | N/A | N/A | 是的 | N/A |
证据质量排序 | 在研究 | 在结果 | 在结果 | 在研究 | 在结果 |
一个尼科布:没有报道。
bN / A:不适用的。
值得注意的是,除了通过仪器正式评价初步研究的质量或偏倚风险的综述外,还有3篇综述[
在正式评估初步研究的科学严谨性的9篇综述(见问题7)中,有6篇将方法学质量的结果纳入最终结论(问题8.a)和为未来研究提出的建议(问题8.b)。总的来说,75%的综述在没有考虑或反映纳入研究的潜在偏倚风险的情况下得出了关于HT治疗慢性患者有效性的结论。重要的是,没有一篇纳入的综述将质量评估的结果(问题7中的项目)纳入到综述的实际分析中,以探讨如果将高偏倚风险的研究纳入或排除在分析之外,结论可能会受到何种影响。
我们数据库中的大多数综述(63%)使用叙述性综合对主要研究的结果进行定性汇总。然而,所选择的方法背后的基本原理和作者用来指导他们的决定的方法一般没有提到。在15份叙述性报告中,8份(53%)提供了关于为什么选择定性综合证据而不是荟萃分析的陈述[
在15个SRs中,只有3个(20%)提供了一个分析计划,其中包含了在合成过程的每个阶段使用的方法、工具或总体框架的信息[
如图所示
在24篇综述中,有9篇综述使用元分析方法定量地结合了主要研究的结果。然而,没有一个MAs明确说明在研究问题的背景下使用了什么标准来客观地支持所分析的HT试验在临床和方法上足够相似,可以进行定量结合(Q9.a)。在一个MA [
如图所示
我的2统计(
鉴于这种方法学上的限制对MAs的可靠性在结果解释和统计模型选择方面的潜在负面影响[
6个月[
我们发现的第二个方法学问题与相反的问题有关,即对异质性的高估。在4个MAs的5个森林样地[
最后,一个稍微微妙但却很重要的方法错误涉及在MA中通过重复计算其研究小组而高估研究的问题[
使用的统计模型中,6个(67%)进行了随机效应分析,3个进行了固定效应分析(Q.9c)。后两项研究[
该问题中包含的三个标准侧重于用于评估发表偏倚可能性的元分析方法,即研究结果的发表或不发表取决于主要研究结果的方向。在我们的综述中纳入的9个MAs中,5个在评估中考虑了发表偏倚(Q10.a),只有3个在已发表的文章中呈现了实际的漏斗图(Q10.b)。在这5个MAs中,作者依靠视觉检查和解释漏斗图。任何ma (Q10.c)均未使用评估偏倚存在的正式统计检验(例如,Egger回归检验)。考虑到每次综述中纳入的试验数量较少,这是合理的。理论上,这样的测试需要相当数量的初步研究,才能有足够的能力发现偏倚;很少被满足的标准。然而,没有一个MAs承认与目视检查漏斗图相关的主观性的巨大风险[
在我们的样本中,大多数评审(79%)明确披露了评审过程中获得的所有支持来源。在50%的调查中,至少有一名或多名调查人员直接隶属于在各自审查结果中具有竞争利益的实体,或与实体有其他积极参与,例如HT解决方案提供商(Q10.b)。只有一篇综述(4%)检查并报告了所纳入实证研究的作者是否存在潜在的利益冲突(Q10.c)。
在SRs和MAs中使用的方法来综合来自原始研究的现有证据。
方法 | 评论 | n | |
|
|
|
|
|
报告结果 | [ |
11 |
|
证据水平(研究设计) | [ |
4一个 |
|
计票(干预效应) | [ |
1一个 |
|
远程控制模式 | [ |
2 |
|
|
|
|
|
|
|
|
|
风险比(对于二分类数据) | [ |
4 |
|
风险差异(对于二分类数据) | [ |
1b |
|
平均差(连续数据) | [ |
3. |
|
标准化平均差(连续数据) | [ |
2 |
|
|
|
|
|
用统计检验方法评估异质性 | [ |
9 |
|
报告Cochran 's Q统计量(卡方检验)异质性 | [ |
6 |
|
报道我2异质性检验 | [ |
8 |
|
|
|
|
|
随机效应荟萃分析 | [ |
4 |
|
固定效应荟萃分析 | [ |
3. |
|
|
|
|
|
亚组分析 | [ |
3. |
|
敏感性分析 | [ |
2 |
一个包括使用两种不同方法的评论。
b同样的回顾使用了两种不同的汇总统计。
的置信区间2ma的估计。
|
作者(年) | 试验次数 | 我2 | 低区间(95% CI) | 高区间(95% CI) | 统计模型 | 评估结果 |
|
|
|
|
|
|
|
|
|
|
5 | 0 | 0 | 79 | 随机效应 | 全因死亡率 |
|
|
|
|
|
|
|
|
|
|
10 | 51 | 0 | 76 | 固定效果 | 全因死亡率 |
|
|
6 | 59 | 0 | 83 | 固定效果 | 全因住院 |
|
|
6 | 0 | 0 | 75 | 固定效果 | CHF-related住院 |
|
|
4 | 82 | 52 | 93 | 固定效果 | 全因急诊 |
|
|
|
|
|
|
|
|
|
|
11 | 0 | 0 | 60 | 固定效果 | 全因死亡率 |
|
|
8 | 0 | 0 | 68 | 固定效果 | 全因死亡率随访6个月 |
|
|
8 | 78 | 56 | 89 | 固定效果 | 全因住院 |
|
|
6 | 85 | 70 | 93 | 固定效果 | 全因住院随访6个月 |
|
|
4 | 39 | 0 | 79 | 固定效果 | CHF-related住院 |
|
|
4 | 39 | 0 | 79 | 固定效果 | chf相关住院随访6个月 |
|
|
|
|
|
|
|
|
|
|
6 | 0 | 0 | 75 | 随机效应 | 全因死亡率 |
|
|
4 | 5 | 0 | 85 | 随机效应 | 全因住院 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
11 | 65.8 | 35 | 82 | 随机效应 | 收缩压改变 |
|
|
11 | 56.6 | 15 | 78 | 随机效应 | 舒张压改变 |
|
|
6 | 77.9 | 44 | 91 | 随机效应 | 控制血压 |
|
|
5 | 79.1 | 50 | 91 | 随机效应 | 抗高血压药物的数量 |
|
|
|
|
|
|
|
|
|
|
9 | 0 | 0 | 65 | 固定效果 | 血糖控制- HbA1c的变化 |
|
|
|
|
|
|
|
|
|
|
7 | 65 | 20. | 84 | 随机效应 | 血糖控制- HbA1c的变化(所有研究) |
|
|
4 | 45 | 0 | 82 | 随机效应 | 血糖控制- HbA1c的变化(亚组分析) |
|
|
|
|
|
|
|
|
|
|
8 | 33.8 | 0 | 71 | 随机效应 | 血糖控制- HbA1c的变化 |
|
|
7 | 0 | 0 | 71 | 随机效应 | 血糖控制- HbA1c的变化(事后亚组分析) |
这篇重要的综述首次对已发表的研究HT对慢性疾病患者影响的综述进行了正式和全面的质量评估。我们应用R-AMSTAR工具严格检查每个综述的方法严谨性和报告特征,并在该特定工具的11个领域内进行了仔细评估,以确定可能影响其内部有效性的推断或结果中的偏倚风险(即系统错误)。为此,R-AMSTAR被用作指导和支持我们评估的一般框架,而不是为每次审查计算质量分数的特定工具。这样的评分可能并不总是反映每一篇综述的真实科学质量,而且有证据表明,由于可能存在假阳性或假阴性,在判断是否信任个别分析时,使用这些评分可能会出现问题[
我们的文献检索结果表明,与其他临床领域相比,该领域的SRs和MAs是相当新的(例如,[
根据我们的评估,我们发现随着最近对高温疗法干预的评论的增加,由于内在的方法问题,这些文章中有相当一部分似乎缺乏最佳的科学严谨性。此外,他们的整体素质似乎并没有随着时间的推移而提高。尽管重要的方法指引广泛提供和传播[
虽然大多数综述使用了2个以上的电子数据库来检索相关研究,但很少使用其他重要的方法来减少偏倚和增强检索策略。只有2篇综述试图识别灰色文献中的主要研究,绝大多数将所有搜索限制在英语文章中,尽管已经证明,在专门关注英语出版物的SRs和ma中可能会引入偏见[
在过去的十年中,HT作为一个研究领域有了长足的发展。然而,从概念的角度来看,SRs和ma的作者在他们使用的术语(例如,“远程医疗”)方面似乎缺乏共识[
下面的例子很好地说明了目前存在的问题及其对HT审查结果和直接比较结果的影响。一项随机对照试验被纳入了三篇关于治疗心力衰竭的HT的综述[
先前综述结果的有效性及其结论的可信度在很大程度上取决于纳入研究的质量。有充分证据显示,初步研究的科学质素并不总是足够,而方法上的缺陷如未加以识别和考虑,可能会夸大或降低研究评估的结果[
关于选择最适合解决综述研究问题的数据合成方法的决定需要深思熟虑和临床判断,并应基于明确的临床和方法标准,尽可能减少主观性[
采用叙述性或定性综合的作者应明确描述支撑证据综合过程每个阶段的分析计划,以便阐明和支持用于得出最终结论的逻辑。提交一份分析计划是至关重要的,并且应该成为未来HT的SRs中方法部分的组成部分,因为它澄清了合成过程,提高了审查的透明度和可靠性,并作为防止因不适当地强调一项研究的结果而产生的偏见的保障[
在HT干预的MAs中使用的统计方法的主要目的之一是评估纳入研究结果之间的离散性,即研究间效应量的异质性,以评估研究结果的一致性。鉴于观察到的异质性,重要的是调查和解释,只要可能,是什么导致了它,以增加科学认识和临床相关性。关于第一个目标,我们样本中的所有9个MAs都严格遵守推荐的指南,并通过计算Cochran ' s Q, I, I, I来正式评估HT研究结果的变异性(异质性)2,或者在大多数情况下都是异质性统计。这尤其令人鼓舞,反映了一种与医疗保健领域的其他ma大体一致的良好做法[
该领域的未来MAs应继续使用统计数据来衡量观察到的效应的统计显著性和异质性的比例。然而,必须考虑到这些度量的局限性。与所有显著性检验一样,Q统计量也有同样的注意事项,在解释时应根据分析中纳入的HT研究的数量谨慎进行[
当结合来自各种HT研究的数据时,一个主要的难题是决定是进行固定效应还是随机效应的meta分析。这一决定尤其重要,因为模型的选择可能会影响对效应大小的估计,并最终影响对结果的解释[
我们的评估结果显示,随机效应模型总结了不同研究的干预效应分布,具有更广阔的前景,似乎是HT干预中最可取的统计模型。事实上,从临床角度来看,固定效应模型的“一刀切”方法似乎很难证明是正确的。在大多数情况下,HT干预的参与者和背景特征在许多实际方面存在差异,这可能对结果产生影响[
如果我们将批判性综述方法应用于我们自己的综述,我们意识到在评估纳入的SRs和ma的方法学质量的过程中面临许多挑战,这些挑战可能反过来影响我们的研究结果。首先,我们的评估是在每次审查中明确或含蓄地报告的信息的基础上进行的。因此,在所有的方法学质量或偏倚风险评估中,评估者所做判断的准确性在很大程度上依赖于报告审查的充分性。有可能作者们进行了更严格的审查。然而,由于意识到期刊施加的篇幅限制,并且考虑到报告其综述的主要发现的竞争性要求,他们可能决定省略一些被认为是微妙的或不太重要的方法信息。也有可能是同行评议过程本身导致了文本的缩写,以满足篇幅限制。为缓解这一问题,对未来的综述的一个建议是在电子版中提供关于综述方案的基本细节,就像今天一些同行评议期刊的做法一样,以帮助理解所考虑的系统综述过程。另一方面,对发表科学技术领域的科学论文和硕士论文感兴趣的同行评议期刊应该腾出空间发表在线补充材料,并采用适当的机制,一旦发现错误或其他重要缺陷,就可以标记先前工作的问题并允许对其进行更正[
其次,重要的是要注意,我们评估的结果仅限于符合方法部分中描述的纳入标准的综述。虽然我们的文献检索发现了一些“叙述性综述”,这些综述关注的是HT干预对各种慢性疾病患者的有效性,但当这些综述不被自我认定为系统性的或不具有SR或MA的基本特征时,它们被排除在我们的研究之外。正如R-AMSTAR仪器和我们的分析所反映的那样,这种严格的选择过程可能导致了对高温疗法评价方法质量的高估。同样被排除的还有几篇综述,这些综述对HT干预措施以及其他各种“远程监测”干预措施(例如,结构化电话支持和独立视频咨询)进行了全面和混合的概述,但在分析结果时没有明确区分它们。因此,我们的研究结果不能推广到将HT作为远程患者监测的许多其他多学科干预措施之一的综述中,尽管大多数人都同意,突出的方法缺陷具有重要的相关性,并且也适用于这些综述。
本研究首次尝试评估HT干预的既往SRs和ma的整体质量。用于识别相关评论的搜索策略的全面性,与研究选择、数据提取和质量评估相关的重复过程,以及使用能够进行深入质量评估的有效工具,是本研究方法学合理性的关键指标。
在过去的十年中,在HT领域发表的SRs和ma的数量大幅增加,为广泛的卫生保健利益相关者提供了广泛的“大规模证据”基础,这些证据来自对HT对慢性疾病患者的临床、行为、结构和经济影响的多项初步研究的综合。然而,尽管已经发展了大量的知识,但付款人和护理提供者的广泛接受以及将HT作为一种有效的患者管理方法的整合仍然存在问题。这主要是因为现有的知识库仍然显示出一些重要的方法上的弱点和研究差距。
最重要的是,我们的关键评估显示,现有的SRs和ma的整体质量和严格性是高度可变的,随着时间的推移没有改善的迹象。大量的综述包含几个常见的方法缺陷,这些缺陷损害了它们的内部有效性,限制了它们在临床、教育、研究和政策目的方面的有用性。因此,关于HT对慢性疾病管理的有效性的一系列问题仍然没有答案,包括哪种是病例管理和远程监测的理想和最有效的组合,哪种行为改变技术和模式最有效,干预措施的有效性是否受到参与者人口统计和环境的影响,以及从经济角度来看HT是否是一种有效和可行的解决方案。因此,我们建议今后在这一领域的审查应严格遵守现有的方法准则,从而提高其总体严谨性及其报告方面。更准确地说,它们至少应包括以下要素:(1)明确陈述的研究问题,明确描述患者群体、干预措施、比较干预措施和结果;(2)全面而明确的搜索策略;(3)对初步研究的有效性进行正式评估(即偏倚风险评估),并适当尝试探讨高偏倚风险的研究对HT估计效应的影响;(4)更严格的数据合成方法,对所使用的技术或统计数据进行透明的描述和证明。
总之,我们希望本研究能够通过帮助作者最大限度地减少各种偏倚风险和避免以前的方法缺陷,从而有助于提高远程医疗领域以及更广泛的远程医疗领域的sr和ma的整体质量。尽管如此,我们认为,在高温疗法领域建立更严格、更有力的证据需要研究人员、临床医生、资助者、期刊编辑和同行评议人员付出前所未有的努力。这些努力包括但不限于让具有临床和方法学专业知识的个人参与SRs和MAs的实施;对期刊发表的一般说明进行修订,其中包含具体指南或方法和报告建议的链接;在同行评议过程中,让具有社会责任报告和社会责任评估方法经验和知识的个人参与;采用允许更新或更正在线出版材料的机制,以解决出版后发现的重要缺陷甚至错误。
排除的物品清单。
R-AMSTAR对每次审查方法严谨性的评估。
心力衰竭患者家庭远程监护干预的系统综述和荟萃分析的引用分析。
分级的建议,评估,发展和评价
家庭远程控制
荟萃分析
人口,干预,比较,结果
系统评价和荟萃分析的首选报告项目
荟萃分析报告的质量
对多个系统评价的修订评价
随机对照试验
系统综述
感谢加拿大研究主席计划为本研究提供资金支持。
没有宣布。