发表在第七卷第1期(2005):

损耗法则

损耗法则

损耗法则

本文作者:

冈瑟Eysenbach

的观点

全球电子卫生创新中心,大学卫生网络,多伦多,加拿大

通讯作者:

Gunther Eysenbach, MD, MPH

全球电子卫生创新中心

多伦多大学和大学健康网络

伊丽莎白街190号

多伦多,m5g2c4

加拿大

电话:+1 416 340 4800转6427

传真:+1 416 340 3595

电子邮件:geysenba@uhnres.utoronto.ca


在本刊围绕电子健康研究发展和进一步发展理论、模型和最佳实践的持续努力中,本文认为需要一门“流失科学”,即需要为电子健康应用程序的中断和参与者退出电子健康试验的相关现象开发模型。我称之为“消耗定律”的是,在任何电子健康试验中,相当大比例的用户在完成或停止使用应用程序之前就退出了。与药物试验等相比,电子卫生试验的这一特点是一个明显的特点。传统的临床试验和循证医学范式规定,高辍学率会降低试验的可信度。因此,电子健康研究人员倾向于掩盖高辍学率,或者根本不发表他们的研究结果,因为他们认为他们的研究是失败的。然而,对于许多电子保健试验,特别是在互联网上进行的试验,特别是使用自助应用程序的试验,高辍学率可能是一种自然和典型的特征。应该强调、测量、分析和讨论损耗的使用度量和决定因素。这还包括分析和报告应用程序最终“起作用”的亚群的特征,即那些留在试验中并使用它的人。对于什么有效什么无效的问题,这种损耗测量与意向治疗(ITT)分析的纯疗效测量一样重要。在高辍学率的情况下,功效测量低估了应用程序对继续使用它的人群的影响。 Methods of analyzing attrition curves can be drawn from survival analysis methods, eg, the Kaplan-Meier analysis and proportional hazards regression analysis (Cox model). Measures to be reported include the relative risk of dropping out or of stopping the use of an application, as well as a “usage half-life”, and models reporting demographic and other factors predicting usage discontinuation in a population. Differential dropout or usage rates between two interventions could be a standard metric for the “usability efficacy” of a system. A “run-in and withdrawal” trial design is suggested as a methodological innovation for Internet-based trials with a high number of initial dropouts/nonusers and a stable group of hardcore users.

医学信息学报,2005;7(1):1 - 11

doi: 10.2196 / jmir.7.1.e11

关键字



在这一期的《华尔街日报》上,有几篇优秀的论文讨论了进行基于互联网的试验的方法。Peter Farvolden和他的同事对一个恐慌症自助网络项目进行了基于互联网的评估,与大量停止使用的用户进行了抗争:1161人中只有12人(约1%)完成了整个12周的项目[1]。Christensen等人在之前对Moodgym(一个包含5个模块的抑郁项目)的评估中也做了类似的观察,19607名参与者中只有97名(0.5%)在“开放”环境中完成了所有5个模块,182名参与者中有41名(22.5%)在试验环境中完成了所有模块。图1) [23.]。同样在本期中,Wu等人报告了一项示范性研究的结果,该研究评估了人们是否会实际使用(并继续使用)一个创新的基于互联网的交流和疾病管理平台,该平台要求患者输入不同的参数,并使他们能够在线与临床医生交换信息。他发现58名患者中有26人在3个月的时间内使用了该系统,只有16名患者在12个月后继续使用该系统,8名患者在2年后继续使用该系统,4名患者在3年后继续使用该系统[4]。在用户中,使用强度似乎也在下降,随着时间的推移,患者和临床医生输入的信息数量也在减少。这些数据让人联想到Anhoj在上一期的经验医学互联网研究杂志。Anhoj观察到用户对LinkMedica的积极看法和他们不愿意在短时间内使用该网站之间的对比。造成这种情况的主要原因是“领医”不适合他们的日常生活。“(5最后,在本期中,是jean - franois Etter的具有里程碑意义的论文,该论文报告了迄今为止发表的规模最大、可能也是进行得最好的基于互联网的试验之一的结果[6]。他还报告了相当大比例的辍学率,在11969名登记的参与者中,只有35%的人回答了后续问卷。令人惊讶的是,尽管随访率如此之高,这项研究仍然有足够的统计能力来发现两种干预措施之间的显著差异。

所有这些论文都暗示了一个共同的问题:损耗定律,我称之为损耗定律。参与者停止使用和/或失去随访的现象,作为评估电子健康应用程序的基本特征和方法挑战之一。

图1所示。两项研究的非使用损耗曲线[12发表在本期的《医学互联网研究杂志》上。绘制了两个基于web的干预措施中完成模块的数量与完成模块的参与者比例的关系。从两条Christensen/Moodgym曲线来看,上面一条是指一个试验环境,而另一条(下一条)是指一个“开放”的情况,只有偶尔的互联网访问者。
查看此图

虽然在大多数药物试验中,干预措施是“规定的”,但在涉及信息和通信技术的研究中,干预措施的使用主要由参与者自行决定,参与者可以很容易地选择停止使用。在任何纵向研究中,干预既不是强制性的,也不是对参与者的健康至关重要的,试验参与者将会丢失。在药物试验中,缺乏依从性通常不是一个主要问题,因为参与者受到更密切的监督,有时服用药物会对健康产生可观察到的直接益处。因此,在药物试验中,几乎干预组的每个人实际上都会接受干预(并且接受相同的剂量)。相比之下,电子健康试验中一个基本的方法学问题是,在干预组中,有相当大比例的人不会使用干预措施或很少使用干预措施。7]。如果干预组的参与者不使用该应用程序,则很难衡量干预的效果。

在本文中,我认为需要一门“损耗科学”。Nonusage数据本身研究人员应该对此非常感兴趣,而损耗曲线可能被低估和分析不足。提出了一些损耗的理论模型,我认为,通过理解和描述损耗的模式和预测因素,并通过经验验证所提出的模型,电子卫生研究人员不仅可以促进我们对电子卫生干预措施的影响和吸收的理解,而且还可以为跨学科的扩散研究领域做出贡献。

磨损曲线

当谈到纵向研究中的人员流失时,我们实际上可能指的是两个不同的过程:失去参与者的现象(例如,参与者不返回填写后续问卷),我称之为辍学磨损这里,和不使用的现象,我称之为nonusage磨损。两者可能密切相关:通常情况下,高失踪率表明相当大比例的参与者对应用程序失去了兴趣并停止使用它。另一方面,也可能有较低的失访率,但仍然有参与者不使用(或很少使用)干预措施(例如,在[23.])。

因此,在任何纵向电子健康研究中,我们都可以绘制两种流失曲线:(1)随着时间的推移失去随访的用户比例;(2)未退出的用户比例(例如,仍在填写问卷的用户),但不再使用该应用程序,随时间绘制。我的假设是,流失到后续的流失曲线通常跟随不使用的流失曲线,因为大部分流失到后续的流失是不使用的结果(“失去兴趣”是解释这两条曲线的潜在变量)。在与对照组的纵向研究中,例如随机试验,可以绘制第三条曲线来说明对照组的失访率。如果比较组包括提供另一项技术创新,则可以绘制第四条曲线来描述未使用控制干预措施(图2).

图2。一个假设的电子健康试验中对数“损耗曲线”的例子。在干预组(INTV)中,一定比例的参与者将失去随访(INTV退出),对照组(CTRL退出)也是如此。此外,即使在那些没有失去跟进的人中,也可能有一部分人不使用
查看此图

假设的损耗曲线图2是对数曲线,它们与Farvolden等人在试验中实际观察到的损耗曲线非常相似[1], Christensen等[2], Wu等[4[与…相比图1).事实上,当以对数尺度绘制时,从图1几乎形成直线(图3).

图3。损耗曲线从图1在对数尺度上(y轴是完成一个模块的用户比例的自然对数)
查看此图

非使用性损耗:创新扩散逆转

“损耗科学”可以被看作是扩散研究理论框架的应用(和贡献)。电子健康干预试验通常会给参与者带来创新。埃弗雷特·m·罗杰斯将创新定义为“一种被个人认为是新的想法”,而传播是“创新传播的过程”。“(8罗杰斯提出的创新扩散模型最初被农村社会学家用来研究农业技术在社会系统中的扩散。一项创新在构思出来之后,一开始传播得很慢——通常是通过他人的工作变革推动者他们积极推广它,然后随着越来越多的人采用它而加快速度。最终它会达到一个饱和水平,几乎所有想要采用这种创新的人都已经这么做了。

在电子健康干预措施的有效性试验中,我们通常从100%“有意使用”参与者的登记人群开始,他们已经经历了招募、选择和知情同意过程,即所有人原则上都已经同意使用和“采用”干预措施。然而,如上所示,在许多试验中,相当多的用户可能会停止干预或(更糟)完全退出试验-这是采用过程的逆转。

在这本关于新思想如何传播和被采用的550页的书中,罗杰斯只用了5页来讨论逆转决定采用一项创新,说明在这方面的研究是多么的少。如Farvolden所指出的,电子卫生保健的经验证据(也可能是卫生保健的其他领域,例如,一般的自助和自我支持领域)[1])表明放弃一项创新是一种重要的现象,也许值得更多的关注和研究。事实是,决策的逆转是经常被扩散学者承认。罗杰斯引用了一项对威斯康辛州农民的研究,该研究表明,在决定任何特定时间的收养水平时,中止收养的比率与收养的比率同样重要,因为在任何一年中,中止收养的人数与首次收养的人数一样多。

罗杰斯把人们可能改变决定的创新采纳阶段称为创新采纳阶段确认阶段。在这个阶段,根据罗杰斯的说法,“个人……寻求加强已经做出的创新决策,如果暴露在与创新相冲突的信息中,可能会改变这个决定。”如果产生了一种不和谐,即一种内部不平衡状态或不舒服的心理状态的发展,创新可能会被放弃。

罗杰斯区别不抱幻想更换中止。更换中止是“为了采用取代它的更好的想法而决定拒绝一个想法”,例如,MP3和iPod播放器取代随身听,电子邮件取代邮政信件。在基于互联网的医学研究的背景下,下一个拥有(也许更好的)内容的网站只需要点击几下鼠标就能吸引参与者的注意力。8],使得替代停产成为一件并非不可能发生的事情。觉醒中止导致拒绝,因为个人不满意。在医疗保健领域,幻灭和替代往往是齐头并进的,因为通常不可能简单地放弃一种干预措施而不使用替代措施。在基于网络的沟通工具干预中,如Wu等人所描述的[4),例如,电子信息可以被电话或办公室拜访所取代。

影响人员流失的因素

在罗杰斯的经典模型中,采用率与创新的几个特征正相关,因为它们被创新扩散的系统成员所感知。这些都是

  1. 相对优势,即人们认为创新优于被其取代的想法的程度;
  2. 兼容性,一项创新被认为与现有价值、过去经验和潜在采用者的需求相一致的程度;
  3. 复杂性,一项创新被认为难以理解和使用的程度;
  4. 可试验性,一项创新在有限的基础上可以试验的程度;和
  5. 可观察性,指创新成果对他人可见的程度。

创新的这些特征也在决定停止使用电子健康创新和/或退出电子健康试验中发挥作用。例如,如果创新不能创造任何利益(相对优势)或者存在可用性问题(复杂性),那么它将被拒绝。然而,还有更多的因素与创新本身无关,而更多的是与环境和试验设置有关。这些因素,例如,试验前的期望管理或“推动因素”,如研究团队的提醒,都会影响损耗曲线的形状和斜率(陡峭度)。在图1(和图3)有趣的是,在MoodGym的随机试验中,“推动”因素(例如,研究助理联系参与者)如何导致更平坦的流失率曲线,而在MoodGym的“开放试验”中,休闲用户的“推动”环境(比较顶部和底部曲线)。

对这些曲线进行更正式的分析,例如使用生存曲线分析的方法,可以得出不同流失率的指标,并确定影响这些曲线形状和斜率的因素。其中一些建议的(假设的)因素已被汇编在表1

还会有其他参与者因素,例如影响流失率的人口统计学因素。受教育程度较低、社会经济地位较低和较少接触变革代理人的用户更有可能停止创新[8]。Rogers还声称,较晚的采用者(落后者)比较早的采用者更有可能停止创新([8,概化5-11,第191页)。在电子健康试验的背景下,这可能意味着如果参与者犹豫是否参加,这可能是潜在退出的早期指标。可以通过比例风险回归分析(Cox模型)等统计模型,例如比较对照组的退出曲线与干预组的退出曲线,来确定这些因素对终止特定电子保健干预试验的预测价值。

表1。电子健康试验中影响非使用损耗和退出损耗的建议(假设)因素
因素 对非使用流失率的影响 对辍学率的影响
试验前提供信息的数量和适当性,期望管理 不恰当的信息会导致不切实际的期望,进而导致幻想破灭 间接地通过不使用(使用中断导致退出)
注册的便利性(例如,一个简单的鼠标点击,而不是个人接触,体检等),招募“合适”的用户,预先注册筛选的程度 如果“错误”的参与者被招募,即那些不太可能使用它,愿意投入时间,并且干预不“适合”的人。 注册越容易,如果用户意识到填写问卷等工作比他们想象的要多,就会有越多的用户退出。也可以通过非用法间接使用。
易于退出/停止使用 停止使用应用程序越容易,不使用的流失率就越高(间接地通过退出)。 越容易退出试验,流失率就越高(间接地通过不使用)。
可用性和界面问题 可用性问题显然会影响使用 间接地通过不使用(使用中断导致退出)
“推动”因素(提醒、研究助理追逐参与者) 如果被提醒,参与者可能会觉得有义务继续使用(外部有效) 参与者可能会觉得有义务继续接受审判
通过面对面或电话进行个人接触(注册时和持续接触),而不是虚拟接触 主要是间接通过辍学 与研究团队的接触越“虚拟”,参与者就越有可能退出
来自变革推动者和(针对消费者健康信息应用)卫生专业人员/保健提供者的积极反馈、支持和鼓励 参与者可以在没有获得变革推动者认可的情况下停止使用。特别是,如果卫生专业人员不鼓励(或没有积极鼓励),患者可能会停止使用电子健康应用程序 间接地通过不使用(使用中断导致退出)
完成试验或继续使用试验的有形和无形的可观察到的优势(外部压力,如财务劣势、临床/医疗/生活质量/疼痛) 是的 是的
干预费用已全额支付(自费) 如果个人预先为一项创新付费,他们就不太可能放弃它(与按使用付费的干预措施相反)。 间接地通过不使用(使用中断导致退出)
工作量和所需时间 是的 例如,填写后续调查问卷可能会造成参与者退出的负担
竞争的干预措施 例如,在网上或线下进行的类似干预可能导致替代中断 间接地通过不使用(使用中断导致退出)
外部事件(9/11等) 这些可能导致分心和中断,特别是如果干预是不必要的 间接地通过不使用(使用中断导致退出)
网络效应/同伴压力、点对点交流和社区建设(参与者之间的开放互动) 社区可以加快或减缓创新被抛弃的速度。 社区可能会增加或减缓辍学的流失。
用户的经验(或能够获得帮助) 由于大多数电子健康应用程序需要初始学习曲线和组织变化,因此用户必须克服初始障碍才能使应用程序工作。经验/外部帮助有助于克服这些最初的障碍,并帮助看到“隧道尽头的光明”。 间接地通过不使用(使用中断导致辍学)

测量和报告损耗

在报告电子健康研究的结果时,除了功效测量之外,还可以(也应该)提供一些使用和退出损耗指标。应报告不同时间点的原始损耗比例,并以损耗曲线表示。曲线的形状可能表明磨损的潜在原因。如图1至3所示的对数曲线表示稳定的损耗,其中用户停止使用(或退出)的比例恒定,类似于概率事件。s型曲线,如中所示图4建议一个3阶段的过程:初始阶段(第一阶段),参与者出于好奇最初留在试验中(并使用eHealth应用程序);在第二阶段,拒绝和流失开始出现,例如,因为参与者意识到申请没有达到他们的期望;第三阶段,一个稳定的用户组(“硬核用户”)仍然存在,他们会在很长一段时间内继续使用应用程序。相比之下,l型曲线(未显示,但与II+III期相似)图4)反映了参与者最初的快速下降,然后是一个更稳定的“核心”用户群体和/或继续参与试验的试验参与者。这表明在没有“好奇心平台期”的情况下,最初的快速淘汰过程,可能是因为许多注册的参与者是错误的用户群体,他们很快就失去了兴趣。

图4。(假设的)s型损耗曲线
查看此图

除了提供流失曲线外,还可以计算一些汇总指标。在生物学、物理学和经济学中,“半衰期”一词用来衡量“某物的一半经历一个过程所需的时间”。韦氏医学词典)。“使用半衰期”可能是报告eHealth试验的有用指标,它表明在t50 (t10, t25…)多长时间后,志愿用户组中有50%(10%,25% ....)停止使用该应用程序(由于许多应用程序都有缓慢的损耗,因此报告t10或t25可能更实际,其中分别损失了10%或25%)。

形式上比较不同的损耗曲线也很有趣,例如,在同一试验中评估干预a的退出损耗曲线和干预B的退出损耗曲线。例如,Christensen等[3.[endnoteref: 3]的报告显示,6周后,控制组有89.3%的人仍留在对照组,而Moodgym试验中只有74.7%的人可以随访,而使用另一种干预措施Bluepages的组有84.9%的随访率,这可能表明Moodgym应用程序存在更多的可用性问题。如果损耗曲线是对数的,那么报告对数比率ln(P)可能是有利的一个[tx] / ln(PB(P[tx]是A组或B组中仍在试用和/或在特定时间tx后使用该应用程序的用户的比例),因为如果曲线是对数的,则该比例在不同时间点上是恒定的。

通过Kaplan-Meier(生存曲线)分析和Cox回归模型,可以对流失曲线进行进一步的统计比较。

处理人员流失:ITT与“磨合退出设计”

辍学损耗是对有效性的威胁,因为它可能会引入选择偏差。例如,干预组可能会选择性地失去比对照组更多的无动机的人(由于无动机的事实,他们可能会有不同的结果),这种差异辍学可能会导致剩余参与者之间测量结果的差异。意向治疗(ITT)分析是避免这种偏倚的唯一机会,在ITT分析中,所有的辍学者都被假设有负面或中性的结果。然而,高流失率和治疗意向分析极大地削弱了检测组间差异的能力(增加了beta,即无法测量真实差异的可能性)。

ITT的分析可以与一种方法相结合,我称之为“磨合和退出设计”。在这里,第一阶段的试验(对应于I期和II期)图4)是一个“磨合期和淘汰期”,在此期间,那些不想长时间使用该应用程序的参与者将被“淘汰”出干预组。这是在第三阶段开始时从图4),在干预组中剩余的实际用户中进行另一次随机分配,这些用户将被随机分为可以继续使用应用程序的用户和已退出应用程序的用户(图5).磨合期后的第一次评估将确定最初打算使用该系统的参与者中有多少人实际使用了该系统,将确定用户组的特征,并将根据ITT比较给出保守的功效估计。在第二阶段,退出阶段,干预将从原来干预组的一半用户中移除。然后将戒断组与非戒断组进行比较,就会对干预的有效性给出一个不那么保守的估计——同时要注意降低了通用性,因为这个估计只对最终使用它的人群中的一个子群体有效。

可悲的是,这种设计只有在确实存在“硬核”用户群体(即,如果找到合适的用户,流失实际上就会停止),结果完全可逆,并且没有学习或其他延续效应(如教育干预)的情况下才可行。然而,所提出的设计对于评估仅在使用期间具有短暂效果的电子健康干预措施是可行的,例如评估与医生的电子邮件与电话通信,或评估获取电子临床指南等。

图5。提议的“磨合和退出”设计
查看此图

结论:克服亲创新偏见

流失定律可能是发表偏倚的一个原因,因为拥有电子健康试验和高流失率的作者可能很难发表他们的作品。如果期刊编辑和审稿人看到大量的辍学率,他们通常会皱眉。在医学互联网研究杂志在美国,高辍学率的研究是受欢迎的,因为我们知道,在许多情况下,在试验情况下终止电子卫生创新是一个生活事实,值得报告。流失率数据可能为现实生活中的收养问题提供线索。

我们很少看到对流失率进行深入分析的另一个原因是,许多研究人员(特别是如果他们参与了应用程序的开发)有一种隐性的支持创新的偏见,不期望创新会被拒绝。8]。这导致忽视或低估停产。因此,罗杰斯指出:“我们对创新的成功了解得太多,而对创新的失败了解得不够。”对于扩散学者来说,电子健康尤其为研究被拒绝或停止的创新提供了一个特别丰富的领域,电子健康学者可能希望开始将他们的注意力集中在消耗、吸收和扩散措施上,就像他们过去强调结果有效性一样。

  1. 刘建军,刘建军,刘建军。基于网络自助认知行为治疗惊恐障碍的研究进展。[J]医学与互联网研究2005,26;7(1):7 [J]免费全文] [Medline] [CrossRef
  2. Christensen H, Griffiths KM, Korten AE, Brittliffe K, Groves C.自发使用认知行为治疗网站与试验参与者焦虑和抑郁症状变化的比较。[J] Med Internet Res 2004; 12 (4): 96 [J]免费全文] [Medline] [CrossRef
  3. 葛瑞森,葛瑞菲思,乔姆。利用互联网提供抑郁症干预:随机对照试验。中华医学杂志2004;31 (2):1 - 5 [j]免费全文] [Medline] [PMC] [CrossRef
  4. 吴瑞春,张建军,张建军,张建军。基于网络的心衰患者-医生沟通工具的初步研究。[J]医学与互联网研究2005,26;7(1):8 [J]免费全文] [Medline] [CrossRef
  5. 杨建军,杨建军。利用互联网改变饮食和体育活动的生活方式:可行性研究。中国医学信息学报,2004;6(3):928 [J]免费全文] [CrossRef
  6. 埃特尔摩根富林明。比较两种基于互联网、电脑定制的戒烟计划的效果:一项随机试验。[J]医学与互联网研究2005,8;7(1):2 [J]免费全文] [Medline] [CrossRef
  7. 在一项基于互联网的随机对照试验中评估健康网站的问题。[J]互联网研究,2002,12 (3):17 [J]免费全文] [Medline] [CrossRef
  8. 《创新的扩散》,第5版。纽约,纽约:自由出版社;二零零三年八月十六日。

G·艾森巴赫编辑;提交31.03.05;H克里斯滕森的同行评审;接受31.03.05;发表31.03.05

版权

©Gunther Eysenbach。原载于医学互联网研究杂志(//www.mybigtv.com), 2005年3月31日。除非另有说明,发表在《医学互联网研究杂志》上的文章是在知识共享署名许可(http://www.creativecommons.org/licenses/by/2.0/)的条款下发布的,该许可允许在任何媒体上不受限制地使用、分发和复制,前提是正确引用原创作品,包括完整的参考书目细节和URL(见上面的“请引用”),并包括本声明。

Baidu
map