发表在15卷第11名(2013): 11月

在在线干预中使用多重估算来适应超时

在在线干预中使用多重估算来适应超时

在在线干预中使用多重估算来适应超时

原始论文

1美国华盛顿州西雅图市生物统计组健康研究所

2华盛顿大学生物统计学系,西雅图,华盛顿州,美国

3.群体健康研究所,西雅图,华盛顿州,美国

通讯作者:

苏珊·M·肖特雷德博士

集团健康研究所

生物统计学单位

小大道1730号,1600室

西雅图,华盛顿州,98101

美国

电话:1 206 287 2088

传真:1 206 287 2871

电子邮件:shortreed.s@ghc.org


背景:准确估计个人接触在线干预内容的时间对于理解项目参与非常重要。这可以通过时间戳数据来计算,这些数据反映了进出各个网页的导航。长时间的不活动通常使用暂停功能处理,并分配预先指定的暴露时间。不幸的是,这种做法会导致描述程序公开的结果有偏差。

摘要目的:这项研究的目的是描述如何使用多重估算来更好地解释浏览网页所花费的时间,这些时间会导致长时间的不活动或超时。

方法:为了说明这种方法,我们展示了从Q中收集的超时数据2随机戒烟试验。在这项分析中,我们评估了接受以说明性语调和动机性语调书写的内容对干预暴露的影响。使用多重imputation,我们创建了五个完整的数据集,其中导致超时的浏览网页的时间被替换为用imputation模型估计的值。我们使用鲁宾公式计算标准误差,以解释由于impution引起的可变性。我们还说明了当前计算超时的方法(排除超时页面浏览量或分配任意查看时间)如何影响关于参与者参与度的结论。

结果:共有63.00%(1175/1865)的参与者在Q中访问了在线干预2审判。在6592个独特的页面视图中,683个(10.36%,683/6592)导致了超时。浏览没有超时的网页的平均时间为1.07分钟。假设参与者没有花费任何时间浏览导致超时的网页,则观察不到两种消息音之间的差异(平均在线时间之比:0.87,95% CI 0.75-1.02)。将导致超时的所有页面浏览时间分配为30分钟,得出的结论是,接收激进型内容的参与者比接收规范性内容的参与者花费更少的时间查看内容(平均在线时间比:0.86,95% CI 0.77-0.98)。使用多重估算来解释超时,得出的结论是,两种消息音之间的参与者参与度没有差异(平均在线时间之比:0.87;95% ci 0.75-1.01)。

结论:所选择的分析技术可以显著影响在线干预参与的结论。我们提出了一种标准化的方法,其中花费在查看导致超时的网页上的时间被视为丢失的信息,并通过多次估算进行更正。

试验注册:Clinicaltrials.gov NCT00992264;http://clinicaltrials.gov/ct2/show/NCT00992264(由WebCite存档于http://www.webcitation.org/6Kw5m8EkP)。

中国医学杂志,2013;15(11):e252

doi: 10.2196 / jmir.2781

关键字



跟踪内容曝光时间

随着基于互联网的行为干预变得越来越普遍,研究人员了解人们如何与这些程序交互变得越来越重要,包括参与者花费在查看单个内容页面和与整个程序交互上的时间[1-3.].接触时间是参与的几个重要代理之一,可能是项目对参与者的知识、态度和行为的预期影响的重要中介。

曝光时间可以通过监控每个网页何时打开或退出,或浏览器本身何时关闭来跟踪。更复杂的软件可以通过跟踪击键或鼠标点击来进一步评估特定网页上的活动,但没有软件能够区分用户是在积极阅读或浏览页面,还是在周围进行其他活动。此外,跟踪活动也有限制,比如在单独的浏览器或窗口中查看内容,甚至在其他开放的程序或应用程序中并发工作。在所有情况下,结果将出现在程序网页上的长时间不活动。

应对这些长时间不活动的常见策略是在预定的时间后暂停运动(例如30分钟)[4-11].这种策略作为结束程序的一种手段是有意义的,但是依赖这些超时期间的时间戳数据作为参与者实际接触开放网页中程序内容的时间指标是有误导性的。其他研究人员允许长时间的页面浏览,没有超时功能,但为了分析目的,会在实际浏览时间后截断假设的实际浏览时间[5-71213].由于这两种方法对于测量上网时间的目的是等效的,我们将它们等同对待,并将它们分别称为“超时”。

不幸的是,上述两种方法在估算参与者积极浏览在线内容的时间时都不理想。每个人都可能高估或低估了真实的观看时间。个人花在网页上的实际时间长度是未知的,导致信息丢失。因此,排除所有导致超时的页面视图与完整的案例分析相同,分配任意长度的时间与单一的、不知情的归责方法相同。众所周知,完整的案例分析可能会导致偏差和功率的降低,单一的imputation也一样[14-16].作为另一种分析方法,我们建议使用标准的缺失数据方法,特别是多重imputations (MI),以适应在分析在线时间时长时间不活动或超时的情况。

多重估算是一种灵活而直接的方法来容纳缺失的数据,它使用可用的观测信息来预测缺失信息的值。标准的软件和简单的公式可以用来将多个imputation纳入分析。我们概述了如何实现多种估算方法,回顾标准公式,以适应导致超时的页面视图。例如,我们使用了一项名为“关于戒烟的问题”的在线戒烟干预随机试验收集的数据(问2)试验[1017].使用该试验的数据,我们演示了处理超时数据所选择的方法如何显著影响有关程序暴露的结论。

关于退出试验的问题

的问2该试验是由华盛顿州西雅图市的群体健康研究所和密歇根州安阿伯市密歇根大学健康传播研究中心合作进行的。关于研究设计和方法的详细信息已在其他地方发表[17].简而言之,研究人员从一个大型区域健康计划人群中招募成年吸烟者,并邀请他们参加一项随机临床戒烟试验;然而,参与者不必有戒烟的兴趣来注册。这项全因子随机试验的主要目的是18]的目的是评估四种特定设计特征或因素的对比水平对吸烟者的戒断和利用通过他们的健康保险提供的辅助治疗(咨询和药物治疗)的影响。每个设计因素的对比水平对项目参与度的影响也进行了探索,并已发表[10].

该试验的参与者被随机分配到四个设计因素的16个不同水平组合中的一个,其中一半的参与者被分配到每个因素的两个对比水平中的一个。随机分组根据参与者戒烟准备程度的基线测量进行分层。这四个因素和每个因素的两个对比层次分别是信息语气(说明性和动机性);导航自主权(指定与非指定);主动的电子邮件提醒(是vs否);以及推荐信的可用性(是与否)。在这里,我们专注于比较两种不同水平的信息语调对项目参与度的影响,通过在研究注册后的头两个月评估的在线干预内容所花费的总时间来衡量。一半的参与者随机接受以说明性信息语调写的干预内容,另一半随机接受以激励性语调写的干预内容。以说明性口吻撰写的干预内容具有说教性,直接建议吸烟者戒烟,并具体说明如何实现这一目标。相比之下,动机性信息的语气与动机性访谈的主要原则一致(表达同理心、发展差异、抵抗、支持自主性和自我效能)[19].

的问2每次参与者访问干预网站时,程序都会收集自动跟踪数据。这个自动收集过程记录了每个参与者访问网站的日期和时间,以及每次通过退出干预网站、关闭浏览器或移动到不同的干预网页或同一浏览器窗口中的外部网页来访问或离开内容页面时的个人日期/时间戳。的问2在线干预包括一个自动超时功能,可以在参与者不活动30分钟后让他们退出该项目。


倍增输入页面浏览时间

缺失信息通常根据假设的缺失数据生成过程进行分类,也就是说,影响特定数据元素缺失或观察到的概率的决定因素。一般的缺失数据生成过程有三种:完全随机缺失(MCAR)、随机缺失(MAR)和非随机缺失(NMAR) [1520.].MCAR假设数据元素缺失的概率独立于观察到的和未测量的信息。这在实践中不太可能发生,并且是完整的案例分析是公正的唯一情况(权力的减少总是发生)。较少限制的MAR生成过程假设数据元素缺失的概率取决于观察到的信息,而NMAR意味着缺失的概率取决于观察到的和未测量的信息。

多重计算是容纳缺失数据的一种灵活而直接的方法。Imputation方法使用观测到的信息估计预测模型,并用估计的预测模型中的样本替换缺失的数据元素。采用多种imputation方法优于单一imputation [151621],并重复利用估计的预测模型来创建几个完整的数据集。然后对每个完整的数据集进行分析,就像观察到所有信息一样,并在每个完整的数据集上组合信息。

当需要多元填充模型时,有两种常用的方法来估计预测模型(即,当多个变量包含丢失的数据或一个纵向变量随着时间的推移具有丢失的信息)。一种方法假设所有记录变量的联合预测分布[2223],另一种方法分别为每个信息缺失的变量估计单独的条件预测模型[24-26].第二种方法被称为链式方程多重imputation (MICE)或全条件规范,由于其计算效率和灵活性而越来越受欢迎。MICE过程可以很容易地适应二进制、分类和连续变量,以及更复杂的数据挑战,如有界变量值和个人子集的输入信息。由于这些原因,我们使用MICE来估算丢失的页面浏览时间(即页面浏览超时的时间)。

MICE方法循环使用每个变量的缺失信息,估计每个变量的回归模型。然后用这些基于回归的预测分布的样本替换缺失值,其中包括适当的随机误差。有几个内置和独立的软件包可实现MICE程序[27-30.].MICE算法首先用朴素值(例如,变量观测值的中位数)来输入所有缺失的信息;然后,考虑包含缺失信息的第一个变量(变量1)(通常是缺失数据最少的变量)。基于回归的预测模型是使用变量1的观测值和所有其他变量的观测值和天真的估算值来估计的。通常所有其他变量都被用作预测因素,除非分析师选择限制预测因素的集合[3132].从变量1中朴素地估算的值被从这个预测模型中提取的估算值所取代,然后继续到第二个缺少信息的变量(变量2)。使用变量2的观测值、变量1的观测值和新估算值,以及所有其他预测因子的观测值和朴素地估算值,来估计一个预测模型。然后将变量2的原始估算值替换为从这个新估算的估算模型中提取的估算值。注入过程循环遍历所有包含缺失信息的变量,用新估计的注入模型来替换天真地注入的缺失值。当MICE算法循环遍历所有缺少信息的变量时,这被称为一次“迭代”。然后重复循环,将第一次迭代中的估算值替换为第二次迭代中新估计的预测模型的估算值。使用多次MICE迭代以确保imputation已经“稳定”,这样变量循环的顺序不再影响imputation值[2431].

MICE算法的迭代特性提供了优点和缺点。虽然MICE程序在实践中已被证明是有用的,但它没有替代imputation方法的坚实的理论依据。例如,不能保证收敛性(即“稳定”的imputation值)[2425].也有可能,条件归因模型将被估计为不存在与所有条件分布一致的联合多元分布。虽然这些缺陷在理论上可能引起合理的关注,但在实践中,它们似乎通常不值得关注[21243334],而MICE越来越多地被用来弥补分析中缺失的数据[3135-37].

一次已经创建了完整的数据集,每个完成的数据集都用于计算兴趣的估计值(参见#1)多媒体附件1),其中下标用来表示估计对应于-th完成的数据集。的平均值估计(见第2条)多媒体附件1)作为感兴趣参数的估计值。Rubin开发了一个简单的公式,用于估计多个imputation估计器的标准误差,该公式考虑了估计器的传统抽样可变性和由于imputation过程而增加的可变性[153839].鲁宾公式可用于计算大多数标准估计器的标准误差。它是M个完全数据标准误差(W1, . .)和跨M个估算的完整数据估计值之间的可变性(B).让W的完备数据估计器的标准误差-th估算数据集,则Rubin的估算器标准误差公式如中#3所示多媒体附件11538].在实践中,分析人员通常使用5-10次imputation,因为这已被证明足以正确捕获imputation估计器中的可变性[39].

我们生成了五个完整的数据集,其中所有缺失的页面浏览时间都被来自估计的条件imputation模型的样本所取代。假设归责模型为正态分布,在对数变换页面浏览次数后,用均值和适当的标准偏差估计线性回归模型。我们以广泛的格式构建数据,每个人代表数据集中的一行,多个网页视图由多个列表示。一个新的归责模型估计每重复的页面浏览量。我们使用观察到的页面浏览时间来估算估算模型,并且仅对那些观察到的页面浏览进行估算,但这会导致自动超时。使用线性回归模型指定每个条件预测分布的平均值,并使用以下预测指标:基线参与者信息(参与者人口统计数据、吸烟史、吸烟信念和戒烟准备程度)、随机组和参与者在第一个核心内容页面上花费的分钟数。此外,我们还使用了关于所浏览网页类型的信息作为预测因素,例如网页中涉及的内容(准备戒烟、戒烟和保持戒烟)和所浏览的页面类型(例如,介绍页、推荐页)。

内容语气对用户粘性的影响

我们计算了干预访问的总数、个人页面浏览量以及导致超时的页面浏览量。我们总结了参与者花费在查看干预内容上的时间分布(以分钟为单位),排除了所有超时的页面视图。在计算了缺失页面浏览时间后,通过将花费在干预网页上的分钟数相加,计算出每个参与者的总在线时间。为了评估为导致超时的页面浏览时间分配任意值的影响,我们改变了分配给页面视图的超时分钟数,从接近零到30分钟。

然后,我们使用零膨胀泊松(ZIP)模型比较了查看干预内容所花费的总时间中消息语气的对比因素水平[4041].我们使用ZIP模型是因为在线总时间的分布比泊松分布的预期有更大的零比例;从未接触过干预内容的研究对象在网上花费的总时间都为零,导致分布中显著的点质量为零。我们在ZIP的逻辑部分中包括了一个截距项,该部分对总体中的“多余”零进行建模。在ZIP模型的泊松部分,我们纳入了随机因素水平和基线戒烟准备程度测量,用于分层随机化。我们报告来自ZIP模型的泊松部分的估计。一般来说,从泊松模型中得到的估计被解释为发病率比率,但当所有受试者都有一个共同的暴露时间时,如Q2试验,估计可以解释为比较两个对比因素水平的平均事件计数的比率。因此,我们报告了接收到激励语气内容的个人与接收到说明性信息语气的个人在线花费的平均分钟数的比率。我们使用Stata Version 12进行所有分析,包括计算缺失页面浏览次数[30.42].


的问2试验招募了1865名吸烟者;1175(63.00%, 1175/1865)参与者至少访问了一次在线干预。干预内容总共在1691次单独访问中被查看,导致6592次独特的页面视图。总共有683次(10.36%,683/6592)的页面浏览在30分钟不活动后自动超时,550次(46.81%,550/1175)的参与者至少有一次页面浏览导致了超时。图1显示花在没有导致超时的页面视图上的时间分布;观察到花在干预页面上的时间中位数为1.07分钟(四分位数范围0.47-2.27)。这表明,将导致超时的所有页面浏览量分配为30分钟,会高估参与者用于查看在线干预内容的时间。

图2当被分配用于浏览导致超时的网页的时间值从接近零到30分钟不等时,呈现那些收到规定性内容的人与那些收到激进性内容的人的平均在线花费时间的估计比例。虽然均值估计值的比值稳定在0.87左右,但估计值周围的95%置信区间(CI)的宽度随着分配给超时的时间的变化而变化。为超时分配一个接近零的值(0.00001分钟),结果是估计值为0.87,95% CI 0.75-1.02,其中包括1(即未能拒绝原假设,即两个因素水平之间的参与者参与度在0.05显著性水平上没有差异)。或者,给自动超时的页面浏览量分配30分钟的值,得到的估估值为0.86,95% CI 0.77-0.97(不包括1),得出的结论是,分配给规定语气的参与者查看内容的时间明显少于分配给激励语气的参与者。

5个完整数据集的平均值(即,超时替换为估算的页面查看时间),用于查看干预内容的平均总时间为12.3分钟。观看干预的总时间从少于1分钟到超过180分钟不等,中位数为7.0分钟。比较以规定性语调观看内容与以激励性语调观看内容的人观看干预内容的平均累积分钟数,其均值之比为0.87 (95% CI 0.75-1.01;P= 0。06)。因此,以说教性语气呈现内容的参与者观看在线干预内容的时间减少了13%,尽管这一差异在0.05水平上没有统计学意义。

图1。用于查看干预页面的时间分布,不包括导致自动超时的页面视图。
查看此图
图2。将任意在线时间分配给导致超时的页面浏览量的模型结果的敏感性(从零膨胀泊松模型估计的平均在线时间的比率,比较以规范性[RX]语气接收内容的个体与以激励性[MI]语气接收内容的个体)。
查看此图

主要研究结果

在过去十年里,基于互联网的行为和教育干预项目的数量呈爆炸式增长。当研究人员试图了解如何优化这些项目的设计以使其最有效时,研究人员必须检查参与者在多大程度上接触和参与这些项目,以及这种相互作用在多大程度上影响干预结果。即使出现了更复杂的方法来跟踪程序的交互性,仍然会有一段时间,无论是设计还是偶然,都不涉及直接的人机交互,导致长时间的“不活动”。正如我们的案例所示,如何分析处理这些数据可以显著地改变关于参与者实际花费多少时间查看内容的结论。反过来,这可能会影响旨在探索程序暴露是否介导所观察到的治疗效果的分析。

结论

我们提出了一种标准方法,研究人员利用本文中概述的MI过程来管理长时间的不活动或超时数据。使用这种方法的决定应该是先验的,因为人们无法提前知道给暂停分配任意值会对研究结论产生多大影响。鼓励研究人员在未来检查在线干预内容的暴露时采用多重imputation。

致谢

该研究由美国国家癌症研究所(R01 CA138598, J McClure, PI)资助。我们非常感谢在群体健康研究所和密歇根大学的许多研究团队成员的贡献。这项研究中评估的干预措施是由群体健康研究所和密歇根大学的研究人员开发的。

利益冲突

Shortreed博士获得了Bristol Meyers Squibb公司授予群体健康研究所的研究补助金。鲍嘉先生和麦克卢尔博士没有利益冲突需要声明。

多媒体附件1

2截图。

PNG文件,139KB

  1. Bennett GG,格拉斯哥RE.通过互联网提供公共卫生干预措施:实现其潜力。年度修订公共卫生2009;30:273-292。[CrossRef] [Medline
  2. Baker TB, Gustafson DH, Shaw B, Hawkins R, Pingree S, Roberts L,等。CONSORT报告标准与电子保健干预措施研究的相关性。患者教育计数2010年12月;81增刊:S77-S86 [免费全文] [CrossRef] [Medline
  3. Proudfoot J, Klein B, Barak A, Carlbring P, Cuijpers P, Lange A,等。建立执行和报告互联网干预研究的指导方针。认知行为治疗2011年6月12日;40(2):82-97。
  4. 彼得森ET网站测量黑客。加利福尼亚州塞瓦斯托波尔:O'Reilly Media;2005.
  5. Danaher BG, Boles SM, Akers L, Gordon JS, Severson HH。在基于网络的健康行为改变项目中定义参与者暴露测量。中国医学杂志,2006;8(3):e15 [免费全文] [CrossRef] [Medline
  6. Danaher BG, Seeley JR.基于网络的行为干预研究中的方法问题。Ann Behav Med 2009 Aug;38(1):28-39。[CrossRef] [Medline
  7. 克伦肖K,库里W,萨拉尼特罗AH,萨福德MM,休斯顿TK,艾利森JJ,等。医生参与网络CME是否与患者的基线糖化血红蛋白水平有关?农村糖尿病在线护理研究。2010年9月;85(9):1511-1517 [免费全文] [CrossRef] [Medline
  8. Crutzen R, rojen JL, Poelman J.使用谷歌分析作为互联网提供干预的过程评估方法:以性健康为例。健康促进杂志2013年3月28日(1):36-42。[CrossRef] [Medline
  9. 陈建平,陈建平,陈建平,等。提高对基于网络的戒烟计划的坚持:一项随机对照试验研究方案。《审判》2013;14:48 [免费全文] [CrossRef] [Medline
  10. McClure JB, Shortreed SM, Bogart A, Derry H, Riggs K, St John J,等。项目设计对参与基于互联网的吸烟干预的影响:随机析因试验。中国医学杂志,2013;15(3):e69 [免费全文] [CrossRef] [Medline
  11. 李志强,李志强,李志强,等。参与促进基于网络的戒烟干预:队列研究。中国医学网络学报,2013;29 (1):314 [免费全文] [CrossRef] [Medline
  12. Glasgow RE, Christiansen SM, Kurz D, King DK, Woolley T, Faber AJ,等。参与糖尿病自我管理网站:使用模式和程序使用的普遍性。中国医学杂志,2011;13(1):e9 [免费全文] [CrossRef] [Medline
  13. Zbikowski SM, Jack LM, McClure JB, Deprey M, Javitz HS, McAfee TA,等。在一项随机试验中使用服务,测试手机和网络戒烟干预措施。尼古丁Tob Res 2011年5月;13(5):319-327 [免费全文] [CrossRef] [Medline
  14. Allison PD。缺失的数据。美国加州千橡市:鼠尾草;2002.
  15. 小RJA, Rubin DB。缺失数据的统计分析。第二版,纽约。美国:J Wiley & Sons;2002.
  16. 国家研究委员会。临床试验数据缺失的预防与处理。处理临床试验中缺失数据的小组,国家统计委员会,行为和社会科学与教育司,编辑。华盛顿:美国国家科学院出版社;2010.
  17. McClure JB, Derry H, Riggs KR, Westbrook EW, St John J, Shortreed SM,等。关于戒烟的问题(Q2):在线动机性戒烟干预的多阶段优化策略(MOST)随机筛查实验的设计和方法。conp cltrials 2012 Sep;33(5):1094-1102。[CrossRef] [Medline
  18. 吴cfj, Hamada M.实验:规划、分析和参数设计优化。纽约:Wiley and Sons, Inc;2000.
  19. 《动机性访谈:让人们为变革做好准备》第二版,纽约:吉尔福德出版社;2002.
  20. 小RJ, D'Agostino R, Cohen ML, Dickersin K, Emerson SS, Farrar JT,等。临床试验数据缺失的预防与处理。中华外科杂志2012 10月4日;367(14):1355-1360。[CrossRef] [Medline
  21. Blankers M, Koeter MW, Schippers GM.电子健康研究中的缺失数据方法:模拟研究和非数学倾向研究人员的教程。中国医学杂志,2010;12(5):e54 [免费全文] [CrossRef] [Medline
  22. 谢弗莱托。不完全多元数据分析。英国伦敦:Chapman & Hall;1997.
  23. 谢弗莱托。多元线性混合模型下缺失协变量的归因。技术报告,宾夕法尼亚州立大学统计系,1997:1-24。
  24. 李志强,李志强,李志强。一种基于多元回归模型的缺失值多重输入方法。调查方法2001;27(1):85-95。
  25. Van Buuren S, Brand JPL, Groothuis-Oudshoorn CGM, Rubin DB。多元imputation的全条件规范。统计计算与仿真学报2006;76(12):1049-1064。
  26. 离散和连续数据的多重归算全条件规范。Stat Methods Med Res 2007 Jun;16(3):219-242。[CrossRef] [Medline
  27. Raghunathan TE, Solenberger P, Van Hoewyk J. IVEware: Imputation和方差估计软件用户指南。密歇根大学社会研究所调查研究中心2001:1-73。
  28. 霍顿NJ,克莱曼KP。无事生非:缺失数据方法和软件的比较,以适应不完整的数据回归模型。Am Stat 2007年2月;61(1):79-90 [免费全文] [CrossRef] [Medline
  29. 陈晓峰,王晓峰,王晓峰,等。基于链式方程的小鼠多变量归一化研究。中国生物医学工程学报,2011;45(3):1-67。
  30. Royston P, White IR。链方程(小鼠)的多重imputation:在Stata的实现。统计软件学报2011;45(1):1-20。
  31. Stuart EA, Azur M, Frangakis C, Leaf P.大型数据集的多重imputs:儿童心理健康倡议的案例研究。美国流行病学杂志2009年5月1日;169(9):1133-1139 [免费全文] [CrossRef] [Medline
  32. 肖瑞SM, Laber EB, Pineau J, Murphy SA。抗精神病药物临床试验的干预和有效性研究的估算方法。麦吉尔大学计算机科学学院2010:1-26。
  33. 谢弗JL,格雷厄姆JW。缺失的数据:我们对技术现状的看法。心理方法2002 6月7(2):147-177。[Medline
  34. 李kj, Carlin JB。缺失数据的多重填充:全条件规范与多元正常填充。美国流行病学杂志2010年3月1日;171(5):624-632 [免费全文] [CrossRef] [Medline
  35. 拉格纳坦TE,西斯科维克DS。药物治疗高血压患者原发性心脏骤停风险的病例-对照研究的多重归因分析应用统计1996;45:35 -352。
  36. 巴纳德J,孟XL。多重归责在医学研究中的应用:从艾滋病到NHANES。统计方法医学杂志1999年3月8日(1):17-36。[Medline
  37. 李国强,李国强,李国强。纵向饮食数据中的缺失值:基于完全条件规范的多重imputation方法。统计医学2009年12月20日;28(29):3657-3669。[CrossRef] [Medline
  38. 鲁宾DB, Schenker N.从可忽略无响应的简单随机样本中进行区间估计的多重imputation。中国统计杂志,1986;32(3):366-374。
  39. 鲁宾DB。调查中不回应的多重归因。纽约:J Wiley & Sons;1987.
  40. Böhning D, Dietz E, Schlattmann P, Mendonca L, Kirchner U.牙科流行病学中的零膨胀poisson模型。中国社会科学学报(英文版);1999;
  41. presisser JS, Stamm JW, Long DL, Kincade ME。对流行病学研究中龋齿指数零膨胀计数回归模型的回顾和建议。龋齿决议2012;46(4):413-423 [免费全文] [CrossRef] [Medline
  42. StataPress。Stata统计软件:第12版。大学城,德克萨斯州:Stata Corp;2011.


3月:随机失踪
MCAR:完全随机失踪
小姐:多个罪名
老鼠:链式方程的多重计算
NMAR:不是随机丢失
邮政编码:零膨胀泊松模型


G·艾森巴赫(G Eysenbach)编辑;提交18.06.13;M Blankers, C Morrison的同行评议;对作者19.08.13的评论;修订版本于05.09.13收到;接受13.10.13;发表21.11.13

版权

©Susan M Shortreed, Andy Bogart, Jennifer B McClure。最初发表于《医疗互联网研究杂志》(//www.mybigtv.com), 2013年11月21日。

这是一篇开放获取的文章,根据创作共用署名许可(http://creativecommons.org/licenses/by/2.0/)的条款发布,允许在任何媒介上无限制地使用、分发和复制,前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。


Baidu
map