这是一篇在知识共享署名许可(https://creativecommons.org/licenses/by/4.0/)下发布的开放获取文章,该许可允许在任何媒介上不受限制地使用、分发和复制,前提是原始作品首次发表在《医学互联网研究杂志》上,并适当引用。必须包括完整的书目信息,到//www.mybigtv.com/上原始出版物的链接,以及版权和许可信息。
基于网络的问卷调查越来越多地用于流行病学研究,因为传统方法正面临着回复率下降和成本增加的问题。然而,很少有研究调查与网络流行病学问卷完成程度相关的因素。
我们的目标是在基于网络的问卷中确定与中断(未完成问卷)和项目无反应相关的个人水平特征和项目设计因素。
本研究是对2005年至2016年意大利NINFEA (Nascita e Infanzia: gli Effetti dell’ambiente)出生队列基线问卷的横断面分析。基线调查问卷对登记的妇女进行管理,她们可以在怀孕期间的任何时间登记。采用logistic回归分析个人层面因素对问卷断裂的影响,并建立logistic多层次模型(第一层次:问卷条目;第二层:问卷部分;第三层次:研究参与者)分析个人层面和项目设计因素对项目无反应的影响。由于适用项目的数量取决于被调查者的特征和中断,我们使用逆概率加权来处理设计中的缺失。
5970名女性中,519名(8.69%)未完成问卷。年龄较大(校正优势比1.40,95% CI 1.05-1.88)、教育程度较低(校正优势比[OR] 1.53, 95% CI 1.23-1.90)和妊娠早期(校正优势比3.01,95% CI 2.31-3.92)与问卷破裂呈正相关。在显示给参与者的1,062,519个适用的项目中,22,831个没有反应(项目无反应的总体发生率为2.15%)。项目无反应与年龄较大(校正OR 1.25, 95% CI 1.14-1.38)、妊娠前三个月(校正OR 1.18, 95% CI 1.06-1.31)和教育水平较低(校正OR 1.23, 95% CI 1.14-1.33)呈正相关。下拉菜单项(调整后的OR为1.77,95% CI为1.56-2.00)和网格中组织的项目(调整后的OR为1.69,95% CI为1.49-1.91)与项目无反应呈正相关。
使用有针对性的策略来保持参与者的积极性是很重要的。网络调查问卷中项目无应答受个人层面和项目设计因素的影响。某些项目类型应该限制,以减少项目无响应。
新的数据收集方法越来越多地用于流行病学研究[
与传统方法相比,基于网络的流行病学问卷具有明显的优势,例如数据质量更高(如果使用过滤问题和一致性检查),成本更低[
虽然项目无反应可能对研究的效度有很大的影响,但很少有研究调查了基于互联网的流行病学问卷完成程度的相关因素[
NINFEA是一项基于网络的出生队列研究,于2005年在意大利启动[
2005 - 2016年,共有7712名孕妇完成了NINFEA基线问卷(数据库版本为2017年3月),其中1176名孕妇参与了1次以上妊娠。问卷最初是使用超文本预处理器脚本语言[
基线调查表由18个部分组成,调查人口因素、产妇一般健康、怀孕前和怀孕期间的暴露、生活方式和生殖史。在这些部分中,有4个部分是补充的,完全依赖于前一部分给出的答案,因此我们没有在分析中考虑它们。我们在分析的14个部分中总共纳入了244个项目;其中,7项是强制性的,因此我们将其排除在分析之外。因此,我们总共分析了237个项目,尽管在每个参与者完成问卷时,呈现给他们的实际项目数量有所不同,因为过滤问题使问题集不适用。例如,对“你在怀孕期间吸烟吗?”就会跳过一系列关于吸烟的问题。相反,对相同的过滤器问题的肯定回答将向应答者呈现一组有关吸烟的适用问题。
我们分析了2个结果:问卷断裂和项目无反应。如果受访者在到达最后一节之前停止回答问题,我们认为她已经中断了调查问卷。如果最后一节全部或部分完成并提交,即使前几节中有些项目是空白的,我们也认为问卷不应该被分割。因此,在问卷的最后一部分不可能出现中断。对于问卷中断的分析,分析单位是5970名至少完成了问卷的一个部分的女性。
我们对问卷14个部分的237个非强制性项目进行了分析。我们对5970名参与者的237个非强制性项目进行了评估,如果项目适用,则将空白视为无反应。项目nonresponse被构造为一个二元变量:1=nonresponse, 0=response。分析单位为问卷项目(最多237项× 5970名女性= 1414890项)。
我们分析了以下个人层面的特征作为问卷破裂的预测因素:年龄(≤30岁、31-35岁、≥36岁)、大学学历(是、否)、入组时的妊娠期(妊娠前期、妊娠中期、妊娠晚期)、首次妊娠(是、否)、妊娠初的就业状况(在职、失业)、招聘类型(线下、线上)、意大利居住地区(皮埃蒙特大区、托斯卡纳大区、意大利北部其他地区等)、基线问卷参与人数(1、≥2)。除参与人数外,所有暴露变量均在基线问卷中自我报告,该问卷是根据女性编制的基线问卷总数构建的。我们从第一个问题开始评估招募的类型,该问题询问了参与者了解研究的方式。我们将传单、海报、口碑、面对面邀请、传统媒体作为线下招聘方式,将网站内置链接和社交媒体网站作为线上招聘方式。具体来说,对于在线招聘,我们在选定的针对孕妇或卫生保健工作者的论坛或网站上,在选定的产科或儿科医院或大量分娩医院的主页上,以及在NINFEA的Facebook页面上宣传了这项研究。所涉及的网站、论坛和医院的数量随着时间的推移而变化,这取决于所启动的特定合作类型。我们在Facebook上开展了两次针对育龄女性的小型广告活动[
我们评估了与问卷中断分析的个人层面特征相关的项目无反应,以及与项目本身设计相关的项目:(1)项目类型(复选框,下拉菜单,单选按钮,文本),(2)响应选项的数量,以及(3)项目是否位于网格中(是,否)。
我们采用logistic回归和稳健方差估计,根据个人因素估计了中断问卷的比值比(ORs)和95%置信区间,以解释参加NINFEA队列的母亲在1次以上怀孕期间的回答之间的相关性。
为了分析个人层面和项目设计因素与项目无反应的关系,我们使用了一个三层次逻辑回归模型。问卷项目构成第一层次,问卷部分构成第二层次,回答问卷的女性构成第三层次。通过对产妇年龄、大学学历、就业状况、妊娠期、是否首次怀孕、招聘类型、居住地区和参与人数进行相互调整,拟合了原始模型和调整后的模型。
由于在问卷中使用了过滤器,需要回应的项目总数因参与者而异。为了解释这些差异,我们应用逆概率加权(IPW)技术来处理设计的数据缺失[
使用Stata 15.0软件(StataCorp LLC)进行分析。
研究人群的特征(N=5970)。
参与者的特征 | n (%)一个 | |
|
||
|
≤30 | 1735 (29.06) |
|
31-35 | 2505 (41.96) |
|
≥36 | 1730 (28.98) |
|
||
|
是的 | 3605 (61.59) |
|
没有 | 2248 (38.41) |
|
||
|
失业 | 903 (15.13) |
|
使用 | 5067 (84.87) |
|
||
|
第一个 | 968 (16.41) |
|
第二个 | 1798 (30.48) |
|
第三 | 3133 (53.11) |
|
||
|
是的 | 3196 (53.58) |
|
没有 | 2769 (46.42) |
|
||
|
离线 | 4839 (83.71) |
|
在线 | 942 (16.29) |
|
||
|
皮埃蒙特地区 | 3328 (56.14) |
|
托斯卡纳地区 | 1720 (29.01) |
|
意大利北部的其他地区 | 500 (8.43) |
|
其他 | 380 (6.41) |
|
||
|
1 | 4794 (80.30) |
|
≥2 | 1176 (19.70) |
一个由于缺少值,总数可能会有所不同。
在5970名女性中,519名(8.69%)未完成NINFEA基线问卷。中断分布在问卷的13个部分。
问卷项目特征及根据项目特征的无应答频率。
项目的特点 | n (%) | 无响应,n (%)一个 | |
部分 | 14 | N/Ab | |
项目 | 237 | 22831 (2.15) | |
|
|||
|
没有 | 148 (62.4) | 3900 (1.84) |
|
是的 | 89 (37.6) | 18931 (2.22) |
|
|||
|
复选框 | 14 (5.9) | 804 (1.48) |
|
下拉菜单 | 49 (20.7) | 7454 (2.84) |
|
单选按钮 | 116 (48.9) | 12335 (2.17) |
|
文本(开放性问题) | 58 (24.5) | 2238 (1.26) |
|
|||
|
2 | 69 (38.6) | 7606 (2.20) |
|
3 - 5 | 85 (47.4) | 11827 (2.65) |
|
≥6 | 25 (14.0) | 1160 (1.27) |
|
|||
|
没有 | 198 (83.5) | 16625 (1.96) |
|
是的 | 39 (16.5) | 6206 (2.92) |
一个根据所有参与者未回应的项目总数与适用项目总数(n=1,062,519)之间的比率计算。
b-不适用。
c没有考虑文本项。
根据被试的特点分问卷。
参与者的特征 | n (%) | 粗略分析,或一个(95%置信区间) | 调整分析b,或(95% ci) | |
|
||||
|
≤30 | 137 (7.9) | 1.00 | 1.00 |
|
31-35 | 213 (8.5) | 1.08 (0.87 - -1.36) | 1.11 (0.84 - -1.44) |
|
≥36 | 169 (9.8) | 1.26 (1.00 - -1.60) | 1.40 (1.05 - -1.88) |
|
||||
|
是的 | 220 (6.1) | 1.00 | 1.00 |
|
没有 | 206 (9.2) | 1.55 (1.27 - -1.90) | 1.53 (1.23 - -1.90) |
|
||||
|
使用 | 363 (7.2) | 1.00 | 1.00 |
|
失业 | 156 (17.3) | 2.71 (2.21 - -3.32) | 0.99 (0.73 - -1.34) |
|
||||
|
第三 | 189 (6.0) | 1.00 | 1.00 |
|
第二个 | 134 (7.5) | 1.25 (1.00 - -1.58) | 1.27 (0.98 - -1.65) |
|
第一个 | 170 (17.6) | 3.32 (2.65 - -4.15) | 3.01 (2.31 - -3.92) |
|
||||
|
是的 | 233 (7.3) | 1.00 | 1.00 |
|
没有 | 286 (10.3) | 1.47 (1.22 - -1.76) | 1.13 (0.90 - -1.43) |
|
||||
|
离线 | 389 (8.0) | 1.00 | 1.00 |
|
在线 | 107 (11.4) | 1.47 (1.17 - -1.84) | 1.11 (0.82 - -1.51) |
|
||||
|
皮埃蒙特地区 | 236 (7.1) | 1.00 | 1.00 |
|
托斯卡纳地区 | 170 (9.9) | 1.44 (1.17 - -1.77) | 1.06 (0.84 - -1.35) |
|
意大利北部的其他地区 | 49 (9.8) | 1.42 (1.03 - -1.97) | 1.14 (0.75 - -1.73) |
|
其他 | 54 (14.2) | 2.17 (1.58 - -2.99) | 1.80 (1.21 - -2.66) |
|
||||
|
1 | 387 (8.1) | 1.00 | 1.00 |
|
≥2 | 132 (11.2) | 1.44 (1.17 - -1.77) | 1.19 (0.91 - -1.57) |
一个OR:优势比。
b模型调整了年龄、大学学历、就业状况、妊娠三个月、首次怀孕、招聘类型、地区和参与人数。
在1,062,519个适用的项目中,有22,831个没有得到回应,总体项目无回应率为2.15%。
所有被分析的项目设计因素都与项目无反应相关(
根据被试的特征,项目无反应的发生率和粗比值比及校正比值比。
参与者的特征 | 患病率(%) | 粗分析,OR (95% CI) | 调整分析一个,或(95% ci) | |
|
||||
|
≤30 | 2.1 | 1.00 | 1.00 |
|
31-35 | 2.0 | 1.03 (0.95 - -1.13) | 1.07 (0.98 - -1.17) |
|
≥36 | 2.4 | 1.25 (1.14 - -1.38) | 1.25 (1.14 - -1.38) |
|
||||
|
是的 | 1.9 | 1.00 | 1.00 |
|
没有 | 2.4 | 1.22 (1.14 - -1.31) | 1.23 (1.14 - -1.33) |
|
||||
|
使用 | 2.0 | 1.00 | 1.00 |
|
失业 | 3.0 | 0.89 (0.78 - -1.01) | 0.87 (0.77 - -0.98) |
|
||||
|
第三 | 2.0 | 1.00 | 1.00 |
|
第二个 | 2.1 | 1.04 (0.96 - -1.12) | 1.00 (0.93 - -1.09) |
|
第一个 | 2.6 | 1.17 (1.06 - -1.29) | 1.18 (1.06 - -1.31) |
|
||||
|
是的 | 2.2 | 1.00 | 1.00 |
|
没有 | 2.1 | 1.05 (0.98 - -1.12) | 1.03 (0.95 - -1.11) |
|
||||
|
离线 | 2.1 | 1.00 | 1.00 |
|
在线 | 2.4 | 1.12 (1.01 - -1.23) | 1.07 (0.96 - -1.18) |
|
||||
|
皮埃蒙特地区 | 1.9 | 1.00 | 1.00 |
|
托斯卡纳地区 | 2.5 | 1.17 (1.08 - -1.27) | 1.16 (1.07 - -1.25) |
|
意大利北部的其他地区 | 1.9 | 1.02 (0.90 - -1.15) | 0.97 (0.85 - -1.11) |
|
其他 | 2.8 | 1.37 (1.16 - -1.61) | 1.14 (0.98 - -1.34) |
|
||||
|
1 | 2.2 | 1.00 | 1.00 |
|
≥2 | 1.9 | 0.84 (0.77 - -0.92) | 0.90 (0.82 - -0.99) |
一个模型调整了年龄、大学学历、就业状况、妊娠三个月、首次怀孕、招聘类型、地区和参与人数。
根据项目设计因素,项目无反应的粗比值比和调整比值比。
项目设计因素 | 粗分析,OR (95% CI) | 调整分析一个,或(95% ci) | |
|
|||
|
单选按钮 | 1.00 | 1.00 |
|
复选框 | 0.20 (0.17 - -0.25) | 0.20 (0.16 - -0.25) |
|
下拉菜单 | 1.73 (1.53 - -1.94) | 1.77 (1.56 - -2.00) |
|
文本(开放性问题) | 0.70 (0.63 - -0.78) | 0.70 (0.63 - -0.79) |
|
|||
|
2 | 1.00 | 1.00 |
|
3 - 5 | 1.12 (1.04 - -1.21) | 1.09 (1.01 - -1.18) |
|
≥6 | 0.41 (0.35 - -0.47) | 0.41 (0.35 - -0.47) |
|
|||
|
没有 | 1.00 | 1.00 |
|
是的 | 1.63 (1.44 - -1.83) | 1.69 (1.49 - -1.91) |
一个模型调整了年龄、大学学历、就业状况、妊娠三个月、首次怀孕、招聘类型、地区和参与人数。
我们的研究结果显示,在妊娠早期报名的妇女比在妊娠晚期报名的妇女有更高的问卷中断的可能性。年龄较大和受教育程度较低的女性更有可能不填写问卷,留下空白。在所有类型的项目中,下拉菜单项目的回复率最低。出乎意料的是,文本项比单选按钮项更不可能留空;同样地,有6个或更多选项的题目比有2个选项的题目更不容易被留白。
我们的研究发现,在怀孕的前三个月的妇女中,中断率和项目无反应率比在怀孕的第三个月的妇女中要高,这可以用几个因素来解释,包括参与者回答问卷的时间。怀孕后期的女性可能有更多的时间来完成问卷,因为她们已经在休产假了。在NINFEA基于网络的队列中,较低的教育水平与问卷中断正相关。这一发现与其他包括不同人群(如男性)的研究一致[
相比之下,有一些决定因素与基于网络的研究密切相关,比如参与者是通过在线还是离线渠道了解到这项研究。很少有研究调查招聘类型与网络问卷中断之间的关系[
在我们的研究中,项目无反应的比例较低,在1.3%到2.9%之间。另一项每天进行网络问卷调查的研究也描述了低项目无反应率,从0%到7.4%不等[
女性参加NINFEA基线问卷的次数与中断无关,但与较低的项目无反应率相关。然而,置信区间几乎包含了单位,因此我们认为这种关联可能是由于残留混淆。
为了根据项目类型分析项目无反应,我们将所有项目与单选按钮项目进行比较,因为这是NINFEA问卷中最普遍的项目。我们发现,复选框项比单选按钮项与较低的项目无反应相关联,这与文献一致,并且是复选框逻辑所固有的[
正如预期的那样,位于网格中的项目比单个项目无反应的几率更高。连接网格的行和列来选择合适的答案比选择单个项目的答案要复杂得多;因此,如有可能,应避免使用网格项目[
除了题目的设计,题目的内容也会影响题目的无反应[
我们在纵向流行病学研究的背景下获得了我们的发现:NINFEA基于网络的出生队列。在这种类型的研究中,避免中断和项目无反应是非常重要的,因为基线问卷中缺失值的存在使得对未来结果的分析变得困难。利用IPW技术和多层次模型,我们能够全面、并行地分析个人层面和项目设计因素与项目无反应的关系。通过这样做,我们还能够根据母亲的特征调整所有分析。
据我们所知,这是第一个在电子流行病学背景下评估问卷中断和项目无反应的决定因素的研究。我们的研究仅基于1项基于互联网的流行病学研究,且仅包括孕妇;因此,需要在其他人群和环境中进行重复实验。了解无反应者的特征对于制定个性化的激励方法和减少项目无反应和中断是至关重要的。个性化招聘[
NINFEA出生队列基线问卷的低中断率证明了电子流行病学研究的可行性,即使在应用长问卷时也是如此。然而,调查问卷的设计应该谨慎。例如,带有1和多个单选按钮选项的项应该分别替换下拉菜单项和位于网格中的项,以减少无响应。此外,我们还发现,在基于互联网的问卷调查中,几个个人层面的特征是中断和项目无反应的重要决定因素。因此,研究协调员应该了解他们的目标人群,以便采用集中的激励和招募技术,减少中断和项目无反应。应直接联系年长者和受教育程度较低的个人(甚至通过其他方式,如电话),以协助和鼓励他们参与电子流行病学研究。
项目特征的例子。
逆概率加权
巴西和巴西:意大利的气氛
优势比
本研究由巴西教育部Capes基金会资助(资助号88881.133234/2016-01),在意大利都灵大学进行博士交流。
没有宣布。