这是一篇根据创作共用署名许可协议(http://creativecommons.org/licenses/by/2.0/)发布的开放获取文章,允许在任何媒介上不受限制地使用、分发和复制,前提是正确引用了首次发表在JMIR公共卫生和监测上的原创作品。必须包括完整的书目信息,http://publichealth.www.mybigtv.com上的原始出版物的链接,以及此版权和许可信息。
传统的流行病学研究方法存在局限性,后勤、人力和财力负担大。创新数字工具的持续发展有可能克服许多现有的方法问题。尽管如此,基于网络的研究仍然相对少见,部分原因是对有效性和可泛化性的持续担忧。
这一观点的目的是总结NutriNet-Santé研究中进行的方法学研究的结果,这是一项法国基于网络的队列研究。
基于NutriNet-Santé电子队列(目前包括>万参与者)先前的发现,我们综合了关于样本代表性、有利招募策略和数据质量的电子流行病学知识。
总体而言,报告的结果支持基于网络的研究在克服流行病学研究中常见方法缺陷方面的有用性,特别是在数据质量方面(例如,体重指数[BMI]分类的一致性为93%),减少社会可取性偏差,以及获得广泛的参与者资料,包括难以触及的亚群体,如年轻人(12.30%[15,118/122,912],<25岁)和老年人(6.60%[8112/122,912],≥65岁),失业或家庭主妇(12.60%[15,487/122,912])和低教育程度(38.50%[47,312/122,912])。然而,一些选择偏差仍然存在(78.00%(95,871/122,912)的参与者是女性,61.50%(75,570 /122,912)有高等教育背景),这是队列研究纳入的固有方面;其他特定类型的偏见也可能发生。
鉴于各社会阶层接入互联网的人数迅速增加,招募具有不同社会经济背景和健康风险敞口的参与者是非常可行的。仍然需要继续努力确定电子队列中的特定偏差和收集全面有效的数据。这一来自NutriNet-Santé队列的方法学发现的总结可能有助于研究人员开发下一代高质量的基于网络的流行病学研究。
健康和疾病知识的进步很大程度上依赖于前瞻性队列研究数据的可用性、质量和全面性,这些研究以非常大的人口为基础样本。这类研究对于探索不适合随机试验的研究假设尤其重要。
在大型流行病学研究中,传统的数据收集方法(纸笔问卷、面对面访谈和电话访谈)需要大量的后勤资源(邮寄、准备和邮资、运输等);人事(面试人员、行政协助、数据录入、数据质量控制);以及资源(打印纸、重型打印机、墨盒等)。此外,传统的方法可能会使学习参与负担沉重(例如,邮寄问卷,组织预约,到达考试中心的交通时间)。由于传统的流行病学研究在过去几十年见证了反应率的稳步下降[
尽管传统流行病学研究和电子流行病学研究都依赖于志愿者,但使用创新的计算机化工具可以提供高度相关的未来方向[
目前,大多数现有的电子队列以年轻女性为目标人群,并以高比例的受过良好教育的志愿者为特征[
在这种情况下,这项工作的目的是汇编来自验证研究的方法学研究结果,这些研究基于正在进行的NutriNet-Santé e队列,迄今为止有>万名参与者参加。
NutriNet-Santé研究[
社会人口学数据(年龄、性别、教育程度、婚姻状况、子女数量、地理区域和职业状况)通过网络问卷收集。
参与者还被要求完成关于参与动机的问卷调查(“如果不是基于互联网,你会参加NutriNet-Santé的研究吗?”(是或否),计算机和互联网技能,以及招聘渠道。他们还被要求提供部分15位数的国家身份识别号码(个人社会安全号码)。
一项研究在147名参与者中(论文第一,n=76;首先是基于网络的,n=71)。
饮食数据在纳入时收集,每两年收集一次,通过一组3个24小时记录(24小时),随机分配在2周内,包括2个工作日和1个周末。参与者报告了24小时内每餐(早餐、午餐和晚餐)或任何其他进食场合消耗的所有食物和饮料(类型和数量)。消费的每一种食品或饮料都是通过食品浏览器或搜索引擎输入系统的。此外,还收集了有关进食时间和地点的其他信息。份量是根据食物的估计重量、购买单位或经验证的图片小册子上的照片[
进行了一项验证研究,以评估通过24小时饮食记录工具收集的数据与24小时尿液和血浆生物标志物的质量[
除了24小时工具的客观有效性外,我们还进行了一项比较研究,以评估24小时网络工具所获得的结果与由营养师进行的电话访谈所获得的结果的一致性(这是在进行传统调查模式时使用的参考方法)[
膳食数据验证研究设计,NutriNet-Santé, 2013 (N=199)。
人体测量数据包括体重、身高、限制性饮食和体重史,在纳入时和此后每年通过自我管理的问卷收集。此外,参与者的子样本(n=20,000)在法国各地的诊所访问期间完成了临床评估和生物采样。在这些访问期间,参与者接受了包括体重、身高、腰围、臀围和生物阻抗测量在内的临床检查。为了评估自我报告的人体测量数据的质量,所有进行了预定临床检查的参与者的随机子样本被要求在预约前3天完成一份基于网络的人体测量问卷(2011年11月- 2012年7月)[
另一项比较研究是为了比较基于网络的人体测量问卷与同一问卷的纸质版本[
为了提供研究人群的社会人口学概况的详细介绍,122,912名NutriNet-Santé参与者(2009年至2014年间招募)的特征与法国2009年人口普查的数据进行了比较[
NutriNet-Santé队列的饮食数据与Santé (ENNS, 2006-2007)的横断面国民营养练习册的全国代表性数据进行了比较,其中包括2754名18-74岁的法国成年人[
在两项研究中,报告的膳食摄入量来自3个24小时膳食调查(2周内的非连续天,包括2个工作日和1个周末)(NutriNet-Santé研究中的计算机记录和ENNS中的电话回忆),使用法国人口普查估计数进行加权。使用相同的食物成分表来估计两个样本的营养摄入量。
采用多项统计指标对数据进行分析,包括均数、均数标准误差、类内相关系数(ICCs)、kappa系数和Spearman相关系数。自我报告的蛋白质、钾和钠的饮食摄入量与基于尿液生物标志物估计的摄入量进行了比较,使用了经过验证的对数比公式[
我们的发现基于12项调查样本特征和代表性的研究[
e队列的性别比例(女性:男性)为5:3,纳入时参与者的平均年龄为42.6岁(SD 14.6岁)。一小部分(即5.00%(6208/ 122912)受访者出生在法国以外的国家,31.40%(38606 / 122912)受访者拥有大学学历,70.80%(87048 / 122912)受访者已婚或同居,65.80%(80934 / 122912)受访者家中没有18岁以下的子女。
同样,65岁以下的年龄分布与在法国普通人口中观察到的有关数据相似。然而,在性别、教育程度和职业方面发现了重要的差异。一些子群体在e队列中代表性严重不足(如农民),限制了加权方法的有效性,从而限制了泛化性。值得注意的是,在NutriNet-Santé样本中,失业、家庭主妇或残疾人的志愿者比例高于法国总人口。
NutriNet-Santé和全国代表性ENNS的膳食摄入量的比较显示在
对比显示,在NutriNet-Santé队列中,水果、蔬菜、鱼类和海鲜的消费量更高。相比之下,NutriNet-Santé组的土豆和豆类、肉和鸡蛋以及非酒精饮料的消费量明显低于ENNS组。
NutriNet-Santé(2009-2014)受试者(N= 122912)的社会人口学特征与法国人口普查数据的比较。灰色条表示NutriNet-Santé主题。黑柱表示法国人口普查对法国大城市18岁及以上人口的估计(2009年)。NutriNet-Santé受试者与人口普查估计值之间的所有差异均具有统计学意义(均为卡方检验
NutriNet-Santé研究(2009-2010年,N=49,443)和全国代表性调查(ENNS, 2006-2007年,N= 2754)中的营养素摄入量a、b.
营养指标 |
男人 | 女性 | ||
NutriNet-Sante | 新奥集团c | NutriNet-Sante | 新奥集团 | |
总能量(千卡/天) | 2326.31 (5.79) | 2388.67 (27.70) | 1767.94 (2.21) | 1713.69 (14.02) |
总碳水化合物(g/d) | 238.61 (0.69) | 246.11 (3.33) | 184.04 (0.27) | 180.35 (1.69) |
总脂质(g/d) | 97.11 (0.32) | 98.44 (1.27) | 75.95 (0.13) | 73.30 (0.74) |
蛋白(g / d) | 96.13 (0.26) | 98.31 (1.13) | 75.72 (0.10) | 74.10 (0.70) |
膳食纤维(g/d) | 21.30 (0.08) | 19.12 (0.30) | 18.17 (0.03) | 16.10 (0.19) |
钙(mg / d) | 1028.98 (3.48) | 1022.16 (13.91) | 879.87 (1.50) | 869.80 (9.94) |
视黄醇(μg / d) | 608.97 (8.01) | 668.23 (37.71) | 480.38 (3.72) | 496.11 (27.02) |
β-胡萝卜素(μg / d) | 3418.12 (27.22) | 3196.52 (113.87) | 3270.61 (13.40) | 3211.01 (67.38) |
维生素B6 (mg/d) | 2.04 (0.01) | 1.89 (0.02) | 1.63 (0.00) | 1.52 (0.02) |
维生素B9 (μg/d) | 352.74 (1.27) | 332.61 (4.78) | 312.18 (0.59) | 292.16 (3.15) |
维生素B12 (μg/d) | 6.36 (0.06) | 6.17 (0.21) | 5.02 (0.03) | 4.66 (0.14) |
维生素C (mg/d) | 117.53 (0.78) | 95.87 (3.49) | 109.87 (0.44) | 96.68 (1.70) |
维生素D (μg/ D) | 2.93 (0.02) | 2.47 (0.10) | 2.50 (0.01) | 2.00 (0.06) |
维生素E (mg/d) | 13.16 (0.05) | 11.72 (0.22) | 11.10 (0.03) | 9.62 (0.12) |
锌(mg / d) | 13.06 (0.04) | 13.09 (0.18) | 10.29 (0.02) | 9.67 (0.11) |
铁(毫克/天) | 15.63 (0.06) | 14.00 (0.20) | 12.45 (0.02) | 10.80 (0.12) |
钾(mg / d) | 3344.58 (9.15) | 3194.87 (38.86) | 2840.51 (3.99) | 2668.44 (24.74) |
镁(mg / d) | 372.75 (1.19) | 329.68 (3.68) | 310.03 (0.52) | 266.18 (2.54) |
一个所有来自NutriNet-Santé和ENNS的数据都根据年龄、教育程度、家庭中是否有孩子以及数据收集的季节进行了加权,使用的是法国2007年人口普查数据。
b数值是均值,括号内是均值的SEs。
cENNS:练习曲国家营养Santé。
NutriNet-Santé研究(2009-2010年,N=49,443)和全国代表性调查(ENNS, 2006-2007年,N= 2754)的平均食物(g/d)和饮料(ml/d)摄入量。所有来自NutriNet-Santé和ENNS的数据均采用法国2007年人口普查数据,根据年龄、教育程度、家庭中是否有孩子和数据收集季节进行加权。ENNS:练习曲国家营养Santé。
总能量和宏量营养素的摄入量总体上相似,而在NutriNet-Santé研究中,纤维、铁、镁和维生素B6、B9、C、D和E的摄入量高于ENNS。总的来说,摄入量的真实差异、与不同给药模式相关的差异测量误差、样本组成(志愿者vs分层随机样本)以及志愿者偏差可能都有助于解释这些发现。关于NutriNet-Santé研究中潜在的志愿者偏倚,应该注意的是,这种偏倚的大小应该与使用传统数据收集方法的基于志愿者的营养流行病学研究相似。鉴于NutriNet-Santé研究和ENNS研究中的大样本,值得注意的是,并非所有统计上显著的差异都具有实际意义。
努力使样本招募的沟通渠道多样化可能是增加参与者资料异质性的一个重要因素。因此,我们调查了根据社会人口学概况最终招募受试者的不同渠道[
调查对象最多的是电视广告(34.46%,30,414/88,238)。其他非常重要的渠道是无线电广播(16.21%,88,238人中有14,309人)和网站(19.05%,16,807/88,238人)。值得注意的是,与其他渠道相比,电视广播招募的被试中,低教育程度的个体比例(44.1% vs . 37.4%)和失业个体比例(36.1% vs . 4.8%)较高。
由于营养网络队列中受试者的具体情况可能与特定的参与动机有关,我们根据社会人口学特征调查了NutriNet-Santé研究的参与原因和动机[
在NutriNet-Santé研究中,相当一部分(23.79%,43028人中有10235人)的受试者自我报告的计算机或互联网技能相对较低,这表明这一因素并不代表参与基于网络的队列的障碍[
从自我管理的网络版本和传统纸质版社会人口问卷中获得的数据之间的一致性很高,连续变量的ICCs范围在0.81到1之间,分类变量的kappa系数范围在0.76到1之间。行政命令、年龄、性别和互联网技能对结果影响不大[
在84,442名受试者(84,442/100,118)中,估计来自个人社会安全号码的数据与通过社会人口调查问卷收集的信息之间的响应一致性。共有5141名被试(6.09%,5141/ 84442)至少有一个不一致的数据值。性别、年龄、教育程度和就业情况与反应一致性模式相关[
自我报告的饮食数据与尿液生物标志物的比较(
蛋白质、钾和钠的饮食摄入和尿排泄,NutriNet-Santé研究,2013一个.
营养素及指标 | 男人(n = 102) | 女性(n = 91) | |||||
的意思是 | 较低的价值 |
上的值 |
的意思是 | 较低的价值 |
上的值 |
||
|
|||||||
|
平均24小时Ub, d(克/天) | 101.7 | 62.3 | 166.2 | 77.4 | 45.8 | 130.5 |
|
平均24小时b, e(克/天) | 88.6 | 83.9 | 93.7 | 68.8 | 65.1 | 72.8 |
|
差异%c | −14.4 | −18.2 | −10.3 | −13.9 | −18.3 | −9.3 |
|
|||||||
|
平均24小时Ub(毫克/天) | 3357 | 3189 | 3535 | 2843 | 2685 | 3010 |
|
平均24小时b(毫克/天) | 3444 | 3279 | 3618 | 2739 | 2607 | 2879 |
|
差异%c | 2.6 | −1.7 | 7.1 | −3.6 | −8.9 | 1.9 |
|
|||||||
|
平均24小时Ub(毫克/天) | 3578 | 3320 | 3856 | 2996 | 2790 | 3217 |
|
平均24小时b(毫克/天) | 3503 | 3271 | 3752 | 2747 | 2567 | 2941 |
|
差异%c | −2.1 | −9.2 | 5.6 | −8.3 | −15.7 | −0.2 |
一个饮食摄入量为3个24小时内的平均值,尿液排泄为2个24小时尿液样本的平均值。
b基于对数变换数据的几何均值。
c平均报告摄入量(24小时)与平均生物标志物摄入量(24小时Us)的对数比计算出的百分比的平均差值。
d24小时尿,24小时尿收集。
e24小时,24小时饮食记录。
报告和“测量”摄入量之间的相对差异为:男性- 14.4%(蛋白质),2.6%(钾),- 2.1%(钠),女性- 13.9%,- 3.6%和- 8.3%。误报与体重状况无关。
在男性中,调查显示斯皮尔曼相关性在0.20(蔬菜和血浆维生素C)和0.55(鱼和血浆二十二碳六烯酸[DHA])之间。在女性中,这些相关性通常较低,范围为0.13(不显著;(蔬菜和血浆维生素C)到0.54(鱼和二十碳五烯酸[EPA]+DHA)。关于微量营养素,自我报告的摄入量与血浆生物标志物的调整相关性在男性中为0.36 (EPA)至0.58(维生素C),在女性中为0.32(维生素C)至0.38 (EPA) [
其次,24小时Web工具数据与通过电话访谈获得的数据之间的一致性非常高[
与实施和使用基于网络的膳食问卷相关的财务成本估算与涉及营养师的标准评估相关的成本(1个24小时的膳食记录/召回)在
传统和基于web的评估的成本估计一个.
问卷调查 | 成本 | |
|
||
|
饮食资料,访谈(1个24小时的回忆),包括工资 |
€38.1 /主题 |
|
人体测量数据,包括印刷的纸质版本,邮寄和寄回问卷的邮资,以及双重数据输入 | €9.9 /主题 |
|
社会人口统计数据,纸质版本包括印刷,邮寄和返回问卷的邮资,以及双重数据输入 | €16.5 /主题 |
|
10万受试者总数 | €6450000 |
|
||
|
NutriNet-Santé基于网络的平台,包括整个研究过程:安全注册系统、基线问卷的开发和管理(包括三个24小时记录)、许可证、设备和托管) |
€380000 |
一个2009年使用成本进行财务估算。
基于网络的队列研究在数据收集方面相对于传统流行病学研究模式的优势。
流行病学研究中遇到的问题 | 基于网络的队列研究的优势 |
代表性 | 使用互联网作为唯一的随访模式是参与的决定性原因,尤其是男性、年轻人和肥胖者 |
数据收集 | 减少大型流行病学研究的后勤、人员、物质和财政负担 |
可接受性 | 与纸质问卷不同,通过使用设计良好的交互界面和视频,数据输入可以变得更容易、更愉快 |
数据管理 | 数据处理可以直接整合到软件中,从而快速获得收集到的信息 |
营养和人体测量数据的有效性 | 高质量或与常规研究相似的质量 |
开发新的评估工具 | 快速测试和实现新的评估工具、协议等的可能性。 |
健康事件评估 | 能够将参与者数据与不同的医疗登记进行快速匹配 |
验证研究显示较高的icc,从0.94的身高到0.99的体重,BMI分类的一致性为93%(敏感性为88%,特异性为99%)。然而,我们观察到轻微的低报体重和高报身高,导致低报BMI,这在肥胖参与者中更为明显。网上和面对面的体重和身高自我报告几乎完全一致(分类一致性为98.5%)。
在对比研究中,基于网络版本的自我管理人体测量问卷与基于纸质版本的同一问卷之间的一致性非常高,连续变量和分类变量的ICCs分别为0.86至1,kappa统计值为0.69至1 [
总的来说,基于NutriNet-Santé研究中进行的方法学研究的结果,我们提供了关于流行病学研究中互联网使用的新见解(
总的来说,提出的研究结果支持一个可接受的高质量的数据收集在一个大型和异构的基于web的队列,并大大减少了经济负担。在客观验证研究和方法比较研究中评价的一致性较高。此外,研究结果表明,基于网络的研究可能有助于减少社会期望偏差。
收集到的数据的有效性似乎与传统研究(基于访谈或纸笔工具)相当,甚至更高。例如,观察到营养摄入估计的效度可接受到中等。虽然观察到的相关系数可以认为绝对值相对较低,但先前的验证研究报告了类似量级的相关性[
像NutriNet-Santé研究这样的志愿者群体往往具有与一般人群不同的社会人口学分布特征[
我们的研究结果还表明,仅使用互联网进行数据收集和跟踪——这意味着参与者在很大程度上减少了努力[
基于网络的队列有可能包含大量的参与者,包括难以触及的子群体。然而,由于那些愿意参与基于网络的队列研究的人可能与一般人群不同,因此需要其他方法来专门增加低社会经济群体参与基于网络的流行病学研究的机会。在这种情况下,统计加权方法是一种重要而有效的方法,可以帮助抵消描述性流行病学研究的外部有效性方面的限制。
基于网络的研究的一个关键优势与数据输入有关。通过比较基于网络的基线问卷与方法学研究中使用的传统纸笔版本[
此外,通过使用设计良好的交互界面、音频和视觉反馈以及弹出窗口提供关于问卷中潜在复杂元素的额外信息,可以使数据输入更令人愉快。事实上,我们对NutriNet-Santé中收集的营养数据质量的调查显示,非常高的参与者认为基于web的营养评估工具是用户友好的。另一个优势是基于web的平台的高度灵活性,允许快速实现新的问卷或辅助协议。例如,在NutriNet-Santé研究的背景下开发或翻译了几份问卷,因为这样一个平台可以快速测试和微调新问卷的验证[
本文概述了电子流行病学的方法学进展,并填补了关于电子队列及其设计的具体方法学方面的知识空白,如参与者选择过程、样本代表性、社会人口学概况的多样性和基于web的工具的验证。开展特别验证和比较研究可能有助于改进创新数字工具,并增强对使用新技术收集的数据的信心。这可能指导未来电子队列和目前缺乏的验证研究的进一步发展和实施。
未来的方向可能包括评估通过不同来源(自我报告数据、疾病登记处或医疗数据库)收集的健康数据的一致性。实施特别研究以比较难以接触到的亚群体与非参与者的特征也是有用的。
身体质量指数
二十二碳六烯酸
二十碳五烯酸
类内相关系数
NutriNet-Santé的研究得到了法国卫生部(DGS)、法国卫生监测研究所(InVS)、国家预防和健康教育研究所(INPES)、医学研究基金会(FRM)、国家卫生和医学研究所(INSERM)、国家农业研究所(INRA)、国家工艺美术学院(CNAM)和巴黎13大学的支持。ENNS的研究由法国健康监测研究所(InVS)、法国国家健康保险系统(Caisse Nationale d’assurance Maladie des Travailleurs Salariés, CnamTS)和巴黎大学资助。作者对参与NutriNet-Santé研究的数据管理人员和统计人员以及收集ENNS数据的营养师表示感谢。
没有宣布。