这是一篇开放获取的文章,根据创作共用署名许可(http://creativecommons.org/licenses/by/2.0/)的条款发布,允许在任何媒介上无限制地使用、分发和复制,前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。
卫生知识和素养是健康的主要决定因素之一。通过基于网络的调查对这些问题的评估正在持续增长。研究表明,大约五分之一的受访者在事实性知识项目上提交了抄袭的答案或作弊,这可能会导致测量误差。然而,在基于网络的健康知识调查中,人们对阻止作弊的方法知之甚少。
本研究旨在探讨设置调查时间限制以防止求助和作弊的有效性。
在样本量估计的基础上,94名本科生按1:1的比例随机分配完成一项基于网络的营养知识调查,有或没有时间限制为15分钟(每项30秒);选择营养专题是因为它与公共卫生特别相关。问卷由两部分组成。第一个是经过验证的消费者导向营养知识量表(CoNKS),包括20个正确/错误条目;第二份是一份特设问卷(AHQ),其中包含10个问题,对于没有医疗保健资格的人来说很难正确回答。因此,它的目的是测量食物,而不是营养知识。AHQ项目在某种程度上是百科全书式的,适合Web搜索,而CoNKS项目的措辞更复杂,因此在搜索字符串中简单地复制/粘贴一个问题不会立即产生正确答案。
94名受试者中共有72人开始了调查。两组的辍学率相似(非定时组和定时组分别为11%,4/35和14%,5/37)。大多数参与者通过移动电话和平板电脑等便携式设备完成了调查。为了完成调查,不计时组的参与者比计时组的参与者多花了2.3分钟;效应量很小(科恩的
在研究者不可控的条件下,抄抄健康知识题的答案容易导致对人们知识的高估;在设计和实施基于网络的调查时,应该考虑到这一点。仅设置时间限制可能不能完全防止作弊,因为一些作弊者在网络搜索中可能非常快。在实施基于web的健康知识调查之前,更复杂和上下文化的项目措辞以及检查项目的“可查找性”属性可能会减少求助,从而减少测量误差。需要更大样本量和不同人群的研究来证实我们的结果。
测量人们对健康相关主题的知识,以评估他们是否充分了解预防、用药和自我保健,这一点特别重要,因为健康知识和健康素养是健康行为和健康状况的主要决定因素之一[
通过问卷收集数据的方式因潜在受访者的招募方式、调查交付工具和问卷管理模式而异;所有这些因素都可能严重影响数据的质量[
与其他研究领域一样,通过基于网络的调查对健康相关主题知识的评估也在不断增加[
一些早期研究的作者使用基于网络的调查,通过在无人监督的环境下进行问卷调查来评估健康相关主题的知识,他们承认受访者可能会通过使用额外的信息来源来作弊[
虽然网络调查研究中的作弊问题已得到承认,但人们对控制其对数据质量影响的实际方法知之甚少,特别是在健康主题的研究中。有人建议使用以图片为基础的项目,以防止受访者使用搜索引擎寻找正确答案[
目前的随机研究旨在通过不受控制的基于网络的方式,比较受访者在有或没有时间限制的健康知识调查中的表现。调查的主题是与营养有关的知识,这是一个与公共卫生密切相关的主题,也是通过各种数据收集方式进行最广泛研究的主题之一。我们首先假设,在有限时间内完成问卷的受访者比没有时间限制的受访者得分更低,因为他们有更少的时间来寻求帮助、社交和电子作弊。我们的第二个假设是,有时间限制组和无时间限制组在测试中表现的差异取决于问卷的类型——在更容易作弊的测试中,差异会更大(主要是由于项目具有良好的Web“可查找性”属性)。这项研究的目的不是评估与营养相关的事实知识;相反,它构成了寻找基于网络的健康相关调查和减少测量误差的最佳方式的又一步。
2014年5月,研究人员招募了大约150名热那亚大学三年级学生(建筑和教育科学学院,约65%为女性)作为样本。学生们被告知,这项研究的目的是测试基于网络的营养相关问卷管理的可行性。一个简短的描述的研究,调查工具,和调查完成的方式是由教师外的研究人员提供。学生们被告知,参与是自愿的,匿名是保证的,研究人员不会知道谁填写了调查。没有提供参与调查的激励措施。研究报告公布后,收集了那些同意参与的人的电子邮件地址;所有志愿者都能连接到网络。
招募当天,通过计算机随机生成的方法,将学生按1:1的比例随机分为两组,分别填写无时限(TL -)和有时限(TL+)的问卷。随后,研究人员向参与者发送了一封包含简短说明和调查直接链接的电子邮件。
由于这项匿名调查的性质是非医学和非介入性的,因此认为没有必要对其进行伦理批准;没有收集志愿者的敏感数据或个人信息。
该测试包括两个主要部分和两个关于性别和年龄的项目。没有“不知道”选项,但参与者被告知,如果他们不知道/不确定正确答案,他们可以自由地省略任何项目。只有年龄和性别两项是必须填写的,这一点已清楚地(以星号)表示。第一部分是经验证的消费者导向营养知识量表(CoNKS) [
每个正确的答案记为1分,而不正确或缺失的答案记为0分。总的来说,最终得到的CoNKS总分可以从0到20不等,而AHQ的总分为10分。
在一项初步研究中,我们对21-23岁的工程专业学生(n=15)进行了AHQ测试,并在课堂上由纸笔研究者控制。平均得分为2.3分(SD 1.0),范围为1 - 4分。因此,我们假设在未经监考的情况下,个体AHQ得分≥5可能是由于电子作弊。
本次调查采用基于网络的专业调查软件QuestionPro进行。为了增加受访者的动机,两份调查的布局均设有清晰可见的进度指示器,所有项目均可滚动和跳过[
记录了两项调查的回复率和退出率。回复率定义为开始调查的受试者数量占发送的电子邮件总数的比例(假设所有电子邮件都被阅读),而辍学率是开始调查但没有提交调查的受试者的比例。由于QuestionPro软件允许同一用户的多个参赛作品被识别,因此所有提交的作品都经过了这种可能性的筛选。如果任何受试者有多个条目,他/她的所有条目都将从分析中删除。
两个链接都活跃了两周。没有发送提醒,因为我们不知道哪些学生完成了调查,哪些没有。
采用双面双样本的方法计算样本量
为了描述的目的,定量变量表示为具有SDs的平均值或具有范围的中位数。描述性数据以95%置信区间(ci)的频率和百分比表示。要比较分类数据,请使用
为了评估时间限制组(TL−或TL+)在CoNKS和AHQ中的影响是否相似,使用了测试类型和组之间相互作用的线性混合模型。由于这两个分数在不同的量表上,所以
统计学意义设定在双侧
在107名志愿者中,94人(每组47人)随机接受TL -或TL+链接。没有注册多个条目;这两项调查都是由72名个人访问者开始的。两组的有效率相似(75%,35/47;95% CI 61 ~ 85%, 79%, 37/47;TL -组和TL+组95% CI分别为65 ~ 89%;
研究参与者的性别、年龄和使用的设备。
参数 | TL - |
TL + |
统计检验 | |
性别,女一个, n (%;95%置信区间) | 25/31 (81;64 - 92年) | 26/32 (81;65 - 92年) |
|
|
|
|
|
|
|
|
意思是(SD) | 22.2 (1.8) | 21.6 (1.7) |
|
|
中位数(范围) | 22.0 (20-27) | 21.0 (19-26) |
|
|
费雪精确检验, |
|||
|
台式机/笔记本电脑 | 15/35 (43;27-60) | 14/37(38岁;23-54) |
|
|
移动电话 | 16/35 (46;30 - 62) | 19/37 (51;36 - 67) |
|
|
平板电脑 | 4/35 (11;4-25) | 4/37 (11;4-24) |
|
一个根据完成调查的受试者。
b基于开始调查的受试者,因为只有总体统计数据可用。
两组调查完成时间的分布均明显右偏(TL -组和TL+组的偏度系数分别为1.6和2.0)。TL -组受访者比TL+组受访者花更多时间完成调查(中位数7.8分钟,范围2.9-30.5分钟vs中位数5.5分钟,范围3.4-14.7分钟);Mann-Whitney检验显示差异显著(
如
在线性混合模型中,两份问卷得出的标准化总体评分的群体效应(TL -和TL+)具有统计学意义(
参与者在调查仪器上的表现。
问卷调查 | 参数 | TL - |
TL + |
统计检验 |
|
||||
|
总分,平均值(SD) | 16.5 (1.9) | 15.3 (1.7) |
|
|
中位数(范围) | 17.0(11日至20日) | 15.5 (12 - 18) |
|
|
无响应项,n (%;95%置信区间) | 1/620 (0.2;0 - 0.8) | 6/640 (0.9;0 - 2) | 费雪精确检验, |
|
||||
|
总分,平均值(SD) | 3.1 (2.6) | 2.6 (1.9) |
|
|
中位数(范围) | 3.0(清廉) | 2.5(鹿) |
|
|
得分≥5,n (%;95%置信区间) | 7/31 (22.6;11-40) | 6/32 (18.8;8-35) |
|
|
无响应项,n (%;95%置信区间) | 23/310 (7.4;5-11) | 29/320 (9.1;6-13) |
|
本论文对流行病学和卫生保健研究中基于网络的数据收集的现有方法学文献有几个方面的贡献。首先,我们的研究结果证实,在基于网络的健康知识调查中,社交互动或电子作弊的风险很可能存在,因为在两项测验中都有很高比例的受访者得分出人意料,在设计和实施此类研究时必须考虑到这一事实。在基于网络的调查中,时间和空间上的异步交流以及研究者监督的缺失使得以客观的方式控制抄袭的答案变得极其困难。我们故意没有询问参与者是否使用了额外的信息源,因为由于社会可取性偏见,作弊很可能被低估了;然而,我们采用了心理学研究中描述的作弊代理测量方法[
其次,我们的研究表明,在基于网络的研究人员对健康相关主题知识的不受控评估中使用定时调查可以减少测量误差,因为我们能够建立时间限制组对测验表现的显著影响,特别是在CoNKS上,使我们的第一个假设合理。这一发现也有一定的现实意义,从效应量可以看出。另一方面,由于样本量是根据经过验证的CoNKS调查计算的,虽然TL+组的参与者往往得分较低,但AHQ得分的组间差异不显著可能是由于统计学效力较低。无论如何,设定时间限制会减少调查完成的中位数时间,这至少在实质上降低了参与与调查无关的活动和寻求帮助的概率。然而,仅仅施加时间限制不太可能完全防止求助和电子作弊,因为一些作弊者在网络搜索中可能特别快。事实上,Jensen和Thomsen [
第三,我们认为,问题的措辞在“可查找性”属性方面发挥着重要作用。因此,在进行调查之前,检查一个项目是否可以很容易地在谷歌上搜索到,如果可以,重新制定问题可能是有用的。事实上,大多数CoNKS项目比我们的AHQ项目有“更复杂”的措辞,因此具有较差的“可查找性”属性。例如,要找到一个含有关于CoNKS项目4或18的正确信息的网页(“健康膳食应包括一半肉、四分之一蔬菜和四分之一配菜”和“为了健康营养,乳制品的摄入量应与水果和蔬菜相同”),受访者首先必须考虑查询公式,然后滚动搜索结果,而不是简单地复制/粘贴问题。要快速获取这类问题的正确答案,通过应用高级搜索策略来缩小搜索结果的范围要有利得多。然而,正如Ivanitskaya等人所证明的那样[
需要强调的是,如果在知识问卷上设置了时间限制,那么每个项目或整个问卷的限制应该是临时确定的,因为电子作弊的概率需要与认知加工所需的时间相平衡。一方面,充足的时间限制可能有利于那些信息检索能力有限的电子作弊者,而另一方面,正如Jensen和Thomsen [
第四,超过一半的受访者通过手机或平板电脑等便携式设备完成了调查。调查结果显示,电脑管理模式与流动电话管理模式的差异不大,而两种模式所评估的调查结果大致相当[
第五,我们研究中的辍学率(13%,9/72)不到网络调查中通常观察到的30%辍学率的一半[
这项研究可能存在参与偏差和积极反应偏差,因为完成调查的女性比男性多得多;事实上,不仅招收了更多的女性,而且男学生的参与率也低于预期。已查明妇女参与科学研究的比率较高[
“幸运猜测”的概率,特别是在真假二分题上,也应该承认。虽然加入“不知道”选项可能会阻止人们猜测[
在研究人员没有监督的情况下,健康知识项目的答案很可能是抄袭的。在健康知识、健康素养和KAP调查的设计和实施过程中,以及在将基于网络的问卷结果与监考研究的结果进行比较时,都应考虑到这一点。随后得出的错误结论以及对卫生知识和卫生素养的高估可能会导致较差的卫生结果[
特别问卷调查。
特别问卷
置信区间
消费者导向营养知识量表
knowledge-attitude-practices
没有时间限制
有时间限制
这项研究得到了意大利热那亚大学健康科学系的支持。作者感谢伯纳德·帕特里克博士修改了手稿。
没有宣布。