这是一篇开放获取的文章,根据创作共用署名许可(https://creativecommons.org/licenses/by/4.0/)的条款发布,允许在任何媒介上无限制地使用、分发和复制,前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。gydF4y2Ba
全球COVID-19大流行引发了对如何在数字工作和保持物理距离的新时代安全可靠地进行人类心理研究的根本性重新审视。在线基于web的测试已经成为一种有前途的解决方案,可以在不需要人类接触的情况下快速大规模收集认知数据。然而,关于网络研究的数据质量和有效性一直存在争议。本研究探讨了社会向基于网络的测试转变所带来的机遇和挑战,并强调了为在线研究建立标准数据质量保证框架的迫切需要。gydF4y2Ba
本研究旨在开发和验证一种新的监督在线测试方法,远程指导测试(RGT)。gydF4y2Ba
共有85名健康的年轻人接受了10项认知任务的测试,评估执行功能(灵活性、记忆力和抑制力)和学习能力。这些任务要么在实验室面对面进行(n=41),要么通过远程指导测试在线进行(n=44),并使用相同的基于网络的平台(剑桥神经心理测试自动电池,Inquisit和i-ABC)进行。数据质量评估使用详细的试验级别措施(错过的试验,外围和排除的响应,响应时间)和总体任务绩效措施。gydF4y2Ba
结果表明,在所有数据质量和性能测量中,RGT数据与在实验室收集的个人数据在统计上等效(gydF4y2Ba
这些数据表明,RGT方法可以帮助改善对在线数据质量的担忧——特别是涉及高风险或罕见队列的研究——并提供了一种收集高质量人类认知数据的替代方法,而不需要亲自到场。gydF4y2Ba
2020年,全球COVID-19大流行使基于实验室的人类心理学研究突然停止,因为防止疾病传播的社会距离措施迫使大规模关闭实验室设施,除了必要的人际接触外,其他一切都无法进行,深刻地扰乱了学术研究[gydF4y2Ba
认知测试是一种有价值的心理学工具,广泛用于检查心理执行过程,如学习、决策、抑制和工作记忆[gydF4y2Ba
在当前的数字时代,个人电脑和网络功能的大量可用性为使用更经济、自动化和开放的方法进行认知测试提供了新的途径[gydF4y2Ba
COVID-19大流行推动了“远程医疗”或远程获得医疗保健服务的增长,在提供远程神经心理评估、心理教育和建立融洽关系方面提出了特别的挑战[gydF4y2Ba
此外,关于基于web的数据收集方法与传统的基于实验室的数据收集方法的数据质量、可比性、可复制性和有效性的长期争论仍然存在[gydF4y2Ba
事实上,几项比较研究表明,在不同的认知任务和人群中,基于网络的认知表现与纸质和铅笔的替代品之间只有适度的相关性[gydF4y2Ba
要评估数据质量,首先重要的是建立衡量数据质量的指数和基准。在这些问题上,目前还没有明确的共识。关于参与者未完成任务、数据损耗和技术问题的一般统计数据表明,排除来自遇到技术困难、表现不诚实或未能完成分配任务的参与者的数据是很常见的[gydF4y2Ba
然而,大多数这些程序在记录的响应时间中引入了一个小而可变的延迟。除了程序本身之外,这种延迟还受到计算机操作系统、浏览器、硬件质量以及可能正在运行的任何后台程序的影响。例如,当舒伯特等人[gydF4y2Ba
一些基于web的研究实现了一个硬分界,以排除超过特定阈值的响应延迟,以优化数据质量。例如,Kim等人[gydF4y2Ba
基于实验室和基于网络的认知研究报告的数据排除统计示例。gydF4y2Ba
研究类型及引文gydF4y2Ba | 任务(年代)gydF4y2Ba | 数据排除在外gydF4y2Ba | |
|
|||
|
金等[gydF4y2Ba |
实验室,心理语言学任务gydF4y2Ba | 5/42(11.9%)参与者因出错率高或不在人口统计范围内而被排除在外。反应时间异常值去除=总数据的0.75%gydF4y2Ba |
|
冯·冈腾等[gydF4y2Ba |
实验室,抑制任务(反眼跳,走/不走,停止信号)gydF4y2Ba | 37/463(7.99%)参与者被排除gydF4y2Ba |
|
贝克斯等[gydF4y2Ba |
实验室,剑桥大学gydF4y2Ba一个gydF4y2Ba任务gydF4y2BabgydF4y2Ba | 没有排除,没有分心报告gydF4y2Ba |
|
希克斯等[gydF4y2Ba |
实验室(实验1和3),工作记忆任务gydF4y2Ba | 实验1:0/58(0%)的参与者被排除在外,尽管有10%的参与者报告作弊;实验3:10/112(8.9%)参与者因数据缺失过多而被排除gydF4y2Ba |
|
鲁伊兹等人[gydF4y2Ba |
实验室,工作记忆gydF4y2BacgydF4y2Ba非陈述性/陈述性记忆任务gydF4y2Ba | (一)OSpangydF4y2BadgydF4y2Ba, 0%排除;(b) MLAT5gydF4y2BaegydF4y2Ba, 0%排除;(c) CVMTgydF4y2BafgydF4y2Ba, 1/50(2%)参与者被排除在外gydF4y2Ba |
|
宴会等[gydF4y2Ba |
认知视频训练gydF4y2Ba | 27/219(12.3%)参与者排除或退出gydF4y2Ba |
|
|||
|
金等[gydF4y2Ba |
在线心理语言学任务gydF4y2Ba | 3/39(7.7%)的参与者因错误率高或不在人口统计范围内而被排除在外。反应时间异常值去除=总数据的0.75%gydF4y2Ba |
|
艾森伯格等人[gydF4y2Ba |
在线(使用Amazon Turk),抑制任务(go/no go, Stop Signal)gydF4y2Ba | 102/662(15.4%)参与者因未完成任务组而被排除;38/560名(6.8%)参加者因未能完成4项或以上任务而被排除在外gydF4y2Ba |
|
贝克斯等[gydF4y2Ba |
在线,CANTAB任务gydF4y2Ba | 2/18(11.1%)参与者被排除,高SWMgydF4y2BaggydF4y2Ba错误;gydF4y2Ba |
|
希克斯等[gydF4y2Ba |
在线(实验2和4),工作记忆任务gydF4y2Ba | 实验2:12/100(12%)未在24小时内完成电池测试的参与者被排除;实验4:28/112(25%)被试因未完成任务组而被排除gydF4y2Ba |
|
鲁伊兹等人[gydF4y2Ba |
在线,工作记忆,非陈述性/陈述性记忆任务gydF4y2Ba | (a) osspan,排除7/50(14%)参与者;(b) MLAT5, 8/15(16%)参与者被排除;(c) CVMT,排除10/50(20%)参与者gydF4y2Ba |
|
Buitenweg等[gydF4y2Ba |
认知灵活性训练gydF4y2Ba | 91/249(36.5%)参与者因不符合标准而被排除(N=11)或退出研究(N=80)gydF4y2Ba |
一个gydF4y2BaCANTAB:剑桥神经心理测试自动电池gydF4y2Ba
bgydF4y2BaCANTAB任务包括SWM, PAL, ERT, OTS, PRM-I, RVP和PRM-D。gydF4y2Ba
cgydF4y2Ba内存任务包括osspan、MLAT和CVMT。gydF4y2Ba
dgydF4y2Baosspan:自动操作跨度任务。gydF4y2Ba
egydF4y2BaMLAT:现代语言能力测试。gydF4y2Ba
fgydF4y2BaCVMT:连续视觉记忆任务。gydF4y2Ba
ggydF4y2BaSWM:空间工作记忆。gydF4y2Ba
hgydF4y2BaPAL:成对伙伴学习。gydF4y2Ba
我gydF4y2BaERT:情绪识别任务。gydF4y2Ba
jgydF4y2Ba剑桥的一触长筒袜。gydF4y2Ba
kgydF4y2BaPRM-I:模式识别即时记忆。gydF4y2Ba
lgydF4y2BaRVP:快速视觉处理。gydF4y2Ba
米gydF4y2BaPRM-D:模式识别记忆延迟。gydF4y2Ba
在前面的章节中,我们讨论了基于web的认知测试的前景,特别是它的可扩展性和覆盖面,以及当前数据质量保证的挑战。在某种程度上,由于基于web的测试的无监督性质,出现了关于实验严谨性和数据质量的问题[gydF4y2Ba
RGT方法通过视频会议平台模拟基于实验室的实验测试。与面对面测试类似,实验者安排在特定的日期和时间与参与者在线见面,并在虚拟环境中指导参与者完成实验过程的每一步。这包括获得知情同意、为软件安装提供技术支持、排除问题、监控性能、在适当的情况下提供反馈和汇报。实验者还帮助参与者优化他们的测试环境(包括灯光、声音和最小化干扰),并收集关于参与者的硬件、软件和网络功能的详细数据。此外,远程测试人员可以安排舒适的休息时间(如厕,食物或饮料,休息,运动),这样就不会对测试交付或数据收集产生不利影响。这种方法在其整体方法上是新颖的,因为它提供了完全监督和互动的在线测试体验,据我们所知,这在基于web的认知测试中还没有报道过。gydF4y2Ba
为了对RGT方法的数据质量进行更深入的评估,我们在一系列基于web的认知任务中测量并报告了3个试验级数据质量指标:(1)遗漏的响应,(2)数据排除(试验和参与者级别),以及(3)RTs。为了确保密切的可比性,并隔离测试方式的影响,参与者在心理实验室或在家通过RGT完成了每个认知任务的相同网络版本。在这两种情况下,参与者在完成一系列评估执行功能(认知灵活性、抑制能力和工作记忆)和学习的认知任务时,都接受专家监督。虽然这些任务大多依赖于准确性的测量,但我们特别包括了具有rt依赖结果测量的任务,例如Stroop任务[gydF4y2Ba
共有85名健康的新加坡年轻人参与了这项研究,并面对面地提供了数据(F2F;n=41)和通过RGT (n=44)。另有4名RGT和5名F2F参与者最初表示有兴趣,但随后退出了研究。这些参与者的数据不包括在任何分析中。所有参与者都以英语为母语,无临床诊断的精神疾病或发育障碍史,听力和视力正常或已恢复正常。招聘是通过社交媒体上的在线广告和大学的招聘渠道进行的。这两个组别的人口统计资料详载于gydF4y2Ba
所有85名参与者都参加并完成了他们预定的测试课程。没有人中途退出。RGT组的所有44名(100%)参与者在基于网络的平台上完成了所有10项计算机化任务。然而,只有22名(53.7%)F2F参与者在网络平台上完成了所有计算机化任务(17名女性和5名男性;平均年龄21.06岁,范围=18.11-26.68岁,标准差2.09岁)。其余19名(46.3%)F2F参与者在COVID-19封锁限制之前接受了测试,因此只以与其他参与者类似的格式完成了3个i-ABC任务、词汇和数字跨度任务。其他Inquisit任务(Trails, Stop Signal和Stroop)要么在纸上完成,要么使用不同的(离线)平台完成,CANTAB任务不受管理。由于这些与任务相关的差异可能会产生表现差异,为了一致性,仅对这19名(46.3%)F2F参与者的i-ABC任务、词汇和数字跨度的数据进行了分析。gydF4y2Ba
通过测试方式总结参与者的人口统计数据。gydF4y2Ba
人口统计变量gydF4y2Ba | 形态(集团)gydF4y2Ba | |||||
|
F2FgydF4y2Ba一个gydF4y2Ba(n = 41)gydF4y2Ba | RGTgydF4y2BabgydF4y2Ba(n = 44)gydF4y2Ba | 总(N = 85)gydF4y2Ba | |||
|
|
|
|
|||
|
意思是(SD)gydF4y2Ba | 21.54 (2.26)gydF4y2Ba | 22.14 (2.05)gydF4y2Ba | 21.85 (2.16)gydF4y2Ba | ||
|
范围gydF4y2Ba | 18.11 - -29.22gydF4y2Ba | 18.51 - -26.83gydF4y2Ba | 18.11 - -29.22gydF4y2Ba | ||
|
|
|
|
|||
|
女gydF4y2Ba | 29 (70.7)gydF4y2Ba | 33 (75)gydF4y2Ba | 62 (72.9)gydF4y2Ba | ||
|
男性gydF4y2Ba | 12 (29.3)gydF4y2Ba | 11 (25)gydF4y2Ba | 23日(27.1)gydF4y2Ba | ||
|
|
|
|
|||
|
中国人gydF4y2Ba | 34 (82.9)gydF4y2Ba | 36 (81.8)gydF4y2Ba | 70 (82.4)gydF4y2Ba | ||
|
马来语gydF4y2Ba | 4 (9.8)gydF4y2Ba | 6 (13.6)gydF4y2Ba | 10 (11.8)gydF4y2Ba | ||
|
印度gydF4y2Ba | 2 (4.9)gydF4y2Ba | 2 (4.5)gydF4y2Ba | 4 (4.7)gydF4y2Ba | ||
|
没有报告gydF4y2Ba | 1 (2.4)gydF4y2Ba | 0 (0)gydF4y2Ba | 1 (1.2)gydF4y2Ba | ||
|
|
|
|
|||
|
较低的gydF4y2Ba | 13 (31.7)gydF4y2Ba | 16 (36.4)gydF4y2Ba | 29 (36.3)gydF4y2Ba | ||
|
更高的gydF4y2Ba | 24 (58.5)gydF4y2Ba | 27日(61.4)gydF4y2Ba | 51 (63.7)gydF4y2Ba | ||
|
没有报告gydF4y2Ba | 4 (9.8)gydF4y2Ba | 1 (2.3)gydF4y2Ba | 5 (5.9)gydF4y2Ba | ||
|
|
|
|
|||
|
中学gydF4y2Ba | 27日(65.9)gydF4y2Ba | 23日(52.3)gydF4y2Ba | 50 (58.8)gydF4y2Ba | ||
|
学士学位gydF4y2Ba | 12 (29.3)gydF4y2Ba | 16 (36.4)gydF4y2Ba | 28日(32.9)gydF4y2Ba | ||
|
没有报告gydF4y2Ba | 2 (4.9)gydF4y2Ba | 5 (11.4)gydF4y2Ba | 7 (8.2)gydF4y2Ba | ||
|
|
|
|
|||
|
右撇子gydF4y2Ba | 38 (92.7)gydF4y2Ba | 42 (95.5)gydF4y2Ba | 80 (94.1)gydF4y2Ba | ||
|
左撇子gydF4y2Ba | 2 (4.9)gydF4y2Ba | 2 (4.5)gydF4y2Ba | 4 (4.7)gydF4y2Ba | ||
|
没有报告gydF4y2Ba | 1 (2.4)gydF4y2Ba | 0 (0)gydF4y2Ba | 1 (1.2)gydF4y2Ba |
一个gydF4y2BaF2F:面对面。gydF4y2Ba
bgydF4y2BaRGT:远程引导测试。gydF4y2Ba
对于F2F组,实验测试在心理实验室进行,使用标准测试笔记本电脑(惠普ProBook 430 G2/G3,英特尔酷睿i7 2/2.4GHz, 8 GB RAM, 500 GB HDD +256 GB SSD, 13.3 "显示屏),运行Windows 10操作系统(微软公司),有线鼠标。RGT组在家中使用参与者的个人笔记本电脑或台式机完成实验,这些笔记本电脑或台式机必须满足一定的最低要求(gydF4y2Ba
标准操作程序(gydF4y2Ba
远程指导和面对面测试过程的概述。gydF4y2Ba
参与者总共完成了10个在线实验任务,评估执行功能(认知灵活性、工作记忆和抑制控制)、学习和语言智力的各个方面。这些任务是通过3个不同的实验性网络平台交付的:gydF4y2Ba
所管理的实验任务总结和各自的交付平台。gydF4y2Ba
领域和任务gydF4y2Ba | 交付平台gydF4y2Ba | ||||
|
i-ABCgydF4y2Ba | 剑桥大学gydF4y2Ba一个gydF4y2Ba | InquisitgydF4y2Ba | 口头gydF4y2Ba | |
|
|||||
|
WCSTgydF4y2BabgydF4y2Ba | ✓gydF4y2Ba | - - - - - -gydF4y2BacgydF4y2Ba | - - - - - -gydF4y2Ba | - - - - - -gydF4y2Ba |
|
公关gydF4y2BadgydF4y2Ba | ✓gydF4y2Ba | - - - - - -gydF4y2Ba | - - - - - -gydF4y2Ba | - - - - - -gydF4y2Ba |
|
台湾海陆运输公司gydF4y2BaegydF4y2Ba | - - - - - -gydF4y2Ba | - - - - - -gydF4y2Ba | ✓gydF4y2Ba | - - - - - -gydF4y2Ba |
|
简易爆炸装置gydF4y2BafgydF4y2Ba | - - - - - -gydF4y2Ba | ✓gydF4y2Ba | - - - - - -gydF4y2Ba | - - - - - -gydF4y2Ba |
|
|||||
|
SWMgydF4y2BaggydF4y2Ba | - - - - - -gydF4y2Ba | ✓gydF4y2Ba | - - - - - -gydF4y2Ba | - - - - - -gydF4y2Ba |
|
WAIS-IV BDSgydF4y2BahgydF4y2Ba | - - - - - -gydF4y2Ba | - - - - - -gydF4y2Ba | - - - - - -gydF4y2Ba | ✓gydF4y2Ba |
|
|||||
|
Stroop任务gydF4y2Ba | - - - - - -gydF4y2Ba | - - - - - -gydF4y2Ba | ✓gydF4y2Ba | - - - - - -gydF4y2Ba |
|
风场gydF4y2Ba我gydF4y2Ba | - - - - - -gydF4y2Ba | - - - - - -gydF4y2Ba | ✓gydF4y2Ba | - - - - - -gydF4y2Ba |
|
|||||
|
SLgydF4y2BajgydF4y2Ba | ✓gydF4y2Ba | - - - - - -gydF4y2Ba | - - - - - -gydF4y2Ba | - - - - - -gydF4y2Ba |
|
|||||
|
WASI-IIgydF4y2BalgydF4y2Ba词汇(词汇)gydF4y2Ba | - - - - - -gydF4y2Ba | - - - - - -gydF4y2Ba | - - - - - -gydF4y2Ba | ✓gydF4y2Ba |
一个gydF4y2BaCANTAB:剑桥神经心理测试自动电池。gydF4y2Ba
bgydF4y2BaWCST:威斯康星卡片排序测试。gydF4y2Ba
cgydF4y2Ba空单元格表示未通过特定的交付平台管理特定的任务。gydF4y2Ba
dgydF4y2BaPR:概率学习和逆转。gydF4y2Ba
egydF4y2BaTMT:寻迹任务。gydF4y2Ba
fgydF4y2BaED:额外维度内移位。gydF4y2Ba
ggydF4y2BaSWM:空间工作记忆。gydF4y2Ba
hgydF4y2Baweiss - iv BDS:韦斯切勒成人智力量表-第四版向后数字跨度。gydF4y2Ba
我gydF4y2BaSST:停止信号任务。gydF4y2Ba
jgydF4y2BaSL:结构学习。gydF4y2Ba
kgydF4y2Ba问:智商。gydF4y2Ba
lgydF4y2BaWASI-II:韦斯切勒智力简写量表第二版。gydF4y2Ba
在i-ABC平台上执行三个实验任务[gydF4y2Ba
计算机化版本的Stroop任务、停止信号任务和痕迹制作任务由Millisecond软件在Inquisit 5的网页播放器上托管和管理[gydF4y2Ba
额外维度内(IED)集合转换任务和空间工作记忆任务都作为CANTAB的一部分进行管理[gydF4y2Ba
韦氏智力简写量表(WASI-II)第二版的词汇分测验[gydF4y2Ba
对于在指定时间限制内涉及响应的任务,计算错过试验的数量。如果参与者没有在试验规定的时间内输入响应,则视为错过试验。由于某些任务(例如Stroop)在继续之前需要响应,因此此索引对于这些任务不可用。gydF4y2Ba
参与者数据可以在试验级别或任务级别被排除(即,为该任务删除的所有参与者数据)。gydF4y2Ba
如果单个试验的RT离群(过快或过慢),则排除该试验。参考以前使用类似任务的研究[gydF4y2Ba
作为停止信号任务的例外,并参考Verbruggen等人[gydF4y2Ba
在任务级别,由于技术或性能原因,参与者数据被排除在外。由于技术原因,如果参与者在实验平台、设备或测试环境中遇到困难,数据将被排除在外。如果参与者错过和排除的试验总数占该任务所有试验的25%,则出现任务级表现排除(见前面讨论的试验级排除标准)。gydF4y2Ba
数据质量的最终指标是剩余纳入试验的平均RT(参与者)。这被用作数据质量指标,因为先前的研究表明,在基于web的实验任务交付过程中,平均RTs可能更可变/更长[gydF4y2Ba
每位RGT参与者都在家中使用个人电脑和互联网完成了实验任务。尽管所有参与者使用的设备都符合资格标准中规定的某些最低标准(见方法部分中的设备),但我们希望确定所使用的技术的实际范围和质量。如gydF4y2Ba
远程引导参与者的硬件规格(总N=44),包括计算机(a)品牌;(b)操作系统;(c)屏幕尺寸(英寸)(d)屏幕分辨率(像素);(e)处理器和(f)随机存取存储器(单位为GB)。gydF4y2Ba
远程引导参与者的Web能力(总n=44),包括(a)互联网下载/上传速度(越快=越好);(b)网络延迟(更短=更好)。gydF4y2Ba
与面对面组使用的标准测试设备相比,远程引导参与者的硬件和网络能力规格的总结。gydF4y2Ba
硬件规格gydF4y2Ba | RGTgydF4y2Ba一个gydF4y2Ban /的意思是,(% / SD)gydF4y2Ba | F2FgydF4y2BabgydF4y2Ba标准gydF4y2Ba | |||
|
|||||
|
宏碁gydF4y2Ba | 14 (13.6%)gydF4y2Ba | 该系列gydF4y2Ba | ||
|
苹果gydF4y2Ba | 6 (31.8%)gydF4y2Ba | - - - - - -gydF4y2BacgydF4y2Ba | ||
|
华硕gydF4y2Ba | 9 (20.5%)gydF4y2Ba | - - - - - -gydF4y2Ba | ||
|
戴尔gydF4y2Ba | 3 (6.8%)gydF4y2Ba | - - - - - -gydF4y2Ba | ||
|
惠普gydF4y2Ba | 7 (15.9%)gydF4y2Ba | - - - - - -gydF4y2Ba | ||
|
联想gydF4y2Ba | 5 (11.4%)gydF4y2Ba | - - - - - -gydF4y2Ba | ||
|
|||||
|
窗户gydF4y2Ba | 30 (68.2%)gydF4y2Ba | Windows 10gydF4y2Ba | ||
|
Mac OSgydF4y2Ba | 14 (31.8%)gydF4y2Ba | - - - - - -gydF4y2Ba | ||
|
|||||
|
英特尔酷睿i3gydF4y2Ba | 2 (4.5%)gydF4y2Ba | 英特尔酷睿i7 2/2.4ghzgydF4y2Ba | ||
|
英特尔酷睿i5gydF4y2Ba | 21 (47.7%)gydF4y2Ba | - - - - - -gydF4y2Ba | ||
|
英特尔酷睿i6gydF4y2Ba | 1 (2.3%)gydF4y2Ba | - - - - - -gydF4y2Ba | ||
|
英特尔酷睿i7gydF4y2Ba | 17 (38.6%)gydF4y2Ba | - - - - - -gydF4y2Ba | ||
|
英特尔酷睿i8gydF4y2Ba | 1 (2.3%)gydF4y2Ba | - - - - - -gydF4y2Ba | ||
|
英特尔酷睿i9gydF4y2Ba | 1 (2.3%)gydF4y2Ba | - - - - - -gydF4y2Ba | ||
|
其他gydF4y2Ba | 1 (2.3%)gydF4y2Ba | - - - - - -gydF4y2Ba | ||
RAM (GB)gydF4y2Ba | 9.73 (4.35)gydF4y2Ba | 8.0gydF4y2Ba | |||
硬盘总空间(GB)gydF4y2Ba | 417 (229)gydF4y2Ba | 500硬盘(+ 256ssd)gydF4y2Ba | |||
硬盘剩余空间(GB)gydF4y2Ba | 270 (223)gydF4y2Ba | 108gydF4y2Ba | |||
屏幕尺寸(英寸)gydF4y2Ba | 13.8 (1.74)gydF4y2Ba | 13.3gydF4y2Ba | |||
|
|||||
|
1280 x 800gydF4y2Ba | 1 (2.3%)gydF4y2Ba | 1920 x 1080gydF4y2Ba | ||
|
1366 x 768gydF4y2Ba | 6 (13.6%)gydF4y2Ba | - - - - - -gydF4y2Ba | ||
|
1440 x 900gydF4y2Ba | 2 (4.6%)gydF4y2Ba | - - - - - -gydF4y2Ba | ||
|
1920 x 1080gydF4y2Ba | 19 (43.2%)gydF4y2Ba | - - - - - -gydF4y2Ba | ||
|
1920 x 1280gydF4y2Ba | 1 (2.3%)gydF4y2Ba | - - - - - -gydF4y2Ba | ||
|
2560 x 1600gydF4y2Ba | 10 (22.7%)gydF4y2Ba | - - - - - -gydF4y2Ba | ||
|
3200 x 1800gydF4y2Ba | 3 (6.8%)gydF4y2Ba | - - - - - -gydF4y2Ba | ||
|
未指明的gydF4y2Ba | 2 (4.6%)gydF4y2Ba | - - - - - -gydF4y2Ba | ||
|
|||||
|
鼠标(无线)gydF4y2Ba | 27 (61.2%)gydF4y2Ba | 有线鼠标gydF4y2Ba | ||
|
鼠标(有线)gydF4y2Ba | 15 (34.1%)gydF4y2Ba | - - - - - -gydF4y2Ba | ||
|
鼠标(集成)gydF4y2Ba | 2 (4.6%)gydF4y2Ba | - - - - - -gydF4y2Ba | ||
|
键盘(无线)gydF4y2Ba | 2 (4.6%)gydF4y2Ba | 综合键盘gydF4y2Ba | ||
|
键盘(综合)gydF4y2Ba | 42 (95.5%)gydF4y2Ba | N/AgydF4y2BadgydF4y2Ba | ||
|
摄像头(综合)gydF4y2Ba | 43 (97.7%)gydF4y2Ba | 集成摄像头gydF4y2Ba | ||
|
摄像头(独立)gydF4y2Ba | 1 (2.3%)gydF4y2Ba | N/AgydF4y2Ba | ||
|
麦克风(集成gydF4y2Ba | 35 (79.6%)gydF4y2Ba | 集成麦克风gydF4y2Ba | ||
|
麦克风(独立)gydF4y2Ba | 9 (20.5%)gydF4y2Ba | N/AgydF4y2Ba | ||
|
|||||
|
下载速度(Mb/s)gydF4y2Ba | 77.9 (88.6)gydF4y2Ba | 44.6gydF4y2Ba | ||
|
上传速度(Mb/s)gydF4y2Ba | 70.4 (96.1)gydF4y2Ba | 48.1gydF4y2Ba | ||
|
互联网延迟(毫秒)gydF4y2Ba | 10.6 (12.3)gydF4y2Ba | 5gydF4y2Ba | ||
|
|||||
|
谷歌ChromegydF4y2Ba | 38 (86.4%)gydF4y2Ba | 谷歌ChromegydF4y2Ba | ||
|
Mozilla FirefoxgydF4y2Ba | 5 (2.3%)gydF4y2Ba | N/AgydF4y2Ba | ||
|
SafarigydF4y2Ba | 1 (11.4%)gydF4y2Ba | N/AgydF4y2Ba |
一个gydF4y2BaRGT:远程引导测试。gydF4y2Ba
bgydF4y2BaF2F:面对面。gydF4y2Ba
cgydF4y2Ba我们使用一套标准设备测试F2F参与者,因此F2F列下的每个小标题只报告一个值。gydF4y2Ba
dgydF4y2BaN/A:不适用。gydF4y2Ba
所有任务的数据质量指数摘要。gydF4y2Ba
交付平台与任务gydF4y2Ba | (1)漏检次数(%),平均值(SD)gydF4y2Ba | (2)数据排除gydF4y2Ba | (1)反应时间(sec),平均值(SD)gydF4y2Ba | |||||||||||||||
|
|
试验水平(%),平均值(SD)gydF4y2Ba | 任务级别(N),(技术/性能)gydF4y2Ba |
|
||||||||||||||
|
F2FgydF4y2Ba一个gydF4y2Ba | RGTgydF4y2BabgydF4y2Ba | F2FgydF4y2Ba | RGTgydF4y2Ba | F2FgydF4y2Ba | RGTgydF4y2Ba | F2FgydF4y2Ba | RGTgydF4y2Ba | ||||||||||
|
||||||||||||||||||
|
威斯康辛卡片分类测验gydF4y2Ba | 0.73 (1.3)gydF4y2Ba | 1.02 (1.9)gydF4y2Ba | 3.50 (3.2)gydF4y2Ba | 4.92 (5.4)gydF4y2Ba | 0/0gydF4y2Ba | 0 /gydF4y2Ba |
1.33 (0.18)gydF4y2Ba | 1.39 (0.22)gydF4y2Ba | |||||||||
|
概率学习与逆转(PR)gydF4y2Ba | 0.30 (0.6)gydF4y2Ba | 0.74 (1.5)gydF4y2Ba | 3.06 (3.1)gydF4y2Ba | 5.80 (5.9)gydF4y2Ba | 0/1gydF4y2Ba | 1/1gydF4y2Ba | 0.90 (0.16)gydF4y2Ba | 1.01 (0.21)gydF4y2Ba | |||||||||
|
结构学习(SL)gydF4y2Ba | 3.41 (2.6)gydF4y2Ba | 3.27 (2.6)gydF4y2Ba | 0.99 (0.7)gydF4y2Ba | 1.72 (3.5)gydF4y2Ba | 0/0gydF4y2Ba | 1/1gydF4y2Ba | 1.07 (0.15)gydF4y2Ba | 1.04 (0.16)gydF4y2Ba | |||||||||
|
||||||||||||||||||
|
颜色词特鲁gydF4y2Ba | N/AgydF4y2BacgydF4y2Ba | N/AgydF4y2Ba | 3.38 (4.5)gydF4y2Ba | 3.28 (4.7)gydF4y2Ba | 0/0gydF4y2Ba | 1/1gydF4y2Ba | 0.84 (0.13)gydF4y2Ba | 0.87 (0.14)gydF4y2Ba | |||||||||
|
停止信号任务(SST)gydF4y2Ba | 0.98 (1.8)gydF4y2Ba | 1.59 (3.3)gydF4y2Ba | 1.41 (2.4)gydF4y2Ba | 1.14 (2.7)gydF4y2Ba | 0/1gydF4y2Ba | 1/1gydF4y2Ba | 0.47 (0.08)gydF4y2Ba | 0.42 (0.09)gydF4y2Ba | |||||||||
|
轨迹A和BgydF4y2Ba | 0 (0)gydF4y2Ba | 0 (0)gydF4y2Ba | 0 (0)gydF4y2Ba | 0 (0)gydF4y2Ba | 0/0gydF4y2Ba | 2/0gydF4y2Ba | 40.9 (10.7)gydF4y2Ba | 40.4 (10.2)gydF4y2Ba | |||||||||
|
||||||||||||||||||
|
内/外维集移(IED)gydF4y2Ba | N/AgydF4y2Ba | N/AgydF4y2Ba | N/AgydF4y2Ba | N/AgydF4y2Ba | 0/0gydF4y2Ba | 0/0gydF4y2Ba | N/AgydF4y2Ba | N/AgydF4y2Ba | |||||||||
|
空间工作记忆gydF4y2Ba | N/AgydF4y2Ba | N/AgydF4y2Ba | N/AgydF4y2Ba | N/AgydF4y2Ba | 0/0gydF4y2Ba | 0/0gydF4y2Ba | N/AgydF4y2Ba | N/AgydF4y2Ba | |||||||||
|
||||||||||||||||||
|
向后数字跨度gydF4y2Ba | N/AgydF4y2Ba | N/AgydF4y2Ba | N/AgydF4y2Ba | N/AgydF4y2Ba | N/AgydF4y2Ba | 0/0gydF4y2Ba | 0/0gydF4y2Ba | N/AgydF4y2Ba | |||||||||
|
WASIgydF4y2BaegydF4y2Ba词汇表gydF4y2Ba | N/AgydF4y2Ba | N/AgydF4y2Ba | N/AgydF4y2Ba | N/AgydF4y2Ba | N/AgydF4y2Ba | 0/0gydF4y2Ba | 0/0gydF4y2Ba | N/AgydF4y2Ba |
一个gydF4y2BaF2F:面对面。gydF4y2Ba
bgydF4y2BaRGT:远程引导测试。gydF4y2Ba
cgydF4y2BaN/A:不适用。gydF4y2Ba
dgydF4y2BaCANTAB:剑桥神经心理测试自动电池。gydF4y2Ba
egydF4y2Ba韦氏智力简写量表。gydF4y2Ba
如gydF4y2Ba
最后,我们评估了纳入试验的平均RTs是否作为检验方式的函数而不同(见gydF4y2Ba
通过交付平台对任务绩效指标进行分析。与之前使用简单统一的标准手动计算遗漏/排除试验的数据质量度量不同,这些性能指标在复杂性和粒度上有很大差异(例如,跨越策略、准确性/误差和时间的估计)。大多数性能指标也是由交付软件使用内置标准和假设自动计算出来的。因此,我们根据交付平台分别分析任务性能,以允许我们检测在某些平台及其任务上出现的任何测试方式差异,而不是其他平台。gydF4y2Ba
(a) i-ABC性能指标图;(b) Inquisit;(c) CANTAB和(d)口头交付任务。面对面的参与者显示为深灰色条,远程引导的参与者显示为浅灰色条。误差条表示平均值的标准误差,***gydF4y2Ba
任务绩效指标汇总。gydF4y2Ba
交付平台和任务及绩效指标gydF4y2Ba | 分组得分gydF4y2Ba | 全球语言监测机构gydF4y2Ba一个gydF4y2Ba形态的影响gydF4y2Ba | ||||||
|
F2FgydF4y2BabgydF4y2Ba,平均值(SD)gydF4y2Ba | RGTgydF4y2BacgydF4y2Ba,平均值(SD)gydF4y2Ba |
|
|||||
|
|
|
形态gydF4y2Ba |
|||||
|
|
|
|
|
||||
|
|
Nonperseverative错误gydF4y2Ba | 10.1 (5.5)gydF4y2Ba | 10.2 (6.8)gydF4y2Ba |
|
|||
|
|
持续的错误gydF4y2Ba | 9.3 (2.6)gydF4y2Ba | 10.0 (4.1)gydF4y2Ba |
|
|||
|
|
|||||||
|
|
执拗gydF4y2Ba | 3.1 (1.7)gydF4y2Ba | 3.7 (2.8)gydF4y2Ba |
|
|||
|
|
切换概率gydF4y2Ba | 6.6 (2.5)gydF4y2Ba | 6.7 (2.6)gydF4y2Ba |
|
|||
|
|
|
|
|
||||
|
|
π的意思gydF4y2Ba | 0.15 (0.22)gydF4y2Ba | 0.06 (0.18)gydF4y2Ba |
|
|||
|
|
π的变化gydF4y2Ba | 0.18 (0.30)gydF4y2Ba | 0.16 (0.31)gydF4y2Ba |
|
|||
|
|
|
形态gydF4y2Ba |
|||||
|
|
|
|
|
||||
|
|
干扰(反应时间)gydF4y2Ba | 0.23 (0.10)gydF4y2Ba | 0.22 (0.11)gydF4y2Ba |
|
|||
|
|
干扰(精度)gydF4y2Ba | -0.08 (0.07)gydF4y2Ba | -0.10 (0.09)gydF4y2Ba |
|
|||
|
|
|
|
|
||||
|
|
信号反应时间gydF4y2Ba | 0.24 (0.19)gydF4y2Ba | 0.28 (0.27)gydF4y2Ba |
|
|||
|
|
|
|
|
||||
|
|
试验B/A时间比gydF4y2Ba | 1.26 (0.43)gydF4y2Ba | 1.17 (0.31)gydF4y2Ba |
|
|||
|
|
|
形态gydF4y2Ba |
|||||
|
|
|||||||
|
|
额外维度位移误差gydF4y2Ba | 5.6 (7.2)gydF4y2Ba | 4.7 (5.2)gydF4y2Ba |
|
|||
|
|
额外维度前移位错误gydF4y2Ba | 7.3 (2.6)gydF4y2Ba | 9.6 (7.7)gydF4y2Ba |
|
|||
|
|
|
|
|
||||
|
|
之间的错误gydF4y2Ba | 25.3 (16.7)gydF4y2Ba | 32.3 (21.3)gydF4y2Ba |
|
|||
|
|
策略gydF4y2Ba | 13.3 (4.6)gydF4y2Ba | 14.4 (4.1)gydF4y2Ba |
|
|||
|
|
|
形态gydF4y2Ba |
|||||
|
WASIgydF4y2BaegydF4y2Ba词汇(标准化分数)gydF4y2Ba | 50.1 (7.2)gydF4y2Ba | 56.0 (7.6)gydF4y2Ba |
|
||||
|
倒数数字跨度(总分)gydF4y2Ba | 8.7 (3.1)gydF4y2Ba | 9.7 (3.2)gydF4y2Ba |
|
一个gydF4y2BaGLM:一般线性模型gydF4y2Ba
bgydF4y2BaF2F:面对面。gydF4y2Ba
cgydF4y2BaRTG:远程引导测试。gydF4y2Ba
dgydF4y2BaCANTAB:剑桥神经心理测试自动电池。gydF4y2Ba
egydF4y2Ba韦氏智力简写量表。gydF4y2Ba
总之,我们观察到,在任何交付平台或实验任务中,F2F参与者和RGT参与者在任务表现上没有显著差异,除了WASI词汇表的显著例外,RGT参与者在任务上的得分明显高于F2F参与者。gydF4y2Ba
为了理解这种语言智力明显差异的来源,首先,我们评估了参与者的背景是否可以解释他们在词汇表现上的差异。据此,以词汇分数为因变量,将性别(2级,男/女)、民族(3级,华人/马来/印度人)、教育程度(2级,中等/本科)、家庭居住(6级)、测试方式(2级,F2F/RGT)和连续变量年龄作为预测因子,进行一般回归模型分析。总体而言,该模型意义重大(gydF4y2Ba
接下来,我们对参与者的项目级反应进行了进一步的分析。回想一下,参与者在每个单词项目上得到0分(错误或空回答),1分(部分回答)或2分(完整回答)。我们评估了RGT组的优异表现是否由于(1)掌握了更多的单词(即达到更高的单词条目数)或(2)对单词的更完整的描述(即获得更高比例的单词的满分2分)。未配对的双尾gydF4y2Ba
2019冠状病毒病(COVID-19)大流行从根本上改变了人类心理学研究的格局,需要在新的远程工作方式和传统的基于实验室的研究方法之间重新调整平衡。向基于web的数据收集方法转变的紧迫性和动力从未如此之大。然而,在线协议的数据质量和保证框架——特别是基于网络的认知测量——仍然缺乏,目前发表的基于网络的研究在数据质量监测和透明度方面存在很大差异。因此,我们对基于网络的数据集与亲自收集的数据有何不同知之甚少,关于实验的严谨性、可靠性和有效性仍存在重大问题[gydF4y2Ba
此外,尽管我们在研究背景下使用RGT,但我们的研究结果表明,没有理由不将该方法用于临床神经心理学评估,特别是在面对面会面很难或不可能的情况下。例如,坐在轮椅上或在养老院的人可能会发现在他们的家庭环境中更容易接受检测,特别是在日照时间较短的冬季,而且可能有重大的天气因素阻碍旅行(如冰或雪)。因此,在临床和非临床环境中,RGT方法与传统的F2F方法结合使用具有广泛的潜力。gydF4y2Ba
在通过RGT和基于实验室的标准F2F方法收集的认知测试数据中检查了三个数据质量指标:(1)错过试验,(2)数据排除(个人试验和参与者水平),以及(3)RTs。结果表明,由于技术原因,更多的参与者数据集被排除在外,例如硬件或软件不兼容问题,或者在一种情况下,RGT数据集中的环境破坏(RGT所有任务中的n=6,而F2F没有)。然而,RGT和F2F数据集在遗漏和排除试验的任何其他数据质量指数或RT上没有差异。后者的结果尤其相关,因为先前基于网络的研究检查了RT指数,注意到在无监督的基于网络测试中,参与者的反应时间潜伏期存在显著和一致的滞后[gydF4y2Ba
众所周知,在实验研究中,“实验者效应”对参与者的动机、精神状态、表现、任务投入和可信度有显著影响[gydF4y2Ba
在使用3个不同的实验平台(CANTAB、Inquisit和i-ABC)进行的执行功能(认知灵活性、工作记忆和抑制)和学习的所有测量中,没有观察到任务表现的显著差异。然而,当我们在远程和面对面的环境中测量时,我们确实观察到言语智力(词汇量)的巨大且不可预测的差异。令人惊讶的是,RGT组的得分明显高于F2F组,这种影响不能用背景特征(年龄、性别、种族或社会经济地位)的差异来解释。对项目层面回答的详细分析表明,与F2F参与者相比,RGT参与者对显著更高数量的单词给出了正确的定义,并且对单个测试项目给出了更详尽的回答。这可能是由于F2F参与者和实验者在实验室的整个实验过程中都戴着口罩,并保持至少1米的物理距离(符合现行的COVID-19指南)。这可能影响了参与者与实验者沟通的总体意愿,与之前大规模随机对照研究的数据一致,该研究表明,医生在会诊期间戴口罩对医患沟通、感知共情和关系连续性产生了负面影响[gydF4y2Ba
这项研究的一个优势是参与者是多样化的亚洲血统(包括华人、马来人和印度人),这解决了参与者人口统计学上的西方倾斜,这是许多心理学研究的特征[gydF4y2Ba
鉴于目前的社会势头,我们预计使用基于网络的协议进行认知研究的数量将继续增加。因此,迫切需要为基于网络的认知研究的进行和报告制定标准化的协议、数据质量保证指数和基准。我们向这个方向迈出了一步,使我们的远程引导方法的标准操作协议免费提供(gydF4y2Ba
我们的结果表明,RGT方法产生了高质量的认知数据,可与在实验室中亲自收集的数据相媲美。然而,这种数据质量的提高是以远程人工监督所需的额外人力和时间为代价的。事实上,与基于实验室的测试相比,RGT方法需要额外的设置会话(持续30分钟),因此对实验者和参与者都有更大的时间需求。这种程度的时间投资可能不适用于旨在在短时间内测试数千名参与者的大规模研究,尽管在没有必要的研究人员的情况下,包括明确的在线测试说明和简短的在线辅导(例如,使用视频剪辑)可能会提高说明的可理解性。如gydF4y2Ba
另一个重要的考虑因素是在实际地点亲自出席的必要性和可行性。某些实验方案(例如,神经成像和侵入性手术)由于需要特定的设备或专业知识,需要亲自出席。在这些情况下,基于实验室的亲自测试是数据收集的唯一选择。然而,在不需要或不可能出勤的情况下(例如,在COVID-19封锁限制期间),RGT可能是一种可行的替代方案。采用RGT等方法的决定将进一步考虑群体规模和组成;例如,在涉及高风险或罕见队列的临床研究中,最大化个人数据质量是重要的。同样,在以前的时间点使用基于实验室的面对面认知测试的纵向研究可能会优先考虑交叉设置的可比性,选择有监督的在线方法,产生与基于实验室的测试相似的结果。此外,包括rt依赖任务(例如Stroop和停止信号)的研究可能希望使用监督在线方法来改善已知的反应延迟问题[gydF4y2Ba
对认知测试的无监督、有监督的网络测试和面对面方法的适用性考虑的总结。RT:反应时间。gydF4y2Ba
全球COVID-19大流行加速了基于网络的认知测试,但基于网络研究的数据质量和有效性仍存在长期问题,迫切需要为当前和未来的在线研究开发和实施数据质量保证框架。在这里,我们提出了一种新的监督在线测试方法,RGT,并提出了这种新方法的数据质量基准。在所有数据质量和性能的测量中,RGT方法产生的数据在统计学上等同于在实验室中亲自收集的数据。我们得出的结论是,RGT方法是稳健的,为在实验室研究和临床环境中收集高质量的人类认知数据提供了一种可行的替代方案,而无需亲自参加。gydF4y2Ba
标准操作协议。gydF4y2Ba
设备问卷(远程引导测试)。gydF4y2Ba
测试环境检查表(远程引导测试)。gydF4y2Ba
任务描述和性能指标。gydF4y2Ba
剑桥神经心理测试自动电池gydF4y2Ba
终身学习和个性化认知中心gydF4y2Ba
面对面的gydF4y2Ba
一般线性模型gydF4y2Ba
混合神经心理学gydF4y2Ba
intra-extra维gydF4y2Ba
远程引导测试gydF4y2Ba
反应时间gydF4y2Ba
空间工作记忆gydF4y2Ba
韦氏智力简写量表gydF4y2Ba
这项研究是由终身学习和个性化认知中心(CLIC)进行的。CLIC由新加坡总理办公室的国家研究基金会支持,在其卓越研究和科技企业校园(CREATE)计划下。这项研究还得到了南洋理工大学资助VL (M4081585.SS0),新加坡教育部Tier 1资助VL (M4012105)的支持。年代年代0而且米4011750.年代年代0), and grants to ZK from the Biotechnology and Biological Sciences Research Council (H012508 and BB/P021255/1), the Wellcome Trust (205067/Z/16/Z), and the European Union's Horizon 2020 research and innovation program (grant numbers 765121 and 840271).
我们感谢Janice Tan Yu Jin在数据收集方面的协助,Avraam Papadopoulos在i-ABC应用程序方面的技术支持,以及Kastoori d/o Kalaivanan在校对方面的协助。gydF4y2Ba
TWR接受剑桥认知的咨询费用。BJS是剑桥认知学的顾问。gydF4y2Ba