这是一篇开放获取的文章,根据创作共用署名许可(http://creativecommons.org/licenses/by/2.0/)的条款发布,允许在任何媒介上无限制地使用、分发和复制,前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。
在线干预越来越多地针对认知结果的测量,但到目前为止,还没有简单、快速的认知自我监测得到验证或证明是可靠和可行的。
本研究检验了一种名为脑老化监测-认知评估电池(BAM-COG)的新仪器,以测试其替代形式的信度、面孔和内容效度以及收敛和发散效度。此外,还提供了参考值。
BAM-COG由四个简单,简短,但具有挑战性的益智游戏组成,这些游戏被开发用于测量工作记忆(“传送带”),视觉空间短期记忆(“阳光”),情景识别记忆(“观点”)和计划(“纸草”)。这项研究共招募了641名参与者。其中,397名40岁及以上的成年人(平均54.9,标准差9.6)符合分析条件。研究参与者把所有的游戏都玩了三次,两次游戏间隔14天。面部和内容有效性基于专家意见。替代形式信度(AFR)通过比较不同版本的BAM-COG的得分来测量,并以类内相关性(ICC:双向混合;一致性为95%)。通过将BAM-COG评分与金标准的纸笔和计算机辅助认知评估进行比较,提供了收敛效度(CV)。发散效度(DV)通过比较BAM-COG分数与国家成人阅读测试IQ (NART-IQ)估计值来测量。CV和DV均用Spearman rho相关系数表示。
4款游戏中有3款在AFR、CV和DV测量上表现良好。游戏《输送带》,《阳光》和《Papyrinth》的AFR ICCs分别为。420,。426和。645。此外,这些游戏有很好的CV相关性:rho=.577(
这项研究为使用BAM-COG测试电池作为可行、可靠和有效的工具来在线监测健康成年人的认知表现提供了证据。四分之三的游戏具有良好的心理测量特征,能够测量工作记忆、视觉空间短期记忆和计划能力。
随着互联网的兴起和电子健康的引入,在线医疗保健的新研究领域在过去十年中迅速发展[
从健康行为改变的角度来看,电子健康和游戏都是非常有趣的。广泛的互联网接入为行为改变研究人员提供了接触大量人群所必需的平台。在欧洲和北美,互联网普及率在总人口的63.2%至78.6%之间[
互联网的一个重要缺点是它的内容必须快速和有趣。
衰老对认知功能的影响已得到越来越多的研究[
网上认知测试已被证实适用于10至12岁的儿童[
据我们所知,这是第一个描述、验证和检查在线自我监测认知功能的研究,它利用了视觉上有吸引力的、易于指导的益智游戏。BAM-COG不是作为诊断工具开发的(例如,用于评估病理性认知衰老,如痴呆症),也不是为了预测随着时间的推移认知能力下降而设计的。BAM-COG的目的是让用户能够建立他们的认知表现,并随着时间的推移监测他们的个人认知发展。这是非常重要的,因为它大大增加了在线研究认知功能的可能性,它扩大了覆盖面,它降低了金钱和时间上的成本。
本研究的假设是,与标准的纸笔和计算机辅助认知评估相比,BAM-COG游戏具有良好的替代形式信度,并且BAM-COG新开发的四款益智游戏的面孔和内容效度转化为良好的收敛效度和发散效度。
我们开始在40岁及以上的社区居民队列中验证BAM-COG
该研究网站对参与者开放了四个月。在注册时,我们记录了性别、年龄和教育水平——后者从1到8,其中1是最低值(小学),8是最高值(大学教育水平;参见[
在前两次访问中,参与者进行了相同的BAM-COG游戏
这项研究分为两部分。第1部分涉及AFR分析和参考值的数据收集,这完全是通过互联网完成的。第1部分的参与者估计每次会议大约需要45分钟来完成BAM-COG。总的来说,在28天内进行了三轮BAM-COG谜题后,参与者估计在BAM-COG上花了大约135分钟。从现在起,这个组将被缩写为“在线组”。第2部分涉及计算BAM-COG的收敛有效性(CV)和发散有效性(DV)所需的数据收集。在这个过程中,除了在线玩BAM-COG游戏外,参与者还访问了内梅亨大学医疗中心(RUMC)一次(该组将缩写为“RUMC组”)。这组参与者进行了计算机化的认知测试(剑桥自动神经心理测试或CANTAB的子测试)和纸和笔的神经心理测试(PnP)(见
对于访问RUMC的参与者群体,应用了两个附加的纳入和排除标准。在简易精神状态测验(MMSE [
BAM-COG(大脑老化监测-认知评估电池)游戏细节。
BAM-COG游戏 | 认知领域 | 总水平一个 | 得分范围 | 简短的描述 |
输送带 | 工作记忆 | 7 | 4到10 | 这个游戏在屏幕上向参与者展示购物清单。1秒后,传送带开启。食品杂货沿着传送带进行,参与者只需要选择清单上的产品。 |
阳光 | 视觉空间短期记忆 | 8 | 3 - 10 | 在这个游戏中,太阳在5x5的云矩阵中创建视觉图案。这个视觉图案会消失,在它完全消失后,参与者被要求按照它最初出现在屏幕上的完全相同的顺序重现这个图案。 |
的观点 | 情景识别记忆 | 8 | 1 - 8 | 这个游戏向参与者展示了一个充满刺激(星号)的5x5矩阵。参与者有3秒钟的时间来记住所呈现的图案,然后图案就会从屏幕上消失。3秒后,屏幕上出现3个答案,参与者要从中选择与前面显示的矩阵完全匹配的答案。 |
Papyrinth | 执行功能——计划 | 5 | 3 - 7 | 这个游戏首先向参与者展示一个打乱的路径。参与者的任务是理清路径,这样他们的棋子可以从开始到结束畅通无阻。清除路线是通过以正确的顺序滑动列和行来完成的,这样道路的所有部分最终都相互连接起来。 |
一个不包括实践水平。
BAM-COG一个并提出了匹配的计算机化和纸笔认知测试。
BAM-COG游戏(域) | 剑桥大学b | 纸和笔 |
输送带 |
空间工作记忆[ |
来自WAIS-III的字母-数字测序任务c[ |
阳光 |
空间跨度[ |
WMS-III的空间跨度子测试d[ |
的观点 |
模式识别[ |
持续视觉记忆任务[ |
Papyrinth |
剑桥的长袜[ |
动物园地图任务,BADS的一部分e[ |
一个脑老化监测-认知评估组。有关BAM-COG游戏的简短描述,请参见
bCANTAB:剑桥自动神经心理测试组。
c韦氏成人智力量表,第三版。
dWMS-III:韦氏记忆量表,第三版。
eBADS:执行障碍综合征的行为评估。
根据我们对CV和DV的样本量计算,我们在第2部分需要37名参与者(alpha错误概率<。05,我们研究的幂(1- β误差概率=.8)。使用GPower 3.1进行样本量计算[
BAM-COG由四个益智游戏组成,用于测量工作记忆、视觉空间短期记忆、情景识别记忆和执行功能计划(参见
RUMC组的受试者还参与了与BAM-COGs认知域匹配的CANTAB任务和PnP任务
根据两位神经心理学家、一位老年病学专家、一位公共卫生研究员和一个专业游戏设计团队的专家意见,这四款益智游戏被认为涵盖了工作记忆、视觉空间短期记忆、情景识别记忆和计划的认知结构。在初步评估之后,该仪器大纲与更广泛的卫生保健专业人员小组进行了讨论,这些专业人员包括神经心理学家、流行病学家、公共卫生保健研究人员和普通心理学家。人们一致认为,从内容的角度来看,当快速和容易访问是关键标准时,不可能涵盖整个生命周期中功能下降的每一个认知领域。研究人员决定选择三种执行功能和一种特定的记忆功能,所有这些功能都已被证实可以降低正常衰老和神经退行性综合征[
在不同时间点进行的三批BAM-COG游戏进行比较时,确定了备用形式可靠性(AFR)。每个批次类似于包含相同数量的关卡和试验的BAM-COG的并行版本。从理论上讲,这些批次在难度上没有区别。AFR测定采用类内相关(ICC:双向混合;一致性为95%),即参与者第二轮和第三轮表现的结果。关于icc的解释,我们需要考虑到这项研究是在临床实验室环境之外进行的,在那里人们很容易分心,这可能会影响测试的可靠性。因此,ICC值在0.4到0.6之间被认为足以支持BAM-COG的AFR。这与另一项在线验证研究一致[
为了进一步分析测量之间可能存在的系统差异,计算了Bland-Altman图。在这些图中,两个时间段之间的差异与它们的平均值对应。此外,分数的平均值和一致限度被计算为两个测量值之间的差值的平均值±2 SD这些差值。还计算了测量的标准误差和两次测量之间的平均差的95%置信区间。如果95%置信区间不包括零,则表明平均值发生了系统的、不受欢迎的变化[
CV决定了由BAM-COG游戏所测量的认知领域是否得到了真正的评估,并将经过验证的认知任务作为黄金标准。相比之下,DV检查了BAM-COG在多大程度上与它不应该相关的认知领域相关。通过比较BAM-COG游戏分数与非相关认知结构(在本研究中,智商分数来自荷兰版的国家成人阅读测试,NART), BAM-COG的独特能力被建立起来。由于BAM-COG结局指标的数据分布非正态分布,且样本量小,因此使用单侧Spearman 's rho相关系数计算BAM-COG的CV和DV。
为解释目的,将三个批次的数据汇总到一个测量中,用于计算CV和DV。这使我们能够将任务判断为一个实体,而不是三个单独的批。单次测试统计数据是根据参与者的平均游戏分数生成的(关于得分的更多信息,请参阅Instruments)。为游戏提供参考值,以提供一些洞察在40岁及以上的正常老龄化人口中的预期分数分布。在每次分析中,原始测试分数为0的参与者被排除在外。这是因为这些参与者要么看了说明,但没有开始玩,要么只玩了进入下一关所需的三次尝试中的一两次。
当地医学伦理委员会(阿纳姆-奈梅亨地区,注册号:2011/490)认为该研究无需进行正式的伦理评估。所有统计分析均使用IBM SPSS Statistics for Windows, Version 20.0进行。Bland-Altman图用GraphPad Prism 5.03版进行。
BAM-COG的可行性是基于注册和退出的总数,参与并完成第一轮、第二轮和第三轮的参与者的百分比,以及对下限和上限效应的分数分布的检查进行评估的。
通过我们的研究网站,641名参与者参与了这项研究,其中124人(19.3%)因不符合年龄标准而被排除在外。注册后,每个参与者都被要求第一次进行BAM-COG测试。该组中有76.8%(397/517)的参与者至少玩过一款游戏,因此有资格进行分析;其中78.6%(312/397)为女性。平均年龄54.9岁(标准差9.6岁),文化程度6级(范围1 ~ 8级)。
我们招募了56名参与者参与研究的第二部分。56名参与者中,41名愿意在线注册,平均年龄60.8岁(标准差8.2岁),其中58.5%(24/41)为女性,文化程度为7级(1-8级)。所有参与者的母语都是荷兰语。所有人都能成功完成CANTAB运动筛查任务。总的来说,41名参与者中有21人(51.2%)先完成CANTAB任务,而41名参与者中有20人(48.8%)先完成PnP任务。
在
年龄的平均值(SD), MMSE一个, NART-IQb,以及BAM-COGc人民大学教育的成绩和模式(范围)d和在线小组。
|
网络组 | RUMC集团 |
年龄,年龄,平均值(SD) | 54.9 (9.6) | 60.8 (8.2) |
学历、模式(范围) | 6 (1 - 8) | 7 (1 - 8) |
MMSE,平均值(SD) | -- | 29.4 (1.07) |
NART-IQ,平均值(SD) | -- | 123.2 (12.83) |
输送带评分 | 5.95 (n = 217) | 6.33 (n = 26) |
阳光的分数 | 4.60 (n = 236) | 5.10 (n = 24) |
观点的分数 | 3.97 (n = 306) | 3.90 (n = 28) |
Papyrinth得分 | 4.64 (n = 152) | 5.30 (n = 21) |
一个迷你精神状态检查。
bNART-IQ:全国成人阅读测试-智商。
c脑老化监测-认知评估组。
d内梅亨大学医疗中心。
BAM-COG备选形式可靠性(AFR)一个类内相关性(ICC)中的游戏b)。
BAM-COG游戏 | 误判率 | 95%可信区间 |
输送带(n=55) | .420 | 0.17 - -0.62 |
阳光(n = 78) | .426 | 0.23 - -0.59 |
观点(n = 101) | .167 | −0.04 ~ 0.36 |
Papyrinth (n = 37) | .645 | 0.41 - -0.80 |
一个脑老化监测-认知评估组。
b所有ICC值为>。4一个re considered to support sufficient AFR.
除了观点,与CANTAB和PnP任务相比,BAM-COG游戏的CV(>.4)到非常好(>.6)
为了控制单个游戏是否在同一认知域上没有大量负载,我们使用汇总游戏分数进行了斯皮尔曼相关分析。正如大样本所预期的那样,大多数相关性是显著的。然而,相关性的大小范围很小(rho=.143,
BAM-COG的收敛有效性和发散有效性一个(Spearman rho相关系数)。
BAM-COG游戏 | 聚合效度b | 不同的有效性c | |||
|
认知测试 | ρ( |
认知测试 | ρ( |
|
|
|||||
|
WAIS-IIId字母编号排序 | .577(措施) | 全国成人阅读测试 | −.029(无误) | |
|
空间工作记忆 | −.577(措施) |
|
||
|
|||||
|
WMS-IIIe空间跨度任务 | .669(<措施) | 全国成人阅读测试 | −.029(点) | |
|
空间跨度 | .620(措施) |
|
|
|
|
|||||
|
连续视觉记忆测验 | .202 (.152) | 全国成人阅读测试 | −.162(增长) | |
|
模式识别 | −.157(.212) |
|
|
|
|
|||||
|
坏事f动物园的地图 | .400 (.036) | 全国成人阅读测试 | −.134(陈霞) | |
|
剑桥袋球 | .424 (.028) |
|
|
一个脑老化监测-认知评估组。
brho≥的所有收敛效度值。4名被认为支持良好的简历;rho≥。6一个re considered very good.
c的所有发散效值。2个被认为支持良好的DV。
d韦氏成人智力量表,第三版。
eWMS-III:韦氏记忆量表,第三版。
fBADS:执行障碍综合征的行为评估。
我们提供所有游戏的参考值(
BAM-COG一个参考价值。
|
输送带(n=217) | 阳光(n = 236) | 观点(n = 306) | Papyrinth (n = 152) | ||||
分数 | 频率 | 百分比 | 频率 | 百分比 | 频率 | 百分比 | 频率 | 百分比 |
1 | NAb | NA | NA | NA | 145 | 27.5 | NA | NA |
2 | NA | NA | NA | NA | 57 | 10.8 | NA | NA |
3. | NA | NA | 75 | 19.7 | 32 | 6.1 | 57 | 25.3 |
4 | 78 | 24.4 | 148 | 38.9 | 90 | 17.1 | 82 | 36.4 |
5 | One hundred. | 31.3 | 79 | 20.8 | 70 | 13.3 | 27 | 12.0 |
6 | 26 | 8.1 | 55 | 14.5 | 41 | 7.8 | 15 | 6.7 |
7 | 43 | 13.5 | 15 | 3.9 | 13 | 2.4 | 44 | 19.6 |
8 | 58 | 18.2 | 6 | 1.7 | 79 | 15 | NA | NA |
9 | 12 | 3.8 | 2 | 0.5 | NA | NA | NA | NA |
10 | 2 | 0.7 | 0 | 0 | NA | NA | NA | NA |
一个脑老化监测-认知评估组。
b不适用,因为这个分数不可能出现在本场比赛中。
登记人数共641人。BAM-COG在两个全国性广播节目和几家地区和全国性报纸和杂志上受到了全国的关注。在517名符合条件的参与者中,只有397名参与者在三个批次中至少玩了一款游戏(76.8%)。
传送带游戏在三次评估中玩得最多(分别为314次、143次和107次),纸草游戏玩得最少(分别为189次、123次和87次)。平均而言,75.7%的参与者玩了所有四场游戏,从上一轮结束最后一场游戏的参与者中,平均有80.7%的参与者返回玩下一轮游戏。
只有8名参与者在玩游戏时中途退出。所有其他参与者继续游戏,直到“游戏结束”的消息出现,他们要么继续玩下一个游戏,要么在听到这个消息后决定退出。退出的8名参与者都在玩《Papyrinth》时停下来,这是唯一一款没有综合时间限制的游戏。
数据中没有真正的下限或上限效应。唯一可能的例外可能是Papyrinth和Viewpoint的轻微上限效应(分别为19.6%,44/225和15.0%,79/527,完成最高水平)。否则,参与者完成任务的百分比非常低(分别为0.5%,2/380和0.7%,2/319)。
本文为使用BAM-COG游戏电池作为认知表现的在线自我监测提供了实质性的支持。四分之三的游戏似乎足以衡量相关的认知概念(工作记忆、视觉空间短期记忆和计划)。传送带,阳光,和Papyrinth都有良好的替代形式的可靠性,并被证明是可行的老年人使用。此外,他们都有很好的收敛和发散效度,现在可供参考的游戏。因为所有游戏都是为了衡量某种形式的认知领域而设计的,所以它们之间的相关性在统计上是显著的。然而,它们的大小要么相当小,要么等于与外部金标准测量工具的任务相关性。游戏《Viewpoint》是设计来评估情景识别记忆的,它没有足够的有效性和可靠性,不适合列入在线评估。此外,我们的设置的一个优点是BAM-COG分数与金标准CANTAB和PnP任务的相关性。事实证明,BAM-COG游戏是预期认知领域的可靠测量方法,这为在其他样本中复制这些结果提供了良好的希望,并且BAM-COG可以用于预期的目的。
尽管目前的发现对于BAM-COG的适用性是有希望的,但可以根据这些结果建议进行一些调整。首先,我们偶尔会收到技术困难的反馈,特别是在传送带游戏的表现方面。小尺寸的刺激(在这种情况下,食品杂货如苹果和梨)似乎很难点击,导致无意中错过反应。然而,虽然我们不能完全排除某些远程系统的技术问题,但这也可能是由于个别参与者的鼠标操作不佳造成的。这种解释是可能的,因为软件开发人员和研究人员都无法在不同的操作系统和互联网浏览器的不同系统上复制这个问题。此外,这个问题出现的频率并不高(n= 314中的19个),它会严重影响我们的分析结果。第二,反馈是需要额外的练习级别。显然,仅仅通过一次试验来熟悉任务并不总是足以让所有参与者完全理解对他们的要求。这可能会导致平均分略微落后。在未来发布的BAM-COG电池中,可以很容易地考虑到这一点。 Third, regardless of our follow-up efforts (one additional phone call and one personal reminder email), 15 participants in the RUMC group failed to register online even after they had visited the memory clinic. Reasons for this dropout could have been a sole interest in the neuropsychological screening at the research center, time restrictions, loss of motivation, or the relative ease with which reminder emails and online interventions can be ignored and forgotten. Additionally, the limited amount of personal contact with the researchers and the ease of the registration process may increase attrition [
在解释这些结果时,我们需要考虑游戏进行时的自然环境。也就是说,在高度控制的条件下产生结果的实验室研究通常会导致较高的icc和相关性。本研究中的BAM-COG评估都是在参与者的家庭环境中进行的,没有研究团队的监督。由于BAM-COG并非设计用于实验室环境,我们认为目前的设计是检验其可行性、有效性和可靠性的有效方法。如果有偏差,本研究中提出的性能可能低估了BAM-COGs任务的真实可靠性和有效性[
事实上,我们的人群主要由女性组成(第一部分和第二部分分别为78.6%,312/397和58.5%,24/41),这在一定程度上降低了本研究的外部有效性。然而,这种类型的研究和这些类型的益智游戏已经被证明比男性更能吸引女性参与者。
总而言之,本研究为使用BAM-COG测试组作为可行、可靠和有效的工具来在线监测健康成年人的认知表现提供了证据。研究发现,四分之三的游戏具有良好或非常好的心理测量特征,可以测量工作记忆、视觉空间短期记忆和计划能力。应该强调的是,该结果绝不能用于诊断神经退行性疾病或预测认知表现。BAM-COG适用于在实践中用于在线监测认知和刺激对健康大脑衰老的电子健康干预。
BAM-COG游戏概述。
短视频的BAM-COG的游戏玩法-传送带。
BAM-COG游戏玩法短片-阳光。
BAM-COG比赛短片-视点。
短视频的BAM-COG的游戏玩法-纸草。
备用形式可靠性的Bland-Altman图概述。
备选形式可靠性
脑老化监测-认知评估电池
剑桥自动神经心理测试组
聚合效度
不同的有效性
组内相关
智商
国际教育标准分类
小型精神状态检查
全国成人阅读测试
内梅亨大学医疗中心
我们要感谢Keesing游戏对游戏开发的支持和努力。我们还要感谢Maurice Rijnaard在招募和审查参与者方面所作的贡献。该项目由国家品牌和认知计划(NIHC,赠款#056-12-011)的QuickResult资助,嵌入“健康大脑,计划健康认知衰老”的支柱。RPCK由国家大脑与认知计划(NIHC,赠款# 056-11-011)的QuickResult拨款资助,嵌入“健康大脑,认知康复计划”的支柱。该手稿的出版费用由授予MGMOR的NWO开放获取补助金资助。
没有宣布。