卡塔尔世界杯8强波胆分析|卡塔尔世界杯4强波胆分析

JMIR

J医疗互联网服务

医学互联网研究杂志

14388871

卡塔尔世界杯8强波胆分析JMIR出版公司

加拿大多伦多

v15i12e270

24300212

10.2196 / jmir.2860

原始论文

令人困惑的网络游戏(BAM-COG):老年人认知表现在线自我监测的可靠性、有效性和可行性

Eysenbach

冈瑟

Jordan-Marsh

Maryalice

风笛手

布莱恩

Aalbers

Teun

MSc 1

内梅亨大学医疗中心老年医学系

4 . Reinier Postlaan

奈梅亨，6500 HB

荷兰 31日243619807 31日243617408 teun.aalbers@radboudumc.nl

http://orcid.org/0000-0002-1002-5485

巴尔

玛丽亚·A·E

博士学位 1 2 老Rikkert

马塞尔

医学博士 1 2 ·凯塞尔

罗伊P C

博士学位 3. 4

¹ 内梅亨大学医疗中心老年医学系

奈梅亨

荷兰 ² 内梅亨大学医疗中心 Radboud老年痴呆症中心

奈梅亨

荷兰 ^3. 奈梅亨内梅亨大学唐德斯大脑、认知和行为研究所

奈梅亨

荷兰 ⁴ 内梅亨大学医疗中心医学心理学系

奈梅亨

荷兰

通讯作者:Teun Aalbers teun.aalbers@radboudumc.nl

12 2013

03 12 2013

15 12

e270

01 08 2013 10 09 2013 11 10 2013 30. 10 2013

©Teun Aalbers, Maria A E Baars, Marcel G M Olde Rikkert, Roy P C Kessels。最初发表于《医疗互联网研究杂志》(//www.mybigtv.com)， 2013年12月3日。

2013

这是一篇开放获取的文章，根据创作共用署名许可(http://creativecommons.org/licenses/by/2.0/)的条款发布，允许在任何媒介上无限制地使用、分发和复制，前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息，//www.mybigtv.com/上的原始出版物的链接，以及此版权和许可信息。

背景

在线干预越来越多地针对认知结果的测量，但到目前为止，还没有简单、快速的认知自我监测得到验证或证明是可靠和可行的。

客观的

本研究检验了一种名为脑老化监测-认知评估电池(BAM-COG)的新仪器，以测试其替代形式的信度、面孔和内容效度以及收敛和发散效度。此外，还提供了参考值。

方法

BAM-COG由四个简单，简短，但具有挑战性的益智游戏组成，这些游戏被开发用于测量工作记忆(“传送带”)，视觉空间短期记忆(“阳光”)，情景识别记忆(“观点”)和计划(“纸草”)。这项研究共招募了641名参与者。其中，397名40岁及以上的成年人(平均54.9，标准差9.6)符合分析条件。研究参与者把所有的游戏都玩了三次，两次游戏间隔14天。面部和内容有效性基于专家意见。替代形式信度(AFR)通过比较不同版本的BAM-COG的得分来测量，并以类内相关性(ICC:双向混合;一致性为95%)。通过将BAM-COG评分与金标准的纸笔和计算机辅助认知评估进行比较，提供了收敛效度(CV)。发散效度(DV)通过比较BAM-COG分数与国家成人阅读测试IQ (NART-IQ)估计值来测量。CV和DV均用Spearman rho相关系数表示。

结果

4款游戏中有3款在AFR、CV和DV测量上表现良好。游戏《输送带》，《阳光》和《Papyrinth》的AFR ICCs分别为。420，。426和。645。此外，这些游戏有很好的CV相关性:rho=.577（ P=措施),ρ= .669（ P<.001)， rho=.400（ P分别= .04点)。最后，正如预期的那样，DV相关性很低:rho= - .029（ P=无误),ρ=−.029（ P=.45)， rho= - .134（ P分别=陈霞)。游戏观点提供了不太理想的结果，AFR ICC为。167,CV rho=.202（ P=.15)， DV rho= - .162（ P= . 21)。

结论

这项研究为使用BAM-COG测试电池作为可行、可靠和有效的工具来在线监测健康成年人的认知表现提供了证据。四分之三的游戏具有良好的心理测量特征，能够测量工作记忆、视觉空间短期记忆和计划能力。

认知测试大脑衰老游戏有效性可靠性自我监控互联网电子健康

简介

随着互联网的兴起和电子健康的引入，在线医疗保健的新研究领域在过去十年中迅速发展[ 1］．以公共健康促进为重点的研究领域也不例外[ 2］．此外，在较长一段时间内，游戏产业已经确立了自己作为全球主要产业的地位。 3.］．如今，电子健康和“严肃游戏”日益交织在一起，越来越多的研究人员正在冒险进入(在线)游戏研究领域。反过来，游戏开发者在支持和帮助解决科学研究和社会问题方面表现出了更高的兴趣。 4］．例如，游戏可用于协助中风康复[ 5]，在旨在预防青少年肥胖的项目中[ 6]，以及改善安老院住户的步态平衡[ 7］．

从健康行为改变的角度来看，电子健康和游戏都是非常有趣的。广泛的互联网接入为行为改变研究人员提供了接触大量人群所必需的平台。在欧洲和北美，互联网普及率在总人口的63.2%至78.6%之间[ 8］．由于其广泛的覆盖范围，网络游戏早已从年轻一代的典型消遣转变为服务于不同年龄、种族、性别和文化背景的数百万玩家。 9］．

互联网的一个重要缺点是它的内容必须快速和有趣。 10， 11］．当研究人员考虑使用互联网作为他们的媒介，并希望从其巨大的影响力中获利时，他们的干预和评估方法应该符合这些特征。因此，需要快速、易于访问和有吸引力的应用程序和仪器，为用户提供直接的反馈[ 12］．如果干预未能做到这一点，就很难招募到足够数量的参与者。此外，辍学率可能很高，这将严重影响研究的效果[ 13]。

衰老对认知功能的影响已得到越来越多的研究[ 14， 15］．通常，这是通过纸笔和离线计算机辅助神经心理测试来完成的[ 16］．电子保健领域的一个领域涉及对认知功能的在线评估和监测[ 17］．用神经心理学家和患者都容易理解的有形措施来量化认知表现，已经引起了越来越多的兴趣，像Lumosity这样的认知训练项目也越来越受欢迎[ 18］．既然干预研究招募的参与者数量正在扩大，就存在对简短易用的经过验证的神经心理学测试的需求[ 19］．从时间和成本的角度来看，传统的人对人神经心理测试在这方面往往效率低下[ 20.， 21)，当然不符合在网络环境中成功使用的标准。

网上认知测试已被证实适用于10至12岁的儿童[ 20.]，以及18-80岁的成年人和老年人[ 17， 22］．我们着手开发一种用于40岁及以上人群认知功能的在线自我监测工具——BAM-COG(脑老化监测-认知评估电池)。BAM-COG由四个易于上手、简短但具有挑战性的在线益智游戏组成，旨在评估易受年龄相关变化影响的认知功能的关键方面，即工作记忆、执行功能和情景记忆。本实证验证研究由两部分组成。首先，我们检查了替代形式的信度，其次，我们研究了BAM-COG的收敛效度和发散效度。此外，参考值来自397名40-85岁成年人的样本。

据我们所知，这是第一个描述、验证和检查在线自我监测认知功能的研究，它利用了视觉上有吸引力的、易于指导的益智游戏。BAM-COG不是作为诊断工具开发的(例如，用于评估病理性认知衰老，如痴呆症)，也不是为了预测随着时间的推移认知能力下降而设计的。BAM-COG的目的是让用户能够建立他们的认知表现，并随着时间的推移监测他们的个人认知发展。这是非常重要的，因为它大大增加了在线研究认知功能的可能性，它扩大了覆盖面，它降低了金钱和时间上的成本。

本研究的假设是，与标准的纸笔和计算机辅助认知评估相比，BAM-COG游戏具有良好的替代形式信度，并且BAM-COG新开发的四款益智游戏的面孔和内容效度转化为良好的收敛效度和发散效度。

方法人口

我们开始在40岁及以上的社区居民队列中验证BAM-COG ．以40岁为分界点的理由是，大约从这个年龄开始，正常的认知衰老得到了充分的证明[ 23］．除了年龄，唯一的入选标准是参与者有足够的互联网接入。在给定的年龄限制内，目标人群是不受限制的，因为我们寻找的是具有一般人群代表性的研究人群。没有地区、种族背景、性别或语言限制，尽管网站描述只有荷兰语。研究第一部分的参与者是通过几个网站、社交媒体和博客在线招募的。研究的第二部分，在社区中心、购物区、中型区域组织和老年中心招募了一个便利样本。此外，这项研究得到了全国广播和报纸的关注，这也导致了参与者的招募。

研究设计

该研究网站对参与者开放了四个月。在注册时，我们记录了性别、年龄和教育水平——后者从1到8，其中1是最低值(小学)，8是最高值(大学教育水平;参见[ 22]以参考荷兰的教育分类制度，该制度与联合国的国际教育标准分类[ 24])。在线游戏可以在参与者日常生活的不受控制的环境中完成。 21］．一旦参与者登录，他们就第一次玩BAM-COG游戏。自动提醒系统提示参与者在14天和28天后再次访问网站，进行第二轮和第三轮的BAM-COG游戏。

在前两次访问中，参与者进行了相同的BAM-COG游戏表1参阅更多有关BAM-COG比赛的资料)。在第三轮中，他们进行了不同批次的BAM-COG游戏，因此在几乎相同的难度下进行不同的试验。为了检查不同批次是否在难度方面没有差异，我们进行了备用形式可靠性(AFR)分析(见统计分析)。总共有三个不同批次的试验。通过在线随机放置脚本，参与者被随机分配到六个可能的序列组(1-1-2,1-1-3,2-2-1,2-2-3,3-3-1，或3-3-2)中的任何一个组。在完成所有三轮比赛后，参与者将获得价值4.99欧元(6.75美元)的促销码，可用于益智游戏网站的一个月订阅。

这项研究分为两部分。第1部分涉及AFR分析和参考值的数据收集，这完全是通过互联网完成的。第1部分的参与者估计每次会议大约需要45分钟来完成BAM-COG。总的来说，在28天内进行了三轮BAM-COG谜题后，参与者估计在BAM-COG上花了大约135分钟。从现在起，这个组将被缩写为“在线组”。第2部分涉及计算BAM-COG的收敛有效性(CV)和发散有效性(DV)所需的数据收集。在这个过程中，除了在线玩BAM-COG游戏外，参与者还访问了内梅亨大学医疗中心(RUMC)一次(该组将缩写为“RUMC组”)。这组参与者进行了计算机化的认知测试(剑桥自动神经心理测试或CANTAB的子测试)和纸和笔的神经心理测试(PnP)(见表2查看测试的概述和多媒体附件1参阅更详细的BAM-COG描述)。通过咨询经验丰富的神经心理学家(MAEB, RPCK;看到表2对于使用的比较措施的概述)。离线测试的顺序(CANTAB优先vs PnP优先)是通过抛硬币随机的。第2部分参与者的BAM-COG结果也包含在第1部分的结果中。每个参与者的测试时间约为90分钟。除了在BAM-COG测量上花费的135分钟外，第2部分的参与者估计在BAM-COG验证研究上花费了大约225分钟。

对于访问RUMC的参与者群体，应用了两个附加的纳入和排除标准。在简易精神状态测验(MMSE [ 25])，以确保所有参与者都没有任何神经退行性疾病的症状[ 16］．为了确保参与者能够使用CANTAB触摸屏和测试环境，会议以执行CANTAB运动筛选任务开始，参与者需要尽可能快速准确地触摸屏幕上闪烁的“x”刺激。如果参与者不能理解或执行这项任务，他们将被排除在进一步的参与之外。由于这项研究设计在一定程度上专注于收集参考值，目前的参与者没有收到关于他们与同龄人相比的个人分数的反馈。在完成三项测量后，参与者没有继续参加游戏，因为BAM-COG不是被设计为训练工具，而是一个评估工具。这类似于它在进一步实践中主要应该使用的方式。

表1

BAM-COG(大脑老化监测-认知评估电池)游戏细节。

BAM-COG游戏	认知领域	总水平^一个	得分范围	简短的描述
输送带	工作记忆	7	4到10	这个游戏在屏幕上向参与者展示购物清单。1秒后，传送带开启。食品杂货沿着传送带进行，参与者只需要选择清单上的产品。
阳光	视觉空间短期记忆	8	3 - 10	在这个游戏中，太阳在5x5的云矩阵中创建视觉图案。这个视觉图案会消失，在它完全消失后，参与者被要求按照它最初出现在屏幕上的完全相同的顺序重现这个图案。
的观点	情景识别记忆	8	1 - 8	这个游戏向参与者展示了一个充满刺激(星号)的5x5矩阵。参与者有3秒钟的时间来记住所呈现的图案，然后图案就会从屏幕上消失。3秒后，屏幕上出现3个答案，参与者要从中选择与前面显示的矩阵完全匹配的答案。
Papyrinth	执行功能——计划	5	3 - 7	这个游戏首先向参与者展示一个打乱的路径。参与者的任务是理清路径，这样他们的棋子可以从开始到结束畅通无阻。清除路线是通过以正确的顺序滑动列和行来完成的，这样道路的所有部分最终都相互连接起来。

^一个不包括实践水平。

表2

BAM-COG^一个并提出了匹配的计算机化和纸笔认知测试。

BAM-COG游戏(域)	剑桥大学^b	纸和笔
输送带(工作记忆)	空间工作记忆[ 26］	来自WAIS-III的字母-数字测序任务^c［ 27］
阳光(视觉空间短时记忆)	空间跨度[ 26］	WMS-III的空间跨度子测试^d［ 28］
的观点(情景识别记忆)	模式识别[ 26］	持续视觉记忆任务[ 16， 29- 31］
Papyrinth(规划)	剑桥的长袜[ 26］	动物园地图任务，BADS的一部分^e［ 16， 32］

^一个脑老化监测-认知评估组。有关BAM-COG游戏的简短描述，请参见多媒体附件1．

^bCANTAB:剑桥自动神经心理测试组。

^c韦氏成人智力量表，第三版。

^dWMS-III:韦氏记忆量表，第三版。

^eBADS:执行障碍综合征的行为评估。

样本量计算

根据我们对CV和DV的样本量计算，我们在第2部分需要37名参与者(alpha错误概率<。05，我们研究的幂(1- β误差概率=.8)。使用GPower 3.1进行样本量计算[ 33］．

仪器

BAM-COG由四个益智游戏组成，用于测量工作记忆、视觉空间短期记忆、情景识别记忆和执行功能计划(参见表1游戏细节)。每个游戏开始时都有简短而明确的指示，告诉参与者应该期待什么。为了最大限度地理解说明，书面说明附有实际的游戏截图。在强制性的指导之后，参与者进行了一次练习，以进一步熟悉游戏。在第一次实践试验之后，实际测试开始了。每款游戏的每个关卡都包含三次尝试。要进入下一关，至少要成功完成三次试验中的两次。如果参与者未能成功完成两到三次试验，则会出现“游戏结束”屏幕，参与者将被链接回主界面，在这里可以选择下一个游戏。有关游戏及其说明的概述，请参见多媒体附件1．多媒体附录2- 5包括BAM-COG游戏玩法的短视频。《输送带》、《阳光》和《Papyrinth》游戏的分数是需要处理的刺激或移动的总数。对于《Viewpoint》游戏，分数是指成功完成的关卡数量。

比较方法

RUMC组的受试者还参与了与BAM-COGs认知域匹配的CANTAB任务和PnP任务表2)。所有这些游戏都是经过精心挑选的，以尽可能地模仿BAM-COG游戏中主要依赖的认知领域。

仪器发展

根据两位神经心理学家、一位老年病学专家、一位公共卫生研究员和一个专业游戏设计团队的专家意见，这四款益智游戏被认为涵盖了工作记忆、视觉空间短期记忆、情景识别记忆和计划的认知结构。在初步评估之后，该仪器大纲与更广泛的卫生保健专业人员小组进行了讨论，这些专业人员包括神经心理学家、流行病学家、公共卫生保健研究人员和普通心理学家。人们一致认为，从内容的角度来看，当快速和容易访问是关键标准时，不可能涵盖整个生命周期中功能下降的每一个认知领域。研究人员决定选择三种执行功能和一种特定的记忆功能，所有这些功能都已被证实可以降低正常衰老和神经退行性综合征[ 23， 34- 37]，可以很好地了解整体的老化模式。

统计分析

在不同时间点进行的三批BAM-COG游戏进行比较时，确定了备用形式可靠性(AFR)。每个批次类似于包含相同数量的关卡和试验的BAM-COG的并行版本。从理论上讲，这些批次在难度上没有区别。AFR测定采用类内相关(ICC:双向混合;一致性为95%)，即参与者第二轮和第三轮表现的结果。关于icc的解释，我们需要考虑到这项研究是在临床实验室环境之外进行的，在那里人们很容易分心，这可能会影响测试的可靠性。因此，ICC值在0.4到0.6之间被认为足以支持BAM-COG的AFR。这与另一项在线验证研究一致[ 17］．此外，需要注意的是，icc没有具体的分值[ 38］．

为了进一步分析测量之间可能存在的系统差异，计算了Bland-Altman图。在这些图中，两个时间段之间的差异与它们的平均值对应。此外，分数的平均值和一致限度被计算为两个测量值之间的差值的平均值±2 SD这些差值。还计算了测量的标准误差和两次测量之间的平均差的95%置信区间。如果95%置信区间不包括零，则表明平均值发生了系统的、不受欢迎的变化[ 39］．

CV决定了由BAM-COG游戏所测量的认知领域是否得到了真正的评估，并将经过验证的认知任务作为黄金标准。相比之下，DV检查了BAM-COG在多大程度上与它不应该相关的认知领域相关。通过比较BAM-COG游戏分数与非相关认知结构(在本研究中，智商分数来自荷兰版的国家成人阅读测试，NART)， BAM-COG的独特能力被建立起来。由于BAM-COG结局指标的数据分布非正态分布，且样本量小，因此使用单侧Spearman 's rho相关系数计算BAM-COG的CV和DV。

为解释目的，将三个批次的数据汇总到一个测量中，用于计算CV和DV。这使我们能够将任务判断为一个实体，而不是三个单独的批。单次测试统计数据是根据参与者的平均游戏分数生成的(关于得分的更多信息，请参阅Instruments)。为游戏提供参考值，以提供一些洞察在40岁及以上的正常老龄化人口中的预期分数分布。在每次分析中，原始测试分数为0的参与者被排除在外。这是因为这些参与者要么看了说明，但没有开始玩，要么只玩了进入下一关所需的三次尝试中的一两次。

当地医学伦理委员会(阿纳姆-奈梅亨地区，注册号:2011/490)认为该研究无需进行正式的伦理评估。所有统计分析均使用IBM SPSS Statistics for Windows, Version 20.0进行。Bland-Altman图用GraphPad Prism 5.03版进行。

可行性

BAM-COG的可行性是基于注册和退出的总数，参与并完成第一轮、第二轮和第三轮的参与者的百分比，以及对下限和上限效应的分数分布的检查进行评估的。

结果参与者

通过我们的研究网站，641名参与者参与了这项研究，其中124人(19.3%)因不符合年龄标准而被排除在外。注册后，每个参与者都被要求第一次进行BAM-COG测试。该组中有76.8%(397/517)的参与者至少玩过一款游戏，因此有资格进行分析;其中78.6%(312/397)为女性。平均年龄54.9岁(标准差9.6岁)，文化程度6级(范围1 ~ 8级)。

我们招募了56名参与者参与研究的第二部分。56名参与者中，41名愿意在线注册，平均年龄60.8岁(标准差8.2岁)，其中58.5%(24/41)为女性，文化程度为7级(1-8级)。所有参与者的母语都是荷兰语。所有人都能成功完成CANTAB运动筛查任务。总的来说，41名参与者中有21人(51.2%)先完成CANTAB任务，而41名参与者中有20人(48.8%)先完成PnP任务。

在表3， MMSE, NART-IQ和平均BAM-COG分数。来自这三批游戏的数据汇集在一起，以获得所有四款游戏的总体平均分。RUMC组明显年龄较大( t₃₉₅= 3.78, P<.001)，文化程度较高(χ²₇= 33.8, P<措施)。这导致了更高的整体测试分数(Viewpoint除外)，尽管这些差异只在Sunshine中达到了统计显著性。由于我们的样本中存在如此大的性别分布不平等，我们在原始的BAM-COG分数上控制了男性和女性之间的系统性差异。使用Fisher精确测试，我们没有发现显著差异(范围从 F₁₃= 18.68, P=。07to F₁₉= 21.82, P= .19)。

表3

年龄的平均值(SD)， MMSE^一个, NART-IQ^b，以及BAM-COG^c人民大学教育的成绩和模式(范围)^d和在线小组。

	网络组	RUMC集团
年龄，年龄，平均值(SD)	54.9 (9.6)	60.8 (8.2)
学历、模式(范围)	6 (1 - 8)	7 (1 - 8)
MMSE，平均值(SD)	--	29.4 (1.07)
NART-IQ，平均值(SD)	--	123.2 (12.83)
输送带评分	5.95 (n = 217)	6.33 (n = 26)
阳光的分数	4.60 (n = 236)	5.10 (n = 24)
观点的分数	3.97 (n = 306)	3.90 (n = 28)
Papyrinth得分	4.64 (n = 152)	5.30 (n = 21)

^一个迷你精神状态检查。

^bNART-IQ:全国成人阅读测试-智商。

^c脑老化监测-认知评估组。

^d内梅亨大学医疗中心。

备选表格可靠性

表4显示了四场BAM-COG比赛的AFR及其各自的95%置信区间。除了视点，所有游戏的AFR都是好的(>.4)到很好的(>.6)。为了进一步阐明这种关系，多媒体附件6显示生成的Bland-Altman图。这些还表明，除了视点游戏之外，误差偏差并没有远离零。这就确定了在第二轮和第三轮测量之间没有系统误差。

表4

BAM-COG备选形式可靠性(AFR)^一个类内相关性(ICC)中的游戏^b)。

BAM-COG游戏	误判率	95%可信区间
输送带(n=55)	.420	0.17 - -0.62
阳光(n = 78)	.426	0.23 - -0.59
观点(n = 101)	.167	−0.04 ~ 0.36
Papyrinth (n = 37)	.645	0.41 - -0.80

^一个脑老化监测-认知评估组。

^b所有ICC值为>。4一个re considered to support sufficient AFR.

收敛效度与发散效度

除了观点，与CANTAB和PnP任务相比，BAM-COG游戏的CV(>.4)到非常好(>.6) 表5)。相反地，就像假设的那样，所有的游戏都呈现出良好的DV(<.2)，并带有与IQ无关的整体测量。请注意，视点的AFR较差也会导致CV和DV值较差。

为了控制单个游戏是否在同一认知域上没有大量负载，我们使用汇总游戏分数进行了斯皮尔曼相关分析。正如大样本所预期的那样，大多数相关性是显著的。然而，相关性的大小范围很小(rho=.143， P=.056)，在输送带和视点之间，直到中、小(rho=.406， P<.001)，在Sunshine和Papyrinth之间。

表5

BAM-COG的收敛有效性和发散有效性^一个(Spearman rho相关系数)。

BAM-COG游戏	聚合效度^b		不同的有效性^c
	认知测试	ρ( P值)	认知测试		ρ( P值)
输送带(n=26)
	WAIS-III^d字母编号排序	.577(措施)		全国成人阅读测试	−.029(无误)
	空间工作记忆	−.577(措施)
阳光(n = 24)
	WMS-III^e空间跨度任务	.669(<措施)		全国成人阅读测试	−.029(点)
	空间跨度	.620(措施)
观点(n = 28)
	连续视觉记忆测验	.202 (.152)		全国成人阅读测试	−.162(增长)
	模式识别	−.157(.212)
Papyrinth (n = 21)
	坏事^f动物园的地图	.400 (.036)		全国成人阅读测试	−.134(陈霞)
	剑桥袋球	.424 (.028)

^一个脑老化监测-认知评估组。

^brho≥的所有收敛效度值。4名被认为支持良好的简历;rho≥。6一个re considered very good.

^c的所有发散效值。2个被认为支持良好的DV。

^d韦氏成人智力量表，第三版。

^eWMS-III:韦氏记忆量表，第三版。

^fBADS:执行障碍综合征的行为评估。

参考价值

我们提供所有游戏的参考值( 表6)显示在所有三个批次中达到任何给定分数的总次数。

表6

BAM-COG^一个参考价值。

	输送带(n=217)		阳光(n = 236)		观点(n = 306)		Papyrinth (n = 152)
分数	频率	百分比	频率	百分比	频率	百分比	频率	百分比
1	NA^b	NA	NA	NA	145	27.5	NA	NA
2	NA	NA	NA	NA	57	10.8	NA	NA
3.	NA	NA	75	19.7	32	6.1	57	25.3
4	78	24.4	148	38.9	90	17.1	82	36.4
5	One hundred.	31.3	79	20.8	70	13.3	27	12.0
6	26	8.1	55	14.5	41	7.8	15	6.7
7	43	13.5	15	3.9	13	2.4	44	19.6
8	58	18.2	6	1.7	79	15	NA	NA
9	12	3.8	2	0．5	NA	NA	NA	NA
10	2	0.7	0	0	NA	NA	NA	NA

^一个脑老化监测-认知评估组。

^b不适用，因为这个分数不可能出现在本场比赛中。

可行性

登记人数共641人。BAM-COG在两个全国性广播节目和几家地区和全国性报纸和杂志上受到了全国的关注。在517名符合条件的参与者中，只有397名参与者在三个批次中至少玩了一款游戏(76.8%)。

传送带游戏在三次评估中玩得最多(分别为314次、143次和107次)，纸草游戏玩得最少(分别为189次、123次和87次)。平均而言，75.7%的参与者玩了所有四场游戏，从上一轮结束最后一场游戏的参与者中，平均有80.7%的参与者返回玩下一轮游戏。

只有8名参与者在玩游戏时中途退出。所有其他参与者继续游戏，直到“游戏结束”的消息出现，他们要么继续玩下一个游戏，要么在听到这个消息后决定退出。退出的8名参与者都在玩《Papyrinth》时停下来，这是唯一一款没有综合时间限制的游戏。

数据中没有真正的下限或上限效应。唯一可能的例外可能是Papyrinth和Viewpoint的轻微上限效应(分别为19.6%，44/225和15.0%，79/527，完成最高水平)。否则，参与者完成任务的百分比非常低(分别为0.5%，2/380和0.7%，2/319)。

讨论主要研究结果

本文为使用BAM-COG游戏电池作为认知表现的在线自我监测提供了实质性的支持。四分之三的游戏似乎足以衡量相关的认知概念(工作记忆、视觉空间短期记忆和计划)。传送带，阳光，和Papyrinth都有良好的替代形式的可靠性，并被证明是可行的老年人使用。此外，他们都有很好的收敛和发散效度，现在可供参考的游戏。因为所有游戏都是为了衡量某种形式的认知领域而设计的，所以它们之间的相关性在统计上是显著的。然而，它们的大小要么相当小，要么等于与外部金标准测量工具的任务相关性。游戏《Viewpoint》是设计来评估情景识别记忆的，它没有足够的有效性和可靠性，不适合列入在线评估。此外，我们的设置的一个优点是BAM-COG分数与金标准CANTAB和PnP任务的相关性。事实证明，BAM-COG游戏是预期认知领域的可靠测量方法，这为在其他样本中复制这些结果提供了良好的希望，并且BAM-COG可以用于预期的目的。

限制

尽管目前的发现对于BAM-COG的适用性是有希望的，但可以根据这些结果建议进行一些调整。首先，我们偶尔会收到技术困难的反馈，特别是在传送带游戏的表现方面。小尺寸的刺激(在这种情况下，食品杂货如苹果和梨)似乎很难点击，导致无意中错过反应。然而，虽然我们不能完全排除某些远程系统的技术问题，但这也可能是由于个别参与者的鼠标操作不佳造成的。这种解释是可能的，因为软件开发人员和研究人员都无法在不同的操作系统和互联网浏览器的不同系统上复制这个问题。此外，这个问题出现的频率并不高(n= 314中的19个)，它会严重影响我们的分析结果。第二，反馈是需要额外的练习级别。显然，仅仅通过一次试验来熟悉任务并不总是足以让所有参与者完全理解对他们的要求。这可能会导致平均分略微落后。在未来发布的BAM-COG电池中，可以很容易地考虑到这一点。 Third, regardless of our follow-up efforts (one additional phone call and one personal reminder email), 15 participants in the RUMC group failed to register online even after they had visited the memory clinic. Reasons for this dropout could have been a sole interest in the neuropsychological screening at the research center, time restrictions, loss of motivation, or the relative ease with which reminder emails and online interventions can be ignored and forgotten. Additionally, the limited amount of personal contact with the researchers and the ease of the registration process may increase attrition [ 40， 41]，以及技术或计算机访问问题、身体疾病、程序负担、静态结构和对用户偏好的低适应性[ 42， 43］．这再次强调，在建立基于互联网的学习时，高辍学率是一个需要考虑的重要问题。然而，由于退学组的特征与其他注册参与者没有任何不同，我们不认为这对目前的结果有重大影响。

在解释这些结果时，我们需要考虑游戏进行时的自然环境。也就是说，在高度控制的条件下产生结果的实验室研究通常会导致较高的icc和相关性。本研究中的BAM-COG评估都是在参与者的家庭环境中进行的，没有研究团队的监督。由于BAM-COG并非设计用于实验室环境，我们认为目前的设计是检验其可行性、有效性和可靠性的有效方法。如果有偏差，本研究中提出的性能可能低估了BAM-COGs任务的真实可靠性和有效性[ 38］．因此，我们认为我们可以有效地得出结论，BAM-COG是一种足够的认知表现在线自我监测。

事实上，我们的人群主要由女性组成(第一部分和第二部分分别为78.6%，312/397和58.5%，24/41)，这在一定程度上降低了本研究的外部有效性。然而，这种类型的研究和这些类型的益智游戏已经被证明比男性更能吸引女性参与者。 9， 17， 22］．此外，并非所有参与者都完成了(所有)游戏的概念对天花板效应和地板效应结果的解释方式产生了影响。事实上，没有在第1级开始或退出的参与者仍然有可能正在经历地板效应。最后，应该提到的是，RUMC组与在线组不同，因为RUMC组年龄更大，受教育程度更高。这导致平均考试成绩略高。在一个更平衡的样本中进行进一步的研究可以加强得出的结论和BAM-COG组的外部有效性，应该进行其他认知测量的验证研究来重复目前的结果。

结论

总而言之，本研究为使用BAM-COG测试组作为可行、可靠和有效的工具来在线监测健康成年人的认知表现提供了证据。研究发现，四分之三的游戏具有良好或非常好的心理测量特征，可以测量工作记忆、视觉空间短期记忆和计划能力。应该强调的是，该结果绝不能用于诊断神经退行性疾病或预测认知表现。BAM-COG适用于在实践中用于在线监测认知和刺激对健康大脑衰老的电子健康干预。

多媒体附件1

BAM-COG游戏概述。

多媒体附件2

短视频的BAM-COG的游戏玩法-传送带。

多媒体

BAM-COG游戏玩法短片-阳光。

多媒体附件4

BAM-COG比赛短片-视点。

多媒体

短视频的BAM-COG的游戏玩法-纸草。

多媒体附件6

备用形式可靠性的Bland-Altman图概述。

缩写

误判率

备选形式可靠性

BAM-COG

脑老化监测-认知评估电池

剑桥大学

剑桥自动神经心理测试组

简历

聚合效度

不同的有效性

国际刑事法庭

组内相关

智商

isc

国际教育标准分类

患者的

小型精神状态检查

NART

全国成人阅读测试

RUMC

内梅亨大学医疗中心

我们要感谢Keesing游戏对游戏开发的支持和努力。我们还要感谢Maurice Rijnaard在招募和审查参与者方面所作的贡献。该项目由国家品牌和认知计划(NIHC，赠款#056-12-011)的QuickResult资助，嵌入“健康大脑，计划健康认知衰老”的支柱。RPCK由国家大脑与认知计划(NIHC，赠款# 056-11-011)的QuickResult拨款资助，嵌入“健康大脑，认知康复计划”的支柱。该手稿的出版费用由授予MGMOR的NWO开放获取补助金资助。

没有宣布。

Ritterband

泰特

互联网干预科学。简介

安行为医学 2009 08 38 1 1 3.

10.1007 / s12160 - 009 - 9132 - 5

19816750

Portnoy

Scott-Sheldon

拉

约翰逊

英国电信

凯里

国会议员

促进健康和降低行为风险的计算机干预:1988-2007年75项随机对照试验的元分析

Prev地中海 2008 07 47 1 3. 16

10.1016 / j.ypmed.2008.02.014

18403003

s0091 - 7435 (08) 00101 - 1

PMC2572996

Miniwatts标记组

互联网世界统计 2013-07-29 2013 http://www.stratoserve.com/2011/06/entertainment-video-game-industry-three-times-music-and-double-movie-industry.html

6 itpqlcqw

巴拉诺维斯基

Buday

汤普森

迪

巴拉诺维斯基

玩真实的游戏:改变健康相关行为的视频游戏和故事

是J Prev Med吗 2008 01 34 1 74 82

10.1016 / j.amepre.2007.09.027

18083454

s0749 - 3797 (07) 00647 - 2

PMC2189579

鲍尔

克拉克

类风湿性关节炎

麦克金尼

莱托

马丁

米勒

任天堂Wii游戏系统改善中风后平衡表现的可行性和有效性:住院康复患者II期随机对照试验方案

任天堂Wii游戏系统改善中风后平衡表现的可行性和有效性:住院康复患者II期随机对照试验方案，游戏健康杂志 2013 2 2 103 108

10.1089 / g4h.2012.0069

米勒

助教

Vaux-Bjerke

一个

麦克唐奈

卡

DiPietro

电子游戏能否帮助城市儿童达到中等至高强度体育活动的推荐水平?

健康游戏 2013 04 2 2 96 102

10.1089 / g4h.2012.0058

詹森

年代

Tange

阿伦兹

运动游戏任天堂“Wii Fit Plus”对疗养院居民平衡效果的初步研究

任天堂“Wii Fit Plus”对疗养院居民平衡效果的初步研究，游戏健康杂志 2013 2 2 89 95

10.1089 / g4h.2012.0074

罗伊

年代

StratoServe 2013-07-29 2011 http://www.internetworldstats.com/stats.htm

6 itpalhfk

Haagsma

Pieterse

我

彼得斯

在荷兰，有问题的电子游戏玩家普遍存在

网络心理行为网络 2012 03 15 3. 162 8

10.1089 / cyber.2011.0248

22313358

Jadad

基于“增大化现实”技术

Enkin

兆瓦

迈向电子医疗的道路:沿途的障碍

医学通知 2006 84 7

17051300

me06010084

Vasilyeva

Pechenizkiy

米

Puuronen

年代

面向eHealth的自适应用户界面框架

2005

第18届IEEE基于计算机的医疗系统研讨会论文集

2005

都柏林

10.1109 / CBMS.2005.101

《

纽豪斯

电子健康传播的新方向:机遇与挑战

病人教育计数 2010 03 78 3. 329 36

10.1016 / j.pec.2010.01.013

20202779

s0738 - 3991 (10) 00022 - 4

Cugelman

Thelwall

米

道斯

社会营销健康行为改变运动的在线干预:心理结构和坚持因素的元分析

J医疗互联网服务 2011 13 1 e17

10.2196 / jmir.1367

21320854

v13i1e17

PMC3221338

•夏娃指出

de Jager

在正常老年人中试点和验证一种新的自我管理在线认知筛查工具:认知功能测试

老年精神病学杂志 2013 06 11 Epub提前打印

10.1002 / gps.3993

23754255

斯特恩伯格

达

巴拉德

哈代

莱托

卡茨

Doraiswamy

点

斯坎伦

米

最大的人类认知性能数据集揭示了生活方式因素和衰老的影响

前哼神经科学 2013 7 292

10.3389 / fnhum.2013.00292

23801955

PMC3687527

亲爱的

科里

战争机器

哈里斯

胡莉

Marioni

再保险

预告

Rafnsson

某人

斯塔尔

年龄相关认知能力下降

Br医学牛 2009 92 135 52

10.1093 / bmb / ldp033

19776035

ldp033

马瑟

米

衰老与认知

电线Cog Sci 2010 1 346 362

10.1002 / wcs.64

莱扎克

医学博士

Howieson

Bigler

艾德

Tranel

神经心理学评估，第五版 2012

纽约州纽约

牛津大学出版社

Houx

牧羊人

Blauw

墨菲

福特

我

博伦

埃尔

巴克利

斯托特

Jukema

海兰德

米

衣服上的破处

一个

Norrie

坎普

我

佩里

麦克法兰

Meinders

斯威尼

帕卡德

Twomey

科布

韦斯滕多普

老年人认知功能测试:PROSPER研究

神经学杂志 2002 73 385 389

10.1136 / jnnp.73.4.385

20.

霍沃思

厘米

Harlaar

剥

戴维斯

操作系统

奥利弗

Hayiou-Thomas

我

弗朗西丝

Busfield

麦克米伦

一个

戴尔

普洛明

基因研究需要大样本的互联网认知测试

双Res Hum Genet 2007 08 10 4 554 63

10.1375 / twin.10.4.554

17708696

Naglieri

晶澳

Drasgow

Schmit

米

处理程序

Prifitera

一个

马戈利斯

一个

维拉斯

网络心理测试:新问题，老问题

我Psychol 2004 04 59 3. 150 62

10.1037 / 0003 - 066 x.59.3.150

15222858

2004-14611-001

海鸦

詹森

Rouw

迎面来的船

米

从童年晚期到成年晚期，语言和视觉空间信息的即时记忆和延迟记忆的兴衰

精神学报(Amst) 2013 01 142 1 96 107

10.1016 / j.actpsy.2012.10.005

23261419

s0001 - 6918 (12) 00181 - 3

卡娜

一个

Kivimaki

米

针对

毫米

巴兹

一个

Berr

Ebmeier

•菲利

我

Dugravot

一个

认知能力下降的发病时间:来自白厅II前瞻性队列研究的结果

BMJ 2012 344 d7622

22223828

PMC3281313

联合国教育、科学及文化组织(UNESCO)

国际教育标准分类(ISCED) 1997

蒙特利尔

教科文组织统计研究所

Folstein

曼氏金融

Folstein

麦克休

公关

“心理状态”。为临床医生对患者认知状态进行分级的实用方法

J精神科保留区 1975 11 12 3. 189 98

1202204

0022 - 3956 (75) 90026 - 6

罗宾斯

太瓦

詹姆斯

米

欧文

我

萨哈金

麦克因尼斯

洛夫

剑桥神经心理测试自动电池(CANTAB):对正常老年志愿者大样本的因子分析研究

痴呆 1994 5 5 266 81

7951684

韦氏

韦氏成人智力量表iii 1997

圣安东尼奥

心理学公司

韦氏

韦氏记忆量表-第三版:管理和评分手册 1997

圣安东尼奥，德克萨斯州

心理学公司

Trahan

生活在

连续视觉记忆测验

连续视觉记忆测验 1988

敖德萨,FL

心理评估资源

30.

Trahan

德

生活在

昆塔纳

正常成人及单侧血管病变患者的视觉识别记忆

临床经验神经精神病 1990 12 12 6 857 72

10.1080 / 01688639008401027

2286651

生活在

Trahan

德

寇蒂斯

建构连续视觉记忆测验的效度

阿奇临床神经精神病 1992 10 7 5 395 405

14591274

0887 - 6177 (92) 90152 - d

诺里斯

泰特

执行障碍综合征(BADS)的行为评估:生态，并发和建构效度

神经心理康复 2000 01 10 1 33 45

10.1080 / 096020100389282

福尔

Erdfelder

毕希纳

一个

朗

AG)

使用G* power 3.1的统计功率分析:相关性和回归分析的检验

行为测定方法 2009 11 41 4 1149 60

10.3758 / BRM.41.4.1149

19897823

41/4/1149

·巴德利

一个

假珠宝饰物

Bressi

年代

德拉萨拉

年代

Spinnler

痴呆症和工作记忆

痴呆与工作记忆，精神病学 1986 38 4 603 618

10.1080 / 14640748608401616

Salthouse

助教

巴布科克

分解成人工作记忆的年龄差异

在工作记忆中分解成人年龄差异，Dev Psychol 1991 27 5 763 776

10.1037 / 0012 - 1649.27.5.763

库马尔

Priyadarshi

年龄对语言和视觉空间工作记忆的差异影响

老说 2013 08 4 4 170 7

23946892

PMC3733580

参孙

理查德·道金斯

巴恩斯

老化的大脑回路对认知的影响

神经科学 2013 06 37 12 1903 15

10.1111 / ejn.12183

23773059

PMC3694726

堰

摩根大通

利用类内相关系数和扫描电镜量化测试-重测信度

J强度Cond Res 2005 02 19 1 231 40

10.1519/15184.1

15705040

15184

奥特曼

平淡无奇

医学测量:方法比较研究的分析

医学测量:方法比较研究分析，J R Stat Soc 1983 32 3. 307 317

Eysenbach

消耗定律

J医疗互联网服务 2005 7 1 e11

10.2196 / jmir.7.1.e11

15829473

v7e11

PMC1550631

Khadjesari

穆雷

Kalaitzaki

白色

红外

全球交易

汤普森

华莱士

戈弗雷

在线试验中减少人员流失的激励措施的影响和成本:两项随机对照试验

减少在线试验流失的激励措施的影响和成本:两项随机对照试验，J Med Internet Res 2011 13 1 e26

PMC3221348

科尔

低频

克鲁岑

德弗里斯

针对生活方式行为的在线预防:对评论的系统回顾

针对生活方式行为的在线预防:评论的系统回顾，J Med Internet Res 2013 15 7 e146

PMCID 3714003

Mouthaan

Sijbrandij

米

德弗里斯

Reitsma

简森-巴顿

范德舒特

幼鹅

Luitse

赞美上帝

足球俱乐部

gerson

英国石油公司

Olff

米

基于互联网的早期干预预防损伤患者创伤后应激障碍:随机对照试验

基于互联网的早期干预预防损伤患者的创伤后应激障碍:随机对照试验，J Med Internet Res 2013 15 8 e165

3742408