这是一篇开放获取的文章,根据创作共用署名许可协议(http://creativecommons.org/licenses/by/2.0/)发布,该协议允许在任何媒体上不受限制地使用、分发和复制,前提是要正确引用最初发表在《医学互联网研究杂志》上的原始作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物链接,以及版权和许可信息。
电子卫生干预措施的出现,解决了心理问题和健康行为,创造了新的机会,包括优化干预活动的有效性,然后将这些活动持续地提供给大量有需要的个人的能力。鉴于基于描述良好的变革理论模型的电子保健干预措施更有可能有效,而且电子保健干预措施的开发成本可能很高,确保最终干预内容和活动与基础模型相匹配是一个关键步骤。我们建议应用“内容有效性”的概念作为一个关键检查点,以评估eHealth干预方案中拟议的干预活动对每个计划针对的具体变化机制和干预的预期目标人群的有效程度(例如,相关和可能有效)。
本文的目的是定义应用于基于模型的eHealth干预开发的内容有效性,提出在此背景下评估内容有效性的可行方法,并描述在基于web的儿童干预开发过程中这种新方法的实现。
我们设计了一种实用的5步方法,用于评估eHealth干预措施的内容有效性,包括定义关键干预目标、描述干预活动-目标配对、确定专家并使用调查工具收集专家对每项活动与其预期目标的相关性、其在实现预期目标方面的可能有效性以及其对特定预期受众的适当性的评级。然后利用定量和定性的结果来确定可能需要修改的干预活动。我们在为学龄儿童开发应对教练网络干预的过程中应用了这种方法。
在应对教练内容效度评估中,来自5个国家的15位专家对15个干预活动-目标配对进行了评分。基于定量指标,内容效度在相关性方面表现优异,在可能有效性和年龄适宜性方面表现良好。两项干预活动的项目一级指标表明需要进一步审查和可能由开发小组修订。
该项目表明,对内容有效性的评估可以直接而可行地实施,该评估结果为新的电子卫生干预措施的持续开发和迭代提供了有用的信息,补充了其他信息来源(如用户反馈、有效性评估)。该方法可用于开发过程中的一个或多个点,以指导正在进行的电子卫生干预的优化。
电子卫生干预措施的出现,解决了心理问题和健康行为,创造了新的机会和新的挑战。一些电子卫生干预措施是对已有的面对面干预措施的改编;许多是作为电子交付的干预措施从零开始创建的。在任何一种情况下,它们都提供了优化干预活动有效性的能力,然后将这些活动始终如一地提供给大量有需要的个人。
理想情况下,任何干预措施的开发(无论是通过电子方式还是亲自进行干预)都始于基于经验证据和临床经验的明确描述的项目理论或变化模型[
内容效度的概念起源于心理和教育工具开发领域。评估工具的内容效度是建构效度的一个方面[
我们对eHealth内容效度的定义建立在仪器开发中已确立的内容效度属性的基础上。我们将电子健康干预的内容效度定义为其组成干预活动与基础结构(即项目理论)相关的程度,以及在特定预期人群中实现特定干预目的时可能有效的程度。因此,我们建议专家评审的三个核心维度:相关性、可能的有效性和针对特定受众的适当性。第一个维度,
在电子健康干预措施的发展中,有几个令人信服的理由需要仔细关注内容有效性。当干预内容基于明确描述的项目理论和变化模型而开发时,电子健康干预不仅更有可能有效,其使用和评估还能促进人们对试图干预的心理或行为过程的理解[
毫无疑问,大多数干预开发人员都努力实现这种有效性,并非正式地评估他们成功的程度。然而,据我们所知,目前还没有系统的过程来评估电子健康干预措施的内容有效性。因此,本文的目的是定义应用于基于模型的eHealth干预开发的内容有效性,提出在此背景下评估内容有效性的可行方法,并描述该方法在干预开发过程中的实现。基于以上提出的电子健康内容效度定义,我们设计了一种实用的方法来评估电子健康干预的内容效度,并将该方法应用于我们为学龄儿童开发的基于网络的应对教练干预。外部专家的正式审查使我们能够评估干预活动与我们的干预开发所依据的变化模型和规划理论的匹配程度。
我们提出了一种直接的、系统的方法来获得专家对电子健康干预的内容有效性的评审。这种方法假设所涉及的eHealth干预措施是基于明确的规划理论或变化模型创建的,或者可以将适当的理论/模型应用于现有的干预内容(甚至是回溯性的)。我们的方法包括以下步骤:
步骤1是指定电子保健干预措施要处理的关键干预目标。
第二步是通过定义针对每个目标的离散干预活动,来描述具体的活动-目标配对。这些可能不是一对一的关系;一个目标可以由多个活动处理,反之亦然。在这种情况下,干预活动被定义为一组有意义的用户操作或体验,可以清楚地与一个或多个目标相关联。能够描述每个活动是很重要的,这样专家审查员才能准确地理解包括哪些干预内容。
步骤3是用每个干预活动-目标配对填充内容有效性调查工具。调查工具包括相关性、可能的有效性和针对特定目标受众的适当性
第4步是招募未参与eHealth干预措施开发的专家,并使用内容有效性调查工具收集调查数据。每个专家审查员都应该有相关的内容知识;评审人员的学科和地域多样性可以提供有益的平衡[
第五步是分析结果并根据需要改进干预措施。结果应该进行定量分析(例如,通过计算内容有效性指数)和定性分析(例如,通过检查专家评分者的叙事评论)。利用这些发现来确定潜在的问题活动,并根据需要完善干预措施。根据干预措施的开发阶段,开发团队可以选择立即或在干预措施的未来迭代中删除或修改潜在的次优干预活动。
基于以往有关仪器开发中内容效度的文献,我们提出项目级和量表级内容效度指数(I-CVI和S-CVI/AV)作为可接受内容效度的定量指标[
利用内容有效性评估的结果来完善和改进电子健康干预措施,总是涉及定量指标和开发团队经过深思熟虑的判断。例如,如果一个定量指标,例如I-CVI,指出了一个特定的活动-目标对的问题,那么开发团队的下一步取决于所确定的问题的性质。如果一个活动被评为与其预期目标不相关,开发团队可能会考虑删除它或进行重大修改。另一方面,如果一个活动被评为相关的,但不太可能有效,开发团队应该考虑是否有一种方法来改变或增强该活动,以增加其可能的有效性。作为内容有效性调查的一部分,专家评审员提供的叙述性评论可能是有帮助的,后续采访可以引出关于特定关注的额外细节,这可能是有用的。开发人员可能还需要考虑一个活动是否与某些目标相关/可能有效,但不是所有目标。
应对教练是一种电子健康干预措施,旨在对经历过不同类型的急性、单次创伤事件的8-12岁青少年预防或减少创伤后应激及其对健康相关生活质量的负面影响[
步骤1(指定关键干预目标)贯穿整个开发过程。如前所述,我们基于规划理论开发了干预措施,其中我们确定了13个具体的干预目标(四个近端目标每个2-5个目标),以解决预防创伤后应激的关键机制。
在第二步(划定活动-目标配对)中,我们划定了11个离散的干预活动;每项活动都涉及13个干预目标中的一个或多个目标,结果总共有15个活动目标对。
对于第3步(填充调查工具),我们创建了一个内容有效性调查工具,对15个活动目标对中的每一个都有三个评级。对于每一个活动-目标配对,专家们使用李克特5点量表(0-4)对干预活动的相关性、可能的有效性和年龄适宜性进行评级,如下:(1)
对于步骤4(招募专家和收集调查数据),邀请了一组国际专家参与评估应对教练干预。专家的选择基于他们在儿童潜在创伤事件后的应对和调整、创伤压力预防、对文化敏感的儿童干预措施或开发基于网络的干预措施方面的知识和专业知识。我们为每位专家提供了用户名和密码,以在线访问应对教练干预,并鼓励他们像儿童用户一样至少玩一次完整的游戏。我们还提供了所有干预要素和活动的全文记录。内容效度调查工具以Word文档的形式提供,并通过电子邮件发送给专家;专家们在本文档中完成了他们的评级,并通过电子邮件返回了文档。专家审查员被要求完成内容有效性调查工具,并对任何具体活动或干预作为一个整体提供额外的评论。干预措施的专家审查不构成人体受试者研究,因此机构审查委员会或伦理委员会的批准程序是不相关的或不需要的。
对于第5步(分析结果和完善干预),我们首先计算每个活动目标对在每个维度上的I-CVI;I-CVI是指在这个版本的调查工具中使用的5分制量表(0-1-2-3-4)中给出3或4分评分的评论者的比例。然后我们计算每个维度的S-CVI/AV(相关性、可能的有效性和年龄合适性)作为该维度所有i - cvi的平均值。在这种情况下,I-CVI是一个比Polit等人描述的专家共识略保守的指标,因为用于评估应对教练的调查工具使用的是5分制量表而不是4分制量表。我们还研究了来自专家审稿人的额外叙述评论。这些数据,连同儿童用户及其父母的反馈[
共有15名专家(来自美国、澳大利亚、英国、荷兰和瑞士)通过电子邮件被邀请参加;所有15家公司都同意参与并提供评级。所有专家都是独立的,也就是说,没有参与干预措施的制定。每位专家都是活跃的临床研究人员(12名心理学家和3名精神病学家),在该领域至少有5年的经验和相关的内容专业知识。13名专家应要求在大约2个月内提供了评级;2名专家由于其他任务需要额外的时间,但最终提供了评级。很少有不完整的评级(225个相关性评级中只有2个,225个有效性评级中只有3个,225个年龄合适评级中只有5个没有)。
干预活动和干预目标的四个最近的干预目标,每个活动目标配对的项目级内容有效性指数。
干预活动 | 此项活动的预期干预目标 | 项目级内容有效性指数 | |||
活动与目标的相关性 | 活动的可能有效性 | 活动的适龄性 | |||
|
|||||
|
1.玩家通过操纵眉毛和嘴巴来创造面部,以匹配Face-O-Matic Machine中的特定感觉。 | EM1:孩子会识别并说出基本的感觉/情绪。 | .80 | .60 | 收 |
|
2.“玩家”帮助城镇居民确定他们在潜在创伤事件发生时的感受,以及他们现在的感受。 | EM2:孩子会识别与潜在创伤经历相关的感觉/情绪,以及这些感觉如何随着时间的推移而变化。 | 公布 | 公布 | 公布 |
|
3.玩家在城镇居民的帮助下识别自己的感受。 | EM3:孩子会识别他们自己与潜在创伤经历相关的感受,以及这些感受随时间的变化。 | 公布 | .86 | 1.0 |
|
|||||
|
4.玩家观看/聆听General sickness与应对教练关于“思考→感觉→行动”的对话。 | CR1:孩子会识别思想(评价)、感觉和行为之间的联系。 | 1.0 | 收 | 收 |
|
|
CR2:孩子会识别出与创伤相关的有益/无益的想法/评价,并将评价视为可以修改的东西。 | 公布 | 收 | 正 |
|
5.玩家帮助Jack和Jayla理解他们的想法和感受,然后帮助Jack/Jayla改变无用的想法,以帮助他们感觉更好。 | CR3:孩子会识别有益/无益的创伤相关评估。 | 1.0 | .87点 | .87点 |
|
|
CR4:孩子会用认知重构来修正无益的评价。 | 1.0 | .80 | .79 |
|
6.玩家通过选择“像我”或“不像我”来识别自己的有益/无益想法,玩家的有益想法会引导飞艇向上。 | CR5:孩子会识别自己有益和无益的想法/评价,并运用认知重构来修正自己无益的评价。 | 公布 | .80 | .86 |
|
|||||
|
7.应对教练描述了回避和接近策略。玩家帮助城镇居民识别回避的利弊,看到两个人建模接近策略,并帮助两个人用接近策略替换回避。 | AV1:孩子会识别对创伤相关恐惧/情况的回避和接近策略的利弊。 | 1.0 | 公布 | .87点 |
|
|
AV2:孩子会安全地面对与创伤相关的恐惧情境,并尽量减少对回避型应对策略的依赖。 | 1.0 | .87点 | .87点 |
|
8.分类活动-玩家通过正确识别利弊和使用回避或接近策略对创伤相关恐惧/情况的影响来修复天气机器。 | AV1:孩子会识别对创伤相关恐惧/情况的回避和接近策略的利弊。 | .87点 | 公布 | .80 |
|
|
AV2:孩子会安全地面对与创伤相关的恐惧情境,并尽量减少对回避型应对策略的依赖。 | .80 | .80 | .79 |
|
|||||
|
9.玩家给予或接受城镇居民和普遍的不安的帮助。 | SS1:孩子会寻求帮助,并通过向他人提供帮助来建立支持网络。 | 1.0 | .80 | 1.0 |
|
10.玩家完成日志页面,以确定“谁能帮助我”和“别人能帮助我的方式”。 | SS2:孩子会识别支持网络的成员以及支持网络可以提供什么类型的支持。 | 1.0 | 公布 | 公布 |
|
11.玩家收集分散在世界各地的硬币-这些硬币中的6个有寻求社会支持的提示。 | SS3:孩子会增加寻求帮助/社会支持的策略。 | .86 | .79 | .86 |
S-CVI/AV对所有活动的评级在相关性(0.94)方面都很好,但在可能的有效性(0.82)或年龄适宜性(0.85)方面还没有达到这个标准。在更细的水平上检查定量指标,I-CVIs可能的有效性和年龄适宜性是极好的(≥.78),几乎所有的活动目标配对。然而,我们确定了两个I-CVIs低于0.78的活动(包括三个活动-目标对)。干预活动1 (Face-O-Matic Machine活动)和干预活动4(应对教练和全身不适角色之间的对话)在相关性方面有很好的评分,但在可能的有效性或年龄适宜性方面的I-CVIs为0.60至0.73。审稿人还提供了叙述性的评论来解释他们的担忧和/或建议替代方法。基于这些I-CVIs和评审意见,我们将对这两个活动进行评审,以确定它们是否应该在干预的下一次迭代中保留、删除或修改。
除了定量评分,对于许多干预活动,审稿人的叙述评论有助于理解应对教练干预的优势和潜在差距。评论者对可能的行动机制进行了评论,例如,“最强大的部分之一,很好地教授了思想、感觉和行动之间的联系,并很好地识别了具体的想法”和“练习的互动性和它没有‘糖衣外衣’的事实是,它对逃避有一些积极的影响,这是有用的,因为它对孩子来说是现实的”。评审员还强调了扩展或改进当前干预活动的方法,以更好地实现关键目标,例如,“也许还可以讨论儿童在悲伤、愤怒、担忧等情况下的行为反应(例如,哭泣、跺脚、翻胃),这可能为他们提供更多的机会来识别自己的感受。”
该项目表明,对内容有效性的评估是直接的和可行的,该评估的结果可以为新的电子健康干预措施的持续开发和迭代提供有用的信息。专家对内容效度调查工具的评分显示出了可变性,这表明,在专家对具体干预活动的内容效度的判断中,应适当地调整和固定反应选项,以捕获有用的等级。
特别是对于被认为是干预结果关键的组件,对内容有效性的评估可以减少产生有效的电子健康干预所需的迭代次数。明确表达变化模型和规划理论,并进行内容有效性评估,以确保干预活动与预期目标相匹配,这可能对从零开始创建的电子卫生干预措施的发展尤其重要,即不是基于web的现有完善的面对面干预措施的改编[
专家对内容有效性的评级是对其他信息来源的重要补充。根据评估内容有效性的开发周期中的点,干预开发团队可能需要在用户反馈、有效性评估和其他上下文考虑因素的背景下,权衡关于特定活动的次优内容有效性的信息,以确定适当的行动。一种可能是立即改进或删除有潜在问题的活动;另一个选择是从用户参与度或有效性的角度持续监测这些活动。在应对教练的案例中,专家评审确认了所有被评级活动的相关性,但确定了两种干预活动在可能的有效性和年龄适宜性方面的潜在差距。这些信息将与用户反馈和试点随机试验的结果结合使用,以优化应对教练干预活动的决策。
该方法的实施揭示了许多关于评估内容有效性的过程和时间的教训。关于过程,我们了解到开发团队需要深思熟虑的判断来在适当的粒度级别上定义干预活动,也就是说,要有足够的专一性以便专家审查员进行有意义的评估。还需要经过深思熟虑的判断来确定哪些活动-目标对值得进行内容效度评估。在应对教练的例子中,我们选择将每个干预目标与一到两个最直接针对该目标的活动相结合来组织调查。但是,一些干预目标至少是通过额外活动间接解决的,一份较长的调查表格可以要求专家打分者评估所有这些活动-目标配对。步骤1和步骤2,或在专家评审(步骤4)期间收到的反馈的一个潜在结果是,干预开发人员可能会意识到他们没有充分指定干预目标或干预活动与预期目标之间的预期匹配。如果出现这种情况,它可以被视为开发团队的一个重要提醒,如有必要,可以通过专家咨询的帮助,重新审视和澄清作为电子健康干预基础的项目理论和变化模型。明确这一点不仅有助于干预措施的设计,而且有助于提高干预措施的有效性。
关于时间,当我们已经创建了一个功能在线干预时,我们在开发过程的某个点上寻求专家对内容有效性的审查,并在儿童用户中进行了干预试验,并启动了一个试点随机试验。这个时机的好处是,专家可以看到干预活动的完整版本,并可以完全掌握我们的预期设计。更早地寻求专家评审(使用故事板或功能原型)或在开发过程的多个点寻求专家评审会有不同的优势,即基于内容有效性评估迭代修改干预的早期草案的能力。
本项目存在一些局限性,为今后的研究方向提供了建议。首先,我们建议应用定量指标(I-CVI和S-CVI/AV),以及这些指标的阈值水平,这些指标基于心理测量的内容效度研究。虽然我们认为这是一个合理的起点,但还需要进一步的研究来记录I-CVI和S-CI/AV在开发各种类型的电子健康干预活动中的结果范围,以及这些评级与电子健康干预的改进性能之间的关系。这类研究也有助于评估拟议的内容效度调查工具本身的信度和效度,因为这超出了当前研究的范围。值得注意的是,我们为一个电子健康项目实现了这种内容有效性方法,该项目采用了“隧道”设计,要求所有用户参与所有活动。由于eHealth干预措施在指导每个用户参与同一组活动的程度上各不相同,对更复杂分支结构的内容有效性评估,或对允许自由探索一组活动的干预措施的内容有效性评估,可能需要对我们的方法进行一些调整。提出的内容有效性的方法针对三个领域:相关性、可能的有效性和特定受众的适当性。随着该工具的使用越来越广泛,可能会认识到对其他域的需求。最后,必须记住,专家评定的内容效度并不能保证一系列干预活动的有效性。研究人员和干预开发人员不应用内容效度评估代替严格的干预效果评估。
内容有效性评估可以成为开发或改进电子健康干预过程中一个有用的检查点。我们的团队创建并实现了一个简单的方法和内容有效性调查工具,提供了有关干预活动与基础项目理论匹配的有用信息。该方法可在开发过程中的多个点适当利用,以指导正在进行的电子卫生干预的优化。
这项工作由美国尤尼斯·肯尼迪·施赖弗国家儿童健康和人类发展研究所R21HD069832赠款资助。我们感谢参与这个项目的专家评论家的努力:Melissa Alderfer, Lamia Barakat, Steven Berkowitz, Melissa Brymer, Cindy Buchanan, Judith Cohen, Catherine Cox, Douglas Delahanty, Alexandra De Young, Markus Landolt, Richard Meiser-Steadman, Joanne Mouthaan, Reginald Nixon, Miranda Olff和Josef Ruzek。
内容效度调查工具。
项目级内容有效性指数
量表级内容效度指数/平均值(I-CVIs的平均值)
没有宣布。