JMIR mHealth和uHealth -德国版移动应用评级量表(MARS-G):开发和验证研究

原始论文

¹临床心理学和心理治疗，乌尔姆大学，乌尔姆，德国

²临床与生物心理学，天主教大学eichstaet - ingolstadt，德国eichstaet - ingolstadt

^3.澳大利亚布里斯班昆士兰科技大学创意产业学院

⁴澳大利亚布里斯班昆士兰大学健康与行为科学学院

⁵心理学与咨询，昆士兰科技大学，布里斯班，澳大利亚

⁶乌尔姆大学数据库与信息系统研究所，乌尔姆，德国

⁷德国弗莱堡大学康复心理与心理治疗系

⁸奥地利克雷姆斯多瑙河大学心理治疗和生物心理社会健康系

通讯作者:

Eva-Maria Messner，马萨诸塞州

临床心理学与心理治疗

乌尔姆大学

Albert-Einstein-Allee 47

乌尔姆

德国

电话:49 07315032802

电子邮件:eva-maria.messner@uni-ulm.de

背景:为促进健康行为、预防疾病发作、管理和治疗疾病或协助康复措施而开发的移动健康应用程序(MHAs)数量激增。尽管应用商店的星级评价和描述在终端用户中很受欢迎，但它们通常提供的关于应用质量的信息并不充分，甚至是错误的。迫切需要一种严格的系统方法来建立和评估mha的质量。移动应用评级量表(MARS)是一种评估工具，有助于客观、系统地评估移动应用软件的质量。然而，德国的MARS目前还不可用。

摘要目的:这项研究的目的是翻译和验证德国版本的火星(火星- g)。

方法:最初的19项MARS被前后翻译了两次，并创建了MARS- g。扩展了应用程序描述项目，并由8名独立双语研究人员使用MARS- g和MARS对104个mha进行了两次评级。评估两种量表的内部一致性、效度和信度。采用Mokken量表分析研究总分的可扩展性。

结果:重新翻译的比例尺显示出与原始火星极好的一致性。此外，火星- g的性能与最初的火星相当。所有子量表的内部一致性都很好(即ω的范围从0.72到0.91)。MARS- g与MARS的相关系数(r)在0.93 ~ 0.98之间。MARS (H=0.50)和MARS- g (H=0.48)的可扩展性较好。

结论:MARS-G是专家和利益相关者评估德语人口健康应用程序质量的可靠有效工具。总分是一个可靠的质量指标。然而，需要进一步的研究来评估MARS和MARS- g的析因结构。

[j] .移动医疗与健康;2020;8(3):14479

doi: 10.2196/14479

关键字

移动健康；手机应用评定量表；手机应用程序；评估；评级；规模发展

手机是现代生活中不可或缺的一部分。在欧洲，67%的人口拥有智能手机，而全球智能手机用户的数量也在不断增长。1]。据报道，30%的德国人在他们的智能手机上安装了11到20个应用程序[2]。使用移动应用程序来改善心理健康和幸福感正变得越来越普遍，大约29%的德国人目前至少使用一款健康应用程序[3.]。

在全球范围内，有9500万至1.3亿人讲德语，使其成为世界上第11大语言[4，5]。在德国，老年人和受过基础教育的人通常只说一种语言[6]。然而，这些人群在发展和维持健康行为方面非常需要帮助，并且可以从移动健康应用程序(MHAs)的使用中受益。德国MHA评级量表可以帮助研究人员和医疗服务提供者快速可靠地评估健康应用程序的质量。此外，用德国标准来评价一款德国应用也很容易。

MHAs为促进健康提供了独特和多样化的可能性。它们允许进行短暂的生态评估[7，8]和干预措施[8，9]。此外，它们可以不受地理、金融和社会条件的限制而使用;可以同时针对非临床和临床人群;并有能力在生态环境中提供多样化的健康管理战略[10]。此外，它们支持个人，包括来自高需要高费用人群的个人(例如患有慢性病或生活方式疾病的人)管理自己的健康[9];减少求助障碍;并提供广泛的参与选择[10]。

尽管最近mha数量激增[11]，没有普遍接受的标准来衡量和报告它们的质量[8，12]。因此，有必要支持研究人员、使用者和卫生保健提供者(如医生、心理治疗师和物理治疗师)选择高质量的mha。安全可靠地使用mha需要有效性和质量的证据、有关数据保护的信息、有关应急程序(例如自我伤害和不良影响)的信息，以及对相关风险的全面考虑[10]。

Boudreaux及其同事[13]提出了以下7种评价MHA质量的策略:(1)查阅科学文献;(2)搜索应用结算网站;(3)搜索应用商店;(4)审核应用描述、用户评分和用户评论;(5)在专业人士和(如果有的话)患者网络中进行社交媒体查询;(6)试点应用程序;(7)征求用户反馈。在做出治疗选择时，这一过程可能对卫生保健提供者和最终用户要求过高。标准化和可靠的质量评估工具可以促进这一进程。

迄今为止存在几种MHA评估量表。美国心理学会发布了一个应用评估模型，该模型包括以下五个方面的33个项目:背景信息、风险/隐私和安全、证据、易用性和互操作性[12]。该模型的主要目的是评估危害的可能性[9]。然而，该评级工具的效度和信度评估尚未见报道，对其应用尚无一致意见[14]。

Baumel和同事[15]根据对相关标准的全面系统审查，开发了移动和基于网络的电子卫生干预评估工具(ENLIGHT)。该工具允许从7个维度(可用性、视觉设计、用户参与度、内容、治疗说服力、治疗联盟和一般主观评价)对28个项目的应用质量进行评估。ENLIGHT还提供了评估可信度、证据基础、隐私解释和基本安全性的清单。

流动应用程序评分量表(MARS) [16是最常用的应用程序评估工具，允许电子健康专家对mha进行评级。它包括19个项目，包括4个客观MHA特征(参与度、功能、美学和信息质量)的子量表，以及另外10个项目，包括2个主观特征(主观应用质量和感知影响)的子量表。分量表和总分反映了mha的质量。MARS已被用于科学评估以下领域的应用质量:体重管理、身体活动、心力衰竭、儿童和青少年饮食、药物依从性、正念、背痛、慢性疼痛、戒烟和抑郁症[8，17-24]。因此，它是科学界使用最广泛的MHA质量评级工具。此外，许多促进MHA安全使用的国际努力(例如，移动健康应用程序数据库、心理指南或应用程序脚本、Reachout、各种帮助热线、健康导航员和Vic Health)都是基于MARS。

MARS的原始版本是英语的，但全球范围内需要根据文化和语言进行应用评级。西班牙语和意大利语版本的MARS已被开发出来[25，26]。考虑到德国不断增长和不受监管的MHA市场，德国MARS是必要的。因此，本研究旨在开发和验证德文版本的移动应用评定量表(MARS- g)，并利用与项目反应理论密切相关的莫肯量表分析方法来研究MARS总体评分的可扩展性。

改编与翻译

MARS由两位独立的双语科学家(EMM和TP)从英语翻译成德语。在对两种正向翻译进行审查和讨论后，创建了火星- g的试点版本。该试点版本由两名不同背景的双语人士(一名博士后心理学家[AB]和一名非学术人士[LMZ])进行盲回翻译。此后，由双语科学家(EMM和TP)将回译与原英文版本进行比较，并创建了第二个版本的MARS-G。该版本的可理解性由三名研究人员和三名非学者进行了评估。在解决了他们的意见后，MARS-G的最终版本被创建并用于本研究。MARS-G可以从补充资料中下载，也可以根据要求向作者索取。

查册及程序

MARS-G在一项针对焦虑的应用程序质量的研究框架内得到了验证(E M Messner等人，未发表的数据，2020年)。使用以下搜索词识别应用程序:焦虑、恐惧、焦虑发作、焦虑、焦虑、焦虑症、恐惧、恐惧、恐慌、恐慌发作、担心和担忧。每个搜索词都是单独提供的，因为在Google Play Store和iOS Store中不可能截断或使用逻辑运算符(AND, or和NOT)。

纳入过程分为三个步骤(搜索、筛选和确定合格性)。(1)使用上述搜索词，确定初始应用池。(2)筛选商店网站上的应用程序详细信息，下载和审查应用程序，如果它们是为焦虑开发的，有德语或英语，可以通过官方Google Play store或iOS store下载，并且不符合相关的排除标准(应用程序捆绑[许多应用程序只能作为一个组提供])。(3)所有下载的应用程序，如果没有解决焦虑，不是德语或英语，有故障，或符合相关的排除标准(设备不兼容和开发/测试阶段)，将被评估和排除。我们从应用商店中发现了3562个mha。然而，我们排除了810个重复的应用程序，2577个应用程序被认为不适合筛选，71个应用程序被认为不合格。剩下的104个应用程序由两位独立的训练有素的评分员使用MARS和MARS- g进行评分。评分者对所有mha进行了15分钟的测试。在两种语言的测试期结束后立即对质量进行评估。MARS-G的评估出现在一篇评估焦虑可用mha质量的综述中(E M Messner等人，未发表的数据，2020年)。

评定等级的培训

我们遵循Stoyanov及其同事的原始研究中的评级方法[16]。我们在YouTube上制作了一个视频，介绍了MARS-G评级，并练习了如何将一个应用程序评为典型的健康应用程序(TrackYourTinnitus) [27]。这段视频可以向通讯作者索取。每个评分员都使用这个视频进行训练，然后对五个预定义的应用程序进行评分，以确保每个评分员都得到了适当的训练。如果个人评价分数与我们的标准评价分数相差至少2分，则讨论差异直至达成一致。所有评价者至少拥有心理学学士学位，以确保达到必要的最低心理诊断能力标准。

德文版本的移动应用评定量表

我们在MARS-G的应用程序描述部分添加了以下项目:理论背景(认知行为、治疗、系统治疗等)、方法(眼动脱敏与再处理、追踪、反馈等)、应用商店类别(生活方式、医学等)、嵌入日常护理(与治疗师沟通等)、使用类型(预防、治疗、康复等)、指导(独立、混合护理等)、认证(医疗器械法等)、数据安全(登录、知情同意等)。原始MARS的四个部分进行了扩展，增加了一个部分，重点关注与应用程序相关的治疗收益。衍生项目如下:患者的收益;治疗师的收获;风险和不良影响;以及在日常医疗保健中易于实施。

分析

组内相关

纳入的mha由两名训练有素的评分员独立评定。计算类内相关系数(ICC)来评估评分者之间的一致程度。ICC <0.50为相关性差，0.51 ~ 0.75为相关性中等，0.76 ~ 0.89为相关性好，>0.90为相关性极好[28]。根据以往的研究结果，ICC >0.75被认为是有足够的相关性[8，29，30.]。

内部一致性

评估MARS- g及其子量表的内部一致性，作为量表可靠性的衡量标准，类似于原始MARS [16]。Omega被用来代替广泛采用的Cronbach alpha来评估可靠性，因为它提供了一个更无偏的可靠性估计[31-33]。对于估算，Zhang和Yuan介绍的程序[34]用于获得稳健系数和自适应偏差校正置信区间。ω <0.50表示内部一致性不可接受，0.51-0.59表示一致性差，0.60-0.69表示一致性有问题，0.70-0.79表示一致性可接受，0.80-0.89表示一致性良好，>0.90表示一致性极好[35]。

有效性

我们评估了MARS与MARS- g对应子量表之间的相关性，以及MARS总分与MARS- g总分之间的总体相关性。一个r值>0.8被作者组先验地认为是MARS和MARS- g之间存在强烈和充分关联的指标。此外，使用双面法对MARS- g和MARS- g的维度进行了平均比较t测试。对于所有的比较，aP值<。0.05被认为是显著的。

莫肯量表分析

Mokken量表分析(MSA)是一种与非参数项目反应理论密切相关的量表分析方法[36]。使用MSA的前提条件是单调性和非相交性。MSA中的关键参数是Loevinger H. H_我为项目i的缩放参数，所有项目聚到规模k上的整体可扩展性为H_k．H_我表示潜在变量(应用质量)与项目i之间关系的强度。高可扩展性分数表明，项目i的增加很可能伴随着潜在变量的增加。H <0.4为弱量表，H≥0.4但<0.49为中等量表，H >0.5为强量表[36]。此方法已在上文[36-39]。对于MARS和MARS- g，进行了MSA来评估平均得分的可扩展性。根据van der Ark的建议[36]，另外使用Molenaar-Sijtsma方法(MS)评估量表的信度[40，41]， lambda-2 [42]、潜在类信度系数(LCRC) [43]。MSA已于前文作了介绍[36]。

分析软件

R软件(R Foundation for Statistical Computing, Vienna, Austria) [44除类内相关性外，所有分析均使用]。MSA使用R包进行mokken(36，38]。计算相关性和内部一致性心理(版本1.8.12)[45),coefficientalpha软件包(0.5版本)[34]。的coefficientalpha包包括欧米茄与缺失和非正常数据的计算。ICC的计算使用IBM SPSS 24 (IBM Corp, Armonk, New York) [46]。

描述性数据和平均值比较

MARS和MARS- g的ICC很高(ICC)_火星: 0.84, 95% ci 0.82-0.85;国际刑事法庭_MARS-G: 0.83, 95% ci 0.82-0.85)。MARS-G项目的平均和标准差得分见表1．MARS中项目的平均和标准差得分在其他地方报告(E M Messner等人，未发表的数据，2020)。维度的平均得分订婚（t₂₀₆= 0.12;P=点),功能（t₂₀₅= 0.39;P= 2),美学（t₂₀₆=−0.012;P= 0)信息质量（t₂₀₄= 0.45;P= 0.66)及整体评分(t₂₀₆= 0.27;P=.80)在MARS和MARS- g之间是相等的。

表1。德文版移动应用评级量表的项目和量表得分摘要。

维		得分，平均值(SD)
订婚		2.52 (0.70)
	项目01	2.64 (0.93)
	项02	2.79 (0.90)
	项03	2.19 (1.00)
	项04	1.86 (0.79)
	项05	3.15 (0.72)
功能		4.12 (0.69)
	项06	4.13 (0.82)
	项07	4.24 (0.77)
	08年项	4.09 (0.74)
	09年项	4.03 (0.78)
美学		3.21 (0.94)
	10项	3.40 (0.93)
	11项	3.20 (1.09)
	12项	3.04 (0.99)
信息质量		2.75 (0.60)
	13项	3.60 (0.76)
	项目14个	2.63 (0.68)
	15项	2.67 (0.76)
	16项	2.61 (0.88)
	17项	3.66 (0.68)
	18项	1.87 (0.89)
	19项	3.00 (N / A^一个）
总体的意思是		3.11 (0.58)

^一个关于信息质量的这一项只能对1个应用进行评级，其余的应用都进行了评级不适用．

内部一致性

MARS维度的内部一致性订婚预后良好(ω=0.84, 95% CI 0.77-0.88)。的内部一致性功能(ω=0.90, 95% CI 0.85-0.94)美学(ω=0.91, 95% CI 0.92-0.96)。的内部一致性信息质量可接受(ω=0.74, 95% CI 0.14-0.99;α=。75，95% CI 0.67-0.83). The internal consistency of the overall MARS score was good (ω=0.81, 95% CI 0.74-0.86).

MARS- g维度的内部一致性与原始MARS几乎相同(engagement: ω=0.85, 95% CI 0.78-0.89;功能性:ω=0.91, 95% CI 0.87-0.94;美学:ω=0.93, 95% CI 0.90-0.95;信息质量:ω=0.72, 95% CI 0.33-0.81)。总体评分的内部一致性较好(ω=0.82, 95% CI 0.76-0.86)。

有效性

MARS与MARS- g对应维度的相关系数在0.93 ~ 0.98之间P根据Holmes方法调整数值进行多重检验[47) (表2）.各项目之间的相关性见多媒体附录1．用户评分与质量评分之间没有关联(表1）.

表2。德国版手机应用评定量表的有效性(r和P值)。

维	订婚_蒙古包^一个	功能_蒙古包	美学_蒙古包	信息质量_蒙古包	星级
订婚_英格^b	0.97(<措施)	0.49(<措施)	0.73(<措施)	0.52(措施)	−0.03 (0)
功能_英格	0.45(<措施)	0.98(<措施)	0.43(<措施)	0.36 (.002)	0.06 (0)
美学_英格	0.69(<措施)	0.41(<措施)	0.97(<措施)	0.41(措施)	0.12 (0)
信息质量_英格	0.55(<措施)	0.34 (04)	0.47(<措施)	0.93(措施)	0.25 (.19)
星级	−0.03 (> 0)	0.07 (> 0)	0.12 (> 0)	0.26 (.19)	- - - - - -^c

^一个德国的版本。

^b英文版本。

^c不适用。

莫肯量表分析

MARS的MSA显示出较强的可扩展性(H=0.50;0.062 SE)。没有违反单调性和非相交性。该量表的内部一致性可接受(MS=0.74;λ2 = 0.73;LCRC = 0.72)。MARS-G的MSA具有良好的可扩展性(H=0.48;0.060 SE)。该量表的内部一致性可接受(MS=0.74;λ2 = 0.72; LCRC=0.74). The scalability results of the MARS and MARS-G are presented in表3．

表3。移动应用评级量表(MARS)和德文版移动应用评级量表(MARS- g)的Hk系数(量表中所有项目的整体可扩展性)摘要。

维	火星	MARS-G
订婚	0.59	0.57
功能	0.43	0.41
美学	0.51	0.51
信息质量	0.45	0.41
总规模	0.50	0.48

主要研究结果

本研究开发并评估了mha的MARS-G。结果表明，MARS-G是专家评估MHAs质量的可靠有效工具。MARS- g的有效性和可靠性与原始MARS相当。关于尺寸的可靠性信息质量， ω的置信区间由于计划缺失而被高估。计划缺失源于响应选项不适用，如果应用程序没有任何健康信息(例如，日记应用程序和益智游戏)，评分者可以跳过某个项目。MARS- g和原始MARS之间的可靠性没有差异。

MSA透露，使用MARS-G总分是合适的。此外，MARS- g与原始MARS具有良好的对应关系，表明有效性良好。我们的结果与一项研究的结果一致，该研究介绍并测试了一种意大利版的MARS [25]。

MARS-G已在多媒体附录2并可按要求向作者索取。它可以免费用于研究和非商业mha评估项目。为了达到令人满意的翻译可靠性，强烈建议完成通讯作者提供的在线培训练习。此外，还可以根据要求从通讯作者处获得五个应用程序的训练数据集。应修订MARS-G评级，直到达到一个适当的水平(即ICC >0.75)。

为了协助选择MHA，德语国家需要对MHA进行标准化的高质量评级。总的来说，一个公开可用的数据库提供可靠、有效和标准化的专家评级，比如MARS-G评级，可以帮助医疗保健部门做出明智的决定，决定使用哪个应用程序来治疗特定的疾病或目的。移动健康应用数据库[48]就是这样一个工具的一个例子，它可以帮助用户和医疗保健提供者根据不同的健康相关目的选择合适的应用程序。

限制

这项研究有几个局限性。首先，仅通过比较MARS和MARS- g来评估收敛效度。与其他应用评级量表(如ENLIGHT)的比较[15]和美国心理协会应用评估模型[12]，在未来的研究中是必要的。其次，对焦虑应用的关注限制了概括。需要进一步的研究来证实这些发现可以推广到其他流动卫生领域。这样的研究需要熟悉特定领域的专家评分员。最后，在未来更大样本的研究中，应对MARS和MARS- g进行验证性因子分析，以确保MARS和MARS- g的预定义子量表能够得到确认。

未来的研究

这项对火星的翻译研究发现了几个研究空白。未来的研究应侧重于改进应用程序质量评估，从而扩大MHA的安全使用范围。这项研究面临的一个挑战是，应用程序在应用商店中呈现的顺序是难以理解的，并且根据搜索使用的帐户而有所不同。在未来的研究中，可以使用网络爬虫来搜索欧洲应用商店的关键字，以建立一个公正的可用mha数据库。这样的数据库在中国已经存在，它包含了美国、中国、日本、巴西和俄罗斯所有可用的mha [49]。

未来的研究还应该阐明现实生活中的用户行为与MARS或MARS- g评级之间的关系。由于MARS和MARS- g捕捉应用质量，它们可以帮助预测用户下载和使用数字资源的能力。这样的研究已经在ENLIGHT和现实生活中的用户参与中进行了[50]。mha的疗效与使用者依从性密切相关[50-52];因此，高质量的应用程序可能需要包括依从性促进策略，以发挥其潜力。

此外，还应考虑到患者的参与。MARS (uMARS)的用户版本[53]也应翻译并测试其可靠性和有效性，以便能与德语国家的uMARS-G的用户评分相补充。此外，未来还需要进一步的研究来调查MARS-G和uMARS-G与特定健康问题相关的应用程序。

总之，MARS-G可由公共卫生当局、患者组织、研究人员、卫生保健提供者(如医生和心理治疗师)以及感兴趣的第三方等各利益攸关方用于评估卫生部的质量。此外，应用程序开发人员可以使用MARS-G作为提高应用程序质量的工具。

致谢

作者感谢Linda Maria Zisch在翻译过程中的帮助。

利益冲突

没有宣布。

‎

多媒体附录1

MARS与MARS- g项目相关矩阵。

DOCX文件，25kb

‎

多媒体附录2

移动应用评级量表-德语。

PDF档案(adobepdf档案)，563kb

伦敦大学，eMarketer。Statista -统计门户网站。2014年8月，2011年至2018年西欧智能手机用户渗透率占总人口的百分比https://www.statista.com/statistics/203722/smartphone-渗透-每人均- -西方-欧洲-自- 2000 /[2019-12-05]访问
ForwardAdGroup。Statista - Das统计门户。2015.在智能手机上安装了哪些应用程序?URL:https://de.statista.com/statistik/daten/studie/162374/umfrage/durchschnittliche-anzahl-von-apps-auf-dem- handy-in-deutschland /[2019-12-05]访问
王晓明，王晓明，王晓明，等。基于神经网络的患者赋权研究:基于神经网络的患者赋权研究[j]。中国生物医学工程学报2016;2:1-8。
Deutschland.de。Deutschland.de。2018.我们讲德语URL:https://www.deutschland.de/en/topic/culture/the-german-language-surprising-facts-and-figures[2019-04-24]访问
贡献者维基百科。维基百科，免费百科全书。按母语人数列出的语言列表https://en.wikipedia.org/wiki/List_of_languages_by_number_of_native_speakers[2019-04-24]访问
李国强，郭高林，郭林敏。单语制的双面面孔:德国和澳大利亚语言教育政策的比较。当代问题与规划2010;11(4):439-460。(CrossRef] [Medline]
Heron KE, smith JM。生态瞬时干预:将移动技术纳入社会心理和健康行为治疗。[J]中华卫生杂志，2010;15(1):1-39 [J]免费全文] [CrossRef] [Medline]
引用本文:Terhorst Y, Rathner EM, Baumeister H, Sander l。»:einesystematische Übersichtsarbeit与应用程序评价与研究[j]。中华医学杂志，2018;28(2):101-112。(CrossRef]
Ebert DD, Van Daele T, Nordgreen T, Karekla M, Compare A, Zarbo C，等。互联网和基于移动设备的心理干预:改善心理健康的应用、功效和潜力。中华精神病杂志，2018;23(2):167-187。(CrossRef]
Boulos MNK, Brewer AC, Karimkhani C, Buller DB, Dellavalle RP。移动医疗和健康应用:现状、关注、监管控制和认证。公共卫生通报2014年2月;5(3):229 [J]免费全文] [CrossRef] [Medline]
Albrecht UV。Kapitel 8。Gesundheits-Apps and Risiken。编辑:Albrecht UV机遇与发展与应用(CHARISMHA)。汉诺威:汉诺威医科大学;2016:176 - 192。
美国精神病学协会。美国精神病学协会，2017。应用评估模型URL:https://www.psychiatry.org/psychiatrists/practice/mental-health-apps/app-evaluation-model[2019-12-05]访问
刘建军，刘建军，刘建军。移动医疗应用程序的选择与评价:医疗服务提供商和医疗机构的策略。中华医学杂志2014;4:363-371 [j]免费全文] [CrossRef] [Medline]
Nouri R, Kalhori S, Ghazisaeedi M, Marchand G, Yasini M.评估移动医疗应用质量的标准:系统回顾。医学信息学报，2018 (1):1-10 [J]免费全文] [CrossRef]
Baumel A, Faber K, Mathur N, Kane JM, Muench F. Enlight:移动和基于web的电子健康干预的综合质量和治疗潜力评估工具。医学互联网研究，2017年3月21日;19(3):e82 [J]免费全文] [CrossRef] [Medline]
Stoyanov SR, Hides L, Kavanagh DJ, Zelenko O, Tjondronegoro D, Mani M.移动应用评价量表:一种评估健康移动应用质量的新工具。JMIR mHealth uHealth 2015;3(1):e27 [j]免费全文] [CrossRef] [Medline]
Bardus M, van Beurden SB, Smith JR, Abraham C.对最流行的体重管理商业应用的用户粘性、功能、美学、信息质量和改变技术的回顾和内容分析。[J]行为与营养物理法案2016年3月10日;13:35]免费全文] [CrossRef] [Medline]
张建军，张建军，张建军，张建军。类风湿关节炎患者监测疾病活动的应用程序:对最佳实践和质量应用程序的回顾。JMIR移动健康Uhealth 2017 Feb 21;5(2):e7 [j]免费全文] [CrossRef] [Medline]
Knitza J, Tascilar K, Messner EM, Meyer M, Vossen D, Pulla，等。风湿病学中的德国移动应用程序:使用移动应用评定量表(MARS)的回顾和分析。移动医疗Uhealth 2019 Aug 05;7(8):e14991 [j]免费全文] [CrossRef] [Medline]
马夏多，李海龙，李海龙，吴建军，李建军，等。用于腰痛自我管理的智能手机应用程序:系统回顾。临床风湿病最佳实践与研究2016年12月30日(6):1098-1109。(CrossRef]
Mani M, Kavanagh DJ, Hides L, Stoyanov SR.基于正念的iPhone应用程序的审查和评估。JMIR移动健康Uhealth 2015 Aug 19;3(3):e82 [j]免费全文] [CrossRef] [Medline]
Masterson Creber RM, Maurer MS, Reading M, Hiraldo G, Hickey KT, Iribarren S.基于移动应用评定量表(MARS)的现有手机应用支持心力衰竭症状监测和自我护理管理的综述与分析。JMIR移动健康Uhealth 2016 Jun 14;4(2):e74 [j]免费全文] [CrossRef] [Medline]
Salazar A, de Sola H, Failde I, Moral-Munoz JA。测量疼痛管理的手机应用质量:使用手机应用评级量表进行系统搜索和评估。JMIR移动医疗Uhealth 2018 Oct 25;6(10):e10718 [j]免费全文] [CrossRef] [Medline]
张建军，张建军，张建军，等。免费戒烟手机应用程序在澳大利亚可用:质量审查和内容分析。[J] .中华卫生杂志，2017;41(6):625-630。(CrossRef] [Medline]
刘建军，刘建军，刘建军，等。开发和验证意大利语版移动应用评级量表，并将其推广到针对初级预防的应用程序。英国医学杂志2016年7月7日;16(83):1-10。(CrossRef]
Martin Payo R, Fernandez Álvarez MM, Blanco Díaz M, Cuesta Izquierdo M, Stoyanov SR, Llaneza Suárez E.手机应用评定量表问卷的西班牙语适应与验证。国际医学杂志2019年9月29日:95-99。(CrossRef]
Pryss R, Probst T, Schlee W, Schobel J, langth B, Neff P，等。基于TrackYourTinnitus移动平台的耳鸣变异性和耳鸣-压力关联的前瞻性人群感知与回顾性评分。[J] .数据科学学报，2019(3):327-338。(CrossRef]
波特尼LG，沃特金斯国会议员。临床研究基础:在实践中的应用。上马鞍河，新泽西州:皮尔逊/普伦蒂斯大厅;2009.
林俊，Sander L, Paganini S, Schlicker S, Ebert D, Berking M，等。针对慢性背痛患者的指导性互联网和移动设备抑郁症干预的有效性和成本效益:一项多中心随机对照试验方案英国医学杂志2017年12月28日;7:e015226。(CrossRef]
李建军，李建军，李建军，等。基于互联网和移动的指导性干预对慢性背痛患者重度抑郁的指示性预防的有效性和成本效益——PROD-BP多中心实用随机对照试验研究方案BMC精神病学2017年1月21日;17(36)。(CrossRef]
Dunn TJ, Baguley T, Brunsden V.。从α到ω:内部一致性估计普遍问题的实用解决方案。中国生物医学工程学报，2014,31(3):391 - 391。(CrossRef] [Medline]
Revelle W, Zinbarg RE.系数Alpha, Beta, Omega和GLB:对Sijtsma的评论心理测量学2009;74(1):145 - 154。(CrossRef]
感谢Alpha系数，我们将从这里接手。心理方法2018;23(3):412-433。(CrossRef]
张志，袁康。鲁棒系数α和ω和置信区间与离群观测和缺失数据:方法和软件。中国心理医学杂志，2016;36 (3):387-411 [j]免费全文] [CrossRef] [Medline]
乔治D, Mallery P. SPSS For Windows一步一步:一个简单的指南和参考，11.0更新。波士顿:Allyn & Bacon;2003.
van der Ark LA。Mokken量表分析[J] .统计软件，2007;20(11):1-19。(CrossRef]
Mokken RJ。尺度分析的理论与程序:及其在政治研究中的应用。纽约:De Gruyter Mouton;1971.
van der Ark LA。[J] .中文信息学报;2009;32(5):591 - 591。(CrossRef]
Sijtsma K, van der Ark LA。关于如何对测试和问卷数据进行莫肯量表分析的教程。[J] .心理科学学报，2017;37(1):397 - 398。(CrossRef]
张建军，张建军。一种面向多类别项目的可靠性评估方法。中华医学杂志1988;9(28):115-126。
Sijtsma K, Molenaar IW。非参数项目反应理论中测试分数的信度。心理医学杂志1987;52(1):79-97。(CrossRef]
分析重测信度的基础。心理测量学，1945;10(4):255-282。(CrossRef]
范德明，王晓明，王晓明，等。一种测试分数信度估计的潜在类方法。苹果心理杂志2011年3月09日;35(5):380-392。(CrossRef]
R核心团队。统计计算语言与环境。R Found Stat computer，维也纳，奥地利2017 [免费全文]
《心理学、心理测量学和人格研究程序》[计算机软件]。2017.URL:https://personality-project.org/r/psych[2019-11-22]访问
IBM公司。IBM SPSS高级统计24[软件]。2016.URL:http://www-01.ibm.com/support/docview.wss?uid=swg27047033#ja%5Cnftp://public.dhe.ibm.com/software/analytics/spss/documentation/statistics/24.0/ja/client/Manuals/IBM_SPSS_Advanced_[2020-01-16]访问
一个简单的顺序拒绝多重测试程序。中国生物医学工程学报(英文版);2009;6 (6):391 - 391 [J]免费全文]
MHAD核心团队。移动健康应用数据库。2019。URL:http://www.mhad.science/[2019-09-11]访问
徐伟，刘勇。mHealthApps:一个移动健康应用库和数据库。JMIR mHealth uHealth 2015年3月18日;3(1):e28 [j]免费全文] [CrossRef] [Medline]
Baumel A, Yom-Tov E.预测现实世界中用户对行为电子健康干预的依从性:检查干预设计的哪些方面最重要。中华医学杂志2018年9月8日;8(5):793-798。(CrossRef] [Medline]
王晓明，王晓明。网络干预对焦虑和抑郁的影响。医学与互联网研究，2009;11(2):e13 [J]免费全文] [CrossRef] [Medline]
Van Ballegooijen W, Cuijpers P, Van Straten A, Karyotaki E, Andersson G, Smit JH，等。坚持基于互联网和面对面的抑郁症认知行为疗法:一项荟萃分析。PLoS ONE 2014;9(7):e100674 [j]免费全文] [CrossRef] [Medline]
张建军，张建军，张建军，等。基于用户版本的移动应用评定量表(uMARS)的开发与验证。JMIR mHealth uHealth 2016;4(2):e72 [j]免费全文] [CrossRef] [Medline]

‎

光线:移动和基于网络的电子卫生干预评估工具

国际刑事法庭:类内相关系数

LCRC:潜在类信度系数

火星:手机应用评定量表

MARS-G:德文版本的移动应用评级量表

尼古拉斯:移动健康应用

女士:Molenaar-Sijtsma方法

MSA:莫肯量表分析

奥马尔:用户版的手机应用评定量表

G·艾森巴赫编辑;提交24.04.19;C . Aljoscha、M . Bardus、E . de Krijger、R . Bipeta同行评议;对作者05.06.19的评论;收到修改版本29.07.19;接受24.09.19;发表27.03.20

©Eva-Maria Messner, Yannik Terhorst, Antonia Barke, Harald Baumeister, Stoyan Stoyanov, Leanne Hides, David Kavanagh, rdiger Pryss, Lasse Sander, Thomas Probst。最初发表于JMIR mHealth和uHealth (http://mhealth.www.mybigtv.com)， 2020年3月27日。

这是一篇根据知识共享署名许可(https://creativecommons.org/licenses/by/4.0/)的条款发布的开放获取文章，该许可允许在任何媒体上不受限制地使用、分发和复制，前提是原始作品首先发表在JMIR mHealth和uHealth上，并适当引用。必须包括完整的书目信息，到http://mhealth.www.mybigtv.com/上原始出版物的链接，以及版权和许可信息。

本文内容如下e-collection /主题问题:

德文版移动应用评定量表(MARS-G):开发与验证研究

德文版移动应用评定量表(MARS-G):开发与验证研究

原始论文

通讯作者:

摘要

关键字

介绍

方法

改编与翻译

查册及程序

评定等级的培训

德文版本的移动应用评定量表

分析

组内相关

内部一致性

有效性

莫肯量表分析

分析软件

结果

描述性数据和平均值比较

内部一致性

有效性

莫肯量表分析

讨论

主要研究结果

限制

未来的研究

致谢

利益冲突

参考文献

缩写