发表在6卷, 3号(2018): 3月

本文的预印本(早期版本)可在https://preprints.www.mybigtv.com/preprint/9069,首次出版
公开可用的体育活动应用的质量:审查和内容分析

公开可用的体育活动应用的质量:审查和内容分析

公开可用的体育活动应用的质量:审查和内容分析

审查

1伦敦大学学院初级保健和人口健康研究部电子保健股,英国伦敦

2沙特阿拉伯利雅得沙特国王大学应用医学学院社区卫生科学系

3.伦敦大学学院初级保健和人口健康研究部,英国伦敦

通讯作者:

Paulina Bondaronek,理学学士,理学硕士,mbps

电子健康单位

初级保健和人口健康研究部

伦敦大学学院

皇家自由医院三楼

罗兰山街

伦敦,nw32pf

联合王国

电话:44 20 3002 878

电子邮件:p.bondaronek@ucl.ac.uk


背景:在新的数字健康格局中,健康应用程序的兴起为健康促进创造了新的前景。市场上充斥着旨在增加体力活动(PA)的应用。尽管PA应用程序广泛分布和流行,但关于其有效性,用户体验和个人数据安全性的数据有限。

摘要目的:本综述和内容分析的目的是使用医疗质量指标评估市场上最受欢迎的PA应用程序的质量。

方法:iTunes和b谷歌Play商店中排名前400的免费和付费应用程序被筛选出来。如果应用程序的主要目标行为是个人助理,目标用户是成年人,并且应用程序具有独立的功能,则该应用程序被包括在内。这些应用程序被下载在手机上,并由2名评审员根据以下质量评估标准进行评估:(1)用户数据隐私和安全性,(2)行为改变技术(bct)的存在以及开发和评估过程的质量,以及(3)用户评分和可用性。

结果:在400个应用程序中,有156个符合纳入标准,其中65个应用程序被随机选择下载和评估。近30%的应用程序(19/65)没有隐私政策。每个应用至少包含一个BCT,平均为7个,最多为13个。除一款应用外,所有应用都有商业关联,12款应用咨询了专家,没有一款应用报告在开发过程中涉及用户。65个应用程序中只有12个与应用程序相关的同行评议研究。用户评分很高,只有四分之一的评分低于4星。可用性的中位数得分非常好——86.3分(满分100分)。

结论:尽管PA应用程序在商业市场上很受欢迎,但在数据安全性和评估应用程序有效性的可能性方面存在重大缺陷。应用程序的有限质量可能意味着错过了PA推广的机会。

[j] .移动医疗与健康;2018;6(3):53

doi: 10.2196 / mhealth.9069

关键字



背景

缺乏身体活动是一系列严重健康状况的独立风险因素,包括心血管疾病、糖尿病和癌症[1-3.]。体育活动(PA)也与改善心理健康有关[45]。世界卫生组织建议每周进行150分钟的中等强度或75分钟的高强度体育锻炼,但全球31.1%的成年人未能达到这一目标[6]。旨在增加PA的行为改变干预措施往往具有小到中等的效果,干预效果的可持续性尚未得到很好的确定[7]。

在新的数字医疗领域,应用程序的兴起为预防机会和疾病管理创造了新的前景[8]。与传统的面对面干预相比,移动医疗(mHealth)应用程序更容易获得[9并提供一系列技术增强的功能,如加速度计、可视化、定制反馈和提醒。此外,最近的数据显示,在高收入国家的少数民族群体中,移动电话的普及率与其他人群一样高[10],老年人使用移动电话的人数也在稳步增加[11],从而减少人们对数字鸿沟对保健不平等影响的关注。因此,使用移动健康应用程序提供的行为改变干预措施可能会影响到很大一部分人口,从而增加其小影响的公共卫生影响[12]。

移动健康应用行业在过去两年中翻了一番,2016年主要应用商店中有大约16.5万个健康应用。13];其中很多都是为了提高肾上腺素水平。尽管健康应用程序分布广泛且受欢迎,但其中许多应用程序的开发速度很快[14],而且缺乏证据证明它们的有效性。例如,Direito等人发表的一项荟萃分析[15发现只有7个随机对照试验(rct)评估app干预PA和久坐行为。显然,通过严格的随机对照试验对所有PA应用程序进行评估是不可行的,因此,需要其他评估应用程序的方法。评估应用程序可能的有效性的一种方法是评估它们使用行为改变理论和遵守PA指导方针的程度。这项研究表明,大多数PA应用程序只包含有限数量的行为改变技术(bct) [16-18],而且他们经常不遵守PA的指导方针[19]。

然而,质量比效果更重要,尽管关于如何确切做到这一点一直存在相当大的争论应用质量应该定义,有各种框架可用。BinDhim等人最近的评论[14]和Bardus等[20.分类并评估了用于应用程序质量评估的方法。两项研究都发现,用于评估健康应用质量的方法和措施存在相当大的差异。用于概念化和测量质量的方法差异很大,研究倾向于关注设计质量或基于证据的内容的存在,而不是两者兼而有之[20.]。作者呼吁进行更多的研究来评估健康应用程序的设计和内容的质量。

健康应用程序有潜力成为重要的医疗保健工具。21];因此,在评估应用程序的质量时,医疗保健质量指标被认为是适当的。保健质量的概念是复杂和多方面的[22]。麦克斯韦(23提出了卫生保健质量的六个维度:可及性(所有患者群体获得服务的便利性)、与社区需求的相关性、有效性、公平性(分配的公平性)、可接受性、效率和经济性(以最低成本获得期望的健康结果)。另一方面,Donabedian [24]提出了一种不同的分类,并论证了与卫生保健质量有关的三个关键要素:结构(可用的设施和卫生保健专业人员)、过程(提供卫生保健的行动)和结果(行动的结果)。

Maxwell和Donabedian提出的质量维度是在手机和应用程序出现之前发展起来的,可能更适用于在需要时提供的医疗服务,即面对面的医疗服务。潜在的新医疗工具应用程序需要更简洁的方法为所有人提供高质量的护理NHS下一阶段审查最终报告(25似乎提供了。该报告概述了国民保健服务的十年愿景,并提出了提高保健质量的战略。在这份报告中,高质量的医疗保健被定义为(1)安全,(2)有效,(3)提供尽可能积极的体验。这些质量指标简单而全面,并且足够灵活,可应用于潜在的新医疗保健工具,如PA应用程序。

客观的

在这项研究中,我们专注于最受欢迎的应用,我们将其定义为在两大应用商店中排名靠前的应用。是什么构成了决定应用排名的算法尚不清楚。然而,用户评分、评分和评论量、下载和安装数量、使用情况和卸载等人气变量可能会影响应用在应用商店中的排名。26]。此外,潜在用户更倾向于关注排名靠前的结果,而很少仔细检查搜索结果[27]。这种定义受欢迎程度的方法也被用于其他评估应用程序的研究[28-30.],选择它是为了获得最有可能被使用的应用程序的代表性样本,并模拟用户浏览商店选择健康应用程序的体验。

本研究的目的是评估公共PA应用程序的质量。具体目标是评估最受欢迎的PA应用程序的安全性、有效性和提供最积极的体验。


研究设计

这项研究是对市场上最流行的公共PA应用程序的回顾和内容分析。评价智能手机应用程序的研究的质量和偏倚风险清单用于确保应用程序审查方法得到充分描述[14]。

入选标准。

应用程序包含在

  • 他们的主要目标是增加体力活动
  • 他们的目标是健康的成年人
  • 它们有独立的功能
文本框1。入选标准。
排除标准。

应用程序被排除在外

  • 这款应用专注于多种行为,因为很难将与体育活动相关的内容隔离开来
  • 目标人群是具有特定健康状况的患者,因为这些用户可能与健康成年人有不同的需求
  • 它们是作为一个包(“捆绑”)的一部分出售的,因为不可能评估这个捆绑中单个应用程序的受欢迎程度
文本框2。排除标准。

样品确认

2016年10月17日,我们从英国的iTunes和b谷歌Play商店获得了400个排名靠前的PA应用的样本。正如先前的研究表明,价格与bct的纳入之间存在关联[183132],研究中包括了免费和付费应用。两个应用商店(100个iTunes免费应用+ 100个iTunes付费应用+ 100个谷歌免费应用+ 100个谷歌付费应用)中“健康与健身”类别的应用名称和描述将根据纳入和排除标准进行筛选。(文本框12

样品评估

从确定的应用程序中,随机选择65个应用程序使用Excel (Microsoft)中的随机数生成器函数进行评估。作为市场上最大的健康应用子集(30%)[13[目标PA],预计将有大量应用程序符合纳入标准。我们正在进行一项平行研究,以评估质量指标和用户评分之间的关系,选择n=65是基于该平行研究的功率计算。

这些应用程序被下载到iPhone SE和6(分别运行iPhone操作系统[iOS,苹果公司]10.2.1和9.3.4软件)和Android三星Galaxy S6和J5(分别运行6.0.1或5.1.1软件)上,并使用预估评估方法进行评估。每个应用程序都在后台运行2天,以便评估人员浏览任何提醒或通知。如果两个应用程序被认为是重复的,并且两个操作系统之间的设计和内容似乎是一致的,那么这些应用程序只会在iPhone上进行评估。样本鉴定和评估由两位审稿人(PB和GA)独立进行,任何差异都通过讨论解决。

数据提取

描述性的数据

我们从两个应用商店中提取了以下描述性数据:应用名称,简要描述,目标PA类型(如跑步,步行和全身锻炼),应用可用的平台,开发者名称,排名,评级数量,成本,大小,最近更新和版本。

医疗保健质量指标在体育活动app中的应用

下面描述了对所选应用程序的安全性、有效性和提供最积极的体验这三个质量指标的操作方法。

体育活动应用程序的安全性

健康类app的安全指标考虑了用户数据的隐私性和安全性。私隐及保安评估是根据资讯专员公署的建议进行的[33]及网上信任联盟[34]。它包括8个问题,评估隐私政策的可用性、可访问性、数据收集和共享实践,以及隐私声明中讨论的数据安全性(见多媒体附录1用于数据隐私和安全评估)。

体育活动应用程序的有效性可能性

由于缺乏对PA应用程序有效性的研究,因此通过量化bct的存在来评估有效性的可能性。此外,许多质量评估程序包括对干预措施发展过程的评估[3536]。例如,让主要持份者参与发展过程,对于制订符合使用者需要的干预措施,以及增加实施干预措施的可能性,是很重要的[37]。因此,收集了有关开发人员的组织隶属关系以及专家和用户在开发过程中的参与情况的数据。此外,还提取了任何科学评价的证据。

行为改变技巧

BCT分类法v1 [38]用于评估每个应用程序中BCT的数量以及每个BCT在应用程序样本中的总体频率。编码手册提供了调查93个bct在行为改变干预中的存在的指南,并已用于先前旨在表征健康应用程序中bct的研究[162839-41]。根据说明,我们将每个BCT编码为“不存在”、“存在+”(BCT很可能存在,但证据不明确)和“存在++”(BCT存在,毫无合理怀疑)。

表1。医疗质量指标在体育活动app中的应用。
保健质量指标 将指示器应用于健康应用程序
安全 数据的隐私和安全
有效性 行为改变技巧(Michie等)[38])

开发和评价过程:组织隶属关系;专家参与;用户参与;科学评估的证据
积极的体验 用户评分

可用性
开发过程的质量和评价证据

对开发过程质量的评估是基于应用商店、应用网站(如果存在)和应用本身提供的信息。提取应用内容开发的以下特征:组织隶属关系(大学、医疗、政府或其他非营利机构);专家参与(如健身专家、行为改变专家和医疗专家);以及用户参与应用程序开发的证据。通过在以下科学数据库中搜索应用程序的名称来评估应用程序评估的证据:PubMed、ACM数字图书馆、IEEE Xplore和谷歌Scholar。

在体育活动应用中提供最积极的体验

提供最积极的体验是通过(1)应用商店中的用户评分和(2)两位评论者使用系统可用性量表(SUS)进行的正式可用性评估来实现的[42]。平均星级(范围:1-5星)的计算方法是将星级数相加,再除以提交评级的用户数。SUS是一个有效和可靠的整体可用性衡量标准(从0-100),由10个项目组成,按5点李克特量表排名,从强烈反对强烈同意.第8项声明的措词改为麻烦尴尬的按照建议[43-45]。二、文字系统取而代之的是应用程序使量表适用于本研究的样本。SUS评分的解释采用了Bangor等人提出并验证的阈值[43]。

质量指标应用综述

医疗质量指标在app中的应用总结如下表1

评分者间信度

通过计算Cohen kappa统计量来确定存在或不存在bct的判读者信度[46]。此外,流行校正偏倚校正kappa (PABAK) [47评估是否存在bct。在应用程序中包含BCT的情况下,极有可能出现高比例的负面一致(当两种比例都同意不存在BCT时)。当看到相同反应的高患病率时,kappa值导致低比例的一致,尽管观察到的一致性很高[48]。评估样本的先验策略是完成10个应用程序的数据提取,以解决在提取其余数据之前对措施理解的任何差异。因此,对55个应用程序进行了互连器可靠性评估。

统计分析

应用程序中bct的数量采用平均值、标准差、中位数、25进行汇总th第75百分位,最大值和最小值。类似的统计数据用于总结用户评分、成本、大小和SUS评分。比例用于总结变量:数据隐私和安全,组织隶属关系,专家和用户参与,以及同行评议期刊的评估证据。

摘要描述表分别呈现给每个应用商店的免费和付费应用,因为应用商店根据成本有单独的排名。为了评估免费应用和付费应用在商店特征上是否存在差异,t使用测试来比较平均用户评分、大小和bct数量;采用Wilcoxon检验比较评分数;Fisher精确用于最近更新(<3个月,3-6个月和6个月),组织隶属关系,专家和用户参与以及任何同行评议研究的存在。


样品确认

在400个应用程序中,244个应用程序被排除在外(209个应用程序没有针对PA, 22个应用程序需要外围设备或付费会员才能使用应用程序,13个应用程序专注于多种健康行为),156个应用程序符合纳入标准(见图1)。总共发现了31个重复。随后,确定了125个独特应用程序的样本。共有65款应用,其中32款是免费的,33款是付费的。

样本特征

应用程序示例的描述性数据见表23.,而每个应用程序的数据分别显示在多媒体附录2.在iTunes或b谷歌Play商店中,免费应用和付费应用在评级数量、成本、大小和最新更新等方面没有统计学上的显著差异。

图1所示。分析中包含的应用程序流程图。PA:体育活动。
查看此图
表2。iTunes商店的描述性数据。
iTunes的描述性数据 Free-iTunes (N = 21) Paid-iTunes (N = 24) Total-iTunes (N = 45) P价值
评级数量
意思是(SD) 3408.4 (5848.4) 773.7 (1187.0) 2031.2 (4289.7)
中位数 758 127 550
25 - 75百分位 438.0 - -3698.0 47.0 - -1247.0 85.5 - -1719.0
Min-max 14 - 24530 11 - 3845 11 - 24530
Cost-iTunes(英镑一个




意思是(SD) N/Ab 2.5 (1.5) N/A
中位数 N/A 2.3 N/A
25 - 75百分位 N/A 1.5 - -3.0 N/A
Min-max N/A 1 - 8 N/A
应用大小(兆字节)




意思是(SD) 88.4 (49.8) 94.9 (75.4) 91.8 (64.1) .74点
中位数 74.3 83.3 82.2
25 - 75百分位 52.0 - -131.0 61.7 - -102.0 58.1 - -104.0
Min-max 11 - 164 9 - 376 9 - 376
最后一次更新




<3个月,n (%) 13 (61.9) 7 (29.2) 20 (44.4) .09点
3-6个月,n (%) 3 (14.3) 7 (29.2) 10 (22.2)

一个GBP:英镑。

b-不适用。

表3。谷歌Play商店的描述性数据。
谷歌Play的描述性数据 免费google Play (N=21) 付费google Play (N=16) 总排名- google Play (N=37) P价值
评级数量
意思是(SD) 119000.7 (165085.0) 14457.9 (43700.8) 73793.0 (136723.2) >。
中位数 44923 1720.5 5856
25 - 75百分位 5827.0 - -199596.0 384.5 - -6452.0 1475.0 - -78204.0
Min-max 206 - 625077 7 - 177277 7 - 625077
成本:google Play(英镑一个




意思是(SD) N/Ab 3.6 (2.3) N/A
中位数 N/A 2.7 N/A
25 - 75百分位 N/A 2.3 - -5.0 N/A
Min-max N/A 1 - 9 N/A
应用大小(兆字节)




意思是(SD) 28.4 (21.2) 43.4 (34.2) 34.9 (28.2)
中位数 26.8 31.5 29.6
25 - 75百分位 12.2 - -38.5 27.7 - -54.0 15.4 - -43.9
Min-max 2 - 73 1 - 145 1 - 145
最后一次更新




<3个月,n (%) 16 (76) 7 (44) 23 (62)
3-6个月,n (%) 1 (5) 3 (19) 4 (11)
>6个月,n (%) 4 (19) 6 (38) 10 (27)

一个GBP:英镑。

b-不适用。

这些应用程序根据其主要关注点被分为五组。这些应用包括:展示各种运动的健身应用(31/ 65,47 %),提供跑步、步行或自行车路线地图的运动跟踪应用(13/ 65,20 %),通过跑步与步行比例的增量增加来实现预定目标的跑步程序(12/ 65,18 %),基于计步器的应用程序(6/ 65,9 %),以及使用户能够计算工作或休息时间的间隔计时器(3/ 65,4 %)。

资料私隐及保安

隐私政策的可用性和可访问性

总的来说,有46个(70%,46/65)应用程序可以使用隐私政策。在一个案例中,提供了隐私政策的链接,但没有工作,应用程序被指示没有隐私政策。在那些有隐私政策的应用程序中,只有4个(8%,4/46)有简短的隐私和安全通知,强调了在完整的隐私政策中详细披露的关键数据实践表4)。有九种情况下,由于政策已经很简洁,因此不适用简短通知。多语言政策很少见,只有5个应用程序有另一种语言的政策。在英国以外开发的应用程序更有可能提供多语言政策。

数据收集和共享

大多数应用程序(80%)报告收集个人身份信息。在一个实例中,开发人员没有讨论数据收集实践。在34个案例中(80%,34/46),开发者表示他们与第三方共享他们收集的数据。有两种情况下,开发人员没有讨论数据共享实践。在许多情况下,政策规定“数据不得共享,但以下情况除外”,随后列出了一系列含糊笼统的例外情况。在这些情况下,审稿人认为数据是由第三方共享的。

数据安全

只有41%(19/46)的应用程序描述了如何保护用户的数据。隐私政策指出,数据安全对他们的做法很重要,但没有提供有关如何确保数据安全的信息。

行为改变技术的存在

评价者对BCT存在与否的编码“几乎完全”一致:PABAK=0.94, 95% CI 0.93-0.95, kappa= 0.78(“实质性”),95% CI 0.75-0.81。

表4。如隐私政策所述的数据收集、共享和安全性(在拥有该策略的公司中,N=46)。注:29%(19/65)没有可用的隐私政策。
隐私政策中描述的数据收集、共享和安全性 游离(N=24), N (%) 支付(N=22), N (%) 合计(N=46), N (%)
不需要下载应用程序就可以使用隐私政策吗?



是的 24 (100) 22日(100) 46 (100)
隐私政策在应用程序中可用吗?



没有 13 (44) 16 (55) 29日(63)
是的 11 (64) 6 (35) 17 (36)
是否有一个简短的通知(用简单的英语)来强调关键的数据实践?


没有 17 (70) 16 (72) 33 (71)
是的 4 (16) 0 (0) 4 (8)

不适用 3 (12) 6 (27) 9 (19)
是否有其他语言版本的隐私政策?



没有 20 (83) 21 (95) 41 (89)
是的 4 (16) 1 (4) 5 (10)
该应用程序是否收集个人身份信息?


没有 2 (8) 6 (27) 8 (17)
是的 21 (87) 16 (72) 37 (80)

未指定 1 (4) 0 (0) 1 (2)
应用程序是否与第三方共享用户数据?


没有 2 (8) 8 (36) 10 (22)
是的 21 (87) 13 (59) 34 (74)

未指定 1 (4) 1 (4) 2 (4)
该应用程序是否说明如何确保用户的数据安全?例如加密、鉴权、防火墙等



没有 13 (54) 14 (63) 27 (58)
是的 11 (45) 8 (36) 19 (41)
表5所示。行为改变技术(bct)的描述性统计。
纳入bct 免费(N = 32) 支付(N = 33) 总(N = 65) P价值
总这




意思是(SD) 6.6 (3.0) 7.5 (2.9) 7.0 (2.9) . 21
中位数 7 8 8
25 - 75百分位 5.0 - -8.0 6.0 - -10.0 5.0 - -9.0
Min-max 1 - 12 1-13 1-13

免费和付费应用样本的bct总数相似表5)。每个应用程序至少包含一个BCT,免费应用程序的BCT最多为12个,付费应用程序的BCT最多为13个。免费应用的bct中位数为7个,付费应用为8个多媒体附录3为bct在应用程序中的分布曲线图)。

图2显示了常见BCT组的频率。“反馈和监控”组是最常见的,92.3%的应用程序包含至少一个该组的btc,最常见的是“行为反馈”和“行为结果反馈”btc。“目标和计划”(“目标设定”和“行动计划”)也占84.6%。超过一半的应用程序包含来自“行为比较”组的btc(66.2%),其中最有可能是“行为演示”(见图3查看应用程序功能的示例,其中包括来自最常见的BCT组的BCT)。“社会支持”组(64.6%)、“塑造知识”组(60%)和“协会”组(46.2%)是常见的,但每个组只有一个BCT。“奖励和威胁”组(53.8%)仅在两个btc(“社会奖励”和“非特异性激励”)中常见。其他BCT组很少:不到15%的应用程序包含来自“结果比较”组的BCT;“自然后果”和“前件”分别占全部btc的10.8%和6.2%。其余的BCT组在PA应用程序中不存在。多媒体附录4显示各组btc中单个btc的频率(显示至少五个应用程序中发生的btc)。

应用开发和评估过程的质量

只有一个应用程序与非商业机构有联系,一个你跑到5公里,由英国公共卫生部制定(见表6)。没有一款应用在开发过程中报告用户参与。65款应用(4款免费,8款付费)中有12款在设计应用内容时咨询了专家。23款免费应用中有9款(28.1%)在同行评议期刊上发表了与应用相关的研究。相比之下,只有3款付费应用(9.1%)获得了同行评议。

积极的体验

用户评分

在iTunes中,b谷歌Play的用户评分中值分别为4.4和4.5,免费应用和付费应用在这两个应用商店中的评分并无差异表7)。

在这两个商店中,第25百分位的评分都在4星左右(游戏邦注:在iTunes中是4.0星,在b谷歌Play中是4.4星),这表明这些游戏的用户评分较高,只有25%的评分低于4星。两家商店的星级直方图(图4)表示星型平均分布的偏性。

可用性

免费和付费应用的平均SUS得分相似,中位数为86.3表8)。使用班戈等人提出的描述符[43],分数可以用“优秀”来形容。50%的平均SUS得分介于75.0和92.5之间,25%的得分高于92.5,这表明超过75%的应用样本可以被描述为具有“良好”到“优秀”的可用性。看到多媒体附录5为两个评论者之间的平均SUS分数的分布图。

图2。行为改变技术(BCT)与体育活动(PA)应用程序相结合的频率,由BCT小组提出。
查看此图
图3。最常见的行为改变技术(BCT)来自最常见的BCT组的例子:(1)目标和计划:1.1目标设定(行为),(2)反馈和监控:2.2对行为的反馈,(3)行为的比较:6.1行为的演示。
查看此图
表6所示。应用程序开发和评估过程质量的描述性数据:组织隶属关系,专家和用户参与,以及同行评审期刊的评估证据。
应用开发和评估过程的质量 游离(N=32), N (%) 支付(N=33), N (%) 合计(N=65), N (%) P价值
任何联系




商业 31 (96) 33 (100) 64 (98)
政府机构 1 (3) 0 (0) 1 (1)
任何专家




没有 28 (87) 25 (75) 53 (81)
是的 4 (12) 8 (24) 12 (18)
任何用户参与




没有 32 (100) 33 (100) 65 (100)
任何同行期刊




没有 23 (71) 30 (90) 53 (81) 06
是的 9 (28) 3 (9) 12 (18)
表7所示。在iTunes和谷歌Play中用户评分(1-5星)的描述性统计。
用户评分 免费的 支付 总计 P价值
iTunes (N = 21) (N = 24) (N = 45)

意思是(SD) 4.1 (0.8) 4.3 (0.6) 4.2 (0.7) 口径。

中位数 4.4 4.6 4.4

25 - 75百分位 4.0 - -4.6 4.0 - -4.8 4.0 - -4.6

Min-max 2 - 5 3 - 5 2 - 5
谷歌玩 (N = 21) (N = 16) (N = 37)

意思是(SD) 4.4 (0.5) 4.4 (0.3) 4.4 (0.4) .90

中位数 4.5 4.5 4.5

25 - 75百分位 4.4 - -4.6 4.4 - -4.6 4.4 - -4.6

Min-max 2 - 5 4 - 5 2 - 5
图4。分布的用户评级在iTunes和bb0播放。
查看此图
表8所示。系统可用性量表(SUS)评估的描述性数据。
可用性评估 免费(N = 32) 支付(N = 33) 总(N = 65) P价值
SUS得分



意思是(SD) 81.3 (12.6) 85.5 (11.9) 83.4 (12.4)
中位数 85 87.5 86.3
25 - 75百分位 71.9 - -91.3 80.0 - -93.8 75.0 - -92.5
Min-max 53 - 100 58 - 100 53 - 100

主要研究结果

本研究描述了市场上最受欢迎的PA应用程序,重点关注安全性的质量决定因素(数据隐私和安全性),有效性(bct和开发和评估质量),以及提供最积极的体验(用户评级和可用性)。总的来说,我们的研究结果表明,就用户体验而言,样本中的大多数应用程序的质量都是合理的,但在安全性和有效性方面存在重大缺陷。数据隐私和安全评估显示,29.2%的应用程序没有隐私政策。大多数应用程序收集个人身份信息,与第三方共享用户数据,超过一半的应用程序没有说明它们如何确保数据安全。每个应用程序至少包含一个BCT,平均为7个。btc的最大数量为13个,最常见的btc与提供行为反馈有关。除一款应用外,所有应用都有商业关联,12款应用咨询了专家,没有一款应用报告在开发过程中涉及用户。65个应用程序中只有12个有与应用程序相关的同行评议研究,但只有一个应用程序在试验中被评估为有效性[49]。用户评分很高,只有四分之一的评分低于4星。类似地,可用性得分从“好”到“优秀”。免费和付费应用在特征或质量指标上没有统计学上的显著差异。

应用安全

对隐私政策的评估表明,用户数据的隐私性和安全性可以得到实质性的改善。我们的结果与先前评估数据安全性的研究一致。哈克维尔等人[8],他对NHS应用程序库中的应用程序进行了评估,发现20%的应用程序没有隐私政策,大多数应用程序违反了用户的数据隐私和安全。app开发者收集和分析消费者数据对用户来说是有好处的,比如产品的个性化和改进[35]。然而,有关这些做法的信息应该是透明和可理解的[36使潜在用户能够做出明智的决定来下载应用程序。由于应用程序市场规模庞大,有关数据保护的监管监督具有挑战性。因此,确保资料私隐及安全的工作,交由应用程式开发者负责。[50]。

有效可能性

审查中的应用程序平均包含7个bct。这项研究的结果与之前对PA应用程序的评论相似:Middelweerd等[17发现,每个应用程序平均使用了5个bct;Conroy等[16报道了1 - 13例bct,平均值为4.2;另一项使用与本研究相同的BCT分类的研究发现,平均有6.6个BCT [18]。

最常见的BCTs是反馈和监测、目标设定和行动计划。这些自我调节策略已被证明在增加PA行为方面是有效的[5152]。然而,16个BCT组中有9个BCT在评估的应用程序中很少或不存在,存在的BCT占当前BCT分类的14%。

bct数量对干预效果的影响尚无定论。尽管有一些证据表明,在基于网络的干预措施中,更多的bct会产生更大的效应[53],另一些则没有效果[51]。btc最有可能增加行为改变可能性的证据尚不清楚。某些bct在同时出现时可能会产生协同效应,从而更有效[54]。使用各种BCT组,以及BCT组内的技术,理论上可以通过解决PA的各种障碍来提高有效性。例如,在“目标和计划”BCT组中,9个BCT中只有3个得到利用。实现利用其他btc实现目标设定和计划的功能(例如,解决问题的技巧,要求用户致力于他们的目标,并为用户提供回顾他们目标的机会)可能会增加应用的有效性。

使用证据和理论框架对于制定行为改变干预措施至关重要[55]。COM-B(能力,机会,动机,和行为)行为改变模式[56]使开发人员能够系统地识别目标行为的障碍和促进因素,并选择能够解决这些障碍的干预组件,以增加行为改变的可能性。

结果表明,应用程序开发和评估过程的质量可以得到改善。我们没有发现任何用户参与的证据,而且大多数应用都是商业开发,很少有专家参与。在先前的综述中也发现了类似的结果[2857],而且有证据表明,专家参与可以预测应用下载量[58]。事实上,以用户为中心的设计框架强调了理解潜在用户情境体验的重要性,以及在开发产品和服务时包含多学科技能和观点的重要性。我们的研究结果也支持了之前的研究,即缺乏对市场上应用程序进行科学评估的证据[5960]。我们在同行评议的期刊上只发现了12项与这些应用有关的研究。然而,在一个实用的随机对照试验中,只使用了一个应用程序[49],而且这项研究并不是由应用程序开发人员进行的。

积极的体验

这些应用的可用性很高。同样,用户对PA应用的评分也很高,只有四分之一的评分低于4星。同样,Mendiola等[61发现可用性与一般健康应用样本中的用户评分有关。应用商店中争夺用户的竞争非常激烈,90%的应用在应用商店中没有引起足够的关注,无法出现在应用商店的排名中,因此无法被用户看到,这被称为“应用僵尸”。62]。高质量的图形设计、视觉吸引力和易用性更有可能吸引潜在用户下载和使用应用。然而,这些变量是否与应用的有效性有关尚不清楚。有证据表明,可用性更高的基于网络的干预往往更有效[54]。然而,持续使用应用程序可能意味着参与干预或不健康的依赖[63]。

的优势

本研究的优势包括对样本识别和评估的系统方法。首先,通过筛选两大应用发行平台上的400款应用(包括免费应用和付费应用)来确定应用样本。其次,由2名独立评审员对样本进行识别和评估。第三,评估工具涵盖了质量的各个方面,既包括理论,也包括使用主观(用户评级)和客观(可用性)措施的用户体验。

限制

首先,我们不知道从样本中选择的顶级应用程序的排名算法中包含哪些变量。很可能是使用数据和用户评分构成了排名[26],但也可能包括其他未知变量。其次,不能排除用户评分受到虚假评论影响的可能性。(6465]。然而,如果应用没有达到他们的期望,那么应用的真正用户就会给它打上分数,这篇评论包括了高评分的热门应用(280万)。第三,数据隐私和安全评估仅限于对政策的分析。有证据显示政策声明与应用程序开发商的实际做法不一致[8]。第四,应用开发过程的质量是基于应用商店、应用网站和应用本身提供的信息;因此,如果某些数据在Web上不可用,则可能会丢失它们。最后,通过在科普数据库中搜索应用程序名称来评估应用程序评价的证据。如果标题或摘要中没有应用程序的名称,那么相关的论文就不会被发现。

影响

需要更多的研究来评估是什么预测了更高的用户评分。目前尚不清楚用户喜欢应用程序的哪些功能或特征,并认为这些功能或特征可以有效地提高他们的PA。人们喜欢的东西和更可能有效的东西之间可能存在差异。其次,需要研究如何使用PA应用程序来设计有效的数字工具。关于用户如何将这些应用程序应用到日常生活中,以及增加应用程序使用PA的促进因素和障碍是什么,我们知之甚少。第三,PA app中bct的最优数量仍然是未知的。不同的bct可能更适合不同的交付模式(面对面,基于网络和应用程序),例如,社会支持可能在面对面而不是通过应用程序交付时产生更好的效果。或者,应用程序中对PA的自动监控和反馈可以促进自我调节,可能被认为是比使用日记进行自我监控更有效的方法。

尽管这些应用程序的受欢迎程度很高,但医疗保健专业人员和潜在用户需要意识到个人数据安全性的局限性,以及应用程序改变行为的质量的局限性。目前,还不可能推荐最有效的应用程序,但创建高质量应用程序数据库的尝试正在进行中。例如,国家信息委员会正在开发一种应用程序认证模式,该模式由一个四阶段评估框架组成,旨在建立一个高质量健康应用程序数据库[66]。

结论

这项研究调查了目前市场上最受欢迎的PA应用程序的质量。尽管应用程序的可用性和用户评分很高,但大多数应用程序缺乏对用户个人数据的安全控制,这些应用程序包括有限数量的bct,这些bct主要与行为反馈有关,内容质量和开发过程都不理想。技术的发展和潜在的利润远远超过了对这些应用程序支持PA行为改变能力的研究。市场上有16.5万个应用程序,这意味着大规模健康促进机会的丧失。

致谢

作者要感谢英国伦敦大学学院临床、教育和健康心理学系高级教学研究员Lou Atkins,他为BCT编码提供了咨询。PK是伦敦大学学院的一名博士生,由医学研究委员会资助。

利益冲突

没有宣布。

多媒体附录1

数据隐私和安全评估基于隐私政策的内容。

PDF档案(adobepdf档案),99KB

多媒体附录2

评估应用样本的个人层面数据。

PDF档案(adobepdf档案),649KB

多媒体附录3

bct在PA应用中的分布曲线图。

JPG文件,52KB

多媒体附录4

各组btc中单个btc的频率(显示至少在五个应用程序中发生的btc)。

JPG文件,217KB

多媒体附录5

两个评论者之间的平均SUS分数的分布图。

PDF档案(adobepdf档案),101KB

  1. [3]裴德生BK, Saltin B.运动作为药物-处方运动作为治疗26种不同慢性疾病的证据。体育与医学杂志,2015;25(增刊3):1-72。(CrossRef] [Medline
  2. 王晓明,王晓明,王晓明,等。肿瘤患者治疗前后体育锻炼的临床研究进展[J]。中华临床医学杂志,2005;23(16):3830-3842。(CrossRef] [Medline
  3. Booth FW, Roberts CK, Laye MJ。缺乏运动是引起慢性病的一个主要原因。物理学报,2012;2(2):1143-1211 [j]免费全文] [CrossRef] [Medline
  4. 陈建军,李毅。体育活动对健康的影响:证据、理论与实践。预防医学与公共卫生2013;46(增刊1):S1-S2 [J]免费全文] [CrossRef] [Medline
  5. 王志强,王志强,Ströhle .运动与精神障碍的关系:临床与实验证据。预防医学与公共卫生2013;46(增刊1):S12-S21 [J]免费全文] [CrossRef] [Medline
  6. Hallal PC, Andersen LB, Bull FC, Guthold R, Haskell W, Ekelund U, Lancet Physical Activity Series Working Group。全球身体活动水平:监测进展、缺陷和前景。柳叶刀2012年7月21日;380(9838):247-257。(CrossRef] [Medline
  7. Dzewaltowski DA, estrooks PA,格拉斯哥RE.体育活动行为改变研究的未来:需要什么来改善研究转化为健康促进实践?体育运动科学,2004;32(2):57-63。(Medline
  8. 刘建军,张建军,张建军,等。基于数据集的健康应用程序隐私风险分析。中华医学杂志2015;13:14 14 [j]免费全文] [CrossRef] [Medline
  9. Price M, Yuen EK, Goetter EM, Herbert JD, Forman EM, Acierno R,等。移动健康:一种提供更容易获得、更有效的精神卫生保健的机制。临床心理杂志,2014;21(5):427-436 [j]免费全文] [CrossRef] [Medline
  10. 皮尤互联网。非洲裔美国人和技术使用URL:http://www.pewinternet.org/files/2014/01/African-Americans-and-Technology-Use.pdf[访问日期:2016-05-05][WebCite缓存
  11. 国家统计局,2017。互联网接入-家庭和个人https://www.ons.gov.uk/peoplepopulationandcommunity/householdcharacteristics/homeinternetandsocialmediausage/bulletins/internetaccesshouseholdsandindividuals/2017[2014-10-01访问][WebCite缓存
  12. 格拉斯哥RE,公牛SS,皮耶特JD,斯坦纳JF。互动行为改变技术:对初级保健竞争性需求的部分解决方案。中华预防医学杂志2004年8月27日(增刊):80-87。(CrossRef] [Medline
  13. Research2Guidance。2014.移动健康应用开发者经济学2014http://research2guidance.com/product/mhealth-app-developer-economics-2014/[访问日期:2017-09-25][WebCite缓存
  14. BinDhim NF, Hawkey A, Trevena L.智能手机健康应用质量评估方法的系统回顾。中国电子卫生杂志2015;21(2):97-104。(CrossRef] [Medline
  15. Direito A, carrarada E, Rawstorn J, Whittaker R, Maddison R.移动健康技术对身体活动和久坐行为的影响:行为改变技术,系统回顾和随机对照试验的荟萃分析。中国生物医学工程学报,2017,31(2):326 - 326。(CrossRef] [Medline
  16. Conroy DE,杨超,Maher JP。在排名靠前的体育运动移动应用程序中使用行为改变技术。中华预防医学杂志,2014,46(6):649-652。(CrossRef] [Medline
  17. m - delweerd A, Mollee JS, van der Wal CN, Brug J, Te Velde SJ。促进成年人体育锻炼的应用程序:回顾和内容分析。[J]行为与营养物理法案2014;11:97]免费全文] [CrossRef] [Medline
  18. Yang C, Maher JP, Conroy DE.行为改变技术在体育运动移动应用中的实现。中华预防医学杂志,2015;48(4):452-455。(CrossRef] [Medline
  19. Knight E, Stuckey MI, Prapavessis H, Petrella RJ。体育活动的公共健康指南:有这样的应用程序吗?安卓和苹果应用商店综述。移动医疗Uhealth; 2015;3(2):e43 [j]免费全文] [CrossRef] [Medline
  20. 杨建军,杨建军,杨建军。移动电话和web 2.0技术对体重管理的影响。医学互联网研究,2015;17(11):e259 [J]免费全文] [CrossRef] [Medline
  21. 张建军,张建军,张建军,等。手机作为医疗设备在精神障碍治疗中的应用综述。per Ubiquitous computer 2014 Sep 21;19(2):335-353。(CrossRef
  22. Campbell SM, Roland MO, Buetow SA。定义护理质量。中国生物医学工程学报(英文版);2009;31(11):1611-1625。(Medline
  23. 麦克斯韦RJ。卫生质量评估。Br Med J (clinical Res Ed) 1984,12;288(6428):1470-1472 [J]免费全文] [Medline
  24. Donabedian A.护理的质量。如何评估?中华医学杂志,1988;26(12):1249 - 1249。(Medline
  25. 卫生部,2008年。全民高质量护理:NHS下一阶段审查最终报告https://www.gov.uk/government/publications/high-quality-care-for-all-nhs-next-stage-review-final-report[2014-10-01访问][WebCite缓存
  26. 华尔兹·a·蚊子2015年5月27日解析应用商店排名公式:https://moz.com/blog/app-store-rankings-formula-deconstructed-in-5-mad-science-experiments[访问日期:2018-02-15][WebCite缓存
  27. 盈方。2015年有机首页结果价值https://www.infront.com/blogs/the-infront-blog/2015/6/17/value-of-first-page-google-results[访问日期:2017-09-25][WebCite缓存
  28. Chen J, Cade JE, Allman-Farinelli M.最受欢迎的智能手机减肥应用程序:质量评估。[j] .移动医疗;2015;3(4):104 [j]免费全文] [CrossRef] [Medline
  29. Azar KM, Lesser LI, Laing BY, Stephens J, Aurora MS, Burke LE,等。体重管理的移动应用:基于理论的内容分析。预防医学杂志,2013,45(5):583-589。(CrossRef] [Medline
  30. Breton ER, Fuemmeler BF, Abroms LC。减肥-有一个应用程序!但它是否遵循循证实践?中华医学杂志,2011;1(4):523-529 [j]免费全文] [CrossRef] [Medline
  31. Cowan LT, Van Wagenen SA, Brown BA, Hedin RJ, Seino-Stephan Y, Hall PC,等。钢铁般的应用程序:锻炼应用程序是否为消费者提供了现实的期望?:针对存在行为改变理论的运动app内容分析。健康教育行为,2013,40(2):133-139。(CrossRef] [Medline
  32. West JH, Hall PC, Hanson CL, Barnes MD, Giraud-Carrier C, Barrett J.有这样一款应用:付费健康和健身应用的内容分析。中国医学杂志,2012;14(3):e72 [J]免费全文] [CrossRef] [Medline
  33. 信息专员办公室,2013。移动应用中的隐私https://ico.org.uk/media/for-organisations/documents/1596/privacy-in-mobile-apps-dp-guidance.pdf[访问日期:2017-09-25][WebCite缓存
  34. 网络信任联盟。2014。手机应用隐私与安全https://otalliance.org/best-practices/mobile-app-privacy-security[访问日期:2018-02-14][WebCite缓存
  35. 国家医疗保健卓越研究所。好了。2014年1月2日。行为改变:个人方法https://www.nice.org.uk/guidance/ph49/chapter/What-is-this-guidance-about[2014-10-01访问][WebCite缓存
  36. 李建军,李建军,李建军,等。开发一个框架,用于评估移动医疗应用程序的患者参与度、质量和安全性。Issue Brief (common Fund) 2016 Feb;5:1-11。(Medline
  37. Craig P, Dieppe P, Macintyre S, Michie S, Nazareth I, Petticrew M,医学研究委员会指导。制定和评估复杂干预措施:新的医学研究理事会指南。中国生物医学工程学报,2009;33 (2):391 - 391 [J]免费全文] [Medline
  38. Michie S, Richardson M, Johnston M, Abraham C, Francis J, Hardeman W,等。93种分层聚类技术的行为改变技术分类法(v1):建立行为改变干预措施报告的国际共识。中国生物医学工程学报,2013,31(1):391 - 391。(CrossRef] [Medline
  39. 葛兰D, Garnett C, Brown J, West R, Michie S.行为改变技术在戒酒应用中的应用:内容分析。医学互联网研究,2015;17(5):e118 [J]免费全文] [CrossRef] [Medline
  40. Bardus M, van Beurden SB, Smith JR, Abraham C.对最流行的体重管理商业应用的用户粘性、功能、美学、信息质量和改变技术的回顾和内容分析。国际行为与营养物理法案2016;13(1):35 [J]免费全文] [CrossRef] [Medline
  41. Direito A, Dale LP, Shields E, Dobson R, Whittaker R, Maddison R.体育锻炼和饮食智能手机应用是否包含基于证据的行为改变技术?中华卫生杂志2014;14:6 6 [j]免费全文] [CrossRef] [Medline
  42. 布鲁克·j·赫尔·迈耶特。Reading, UK: Digital Equipment Co Ltd;1986.系统可用性量表(SUS):一种快速而肮脏的系统评估用户信息的方法https://hell.meiert.org/core/pdf/sus.pdf[访问日期:2018-02-15][WebCite缓存
  43. Bangor A, Kortum PT, Miller JT。系统可用性量表的实证评价。[J] .计算机学报,2008;24(6):574-594。(CrossRef
  44. Finstad K.系统可用性量表与非英语母语者。[J]系统工程学报,2006;1(4):185-188。
  45. 使用5年可用性研究数据对PSSUQ进行心理测量评估。[J] .计算机工程学报;2011;14(3):463-488。(CrossRef
  46. 引用本文:张建明。互译者信度:kappa统计。生物化学杂志,2012;22(3):276-282。(CrossRef
  47. Byrt T, J主教,Carlin JB。偏见,流行和kappa。中华流行病学杂志1993;46(5):423-429。(CrossRef
  48. Cunningham M. SAS。2009.不仅仅是卡帕系数:一个充分表征两个评分者之间的评分者可靠性的程序URL:http://support.sas.com/resources/papers/proceedings09/242-2009.pdf[访问日期:2018-02-15][WebCite缓存
  49. 杨建军,杨建军,杨建军,等。应用程序对青少年身体健康的影响:基于amesfit的随机对照研究。医学互联网研究,2015;17(8):e210 [J]免费全文] [CrossRef] [Medline
  50. 韦克斯P,乔兹E。“信任但要核实”——确保医疗应用安全的五种方法。中华医学杂志2015;13:05 [j]免费全文] [CrossRef] [Medline
  51. 杨建军,杨建军,刘建军,刘建军。健康饮食与运动干预的meta回归分析。心理健康杂志2009;28(6):690-701。(CrossRef] [Medline
  52. 皮尔森。目标设定作为超重和肥胖成人的健康行为改变策略:一项检查干预成分的系统文献综述。中华医学杂志;2012;87(1):32-42。(CrossRef] [Medline
  53. Webb TL, Joseph J, Yardley L, Michie S.利用互联网促进健康行为改变:理论基础、行为改变技术使用和交付方式对疗效影响的系统回顾和meta分析。医学信息学报,2010;12(1):1 - 4 [J]免费全文] [CrossRef] [Medline
  54. van Genugten L, Dusseldorp E, Webb TL, van Empelen EP。在基于互联网的干预措施中,哪些技术和提供模式的组合有效地改变了健康行为?一个荟萃分析。医学互联网研究,2016;18(6):e155 [J]免费全文] [CrossRef] [Medline
  55. 格兰仕K,毕晓普DB。行为科学理论在发展和实施公共卫生干预措施中的作用。公共卫生杂志2010年3月31日:399-418。(CrossRef] [Medline
  56. Michie S, van Stralen MM, West R.行为改变轮:一种描述和设计行为改变干预的新方法。实施科学,2011;6:42 [免费全文] [CrossRef] [Medline
  57. 苏希英,刘建军,刘建军,刘建军,等。移动医疗应用程序中专家参与和医学证据依从性的系统评价。JMIR Mhealth Uhealth 2015年7月27日;3(3):e79 [j]免费全文] [CrossRef] [Medline
  58. Pereira-Azevedo N, Osório L, Cavadas V, Fraga A, Carrasquinho E, Cardoso de Oliveira E,等。专家参与预测移动健康应用下载:泌尿科应用的多元回归分析。[j] .移动医疗;2016;4(3):e86 [j]免费全文] [CrossRef] [Medline
  59. Martínez-Pérez B, de la Torre-Díez I, López-Coronado M.世界卫生组织针对最普遍病症的移动保健应用程序:审查和分析。中国医学杂志,2013;15(6):e120 [J]免费全文] [CrossRef] [Medline
  60. Modave F, bianj, Leavitt T, Bromwell J, Harris IC, Vincent H.相对于美国运动医学学院指南的低质量免费教练应用程序:对当前移动应用程序的回顾。移动医疗Uhealth; 2015;3(3):e77 [j]免费全文] [CrossRef] [Medline
  61. 孟德华,陈晓明,李晓明。移动医疗应用的应用价值分析:应用内容分析和用户评价。JMIR移动健康Uhealth 2015年5月13日;3(2):e40 [j]免费全文] [CrossRef] [Medline
  62. 2016年调整。。《僵尸起义》:2016年App Store中的不死族https://www.adjust.com/resources/insights/app-zombies-2016/[访问日期:2018-02-14][WebCite缓存
  63. 杨建军,李建军,李建军,刘建军,等。理解并促进有效参与数字行为改变干预措施。中华预防医学杂志,2016,11(5):833-842。(CrossRef] [Medline
  64. AppAware:哪些手机应用最热门?2010年9月发表于:第十二届移动设备服务人机交互国际会议论文集;2010;葡萄牙里斯本。
  65. 与信任智能手机应用程序?安装还是不安装,这是一个问题。2013年2月发表于2013 IEEE国际多学科会议:态势感知和决策支持的认知方法(CogSIMA);2013;圣地亚哥,加州,美国。(CrossRef
  66. Gov.uk。个性化医疗保健2020:工作流程1.2路线图。让我做出正确的健康和护理选择。为公民提供一套经过评估的NHS和社会护理“应用程序”。https://www.gov.uk/government/uploads/system/uploads/attachment_data/file/433170/NIB_WS_1_2.pdf[访问日期:2017-09-25][WebCite缓存


旅级战斗队:行为改变技巧
健康:移动健康
国民健康保险制度:国民保健制度
PA:体育活动
PABAK:患病率调整偏差调整kappa
个随机对照试验:随机对照试验
SUS:系统可用性量表


G·艾森巴赫编辑;提交05.10.17;J Lumsden, H Atherton同行评审;对作者25.10.17的评论;修订版收到23.11.17;接受23.11.17;发表21.03.18

版权

©Paulina Bondaronek, Ghadah Alkhaldi, April Slee, Fiona L Hamilton, Elizabeth Murray。最初发表于JMIR Mhealth和Uhealth (http://mhealth.www.mybigtv.com), 2018年3月21日。

这是一篇在知识共享署名许可(https://creativecommons.org/licenses/by/4.0/)下发布的开放获取文章,该许可允许在任何媒介上不受限制地使用、分发和复制,前提是原始作品首先发表在JMIR mhealth和uhealth上,并适当引用。必须包括完整的书目信息,到http://mhealth.www.mybigtv.com/上原始出版物的链接,以及版权和许可信息。


Baidu
map