这是一篇在知识共享署名许可(https://creativecommons.org/licenses/by/4.0/)条款下发布的开放获取文章,该许可允许在任何媒体上不受限制地使用、分发和复制,前提是原始作品首次发表在JMIR Formative Research上,并适当引用。必须包括完整的书目信息,到https://formative.www.mybigtv.com上原始出版物的链接,以及版权和许可信息。
智能手机越来越多地用于健康研究。它们为参与者和研究人员之间提供了持续的联系,以监测大量人口的长期健康轨迹,而成本只是传统研究的一小部分。然而,尽管在远程研究中使用智能手机具有潜力,但迫切需要制定有效的战略,以具有代表性和公平的方式接触、招募和留住目标人群。
我们的目的是调查在远程研究中使用不同的招聘和激励分配方法对队列特征和长期保留的影响。还评估了影响主动和被动数据收集的现实因素。
我们使用一项大型远程观察研究的数据对参与者招募和保留进行了二次数据分析,旨在了解与感冒、流感和创伤性脑损伤对日常功能的影响相关的现实因素。我们在2020年3月15日至2022年1月4日分两个阶段进行招聘。在美国招募了超过10,000名智能手机用户,提供为期12周的每日调查和基于智能手机的被动感知数据。利用多元统计,我们调查了不同的招聘和激励分配方法对队列特征的潜在影响。生存分析用于评估社会人口学特征对两个招募阶段参与者留存率的影响。使用逻辑回归评估被动数据共享模式与队列人口统计学特征之间的关联。
我们分析了从1万名参与者那里收集的33万多天的参与数据。我们的主要发现如下:首先,使用社交媒体和新闻媒体上的数字广告招募的参与者的总体特征与使用众包平台(多产和亚马逊机械土耳其;
我们的研究结果强调了几个因素,如招聘平台、激励分配频率、基线调查的时间、设备异质性和数据收集基础设施中的技术故障,这些因素可能会影响远程长期数据收集。将这些实证研究结果结合在一起,有助于为监测现实世界数据收集过程中的异常情况以及以具有代表性和公平的方式招募和留住目标人群提供最佳实践。
智能手机为研究人员提供了一种前所未有的随时随地的媒介,使他们能够参与并评估现实世界中大量人群的健康行为[
使用智能手机进行卫生研究还可以通过减少对传统研究设施或数据收集中介机构的依赖来帮助实现操作效率,因为这需要研究参与者和研究团队之间的亲自接触[
然而,尽管下放了保健研究的希望,但与征聘和保留目标人口的代表性和包容性有关的一些挑战已经浮出水面[
由于大型研究使用多种基于网络的资源来远程接触和招募参与者,因此有必要评估此类策略对已登记队列的特征及其在研究中的保留率的影响。此外,还需要进一步的研究来了解研究参与动机的差异(例如,支付的时间和频率)以及Android和iOS操作系统之间的差异[
为了调查在现实环境中通过智能手机收集健康数据的一些挑战,我们在一项大型分散研究中检查了10,000多名参与者的招募、保留和被动数据共享模式。具体而言,我们评估了以下三个关键问题:(1)结合不同的招聘和激励分配方法是否会导致具有不同特征的异质队列?(2)远程研究的参与者保留率和数据收集的均匀性是否会受到队列异质性的影响?(3)在现实环境中,哪些因素会影响被动数据收集?
本研究由华盛顿大学机构审查委员会(STUDY00004997)和国防部人类研究保护办公室批准和监督;该研究于2020年2月11日获得批准。
“战士分析使用智能手机促进健康”(WASH)研究的参与者是居住在美国的志愿者,他们同意参与一项为期12周的基于智能手机的研究。该研究的主要目标是了解有助于早期预测感冒、流感和创伤性脑损伤对日常功能影响的现实因素。符合条件的参与者为年龄≥19岁的个人、英语使用者、美国居民、iPhone或Android智能手机的所有者和主要上网用户。潜在的参与者在同意之前需要完成资格筛选,不符合纳入标准的参与者不允许完成后续程序。
参与者招募于2020年3月15日开始,滚动招生至2022年1月4日。研究人员分两个阶段招募参与者,采用不同的招聘和激励分配方法(
(A)第一阶段和第二阶段不同的研究招募和参与激励分配方式示意图。在第一阶段招募的参与者在研究的第一天开始每周(12次)支付报酬。任何在2020年10月3日之前参加的人(在招聘暂停日期附近招募的人)仍然会收到每周的报酬。在第二阶段招募的参与者从研究的第一天开始,每3周(共4次)支付一次报酬。(B)研究观察期间(84天)通过学习app收集的基于智能手机的主动和被动数据详细情况。*表示加速计和陀螺仪在2020年8月28日强制共享。
参与者主要是通过在社交媒体平台上投放广告来招募的,这些广告将潜在的参与者引导到一个研究招募网站。当地新闻媒体的新闻稿也成为招聘的来源[
在实施了额外的策略来阻止欺诈性的加入研究之后,招募于2020年8月30日恢复,例如禁止在研究应用程序中自动填写调查问卷,改变招聘来源,改变奖励支付频率[
评估分为1个较长的基线调查和简短的每日评估。基线调查评估了参与者的健康史、情绪、身体活动和手机使用情况,在获得第一阶段研究的同意后24小时进行。然而,在第2阶段,在征得同意后立即进行基线健康调查。在这两个阶段,参与者在12周内每天进行两次与健康相关的调查。调查询问了参与者的情绪、身体活动和手机使用情况。
通过研究应用程序主动和被动地从参与者那里收集基于传感器的数据。参与者完成了绩效结果测量[
从参与者那里收集的所有数据都是不确定的。通过该应用程序收集的数据在手机上进行了加密,并存储在安全的服务器上,与任何可识别的信息分开。原始数据,如图像、接近度、声音和参与者的实际位置数据,与所有其他传感器数据分开存储,不与研究团队共享。在本研究中,从研究启动日期(2020年3月15日)到数据冻结日期(2022年2月9日)之间的入组参与者的数据用于分析。
在分析之前,根据Bracken等人在研究中定义的标记恶意行为者的规则,对6788个可疑恶意行为者的数据进行了删除[
为了调查参与者在研究中的留存率,我们将研究应用程序收集的数据分为两大类:(1)调查数据,表示参与者通过研究应用共享的任何主动调查数据;(2)传感器数据,表示研究应用在没有参与者主动输入的情况下收集的被动连续传感器数据,以及在性能结果评估期间收集的主动传感器数据(例如,从加速度计和陀螺仪收集的行走测试数据)。
从数据集中排除6788名恶意行为者(6788/17,556,38.66%)后,使用10,768名参与者的数据进行统计分析。分类变量的招募和队列特征的描述性分析基于频率和百分比。为减少分析中的数据稀疏性,将包含<5%队列的分类基线变量水平省略或与包含<5%队列的其他水平合并。我们使用第25和75百分位(IQR)的中位数来总结非正态分布的连续变量。采用双变量分析方法比较队列特征的差异。用卡方检验检验分类变量间的差异有统计学意义;当表细胞计数<5时采用Fisher精确检验,Mann-Whitney精确检验
我们调整
为了检查研究中的总体保留情况,我们使用了单变量Kaplan-Meier生存曲线[
为了评估包括社会人口统计在内的多个感兴趣变量对研究中参与者保留的联合影响,我们最初使用了多变量Cox比例风险(CoxPH)模型[
截至数据冻结日期(2022年2月9日),该研究招募了10768名参与者。大多数参与者(6494/10,768,60.3%)在第一阶段招募,其余参与者(4274/10,768,39.69%)在第二阶段招募(见方法部分)。相当大比例的参与者,尤其是在第一阶段,没有完成基线调查(第1阶段:3135/6494,48.27%,第2阶段:918/4274,21.47%)。
在研究期间招募的参与者数量(黑色)和完成的基线调查数量(红色)之间的7天移动平均线的比较。灰色阴影区域为2020年7月11日至2020年8月29日的研究招募暂停阶段。
完成基线社会人口调查的参与者以女性居多(3817/6574,58.06%)。中位年龄为30 (IQR 24-40)岁,其中19 - 29岁的参与者比例较大(2949/6267,47.05%)。非西班牙裔白人人口最多(3938/6677,58.97%),其次是亚洲人(931/6677,13.94%)和西班牙裔或拉丁裔(783/6677,11.72%)。大多数参与者是iOS用户(5883/ 105883,55.58%)。
在第二阶段招募的人群中,年轻人的比例更高(19至29岁;1685/3194, 52.75%),老年人(≥60岁;94/3194, 2.94%)较第一阶段招募的人数(
整个研究队列的特征(N=10,768)以及在第一阶段(N= 6494)和第二阶段(N= 4274)招募的参与者的比较。
|
整体人群 | 在第一阶段招募的参与者 | 在第二阶段招募的参与者 | 检验统计量卡方( |
|
|
|
6267 (58.21) | 3073 (47.32) | 3194 (74.73) | 235.29 (4) | <措施 | |
|
19-29 | 2949 (47.05) | 1264 (41.14) | 1685 (52.8) | - - - - - -一个 | - - - - - - |
|
- 39 | 1637 (26.12) | 739 (24) | 898 (28.11) | - - - - - - | - - - - - - |
|
40至49 | 804 (12.82) | 459 (14.9) | 345 (10.8) | - - - - - - | - - - - - - |
|
50-59 | 490 (7.81) | 318 (10.3) | 172 (5.4) | - - - - - - | - - - - - - |
|
≥60 | 387 (6.37) | 293 (9.51) | 94 (2.96) | - - - - - - | - - - - - - |
|
丢失和无效数据b | 4501 | 3421 | 1080 | - - - - - - | - - - - - - |
|
6574 (61.13) | 3304 (50.92) | 3270 (76.54) | 15.25 (1) | <措施 | |
|
女 | 3817 (58.11) | 1997 (60.41) | 1820 (55.73) | - - - - - - | - - - - - - |
|
男性 | 2757 (41.9) | 1307 (39.64) | 1450 (44.37) | - - - - - - | - - - - - - |
|
丢失和无效数据b | 4194 | 3190 | 1004 | - - - - - - | - - - - - - |
|
6681 (62.03) | 3342 (51.57) | 3339 (78.15) | 101.02 (4) | <措施 | |
|
非西班牙裔白人 | 3938 (58.95) | 1953 (58.44) | 1985 (59.41) | - - - - - - | - - - - - - |
|
亚洲 | 931 (13.93) | 487 (14.67) | 444 (13.32) | - - - - - - | - - - - - - |
|
西班牙裔,拉丁裔或西班牙裔 | 783 (11.72) | 424 (12.75) | 359 (10.81) | - - - - - - | - - - - - - |
|
黑人或非裔美国人 | 723 (10.82) | 267 (8.02) | 456 (13.77) | - - - - - - | - - - - - - |
|
其他 | 306 (4.61) | 211 (6.32) | 95 (2.85) | - - - - - - | - - - - - - |
|
丢失和无效数据b | 4087 | 3152 | 935 | - - - - - - | - - - - - - |
|
6681 (62.03) | 3341 (51.42) | 3341 (78.21) | 134.02 (3) | <措施 | |
|
单 | 3312 (49.65) | 1439 (43.14) | 1873 (56.13) | - - - - - - | - - - - - - |
|
已婚的已婚或同居的 | 2821 (42.22) | 1549 (46.47) | 1273 (38.12) | - - - - - - | - - - - - - |
|
离婚了 | 410 (6.11) | 275 (8.28) | 135 (4.03) | - - - - - - | - - - - - - |
|
其他 | 138 (2.16) | 78 (2.39) | 60 (1.81) | - - - - - - | - - - - - - |
|
丢失和无效数据b | 4087 | 3153 | 933 | - - - - - - | - - - - - - |
|
5793 (53.85) | 2483 (38.24) | 3310 (77.47) | 245.48 (4) | <措施 | |
|
< 25000 | 1736 (30.05) | 599 (24.11) | 1137 (34.42) | - - - - - - | - - - - - - |
|
25000到49999 | 1268 (21.91) | 463 (18.64) | 805 (24.33) | - - - - - - | - - - - - - |
|
50,000到74,999 | 886 (15.37) | 349 (14.15) | 537 (16.21) | - - - - - - | - - - - - - |
|
75000到99999 | 710 (12.33) | 343 (13.85) | 367 (11.14) | - - - - - - | - - - - - - |
|
≥100000 | 1193 (20.62) | 729 (29.41) | 464 (14.05) | - - - - - - | - - - - - - |
|
丢失和无效数据b | 4975 | 4011 | 964 | - - - - - - | - - - - - - |
|
6677 (62.04) | 3340 (51.43) | 3337 (78.11) | 35.34 (2) | <措施 | |
|
高中或以下学历 | 868 (13.09) | 448 (13.41) | 420 (12.65) | - - - - - - | - - - - - - |
|
大学 | 3881 (58.16) | 1827 (54.71) | 2054 (61.62) | - - - - - - | - - - - - - |
|
研究生院 | 1928 (28.91) | 1065 (31.94) | 863 (25.93) | - - - - - - | - - - - - - |
|
丢失和无效数据b | 4091 | 3154 | 937 | - - - - - - | - - - - - - |
一个不可用。
b该比例基于完成基线调查的参与者人数,缺失和无效的数据在
研究应用程序被动收集的数据模式数量在Android(31种数据模式)和iOS(14种数据模式)操作系统中有所不同。Android和iOS设备上可用的被动数据模式数量的差异是由于两种操作系统上可用的机载传感器和数据收集限制[
此外,在Android和iOS设备之间共有的8个被动数据流中,参与者的被动数据共享与社会人口统计学特征和设备类型有关。总共测试了3种数据共享模式,参与者共享至少2(25%),4(50%)或6(75%)的8个被动数据流。在所有3种数据共享模式中,黑人或非裔美国人参与者被发现在统计学上显著低于非西班牙裔白人参与者共享被动传感器数据的可能性(优势比[or] 0.44-0.49, 95% CI 0.35-0.61;
在“战士分析使用智能手机促进健康”研究中,比较个体社会人口变量对参与者(以天为单位)的中位数留存率(95% CI)的影响。
|
第一阶段 | 第二阶段 | |||||||||
|
保留率中位数(95% CI) |
|
保留率中位数(95% CI) |
|
|||||||
|
37 (37-37) | <措施 | 51(调查) | <措施 | |||||||
|
被动 | 37 (37-37) |
|
44 (43-46) |
|
||||||
|
活跃的 | 36 (36-36) |
|
47 (44-49) |
|
||||||
|
<措施 |
|
<措施 | ||||||||
|
是的 | 36 (36 - 37) |
|
59 (57 - 62) |
|
||||||
|
没有 | 37 (37-38) |
|
19日(24) |
|
||||||
|
. 01 |
|
<措施 | ||||||||
|
19-29 | 36 (34-37) |
|
59 (55 - 63) |
|
||||||
|
- 39 | 36 (34-37) |
|
59 (53 - 64) |
|
||||||
|
40至49 | 37 (36-38) |
|
60 (50 - 66) |
|
||||||
|
50-59 | 37 (37-38) |
|
69年(61 - 79) |
|
||||||
|
≥60 | 38 (37-38) |
|
83 (78 - n / A一个) |
|
||||||
|
<措施 |
|
50 | ||||||||
|
亚洲 | 39 (38-49) |
|
60 (54 - 69) |
|
||||||
|
黑人或非裔美国人 | 6(十) |
|
68年(63 - 72) |
|
||||||
|
西班牙裔,拉丁裔或西班牙裔 | 20 (14-25) |
|
58 (50 - 65) |
|
||||||
|
非西班牙裔白人 | 37 (37-38) |
|
57 (54 - 61) |
|
||||||
|
其他 | 5 (3 - 17) |
|
55 (35 - 67) |
|
||||||
|
<措施 |
|
56 | ||||||||
|
< 25000 | 37 (36-38) |
|
61 (56 - 65) |
|
||||||
|
25000到49999 | 34 (31-36) |
|
60 (55 - 66) |
|
||||||
|
50,000到74,999 | 36 (33-37) |
|
62 (56 - 68) |
|
||||||
|
75000到99999 | 24 (19-30) |
|
55 (49 - 64) |
|
||||||
|
> 100000 | 24 (19-30) |
|
55 (50 - 61) |
|
||||||
|
<措施 |
|
措施 | ||||||||
|
高中或以下学历 | 5(十) |
|
50 (46-56) |
|
||||||
|
大学 | 38 (37-38) |
|
60 (57 - 64) |
|
||||||
|
研究生院 | 36第35 - 37 () |
|
62 (57 - 67) |
|
||||||
|
<措施 |
|
<措施 | ||||||||
|
安卓 | 22 (17- 27) |
|
59.5 (56 - 63) |
|
||||||
|
iOS | 37 (37-37) |
|
49(46 - 52点) |
|
一个N/A:不可用。
在84天的研究观察期内,整个队列的中位滞留时间为38天。在主动(中位37天)和被动(中位38天)数据流(
在第一阶段和第二阶段招募的人员中,保留率存在显著差异。在第二阶段招募的参与者的中位数保留时间(+14天)明显高于第一阶段招募的参与者(第一阶段:中位数37天;第二阶段:中位51天;
值得注意的是,某些特征,包括社会经济因素,明显影响了在第一阶段和第二阶段招募的参与者的保留率(
使用Kaplan-Meier生存曲线研究两个招聘阶段的留存模式。(A)-(B)按主动(紫色)、被动(橙色)和总体(即主动或被动)分层的队列保留;(蓝色)数据流。(C)-(D)完成基线调查后的保留差异;(E)-(F)年龄组,(G)-(H)种族或民族,(I)-(J)收入水平,(K)-(L)教育水平。阴影区域显示了基于生存模型拟合的95% ci。
我们分析了来自1万多名参与者的33万多天的敬业度数据,结果表明,结合不同的招聘和激励分配方法可以产生异质队列。据我们所知,这是第一个实证评估参与者使用自带设备(BYOD)方法分享从iOS和Android设备收集的多模式被动数据的现实差异的研究之一。
总的来说,有5个关键的教训。首先,使用不同的媒体招募参与者,例如,在社交媒体和基于网络的报纸或众包平台上的数字广告,可能会导致具有不同特征的异质子队列。其次,参与者的参与度可能会因招聘来源(如社交媒体与众包平台)和激励分配方法的不同而有很大差异。第三,被动数据收集可能会受到Android和iOS设备的技术变化以及人群的社会人口统计数据的影响。第四,如果参与者在同意或登记后立即进行管理,他们完成基线健康调查的可能性更大。第五,在研究层面监测真实世界数据收集的模式可以揭示技术故障,有助于指导上下文数据过滤和队列选择,从而产生更可靠的证据。我们现在将我们的主要研究结果置于背景中,为招募、保留和监测远程数据收集趋势的战略提供信息,以帮助以具有代表性和公平的方式收集真实世界的健康数据。
从基于网络的社交媒体和报纸广告(第一阶段)与众包平台(第二阶段)招募的参与者的人口统计学和社会经济特征之间存在显著差异。这表明,结合多个基于网络的招聘来源可能产生异质队列,导致数据收集不统一。未来的远程研究应评估结合通过不同招募媒体招募的参与者获得的真实世界数据的潜在影响。此外,在第一阶段,基于网络的基于广告的公开招生方法虽然成功地迅速招募了一大群人,但也导致了很大比例的不良行为者加入研究以获得金钱奖励[
通过增加参与者获得报酬的间隔时间,我们观察到在第二阶段加入研究的恶意行为者数量显著减少。此外,在保持奖励总额不变的情况下,每周获得较少报酬的参与者(第一阶段)在研究中的持续时间明显短于每三周获得较多报酬的参与者(第二阶段)。尽管第二阶段较高的留存率不能完全归因于奖励分配的变化(因为缺乏随机化),但它表明了一个潜在的有趣的行为经济学模型[
对日常研究水平数据的评估揭示了几种模式,表明数据收集中存在短暂的技术故障,如果不加以解决,可能会影响下游证据的生成。首先,在第一阶段观察到基线调查完成率的相对入组率显著下降(
从参与者自己的设备收集的被动数据显示,Android和iOS设备上可用的机载传感器差异很大。即使对于Android和iOS设备上可用的常见被动数据流,与参与者的社会人口统计学特征和设备类型相关的多个被动数据流的共享也可能存在实质性差异。例如,在这项研究中,黑人或非裔美国人明显不太可能共享多模态被动传感器数据(
年龄较大的参与者(≥60岁)被保留在研究中最长的时间。这一发现与之前的一项大型交叉研究相一致[
此外,美国的人口构成正变得越来越多民族和多元化,预计到2060年将没有占多数的种族或族裔群体[
审计业务数据显示,进行基线调查的时间可能与调查完成率有关。两期基线调查缺失率差异显著(一期:3135/6494,48.27%;二期:918/4274,22.47%;
对来自WASH研究的参与者招募和保留数据的分析应在一定局限性的背景下进行解释。首先,在美国宣布COVID-19大流行之前开始了大规模、完全远程的数据收集,众所周知,这改变了我们的行为以及与技术和设备的互动[
Schoenfeld检验的检验统计量用于评估Cox比例风险模型假设。
缺少数据分析。
使用智能手机促进健康的战士分析(WASH)研究参与者的社会人口特征,按设备拥有量(iOS和Android)分层。
在两个研究阶段中,按设备类型(Android和iOS)共享传感器数据的参与者比例。*强制共享的传感器类型。**在Android设备上共享数据需要权限。
logistic回归模型的比值比和95% ci显示了参与者的社会人口学特征与被动数据共享之间的关联。3个独立的模型使用Android和iOS设备之间常见的8个被动数据流中的2(25%)、4(50%)和6(75%)来比较被动数据共享模式的结果如下所示。*
使用智能手机促进健康的作战人员分析(WASH)研究中的总体参与者留存率。
通过延长观察窗(84天)2周对参与者保留度的敏感性分析。
额外的生存曲线。
学习App数据收集模式。
自带设备
考克斯比例危险
亚马逊土耳其机器人
优势比
战士分析使用智能手机的健康
本研究的数据由SC1712603资助
作者感谢所有研究参与者在研究中的时间,并为研究目的分享他们的数据。作者还要感谢Calvin Herd帮助下载了研究参与数据,感谢Aditi Surendra校对了手稿并帮助设计了研究数据收集插图。
FJ得到了美国国家老龄研究所(K76AG064390)的资助,并获得了马萨诸塞州总医院Benson-Henry身心医学研究所的酬金和马萨诸塞州总医院临床试验网络研究所的工资支持,该研究所接受了美国国立卫生研究院和制药公司的资助。SXL, RS, RH和AP部分由成瘾和心理健康发现基金中心和加拿大Krembil基金会资助。
本研究中使用的个人层面的业务数据将在通讯作者提出合理要求后提供。用于数据加载和分析的完整代码可通过开源GitHub代码存储库获得[
在这篇论文被接受发表时,Biogen雇佣了AP。然而,所有的分析、论文写作和首次提交都是在AP加入Biogen之前完成的。