发表在gydF4y2Ba在gydF4y2Ba24卷gydF4y2Ba7号gydF4y2Ba(2022)gydF4y2Ba: 7月gydF4y2Ba

本文的预印本(早期版本)可在gydF4y2Bahttps://preprints.www.mybigtv.com/preprint/34669gydF4y2Ba,首次出版gydF4y2Ba。gydF4y2Ba
来自消费者可穿戴设备的高分辨率数字表型及其在心脏代谢风险标志物机器学习中的应用:队列研究gydF4y2Ba

来自消费者可穿戴设备的高分辨率数字表型及其在心脏代谢风险标志物机器学习中的应用:队列研究gydF4y2Ba

来自消费者可穿戴设备的高分辨率数字表型及其在心脏代谢风险标志物机器学习中的应用:队列研究gydF4y2Ba

原始论文gydF4y2Ba

1gydF4y2Ba新加坡科学技术研究局信息通信研究所(A*STAR),新加坡,新加坡gydF4y2Ba

2gydF4y2BaSingHealth Duke-NUS精密医学研究所,新加坡,新加坡gydF4y2Ba

3.gydF4y2Ba新加坡国立大学基因组医学中心,新加坡,新加坡gydF4y2Ba

4gydF4y2Ba杜克-新加坡国立大学医学院心血管和代谢紊乱项目,新加坡,新加坡gydF4y2Ba

5gydF4y2Ba新加坡国立心脏中心心脏病科,新加坡,新加坡gydF4y2Ba

6gydF4y2Ba杜克-新加坡国立大学医学院,新加坡gydF4y2Ba

7gydF4y2Ba癌症和干细胞生物学项目,杜克-新加坡国立大学医学院,新加坡,新加坡gydF4y2Ba

8gydF4y2Ba新加坡国立大学新加坡癌症研究所,新加坡,新加坡gydF4y2Ba

9gydF4y2Ba新加坡科学技术与研究局基因组研究所(A*STAR),新加坡,新加坡gydF4y2Ba

这些作者的贡献相同gydF4y2Ba

通讯作者:gydF4y2Ba

Pavitra Krishnaswamy博士gydF4y2Ba

信息通信研究所gydF4y2Ba

美国科学技术研究局(A*STAR)gydF4y2Ba

1 Fusionopolis Way, 21-01号gydF4y2Ba

联络中心(南塔)gydF4y2Ba

新加坡,138632年gydF4y2Ba

新加坡gydF4y2Ba

电话:65 64082450gydF4y2Ba

电子邮件:gydF4y2Bapavitrak@i2r.a-star.edu.sggydF4y2Ba


背景:gydF4y2Ba消费级可穿戴设备可以在自由生活的条件下详细记录心率和步数。最近的研究表明,这些可穿戴记录的汇总统计数据在健康和疾病状态的纵向监测方面具有潜在的用途。然而,可穿戴设备的高分辨率生理动态与已知的健康和疾病标志物之间的关系在很大程度上仍未确定。gydF4y2Ba

摘要目的:gydF4y2Ba我们的目标是从可穿戴设备记录中获得高分辨率的数字表型,并研究它们与心脏代谢疾病风险的可改变和固有标记的关联。gydF4y2Ba

方法:gydF4y2Ba我们引入了一个原则框架,从自由生活条件下记录的可穿戴数据中提取可解释的高分辨率表型。建议的架构规范处理资料违规行为;在任何给定时间编码有关潜在生理状态的上下文信息;并生成一组66个最小冗余的功能,涵盖活动、久坐和睡眠状态。我们将我们的方法应用于SingHEART研究(NCT02791152)的多模态数据集,其中包括来自可穿戴设备的心率和步数时间序列、临床筛查概况和来自692名健康志愿者的全基因组序列。我们使用机器学习来模拟高分辨率表型与血压、血脂、体重和血糖异常的临床或基因组风险标记之间的非线性关系。对于每种风险类型,我们基于Brier评分进行了模型比较,以评估高分辨率特征在典型基线之上和之外的预测价值。我们还定性地描述了实现临床事件的参与者的可穿戴表型。gydF4y2Ba

结果:gydF4y2Ba我们发现高分辨率特征对心脏代谢疾病风险临床标志物的预测价值高于典型基线:基于高分辨率特征的最佳模型比基于年龄、性别和静息心率的基线分别提高了17.9%和7.36% (gydF4y2BaPgydF4y2Ba<。每种情况下都是001)。此外,不同活动状态的心率动态包含不同的信息(最大绝对相关系数为0.15)。久坐状态下的心率动态最能预测血脂异常和肥胖,而运动状态下的心率动态最能预测血压异常(gydF4y2BaPgydF4y2Ba<措施)。此外,与标准测量方法相比,可穿戴心率记录的高分辨率模式能够更好地代表与心脏代谢疾病基因组风险相关的微妙生理动态(Brier评分提高11.9%-22.0%;gydF4y2BaPgydF4y2Ba<措施)。最后,说明性案例研究揭示了这些高分辨率表型与实际临床事件之间的联系,即使对于缺乏明显心脏代谢风险标记的边缘概况也是如此。gydF4y2Ba

结论:gydF4y2Ba在自由生活状态下,消费者可穿戴设备记录的高分辨率数字表型有可能增强对心脏代谢疾病风险的预测,并可能实现更主动和个性化的健康管理。gydF4y2Ba

[J] .中国医学信息学报,2010;24(7):369 - 369gydF4y2Ba

doi: 10.2196/34669gydF4y2Ba

关键字gydF4y2Ba



背景gydF4y2Ba

近年来,消费级可穿戴活动追踪器在日常使用中的应用迅速增加,据报道,2019年,美国约有五分之一的成年人定期使用腕戴式智能手表和健身追踪器[gydF4y2Ba1gydF4y2Ba]。这一现象产生了空前规模的消费者健康数据,并导致对这些数据在更广泛的健康用途进行了许多研究。这些研究越来越多地提供证据,揭示可穿戴活动追踪器的记录与心理健康和传染病等疾病风险之间的关系[gydF4y2Ba2gydF4y2Ba,gydF4y2Ba3.gydF4y2Ba]到心血管和代谢(统称为gydF4y2Ba代谢疾病gydF4y2Ba)疾病[gydF4y2Ba4gydF4y2Ba-gydF4y2Ba7gydF4y2Ba]。其中,由于活动水平与心脏代谢健康之间的明显联系,可穿戴设备在更广泛的健康用途方面的证据在心脏代谢领域最为明确[gydF4y2Ba4gydF4y2Ba,gydF4y2Ba8gydF4y2Ba-gydF4y2Ba11gydF4y2Ba]。gydF4y2Ba

先前在心脏代谢领域的研究主要集中在可穿戴式汇总统计的实用性上,并分为两类之一。首先,可穿戴设备的心电图信号与心房颤动等心脏代谢疾病的发展有关[gydF4y2Ba12gydF4y2Ba-gydF4y2Ba14gydF4y2Ba],高钾血症[gydF4y2Ba15gydF4y2Ba,gydF4y2Ba16gydF4y2Ba和心力衰竭[gydF4y2Ba17gydF4y2Ba-gydF4y2Ba19gydF4y2Ba]。由于这些疾病中的许多都可以通过饮食改变或增加体育活动进行早期干预,因此人们也对使用可穿戴设备来提高自我意识和调节感兴趣。gydF4y2Ba20.gydF4y2Ba]及加强甄别[gydF4y2Ba11gydF4y2Ba]。第二,可穿戴设备衍生的测量,如昼夜节律测量、睡眠模式和质量[gydF4y2Ba11gydF4y2Ba,gydF4y2Ba21gydF4y2Ba],步数[gydF4y2Ba4gydF4y2Ba]、可穿戴式静息心率[gydF4y2Ba4gydF4y2Ba,gydF4y2Ba8gydF4y2Ba,gydF4y2Ba10gydF4y2Ba,gydF4y2Ba21gydF4y2Ba,gydF4y2Ba22gydF4y2Ba]和心率变异性[gydF4y2Ba23gydF4y2Ba-gydF4y2Ba27gydF4y2Ba已被发现与心脏代谢疾病的结果相关。因此,临床界越来越认识到将可穿戴设备纳入实际的心脏代谢疾病管理[gydF4y2Ba6gydF4y2Ba,gydF4y2Ba28gydF4y2Ba]。gydF4y2Ba

目标gydF4y2Ba

消费者可穿戴技术的快速和持续发展使自由生活状态下心率,活动和睡眠动态的时间分辨率变得更加丰富[gydF4y2Ba6gydF4y2Ba,gydF4y2Ba29gydF4y2Ba,gydF4y2Ba30.gydF4y2Ba]。对这些数据流的原则分析可以产生新的见解,而不仅仅是对心脏代谢健康和疾病管理的汇总统计措施。然而,分析在自由生活状态下记录的时间序列数据具有挑战性,因为这些数据往往表现出现实世界的噪声和波动,通常缺乏重要的物理和生理背景。最近的一些研究使用黑盒深度神经网络将可穿戴设备记录的高分辨率心率和步数时间序列与发生心房颤动、睡眠呼吸暂停和高血压的风险联系起来[gydF4y2Ba31gydF4y2Ba,gydF4y2Ba32gydF4y2Ba]。由于他们的主要目标集中在风险目标分类上,中间预测时间序列特征的性质及其与已知心脏代谢疾病的临床和生物学标志物的联系仍未得到解决。gydF4y2Ba

在这项研究中,我们旨在从消费者可穿戴心率记录中获得高分辨率数字表型,并研究它们与心脏代谢疾病各种风险标志物的关联。具体来说,我们试图开发一种时间序列特征提取方法,根据活动状态进行背景化,以有意义地表示消费者可穿戴设备在自由生活条件下记录的心率动态。然后,我们将我们的方法应用于SingHEART研究中正常志愿者的多维数据[gydF4y2Ba33gydF4y2Ba]以评估衍生的高分辨率可穿戴功能在多大程度上可以预测心脏代谢疾病的临床风险标志物。此外,我们评估了这些高分辨率特征是否也代表了与心脏代谢疾病固有遗传易感性相关的更微妙的生理变化。最后,我们定性地描述了志愿者的这些可穿戴表型,这些志愿者已经实现了临床事件,以评估风险标记之外的联系,以表现出心脏代谢疾病。gydF4y2Ba


数据gydF4y2Ba

我们的数据来自截至2019年10月8日的SingHEART研究(NCT02791152)。招募对象为健康志愿者,他们提供书面知情同意书,同意使用数据(包括电子健康记录)进行研究。参加者必须符合中所载的入选标准gydF4y2Ba文本框1gydF4y2Ba。gydF4y2Ba

入选标准。gydF4y2Ba

入选标准gydF4y2Ba

  1. 21-69岁gydF4y2Ba
  2. 无心血管疾病(心肌梗死、冠状动脉疾病、外周动脉疾病、中风)、癌症、自身免疫性或遗传性疾病、内分泌疾病、糖尿病、精神疾病、哮喘、慢性肺部疾病、慢性传染病等个人病史gydF4y2Ba
  3. 无心肌病家族史gydF4y2Ba
文本框1。入选标准。gydF4y2Ba

在入组时,每个参与者使用一系列健康评估模式进行分析。结果数据集包括:(1)消费者可穿戴设备(Fitbit Charge HR)在3至5天内的心率和步数时间序列记录,以及Fitbit生成的相关睡眠日志;(2)生活方式和生活质量问卷的自我报告答案[gydF4y2Ba4gydF4y2Ba[3]使用Illumina HiSeq X平台的全基因组测序的基因型数据,以及(4)9个临床相关指标的实验室测量(收缩压和舒张压;血液中甘油三酯、总胆固醇、高密度脂蛋白和低密度脂蛋白的水平;空腹血糖水平;腰围和体重指数)。截至2019年10月8日,整个研究队列包含1101名参与者,其中692名(62.8%)参与者拥有可穿戴录音设备。我们将重点放在参与者的这个子集上进行后续分析:数据的详细细分见gydF4y2Ba表1gydF4y2Ba。gydF4y2Ba

此外,我们还跟踪每个参与者的任何实际临床事件的发生。我们提取了截至2021年1月与新加坡国立心脏中心相关的区域卫生系统中与任何急性护理使用事件相关的所有临床代码(基于国际疾病分类,第10版),以表征数据特征、风险标记和实际临床事件之间的联系。gydF4y2Ba

表1。SingHEART研究队列中具有可穿戴记录的参与者(N=692)的人口统计学、临床和消费者可穿戴数据摘要。gydF4y2Ba

女性(n=370, 53.5%)gydF4y2Ba 男性(n=322, 46.5%)gydF4y2Ba

值,平均值(SD)gydF4y2Ba 参与者,ngydF4y2Ba一个gydF4y2Ba(%)gydF4y2Ba 值,平均值(SD)gydF4y2Ba 参与者,ngydF4y2Ba一个gydF4y2Ba(%)gydF4y2Ba
年龄(年)gydF4y2Ba 45.47 (11.71)gydF4y2Ba 0 (0)gydF4y2Ba 44.46 (13.29)gydF4y2Ba 0 (0)gydF4y2Ba
BMI(公斤/米gydF4y2Ba2gydF4y2Ba)gydF4y2Ba 22.87 (3.94)gydF4y2Ba 0 (0)gydF4y2Ba 24.33 (3.39)gydF4y2Ba 0 (0)gydF4y2Ba
WCgydF4y2BabgydF4y2Ba(厘米)gydF4y2Ba 78.91 (10.98)gydF4y2Ba 0 (0)gydF4y2Ba 86.96 (9.86)gydF4y2Ba 0 (0)gydF4y2Ba
SBPgydF4y2BacgydF4y2Ba(毫米汞柱)gydF4y2Ba 122.51 (17.74)gydF4y2Ba 0 (0)gydF4y2Ba 132.20 (14.96)gydF4y2Ba 0 (0)gydF4y2Ba
菲律宾gydF4y2BadgydF4y2Ba(毫米汞柱)gydF4y2Ba 73.38 (12.80)gydF4y2Ba 0 (0)gydF4y2Ba 82.18 (10.97)gydF4y2Ba 1 (0.3)gydF4y2Ba
可穿戴设备的静息心率(bpm;Fitbit)gydF4y2Ba 70.66 (6.55)gydF4y2Ba 0 (0)gydF4y2Ba 69.37 (6.59)gydF4y2Ba 0 (0)gydF4y2Ba
ECG_HRgydF4y2BaegydF4y2Ba(bpm)gydF4y2Ba 64.46 (9.17)gydF4y2Ba 10 (2.7)gydF4y2Ba 63.67 (9.87)gydF4y2Ba 12 (3.7)gydF4y2Ba
总胆固醇(mmol/L)gydF4y2Ba 5.34 (0.94)gydF4y2Ba 6 (1.6)gydF4y2Ba 5.33 (0.97)gydF4y2Ba 5 (1.6)gydF4y2Ba
低密度脂蛋白gydF4y2BafgydF4y2Ba(更易/ L)gydF4y2Ba 3.32 (0.81)gydF4y2Ba 7 (1.9)gydF4y2Ba 3.40 (0.89)gydF4y2Ba 6 (1.9)gydF4y2Ba
高密度脂蛋白gydF4y2BaggydF4y2Ba(更易/ L)gydF4y2Ba 1.59 (0.32)gydF4y2Ba 6 (1.6)gydF4y2Ba 1.36 (0.30)gydF4y2Ba 5 (1.6)gydF4y2Ba
TGsgydF4y2BahgydF4y2Ba(更易/ L)gydF4y2Ba 0.99 (0.51)gydF4y2Ba 6 (1.6)gydF4y2Ba 1.30 (0.76)gydF4y2Ba 5 (1.6)gydF4y2Ba
葡萄糖(更易/ L)gydF4y2Ba 5.17 (0.49)gydF4y2Ba 8 (2.2)gydF4y2Ba 5.36 (0.71)gydF4y2Ba 5 (1.6)gydF4y2Ba
平均每日步数gydF4y2Ba我gydF4y2Ba 10349 .81点(4180.35)gydF4y2Ba 30 (8.1)gydF4y2Ba 10972 .86点(3919.10)gydF4y2Ba 20 (6.2)gydF4y2Ba
平均每天久坐时间gydF4y2Ba 633.45 (96.48)gydF4y2Ba 102 (27.6)gydF4y2Ba 656.49 (95.58)gydF4y2Ba 88 (27.3)gydF4y2Ba
平均每日睡眠时间gydF4y2Ba 395.92 (61.18)gydF4y2Ba 102 (27.6)gydF4y2Ba 374.49 (65.15)gydF4y2Ba 88 (27.3)gydF4y2Ba

一个gydF4y2Ba指各个字段中缺少或不完整值的参与者数量。gydF4y2Ba

bgydF4y2BaWC:腰围。gydF4y2Ba

cgydF4y2Ba收缩压:收缩压。gydF4y2Ba

dgydF4y2BaDBP:舒张压。gydF4y2Ba

egydF4y2BaECG_HR:心电图心率。gydF4y2Ba

fgydF4y2BaLDL:低密度脂蛋白。gydF4y2Ba

ggydF4y2BaHDL:高密度脂蛋白。gydF4y2Ba

hgydF4y2BaTG:甘油三酸酯。gydF4y2Ba

我gydF4y2Ba平均每日步数是通过计算每天的步数总和,然后在几天内取平均值得出的。仅考虑有效数据≥20小时的天数。gydF4y2Ba

伦理批准gydF4y2Ba

SingHEART研究(NCT02791152)由新加坡国立心脏中心(新加坡的一家三级专科医院)建立,并由SingHealth中央机构审查委员会批准(参考编号:2015/2601和2018/3081)[gydF4y2Ba33gydF4y2Ba,gydF4y2Ba34gydF4y2Ba]。gydF4y2Ba

一组22个正则时间序列特征gydF4y2Ba

给定一个时间序列片段,可以使用高度比较性时间序列分析等方法定义一组高分辨率特征[gydF4y2Ba35gydF4y2Ba,gydF4y2Ba36gydF4y2Ba]和基于可扩展假设的时间序列特征提取[gydF4y2Ba37gydF4y2Ba,gydF4y2Ba38gydF4y2Ba]。然而,这种方法可能会产生许多冗余的特征,并且选择简洁但有效的表示的过程通常并不简单。最近的一项研究[gydF4y2Ba39gydF4y2Ba]引入了一个包含22个特征的最小冗余和可解释的集合,称为规范时间序列特征22 (Catch22)特征,这些特征在93个不同的时间序列分类数据集中具有很高的预测价值。由于Catch22特征集旨在减少特征间冗余,因此它提供了时间序列不同动态属性的简明表示。gydF4y2Ba

Catch22特征主要分为7类,即(1)分布特征、(2)极端事件特征、(3)符号特征、(4)线性自相关和周期性特征、(5)非线性自相关特征、(6)逐次差异特征和(7)波动分析特征。基于分布的特征表示系列中测量值分布的汇总统计信息(同时忽略这些值的时间顺序)。极端事件特征表示时间序列中连续异常事件之间的间隔。符号特征表示汇总实际时间序列值的符号变换输出的统计信息。线性自相关和周期性特征包括时间序列中固有周期性的汇总统计。非线性自相关特征涉及基于时间序列非线性变换的周期汇总统计。逐次差异特征表示基于增量差异时间序列的统计量。最后,波动分析特征量化了时间序列的统计自亲和性。表S1提供了22个特性的详细描述gydF4y2Ba多媒体附录1gydF4y2Ba。gydF4y2Ba

可穿戴时间序列记录的特征提取gydF4y2Ba

我们现在描述了获得静息心率的步骤,活动和睡眠模式的汇总统计数据,以及可穿戴心率和步数时间序列记录的高分辨率功能。由于所有这些生理特征都来自相同的记录,因此它们在内部是一致的,可以有意义地用于下游的比较分析。gydF4y2Ba

RestingHR的计算gydF4y2Ba

我们使用可穿戴式心率时间序列记录得出静息心率[gydF4y2Ba4gydF4y2Ba]。具体来说,我们定义了gydF4y2Ba可穿戴设备的静息心率gydF4y2Ba作为具有有效心率记录且步数≤100的所有时间点的心率值的平均值。我们注意到,可穿戴设备得出的静息心率与临床黄金标准心电图得出的心率之间存在相似之处[gydF4y2Ba4gydF4y2Ba,gydF4y2Ba40gydF4y2Ba]。gydF4y2Ba

可穿戴时间序列记录注释gydF4y2Ba

我们提取了每个参与者的可穿戴时间序列记录,并根据Lim等人的要求,仅使用至少有20小时步数和心率数据的天数[gydF4y2Ba4gydF4y2Ba]。心率记录可以每隔1分钟进行一次,也可以每隔5秒、10秒或15秒进行不规律的记录。每隔15分钟或1分钟采样一次步数记录。我们重新采样了所有心率和步数消费者可穿戴设备记录,每隔1分钟,然后注释时间序列,以反映数据的可用性和身体活动状态(gydF4y2Ba图1gydF4y2BaA)我们赋值了AgydF4y2Ba零gydF4y2Ba缺失时间点的心率值。然后,我们将心率和步数的可用数据标注为“睡眠”、“活动”或“久坐”的时间点。具体来说,我们应用了gydF4y2Ba睡眠gydF4y2Ba对Fitbit睡眠日志捕获的所有时间点进行注释gydF4y2Ba久坐不动的gydF4y2Ba注释到任何步长计数为0的时间点,并将剩余的时间点记为gydF4y2Ba活跃的gydF4y2Ba。在我们的研究中,参与者平均有3.72天的有效心率数据,平均每天的心率缺失时间为94.9 (SD 85.8)分钟。的最长不间断时间序列的中位数长度gydF4y2Ba活跃的gydF4y2Ba,gydF4y2Ba久坐不动的gydF4y2Ba,gydF4y2Ba睡眠gydF4y2Ba周期分别为31分钟、105分钟和465分钟。gydF4y2Ba

随后,我们处理了来自消费者可穿戴设备的心率和步数时间序列记录,以产生一系列总结和高分辨率特征,详见小节gydF4y2Ba可穿戴时间序列记录的摘要特征推导gydF4y2Ba和gydF4y2Ba从可穿戴时间序列记录的高分辨率特征的推导gydF4y2Ba。gydF4y2Ba

‎gydF4y2Ba
图1所示。可穿戴数据处理管道。(A)基于汇总统计的低分辨率地物构建。(B)基于Canonical Time-series Characteristics 22 (Catch22)算法的高分辨率特征构建。(C) 692名参与者的不同类别特征的颠覆图。只给出了非空集合交集。交集大小表示在给定集合的交集内发现的参与者的数量。在328名参与者的最大交集中,321人也有实验室测量记录。gydF4y2Ba
查看此图gydF4y2Ba
可穿戴时间序列记录的摘要特征推导gydF4y2Ba

我们使用了一个三步程序来得出一系列可穿戴的汇总统计数据(gydF4y2Ba图1gydF4y2BaA).首先,我们使用我们的身体活动注释来计算不同活动状态的平均每日持续时间。其次,我们使用设备日志来获取与睡眠-觉醒模式相关的统计数据。第三,我们将唤醒和睡眠时间转换为24小时格式,并在给定参与者拥有可穿戴数据记录的所有日子中平均结果值。为了解释睡眠或清醒模式的周期性,我们使用正弦函数转换了平均清醒和睡眠时间。总的来说,这个过程为每个参与者产生了10个总结特征。中的表S2列出了所有汇总统计信息gydF4y2Ba多媒体附录1gydF4y2Ba。gydF4y2Ba

从可穿戴时间序列记录的高分辨率特征的推导gydF4y2Ba

我们进一步开发了一个数据处理管道,从可穿戴设备的心率记录中提取高分辨率时间序列特征(gydF4y2Ba图1gydF4y2BaB).由于不同身体活动状态下的心率和步数模式可以为心血管健康提供不同的见解,我们试图推导出时间序列特征,对身体活动状态的上下文信息进行编码。具体来说,我们分别处理了3种身体活动状态(睡眠、久坐和活动)的心率时间序列记录,如下所示。gydF4y2Ba

对于每个参与者,我们选择了每个身体活动状态下最长不间断的心率时间序列记录。由于数据显示参与者在这些时间段的长度上存在显著差异,我们定义了预先指定的长度来提取标准化的睡眠、久坐和活动时间段。具体来说,我们提取了前20分钟的活动时间,前1小时的久坐时间,前5小时的睡眠时间。如果参与者可用的记录没有满足预先指定的长度标准,即使是给定活动状态的最长片段,我们也不会考虑高分辨率分析的特定活动状态。这个过程为每个参与者产生了多达3个心率时间序列片段。gydF4y2Ba

对于每个可用的心率时间序列片段,我们采用Catch22方法[gydF4y2Ba39gydF4y2Ba]获取22个高分辨率特征。总的来说,我们的管道产生了多达3组22个高分辨率特征,即Catch22(睡眠),Catch22(活动)和Catch22(久坐)。gydF4y2Ba

由于我们的研究没有规定可穿戴记录的受控实验设置,因此产生的时间序列片段通常表现出明显的噪声和不规则性。因此,我们考虑了我们的特征表示方法在这些现实环境中的可靠性。特别是,我们评估了Catch22特征对跨活动状态长度规格的稳定性和敏感性(第SI-1节,gydF4y2Ba多媒体附录1gydF4y2Ba).结果表明,这些特征在考虑的区间内相对稳健,并为后续使用这些高分辨率特征提供了信心。gydF4y2Ba

可穿戴时间序列记录的特征重叠gydF4y2Ba

图1gydF4y2BaC用UpSet图说明了具有不同可穿戴设备衍生特征的参与者之间的重叠[gydF4y2Ba41gydF4y2Ba,gydF4y2Ba42gydF4y2Ba]。例如,41个人有活动和久坐部分的特征,但没有睡眠部分或汇总统计(由于缺乏足够长时间的连续睡眠记录)。我们注意到328名参与者提供了所有不同类型的可穿戴功能,其中321名(97.9%)也进行了实验室测量。我们考虑了这321个参与者,以进行后续的可视化、风险建模和分析。gydF4y2Ba

可穿戴设备的高分辨率心率特征可视化gydF4y2Ba

我们研究了来自睡眠、活动和久坐部分的高分辨率可穿戴心率特征是如何在研究参与者中分布的。gydF4y2Ba图2gydF4y2Ba说明了范例特征的经验分布,这些特征是从对应于3种身体活动状态中的每一种状态的片段中绘制的。为了检查参与者之间的可变性,我们还可视化了密度的第2.5、第25、第50、第75和第975百分位的代表性时间序列。gydF4y2Ba

第一个示例包含一个非线性自相关特性(CO_trev1_num)gydF4y2Ba,gydF4y2Ba量化时间可逆性统计量<(x)gydF4y2Bat + 1gydF4y2Ba- xgydF4y2BatgydF4y2Ba)gydF4y2Ba3.gydF4y2Ba>gydF4y2BatgydF4y2Ba)与可穿戴式心率时间序列的尖峰或规律性程度有关(gydF4y2Ba图2gydF4y2BaA-2C)。第二个示例包含一个分布特性(DN_HistogramMode_5)gydF4y2Ba,gydF4y2Ba对应于z变换值的模态),它通过表示最可能值(模态)与序列均值(gydF4y2Ba图2gydF4y2BaD-2F)。gydF4y2Ba

‎gydF4y2Ba
图2。可穿戴设备衍生的高分辨率心率功能说明。基于2个典型时间序列特征的321名参与者的6个高分辨率特征的分布,从3个活动水平的每个时间序列记录中获得22个特征。所选的参与者分别位于每个分布的第2.5、25、50、75和97.5百分位,参与者的时间序列用相应的颜色绘制。(A-C) CO_trev1_num为时间可逆性统计量;较高的值往往对应于“尖峰”或不规则的时间序列。(D-F) DN_HistogramMode_5采用时间序列,将z得分值分组到5个线性间隔的箱子中,并报告箱子的模式。gydF4y2Ba
查看此图gydF4y2Ba

可穿戴设备衍生特征对临床靶标的预测价值表征gydF4y2Ba

概述gydF4y2Ba

用于表征不同可穿戴设备衍生特征相对于各种临床风险标记的预测价值的总体方法如下。具体来说,我们考虑了基于6种不同特征集的模型类型(gydF4y2Ba表2gydF4y2Ba).然后,根据9项实验室测量是否超过阈值,我们定义了4个目标临床风险标志物gydF4y2Ba表3gydF4y2Ba:(1)血压读数异常(gydF4y2Babp_abnormalgydF4y2Ba);(2)血脂异常(gydF4y2Balipids_abnormalgydF4y2Ba)第III至VI项中最少一项;(3)肥胖gydF4y2Ba肥胖gydF4y2Ba);(4)血脂、血糖、肥胖和血糖异常的综合分类(gydF4y2BaanyRISKoutof9gydF4y2Ba)。gydF4y2Ba

所有321名拥有一整套可穿戴设备衍生功能的参与者也拥有9项实验室测量的完整数据。我们将这321名参与者作为我们的训练集来模拟临床风险目标。在这321名参与者中,149人(46.4%)对4种风险标记中的任何一种都不呈阳性,而172人(53.5%)至少对一种风险标记呈阳性(第SI-2节,gydF4y2Ba多媒体附录1gydF4y2Ba).我们注意到,一个给定的参与者可能在4个标签中有1个是阳性的,但大多数表现出阳性风险标记的参与者只被单一风险标记所标记。172例阳性受试者中,1项临床危险指标阳性119例(69.2%),2项临床危险指标阳性40例(23.3%),3项及以上临床危险指标阳性14例(8.1%)。gydF4y2Ba

表2。不同模型类型的描述。gydF4y2Ba
模型名称gydF4y2Ba 功能包括gydF4y2Ba 特性,ngydF4y2Ba
基线(gydF4y2Ba4gydF4y2Ba]gydF4y2Ba 年龄+性别gydF4y2Ba 2gydF4y2Ba
RestingHRgydF4y2Ba 基线特征+可穿戴式静息心率gydF4y2Ba 3.gydF4y2Ba
SummaryStatsgydF4y2Ba 基线功能+可穿戴总结统计gydF4y2Ba 12gydF4y2Ba
HighRes。一个ct我veSeg 基线特征+ Catch22gydF4y2Ba一个gydF4y2Ba(主动)gydF4y2Ba 24gydF4y2Ba
HighRes。SedenSeggydF4y2Ba 基线特征+Catch22(久坐)gydF4y2Ba 24gydF4y2Ba
HighRes。SleepSeggydF4y2Ba 基线功能+Catch22(睡眠)gydF4y2Ba 24gydF4y2Ba

一个gydF4y2BaCatch22:标准时间序列特征gydF4y2Ba

表3。实验室测量和相应的阈值。gydF4y2Ba
实验室测量gydF4y2Ba 被认为有危险的阈值gydF4y2Ba
1 .收缩压(mm Hg)gydF4y2Ba > 140gydF4y2Ba
2舒张压(mm Hg)gydF4y2Ba > 90gydF4y2Ba
3甘油三酸酯(更易/ L)gydF4y2Ba > 2.3gydF4y2Ba
四、总胆固醇(mmol/L)gydF4y2Ba > 6.2gydF4y2Ba
诉高密度脂蛋白gydF4y2Ba一个gydF4y2Ba(更易/ L)gydF4y2Ba < 1gydF4y2Ba
VI。低密度脂蛋白gydF4y2BabgydF4y2Ba(更易/ L)gydF4y2Ba > 4.1gydF4y2Ba
7空腹血糖水平(mmol/L)gydF4y2Ba > 6gydF4y2Ba
8腰围(厘米)gydF4y2Ba

男性gydF4y2Ba >100gydF4y2Ba

女gydF4y2Ba > 90gydF4y2Ba
9BMI(公斤/米gydF4y2Ba2gydF4y2Ba)gydF4y2Ba > 27.5gydF4y2Ba

一个gydF4y2BaHDL:高密度脂蛋白。gydF4y2Ba

bgydF4y2BaLDL:低密度脂蛋白。gydF4y2Ba

我们使用机器学习对给定特征集和目标配对之间的复杂非线性关系进行建模,使用两种不同的方法。首先,对于任意给定的目标,我们分析了不同特征集(gydF4y2Ba表1gydF4y2Ba),使用模型比较方法。具体而言,我们考虑了可穿戴衍生特征(静息心率、可穿戴汇总统计数据和不同高分辨率可穿戴特征)对基线人口特征集的预测值的增强程度,并将高分辨率可穿戴特征的性能与低分辨率可穿戴特征的性能进行了比较。为了对基线特征的附加价值进行适当的比较,基于可穿戴数据的所有特征集也包括相应的基线特征。其次,对于每个预测目标,我们还比较了各个特征变量的重要性。为了对这些变量重要性计算有一个共同的基础,我们开发了一个包含所有特征的统一模型,并使用该模型来比较不同特征的变量重要性。gydF4y2Ba

预测模型和变量重要性gydF4y2Ba

我们训练机器学习模型来估计参与者表现出常见心脏代谢疾病异常的临床风险标记的概率。具体来说,我们使用随机森林分类器[gydF4y2Ba43gydF4y2Ba]对感兴趣的4个目标进行建模,因为它们是通用的非线性分类器,在不同的设置中表现良好。我们在R中训练随机森林模型gydF4y2BarandomForestgydF4y2Ba包(gydF4y2Ba44gydF4y2Ba]。为了处理手头预测任务的不平衡性,我们将为每棵树选择的少数类样本数量设置为总少数类大小的80%。然后,我们对多数类进行下采样,以匹配所使用的少数类样本的数量[gydF4y2Ba45gydF4y2Ba]。方法实现了这一点gydF4y2Ba地层gydF4y2Ba和gydF4y2BasampsizegydF4y2Ba参数。对于4个预测目标,我们分别构建了200个这样的随机森林,每个随机森林都有不同的起始随机种子,我们记录了每个训练好的随机森林的out-of-bag (OOB)预测误差。gydF4y2Ba

对于随机森林,变量重要性可以使用所有OOB交叉验证预测的平均准确性下降(MDA)来量化。为了获得变量重要性的统计可靠估计,对于给定的预测目标,我们平均了200个随机森林中每个特征的MDA,然后根据它们的平均MDA对特征进行排序,以获得前10个重要特征。为了可视化可变重要性结果,我们考虑了4种心脏代谢疾病风险目标的前10个排名特征的联合。gydF4y2Ba

模型性能度量和评估gydF4y2Ba

由于风险预测任务本质上是概率性的,一个合适的模型性能评估指标应该强调模型预测的校准(即真阳性和真阴性的预测概率分别接近于1和0)。因此,我们使用Brier评分来评估概率预测的准确性[gydF4y2Ba46gydF4y2Ba]:gydF4y2Ba

BrierScore (gydF4y2Ba米gydF4y2Ba) =[∑gydF4y2Bai = 1gydF4y2Ba NgydF4y2Ba(gydF4y2BapgydF4y2Ba 我gydF4y2Ba-gydF4y2BaogydF4y2Ba 我gydF4y2Ba)gydF4y2Ba2gydF4y2Ba) /gydF4y2BaNgydF4y2Ba (1)gydF4y2Ba

在哪里gydF4y2Ba米gydF4y2Ba基于可穿戴设备的模式是否在考虑之中,gydF4y2BapgydF4y2Ba我gydF4y2Ba观测目标的预测概率是多少gydF4y2Ba我gydF4y2Ba利用所评估的模型,gydF4y2BaogydF4y2Ba我gydF4y2Ba实际观察到的目标或标签(二进制:0/1),和gydF4y2BaNgydF4y2Ba是建模中包含的参与者总数。Brier评分范围从0到1,对于校准预测较好的模型,评分较低。gydF4y2Ba

我们使用OOB估算[gydF4y2Ba43gydF4y2Ba,gydF4y2Ba47gydF4y2Ba]来评估分数,因为没有足够的数据来进行独立的测试集。总的来说,上述过程为预测目标和可穿戴衍生特征集(模型)类型的每对配对产生200个Brier分数。gydF4y2Ba

对于每个目标,我们还比较了各种模型类型相互之间的性能。具体来说,对于每一对模型类型,我们进行了双尾韦尔奇检验gydF4y2BatgydF4y2BaBrier分数的真实差值为0的零假设检验。对于每个目标,我们通过控制错误发现率来校正多个假设检验[gydF4y2Ba48gydF4y2Ba]。gydF4y2Ba

可穿戴设备衍生特征与基因组风险标记之间关联的表征gydF4y2Ba

为了更好地理解可穿戴设备衍生的时间序列特征的本质,我们研究了它们与心脏代谢疾病基因组风险标记的关联。由于探测这些关联需要处理具有潜在复杂非线性关系的多种多维数据类型,因此我们使用机器学习框架(类似于前面描述的框架)对这些关系进行建模。然后,我们使用模型性能度量来推断可穿戴特征和基因组风险目标之间的信息重叠程度。由于基因组风险与年龄无关,我们没有在任何考虑的模型中包括年龄。gydF4y2Ba

我们使用多基因评分(pgs)对心脏代谢疾病的遗传易感性进行分类。为了确定血脂异常、血压异常和肥胖的基因组风险,我们使用了PGS目录[gydF4y2Ba49gydF4y2Ba],确定3个指标对应的相关多基因风险评分。具体来说,我们确定了14个血脂异常的PGS (PGS000060、PGS000061、PGS000062、PGS000063、PGS000065、PGS000115、PGS000192、PGS000309、PGS000310、PGS000311、PGS000340、PGS000677、PGS000688和PGS000699), 2个血压异常的PGS (PGS000301和PGS000302), 1个肥胖的PGS (PGS000298)。有关甄选程序的其他详情,请参阅第SI-3 (gydF4y2Ba多媒体附录1gydF4y2Ba).gydF4y2Ba

对于3个目标中的每一个,如果参与者的任何相关PGS得分处于最高或最低十分位数,我们将其标记为具有高基因组风险(参见第SI-3节,gydF4y2Ba多媒体附录1gydF4y2Ba(如何确定PGS的方向),我们称之为90/10截止。例如,脂质异常的高基因组风险组将包括14种脂质相关PGS中至少1种得分较高的成员。这些靶点的建模和不同模型类型性能的统计比较与前面描述的临床风险靶点的过程相同。gydF4y2Ba

为了评估所选择的百分位截断值对基因组风险评分的敏感性,我们对另外两组截断值重复了上述分析,即80/20和85/15截断值。gydF4y2Ba

基于临床事件的说明性分析gydF4y2Ba

最后,我们研究了高分辨率可穿戴设备衍生的特征与321名训练集之外的参与者的实际心脏代谢疾病事件之间的联系。在这些参与者中,我们考虑了那些由心血管疾病、血脂异常和高血压的初步诊断所指示的心血管代谢疾病事件(根据国际疾病分类,10)gydF4y2BathgydF4y2Ba中表S3列出的修订码gydF4y2Ba多媒体附录1gydF4y2Ba).由于这一系列事件跨越了广泛的心脏代谢疾病,anyRISKoutof9是最接近的替代标志物。因此,我们选择将分析重点放在与anyRISKoutof9最密切相关的可穿戴衍生功能集上。gydF4y2Ba

对于根据上述标准选择的参与者,我们检查了人口统计信息、身体测量、疾病的基因组风险、临床风险标记以及可穿戴设备衍生的特征。为了解释不同的可穿戴设备衍生功能如何影响个体参与者水平的模型预测,我们计算了Shapley值(Φ) [gydF4y2Ba50gydF4y2Ba的特征gydF4y2Ba安恩科技gydF4y2Ba包(gydF4y2Ba51gydF4y2Ba],并为每个参与者选出绝对值Φ最大的5个特征。我们说明了参与者的概况,由anyRISKoutof9中表现最好的模型做出的预测,以及对每个选定参与者的这些预测贡献最大的特征。gydF4y2Ba

软件和代码的可用性gydF4y2Ba

所有统计分析和建模均使用R statistical Software (version 4.0.3;R核心团队2020)。静息心率的计算使用R进行,但所有其他特征工程工作,如可穿戴时间序列记录的注释和摘要特征的推导,以及高分辨率特征的生成,都使用Python(版本3.8.6)进行。gydF4y2Ba

特性生成中使用的所有Python和R代码都可以在gydF4y2Ba多媒体附录2gydF4y2Ba。gydF4y2Ba


可穿戴设备的高分辨率心率特征gydF4y2Ba

与静息心率等汇总统计数据不同,静息心率是指在多天内平均心率测量值,我们的高分辨率功能集提供了不同身体活动状态(睡眠、活动和久坐)下心率时间序列动态的更多粒度。gydF4y2Ba图3gydF4y2BaA说明了321名参与者的高分辨率可穿戴特征值的分布(根据他们各自的活动状态着色)。虽然Catch22算法同样应用于3个活动片段,但我们观察到每个特征在3个不同的活动状态中表现出不同的分布。gydF4y2Ba

‎gydF4y2Ba
图3。高分辨率(规范时间序列特征22 [Catch22])可穿戴功能从3个不同的活动状态。(A)基于训练集的特征值的频率多边形。颜色表示活动状态。(B)不同身体活动状态(睡眠、运动和久坐)的Catch22特征对之间的Pearson相关系数。活动期的两个特征(SC_FluctAnal_2_rsrangefit_50_1_logi_prop_r1和SC_FluctAnal_2_dfa_50_1_2_logi_prop_r1)一致为0;因此,涉及这两个特征的相关系数是未定义的(白色方块)。gydF4y2Ba
查看此图gydF4y2Ba

为了研究这种差异是否在参与者水平上成立,我们描述了在3种不同活动状态下获得的高分辨率特征集之间的相关性。对于任何给定的特征(例如,CO_trev1_num),我们考虑了整个种群中每个物理活动状态的特征值向量(例如,CO_trev1_num)。活跃,CO_trev1_num。久坐不动的,CO_trev1_num.sleep). We then calculated the Pearson correlation between these feature vectors for each pair of the activity states. This analysis revealed that the feature values from the different activity states were poorly correlated (图3gydF4y2BaB)。事实上,在任何一对中,最大的绝对相关系数为0.15。综上所述,这些发现表明不同活动状态下的心率动态包含不同的信息。gydF4y2Ba

可穿戴设备衍生特征对临床目标的预测价值gydF4y2Ba

在对可穿戴设备衍生的特征集所包含的信息有了一些直觉之后,我们考虑了它们对心脏代谢疾病风险临床标志物的预测价值。具体来说,我们训练随机森林模型使用不同的可穿戴设备衍生的特征集来分类4种心脏代谢疾病风险目标。我们进行了比较分析,以评估可穿戴设备衍生的不同特征集对4种心脏代谢疾病风险目标分类的预测价值。gydF4y2Ba

首先,我们比较了每个临床风险标记目标使用不同特征集训练的模型的OOB性能(gydF4y2Ba表4gydF4y2Ba).对于每个目标,表现最好的模型是基于高分辨率可穿戴功能集(HighRes。ActiveSeg HighRes。SedenSeg,or HighRes.SleepSeg). Specifically, for anyRISKoutof9, the HighRes.SedenSeg model was the best-performing model, with 17.9% and 7.36% lower Brier scores than baselines based on age and gender and resting heart rate, respectively (PgydF4y2Ba<。每种情况下都是001)。这一发现突出了可穿戴心率时间序列记录中高分辨率信息的预测价值。gydF4y2Ba

其次,我们观察到,从不同活动水平段提取的心率动态对不同目标具有不同的预测潜力,这可以从Brier评分(gydF4y2BaPgydF4y2Ba<.001)。ActiveSeg HighRes。SedenSeg,HighRes。SleepSegmodels (表4gydF4y2Ba).在3种模型类型中,HighRes。SedenSegperforms best for lipid abnormalities, obesity, and anyRISKoutof9, whereas HighRes.ActiveSeg performs best for blood pressure abnormalities.

第三,为了比较评估单个可穿戴设备衍生特征的贡献,我们训练了使用所有可用特征来预测每个心脏代谢疾病风险目标的模型,并对每种情况下的变量重要性进行排序。gydF4y2Ba图4gydF4y2Ba显示了变量重要性图。很明显,不同的特征会影响4个目标中每个目标的模型性能。例如,对于anyRISKoutof9目标,年龄和性别是模型性能的前两个驱动因素,但对于lipids_abnormal和obesity目标,年龄和性别并不在前10个特征之列。此外,我们发现不同活动状态下的心率动态包含不同的心脏代谢疾病风险信息。例如,来自久坐和活动时间段的DN_HistogramMode_5特征对于预测心脏代谢疾病风险标志物很重要,但来自睡眠时间段的DN_HistogramMode_5特征则不重要。gydF4y2Ba图4gydF4y2Ba).gydF4y2Ba

第四,我们观察到,4个目标的前10个特征包括所有6种特征类型(年龄和性别、可穿戴设备衍生的静息心率、可穿戴汇总统计数据)的特征,以及3组来自gydF4y2Ba表1gydF4y2Ba).这表明,使用可穿戴衍生功能的风险预测模型可能不完全依赖于不同功能集中的一个或从这些功能集中提取的任何一个功能。相反,收集来自不同活动状态的不同可穿戴设备的高分辨率心率特征对于准确预测心脏代谢疾病风险目标的多样性至关重要。gydF4y2Ba

表4。心脏代谢风险目标的模型性能。为4个目标计算的5种模型类型中的每一种的袋外模型性能。Brier分数越小,表示模型对给定目标的性能越好。gydF4y2Ba

基线gydF4y2Ba一个gydF4y2Ba,均值(SD)gydF4y2Ba RestingHRgydF4y2BabgydF4y2Ba,均值(SD)gydF4y2Ba HighRes。一个ct我veSegcgydF4y2Ba,均值(SD)gydF4y2Ba HighRes。SedenSeggydF4y2BacgydF4y2Ba,均值(SD)gydF4y2Ba HighRes。SleepSeggydF4y2BacgydF4y2Ba,均值(SD)gydF4y2Ba 统计数据,平均值(SD)gydF4y2Ba
anyRISKoutof9gydF4y2Ba 0.291(−5.87×10gydF4y2Ba−4gydF4y2Ba)gydF4y2Ba 0.258(7.7×10gydF4y2Ba−4gydF4y2Ba)gydF4y2Ba 0.253(8.52×10gydF4y2Ba−4gydF4y2Ba)gydF4y2Ba 0.239(−9×10gydF4y2Ba−4gydF4y2Ba)gydF4y2Ba 0.245(8.43×10gydF4y2Ba−4gydF4y2Ba)gydF4y2Ba 0.247(7.66×10gydF4y2Ba−4gydF4y2Ba)gydF4y2Ba
bp_abnormalgydF4y2Ba 0.227(4.79×10gydF4y2Ba−4gydF4y2Ba)gydF4y2Ba 0.223(5.61×10gydF4y2Ba−4gydF4y2Ba)gydF4y2Ba 0.217(7.88×10gydF4y2Ba−4gydF4y2Ba)gydF4y2Ba 0.222(8.14×10gydF4y2Ba−4gydF4y2Ba)gydF4y2Ba 0.225(8.32×10gydF4y2Ba−4gydF4y2Ba)gydF4y2Ba 0.225(7.9×10gydF4y2Ba−4gydF4y2Ba)gydF4y2Ba
肥胖gydF4y2Ba 0.246(6.64×10gydF4y2Ba−4gydF4y2Ba)gydF4y2Ba 0.227(7.91×10gydF4y2Ba−4gydF4y2Ba)gydF4y2Ba 0.221(8.92×10gydF4y2Ba−4gydF4y2Ba)gydF4y2Ba 0.214(9.34×10gydF4y2Ba−4gydF4y2Ba)gydF4y2Ba 0.226(8.64×10gydF4y2Ba−4gydF4y2Ba)gydF4y2Ba 0.227(8.54×10gydF4y2Ba−4gydF4y2Ba)gydF4y2Ba
lipids_abnormalgydF4y2Ba 0.271(5.84×10gydF4y2Ba−4gydF4y2Ba)gydF4y2Ba 0.261(6.64×10gydF4y2Ba−4gydF4y2Ba)gydF4y2Ba 0.238(8.08×10gydF4y2Ba−4gydF4y2Ba)gydF4y2Ba 0.225(7.58×10gydF4y2Ba−4gydF4y2Ba)gydF4y2Ba 0.241(8.27×10gydF4y2Ba−4gydF4y2Ba)gydF4y2Ba 0.236(7.3×10gydF4y2Ba−4gydF4y2Ba)gydF4y2Ba

一个gydF4y2Ba对于每个风险目标,基线模型的Brier评分与所有其他模型的评分有显著差异(gydF4y2BaPgydF4y2Ba<措施)。gydF4y2Ba

bgydF4y2Ba对于每个风险目标,静息心率模型(RestingHR)的Brier评分与其他所有模型(gydF4y2BaPgydF4y2Ba<措施)。gydF4y2Ba

cgydF4y2Ba对于每个风险目标,3种HighRes模型的Brier评分存在显著差异(gydF4y2BaPgydF4y2Ba<措施)。gydF4y2Ba

‎gydF4y2Ba
图4。随机森林变量重要性。每个特征对4种心脏代谢疾病风险指标的预测的可变重要性。我们在200个模拟中取每个重要值的平均值,并使用结果对每个心脏代谢疾病风险目标保留的前10个特征进行排名。这导致在所有4个目标中总共有26个特性,如图所示。Catch22:标准时间序列特征gydF4y2Ba
查看此图gydF4y2Ba

可穿戴设备衍生特征与基因组风险标记之间的关联gydF4y2Ba

为了进一步解释可穿戴设备衍生特征中包含的信息,我们试图了解它们与心脏代谢疾病的遗传易感性之间的关系。具体来说,我们检查了不同可穿戴设备衍生功能之间的信息重叠程度(gydF4y2Ba表1gydF4y2Ba)和心脏代谢疾病的基因组风险。对于不同的可穿戴设备衍生特征集与3个基因组风险目标之间的每一次配对,我们训练随机森林模型,并使用它们的Brier分数作为关联强度的间接衡量标准。gydF4y2Ba

研究结果见gydF4y2Ba表5gydF4y2Ba。对于3种异常类型中的每一种,我们观察到高分辨率可穿戴功能与基因组风险水平的相关性比性别和静息心率更强(Brier评分提高11.9%-22.0%;gydF4y2BaPgydF4y2Ba<措施)。我们强调,基线心率和静息心率的趋势对用于定义高与低基因组风险的多基因风险评分阈值相对不敏感(第SI-4节,gydF4y2Ba多媒体附录1gydF4y2Ba).这些结果表明,与标准测量相比,来自可穿戴设备的高分辨率特征能够更好地代表与心脏代谢疾病基因组风险相关的微妙生理动态。gydF4y2Ba

表5所示。与基因组风险目标的关联程度。为3个目标计算的5种模型类型中的每一种的袋外性能。对于给定的目标,越小的Brier分数表明模型的性能越好。gydF4y2Ba

基线gydF4y2Ba一个gydF4y2Ba,均值(SD)gydF4y2Ba RestingHRgydF4y2BabgydF4y2Ba,均值(SD)gydF4y2Ba HighRes。一个ct我veSeg, mean (SD) HighRes。SedenSeg,mean (SD) HighRes。SleepSeg,mean (SD) 统计数据,平均值(SD)gydF4y2Ba
血压gydF4y2Ba 0.248(2.0×10gydF4y2Ba−3gydF4y2Ba)gydF4y2Ba 0.245(8.55×10gydF4y2Ba−4gydF4y2Ba)gydF4y2Ba 0.215(1.08×10gydF4y2Ba−3gydF4y2Ba)gydF4y2Ba 0.214(1.09×10gydF4y2Ba−3gydF4y2Ba)gydF4y2Ba 0.215(9.93×10gydF4y2Ba−4gydF4y2Ba)gydF4y2Ba 0.212(9.64×10gydF4y2Ba−4gydF4y2Ba)gydF4y2Ba
肥胖gydF4y2Ba 0.245(2.31×10gydF4y2Ba−3gydF4y2Ba)gydF4y2Ba 0.246(9.03×10gydF4y2Ba−4gydF4y2Ba)gydF4y2Ba 0.205(1.15×10gydF4y2Ba−3gydF4y2Ba)gydF4y2Ba 0.192(1.06×10gydF4y2Ba−3gydF4y2Ba)gydF4y2Ba 0.199(1.21×10gydF4y2Ba−3gydF4y2Ba)gydF4y2Ba 0.203(1.06×10gydF4y2Ba−3gydF4y2Ba)gydF4y2Ba
脂质gydF4y2Ba 0.294(3.02×10gydF4y2Ba−3gydF4y2Ba)gydF4y2Ba 0.308(6.36×10gydF4y2Ba−4gydF4y2Ba)gydF4y2Ba 0.254(9.07×10gydF4y2Ba−4gydF4y2Ba)gydF4y2Ba 0.254(8.82×10gydF4y2Ba−4gydF4y2Ba)gydF4y2Ba 0.259(8.92×10gydF4y2Ba−4gydF4y2Ba)gydF4y2Ba 0.268(8.86×10gydF4y2Ba−4gydF4y2Ba)gydF4y2Ba

一个gydF4y2Ba对于每个风险目标,基线模型的Brier评分与所有其他模型(gydF4y2BaPgydF4y2Ba<措施)。gydF4y2Ba

bgydF4y2Ba对于每个风险目标,静息心率模型(RestingHR)的Brier评分与3种HighRes和SummaryStats模型(gydF4y2BaPgydF4y2Ba<措施)。gydF4y2Ba

具有心脏代谢事件的参与者的说明性概况gydF4y2Ba

最后,我们研究了最能预测anyRISKoutof9的可穿戴设备衍生功能集与实际心脏代谢事件之间的关系。我们关注的是不在训练集中的参与者,并过滤了具有anyRISKoutof9最具预测性特征集数据的参与者(即Catch22[久坐]特征集,基于上述结果)。这产生了197个候选参与者进行说明性分析。在这些参与者中,只有5名参与者实现了初步诊断为心脏代谢疾病的事件(见表S3)gydF4y2Ba多媒体附录1gydF4y2Ba).gydF4y2Ba

表6gydF4y2Ba提供这5名参与者的人口统计、遗传和临床风险概况,以及物理测量和重要的可穿戴功能(A-E)。所有参与者的年龄在54岁到61岁之间。在5名参与者中,4名(80%)是男性。只有1名(20%)参与者肥胖。我们现在提出了高分辨率可穿戴设备衍生功能对这些参与者的预测价值的研究结果。gydF4y2Ba

首先,我们描述了遗传和临床风险标记都异常的参与者,即参与者A和b。参与者A在所有3种情况下都有很高的基因组风险,9种临床风险标记中的大多数都有异常值,并且还被诊断为所有3种类型的心脏代谢疾病(心血管疾病、血脂异常和高血压)。参与者B具有脂质和血压异常、脂质面板值异常和血脂异常临床诊断的基因组风险。参与者A的可穿戴式静息心率略高于人群平均水平,而参与者B的可穿戴式静息心率低于人群平均水平。然而,在这两种情况下,我们的HighRes。SedenSegmodel predicted a positive anyRISKoutof9 outcome.

其次,我们考虑了没有基因组风险但表现出异常临床风险标记的参与者,即参与者c。该参与者患有高血压,胆固醇和血糖水平异常,临床诊断为血脂异常,可穿戴设备获得的静息心率略高于人群平均值。然而,我们注意到我们的高分辨率。SedenSegmodel predicted a negative anyRISKoutof9 outcome. This could be due to modeling error or possibly be attributed to the absence of severe changes in heart rate dynamics given the normal genetic background and moderate wearable-derived resting heart rate value.

第三,我们强调了在临床风险标记中没有表现出任何异常并且处于心脏代谢疾病风险边缘的参与者,即参与者D和e。参与者D只有血压的基因组风险。另一方面,参与者E似乎具有最良性的特征,所有3个目标条件的基因组风险较低,所有9个临床风险标记值正常(只有BMI处于高边缘)。两名参与者的静息心率值都低于人群平均水平。虽然参与者D和E在标准测量中看起来风险较低,但他们分别有血脂异常和心血管疾病的临床诊断。的确,我们的高res。SedenSegmodel predicted a positive anyRISKoutof9 outcome in each case.

最后,检查最重要的特征(前5个Shapley值)有助于anyRISKoutof9的模型预测gydF4y2Ba表6gydF4y2Ba揭示有趣的模式。虽然年龄和性别(意料之中)对大多数参与者的预测分数有一致的影响,但许多Catch22(久坐)特征也有类似的影响。例如,DN_Histogram_Mode_5对所有5个参与者都很重要,而CO_Embed2_Dist_tau_d_expfit_meandiff和DN_OutlierInclude_p_001_mdrmd分别对3个和2个参与者很重要。特别是DN_Histogram_Mode_5是本研究中大多数参与者的重要特征。当参与者的心率时间序列显示出与平均值的显著偏差时,这一特征呈现出较大的值,这可能发生在持续或频繁的高振幅振荡时。尽管这种偏差在运动状态下很常见,但在久坐状态下,它们的存在可能预示着心血管异常,就像这5名参与者的情况一样。除了上面提到的一致特性之外,对于不同的参与者来说,前5个最重要的贡献者中还有其他不同的高分辨率特性。这表明我们的高分辨率特征提取方法提供了一套紧凑但足够多样化的预测心率模式,包括那些在个体参与者中一致的模式和那些可以迎合参与者之间可变性的模式。详细的Shapley加性解释(SHAP)特征重要性图提供了每个参与者gydF4y2Ba多媒体附录1gydF4y2Ba。gydF4y2Ba

表6所示。具有实际心脏代谢事件的5名参与者的说明性概况。参与者资料包括人口统计信息、心脏代谢疾病类型、关键身体测量、临床和基因组风险标记,以及5个重要的可穿戴设备衍生心率特征(根据Shapley值)。gydF4y2Ba
参与者简介gydF4y2Ba 参与者gydF4y2Ba

一个gydF4y2Ba BgydF4y2Ba CgydF4y2Ba DgydF4y2Ba EgydF4y2Ba
人口统计资料gydF4y2Ba

年龄(年)gydF4y2Ba 54gydF4y2Ba 57gydF4y2Ba 56gydF4y2Ba 55gydF4y2Ba 61gydF4y2Ba

性别gydF4y2Ba 男性gydF4y2Ba 男性gydF4y2Ba 男性gydF4y2Ba 女gydF4y2Ba 男性gydF4y2Ba

可穿戴设备的静息心率gydF4y2Ba 72.8gydF4y2Ba 58.2gydF4y2Ba 73.0gydF4y2Ba 69.0gydF4y2Ba 55.7gydF4y2Ba
临床风险标记gydF4y2Ba

BMI(公斤/米gydF4y2Ba2gydF4y2Ba)gydF4y2Ba 28.05gydF4y2Ba 18.79gydF4y2Ba 21.27gydF4y2Ba 22.95gydF4y2Ba 25.95gydF4y2Ba

血压:收缩压gydF4y2Ba一个gydF4y2Ba/菲律宾gydF4y2BabgydF4y2Ba(毫米汞柱)gydF4y2Ba 166/109gydF4y2Ba 108/65gydF4y2Ba 164/105gydF4y2Ba 112/48gydF4y2Ba 133/89gydF4y2Ba

葡萄糖(更易/ L)gydF4y2Ba 6.8gydF4y2Ba 4.8gydF4y2Ba 7.4gydF4y2Ba 5.3gydF4y2Ba 5.3gydF4y2Ba

总胆固醇(mmol/L)gydF4y2Ba 5.27gydF4y2Ba 6.63gydF4y2Ba 6.60gydF4y2Ba 5.05gydF4y2Ba 4.45gydF4y2Ba

anyRISKoutof9gydF4y2Ba 真正的gydF4y2BacgydF4y2Ba 真正的gydF4y2Ba 真正的gydF4y2Ba 假gydF4y2BadgydF4y2Ba 假gydF4y2Ba
高基因风险gydF4y2Ba

脂质异常gydF4y2Ba 真正的gydF4y2Ba 真正的gydF4y2Ba 假gydF4y2Ba 假gydF4y2Ba 假gydF4y2Ba

血压异常gydF4y2Ba 真正的gydF4y2Ba 真正的gydF4y2Ba 假gydF4y2Ba 真正的gydF4y2Ba 假gydF4y2Ba

肥胖gydF4y2Ba 真正的gydF4y2Ba 假gydF4y2Ba 假gydF4y2Ba 假gydF4y2Ba 假gydF4y2Ba
实际的心脏代谢事件gydF4y2Ba

心血管病gydF4y2Ba 真正的gydF4y2Ba 真正的gydF4y2Ba 假gydF4y2Ba 假gydF4y2Ba 真正的gydF4y2Ba

血脂异常gydF4y2Ba 真正的gydF4y2Ba 假gydF4y2Ba 真正的gydF4y2Ba 真正的gydF4y2Ba 假gydF4y2Ba

高血压gydF4y2Ba 真正的gydF4y2Ba 假gydF4y2Ba 假gydF4y2Ba 假gydF4y2Ba 假gydF4y2Ba
预测的重要特征gydF4y2Ba

CO_f1ecac.sedentarygydF4y2Ba 假gydF4y2Ba 假gydF4y2Ba 假gydF4y2Ba 真正的gydF4y2Ba 假gydF4y2Ba

FC_LocalSimple_mean3_stderr.sedentarygydF4y2Ba 真正的gydF4y2Ba 假gydF4y2Ba 假gydF4y2Ba 假gydF4y2Ba 假gydF4y2Ba

SB_MotifThree_quantile_hh.sedentarygydF4y2Ba 真正的gydF4y2Ba 假gydF4y2Ba 假gydF4y2Ba 假gydF4y2Ba 假gydF4y2Ba

SB_TransitionMatrix_3ac_sumdiagcov.sedentarygydF4y2Ba 假gydF4y2Ba 假gydF4y2Ba 假gydF4y2Ba 真正的gydF4y2Ba 假gydF4y2Ba

CO_trev_1_num.sedentarygydF4y2Ba 假gydF4y2Ba 假gydF4y2Ba 假gydF4y2Ba 假gydF4y2Ba 真正的gydF4y2Ba

CO_HistogramAMI_even_2_5.sedentarygydF4y2Ba 假gydF4y2Ba 假gydF4y2Ba 真正的gydF4y2Ba 假gydF4y2Ba 假gydF4y2Ba

DN_OutlierInclude_p_001_mdrmd.sedentarygydF4y2Ba 真正的gydF4y2Ba 真正的gydF4y2Ba 假gydF4y2Ba 假gydF4y2Ba 假gydF4y2Ba

CO_Embed2_Dist_tau_d_expfit_meandiff.sedentarygydF4y2Ba 假gydF4y2Ba 真正的gydF4y2Ba 假gydF4y2Ba 真正的gydF4y2Ba 真正的gydF4y2Ba

DN_HistogramMode_10.sedentarygydF4y2Ba 假gydF4y2Ba 假gydF4y2Ba 真正的gydF4y2Ba 假gydF4y2Ba 假gydF4y2Ba

DN_HistogramMode_5.sedentarygydF4y2Ba 真正的gydF4y2Ba 真正的gydF4y2Ba 真正的gydF4y2Ba 真正的gydF4y2Ba 真正的gydF4y2Ba

性别gydF4y2Ba 真正的gydF4y2Ba 真正的gydF4y2Ba 真正的gydF4y2Ba 假gydF4y2Ba 真正的gydF4y2Ba

年龄(年)gydF4y2Ba 假gydF4y2Ba 真正的gydF4y2Ba 真正的gydF4y2Ba 真正的gydF4y2Ba 真正的gydF4y2Ba

一个gydF4y2Ba收缩压:收缩压。gydF4y2Ba

bgydF4y2BaDBP:舒张压。gydF4y2Ba

cgydF4y2BaTrue表示为真或存在分类变量。gydF4y2Ba

dgydF4y2BaFalse表示分类变量为假或不存在。gydF4y2Ba


主要研究结果gydF4y2Ba

消费者可穿戴设备可以在自由生活的条件下记录丰富的高分辨率生理动态,但这些数据与健康和疾病的关系尚不完全清楚。我们引入了一个原则性框架,从消费者可穿戴记录中获得高分辨率心率特征,并将我们的方法应用于包含健康志愿者多维心脏代谢健康参数的数据集。我们的研究结果表明,与典型的汇总统计相比,解决心率时间动态和活动依赖模式的高分辨率特征与心脏代谢疾病的可修改风险标记和固有遗传易感性有更强的关联。我们的研究结果表明,这些来自消费者可穿戴设备的高分辨率数字表型可以提供更详细的心脏代谢健康和疾病状态的图像,这可能在心脏代谢健康筛查和疾病管理中具有潜在的用途。gydF4y2Ba

我们的框架解决了在自由生活条件下挖掘可穿戴数据的关键挑战。与受控实验环境的干净数据不同,现实世界的可穿戴记录往往是不规则的,包含缺失的拉伸[gydF4y2Ba29gydF4y2Ba,缺乏干净的上下文注释,并且长度可变。因此,基于通用时间序列特征提取方法幼稚应用的分析[gydF4y2Ba36gydF4y2Ba,gydF4y2Ba39gydF4y2Ba,gydF4y2Ba52gydF4y2Ba]可能不具有生态有效性[gydF4y2Ba53gydF4y2Ba]。为了解决这一问题,并从可穿戴时间序列记录中获得有意义的生理动态,我们的特征提取框架对不规则数据的处理进行了标准化,并对有关潜在活动水平和生理状态的上下文信息进行了编码(gydF4y2Ba图1gydF4y2Ba-gydF4y2Ba3.gydF4y2Ba).这个概念框架,虽然在这里用Catch22方法演示[gydF4y2Ba39gydF4y2Ba],与时间序列数据特征表示方法的选择无关[gydF4y2Ba36gydF4y2Ba,gydF4y2Ba37gydF4y2Ba]。此外,与基于大型标记数据集的黑盒特征学习方法相比[gydF4y2Ba31gydF4y2Ba],我们的方法用更小的未标记数据集产生更多可解释的时间序列特征。gydF4y2Ba

我们的框架为从可穿戴录音中获得新的见解提供了许多可能性。我们利用健康志愿者的多模式可穿戴设备、基因组和临床数据进行分析,强调了两种可能性。gydF4y2Ba

首先,我们的研究结果揭示了可穿戴设备的高分辨率心率动态与心脏代谢疾病风险之间的新关系。大多数先前的研究将临床获得的心率动态指标(如心率变异性、运动能力和心率恢复)与疾病风险或结果联系起来[gydF4y2Ba54gydF4y2Ba-gydF4y2Ba56gydF4y2Ba]。相比之下,我们的研究结果显示,消费者可穿戴设备记录的心率动态,如果处理得当,也可以预测心脏代谢疾病的风险(gydF4y2Ba表4gydF4y2Ba-gydF4y2Ba6gydF4y2Ba;gydF4y2Ba图4gydF4y2Ba).此外,我们发现不同活动状态下的心率动态包含有关特定心脏代谢状况的不同信息(gydF4y2Ba表4gydF4y2Ba;gydF4y2Ba图3gydF4y2Ba和gydF4y2Ba4gydF4y2Ba).例如,久坐状态下的心率模式与血脂水平异常和肥胖的关系更大,而运动状态下的心率模式与血压读数异常的关系更大(gydF4y2Ba表4gydF4y2Ba).这些发现强调了在自由生活活动状态下(在受控的临床环境之外)评估生理对疾病风险监测和管理的附加价值[gydF4y2Ba57gydF4y2Ba]。gydF4y2Ba

其次,我们的研究为可穿戴记录与心脏代谢疾病遗传易感性之间的相互关系提供了新的视角。尽管长期以来一直有兴趣探索基因与生活方式的相互作用及其对心血管疾病的累加效应[gydF4y2Ba58gydF4y2Ba-gydF4y2Ba60gydF4y2Ba],这类研究在自由生活条件下的生理学上的能见度有限。我们发现了令人惊讶的联系(gydF4y2Ba表5gydF4y2Ba高分辨率可穿戴设备衍生的特征集与心脏代谢疾病的遗传易感性之间的关系。由于这些关联似乎并不取决于是否存在明显的临床风险标记,因此我们假设,来自可穿戴设备的高分辨率表型可能捕捉到源于潜在疾病易感性的细微亚临床生理变化。gydF4y2Ba

限制gydF4y2Ba

尽管我们数据的独特多模态特性使我们能够发现许多关于高分辨率可穿戴表型的新见解,但数据集大小和队列设计的局限性提出了一些挑战。首先,不可能进行全面的基因-环境相互作用研究[gydF4y2Ba61gydF4y2Ba-gydF4y2Ba63gydF4y2Ba];或者训练具有大型特征集的最先进的机器学习模型。其次,由于心脏代谢疾病的风险是高度多因素的,对相关身体和生活方式因素的有限可见性限制了所有模型的绝对预测准确性。例如,我们对定期运动习惯的输入有限,因为观察时间不到一周,而且关键生活方式指标和可穿戴设备记录之间的重叠有限(例如,只有9名吸烟的参与者有有效的可穿戴设备记录)。最后,由于我们的研究只包括少数有实际心脏代谢事件的参与者,我们无法进行定量分析,将可穿戴表型与临床事件联系起来。未来基于更大队列的研究[gydF4y2Ba64gydF4y2Ba更有针对性的研究设计可以解决这些局限性,并使我们当前的研究结果得到跨队列验证。gydF4y2Ba

结论gydF4y2Ba

总之,我们证明了基于可穿戴记录心率模式的高分辨率数字表型为自由生活条件下的生理学提供了重要见解。我们的研究结果表明,这些测量与心脏代谢疾病的遗传和临床风险标志物相关,并且除了可穿戴设备衍生的汇总统计和心脏代谢健康的临床测量外,还具有额外的预测价值。因此,我们的工作扩大了使用消费者可穿戴设备的数字表型作为易于获取的心脏代谢健康和疾病指标的可能性,并激发了心脏代谢疾病风险定量评分的新方法。未来的研究可以将我们的发现扩展到更高分辨率的数字表型,可以从新一代可穿戴设备的记录中提取[gydF4y2Ba65gydF4y2Ba,gydF4y2Ba66gydF4y2Ba]以及精确筛查、健康监测和疾病管理应用的目标评估。gydF4y2Ba

致谢gydF4y2Ba

这项研究得到了新加坡国家精准医学计划(IAF-PP H17/01/a0/007)和信息通信研究所A*STAR的资助和基础设施的支持。数据采集部分由新加坡健康、杜克-新加坡国立大学医学院、新加坡国立心脏中心、新加坡国家医学研究委员会(NMRC/STaR/0011/2012, NMRC/STaR/0026/2015)、Lee基金会和Tanoto基金会资助。gydF4y2Ba

作者感谢所有参与本研究的志愿者。他们感谢新加坡国家心脏中心和SingHEART临床研究协调员提供的宝贵数据收集协助,以及新加坡国家超级计算中心提供的资源[gydF4y2Ba67gydF4y2Ba]在多基因分数计算管道上进行代码开发。他们还感谢新加坡南洋理工大学的Marie Loh和新加坡国立大学的Xueling Sim就多基因风险评分进行了有意义的讨论。gydF4y2Ba

JZ在参与这项工作时隶属于信息通信研究所,目前隶属于科学技术与研究局(A*STAR)的诊断开发中心(DxD Hub)。gydF4y2Ba

作者的贡献gydF4y2Ba

WZ, YEC, CSF, PT, WKL, PK构思研究。WKL和PK监督研究。PT、KKY、WKL、PK获得融资。JXT、SD、WH、JY、SC、PT、CWC、KKY、WKL负责数据采集和数据管理。WZ, YEC, CSF, JZ, PK开发了分析方法。WZ, YEC, JZ编写软件,进行数据分析和可视化。WZ和PK主导了论文的撰写,YEC、CSF和WKL也提供了重要的意见。所有作者都对研究结果进行了解读、审阅并批准了最终稿件。WKL和PKS是本研究的通讯作者,邮件地址分别为wengkhong.lim@duke-nus.edu.sg和pavitrak@i2r.a-star.edu.sg。gydF4y2Ba

利益冲突gydF4y2Ba

没有宣布。gydF4y2Ba

‎gydF4y2Ba
多媒体附录1gydF4y2Ba

补充信息。gydF4y2Ba

PDF档案(adobepdf档案),1384 KBgydF4y2Ba

‎gydF4y2Ba
多媒体附录2gydF4y2Ba

补充数据:用于特征生成的代码。gydF4y2Ba

ZIP文件(ZIP Archive), 18kbgydF4y2Ba

  1. 大约五分之一的美国人使用智能手表或健身追踪器。皮尤研究中心,2020年1月9日URL:gydF4y2Bahttps://www.pewresearch.org/fact-tank/2020/01/09/about-one-in-five-americans-use-a-smart-watch-or-fitness-tracker/gydF4y2Ba[2021-09-07]访问gydF4y2Ba
  2. 李昕,Dunn J, Salins D,周刚,周伟,sch sller - fiorenza Rose SM,等。数字健康:使用可穿戴生物传感器跟踪生理特征和活动,揭示有用的健康相关信息。PLoS biology 2017 Jan 12;15(1):e2001402 [j]gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  3. Mishra T, Wang M, Metwally AA, Bogu GK, Brooks AW, Bahmani A,等。从智能手表数据中进行COVID-19症状前检测。中国生物医学工程学报,2016,29 (1):1 - 4 [j]gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  4. Lim WK, Davila S, Teo JX, Yang C, Pua CJ, Blöcker C,等。超越健身追踪:在心血管和脂质组学研究中使用普通志愿者的消费级可穿戴数据。《公共科学图书馆·生物学》2018年2月27日;16(2):e2004285 [j]gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  5. Quisel T, Foschini L, Kale DC。日间活动能更好地预测慢性疾病。在:机器学习健康研讨会。2016在:NeurIPS '16;2016年12月5日至10日;巴塞罗那,西班牙gydF4y2Bahttp://arxiv.org/abs/1612.01200gydF4y2Ba
  6. Bayoumy K, Gaber M, Elshafeey A, Mhaimeed O, Dineen EH, Marvel FA,等。心血管护理中的智能可穿戴设备:我们在哪里以及如何前进。中华医学杂志,2011;18(8):581-599 [j]gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  7. 李建军,李建军,李建军,李建军,等。基于多模态感知的心理健康监测方法研究。普适暴徒计算机2018年12月;51:1-26。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  8. Cooney MT, Vartiainen E, Laatikainen T, Juolevi A, Dudina A, Graham IM。静息心率升高是健康男性和女性心血管疾病的独立危险因素。中华医学杂志;2010;31(4):362 - 361。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  9. Fox K, Borer JS, Camm AJ, Danchin N, Ferrari R, Lopez Sendon JL,心率工作组。心血管疾病的静息心率。中华心血管病杂志2007;28 (9):823-830 [J]gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  10. 刘建军,刘建军,刘建军,刘建军。高心率:心血管危险因素?中华心脏杂志,2006;27(20):2387-2393。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  11. 李建军,李建军,李建军,等。基于活动追踪器的指标作为工作成年人心脏代谢健康的数字标记:横断面研究[j] .移动医疗与健康[j] .中国医疗科学,2014;8(1):1145 - 1145 [j]gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  12. Bumgarner JM, Lambert CT, Hussein AA, Cantillon DJ, Baranowski B, Wolski K等。智能手表算法自动检测心房颤动。中华心血管病杂志,2018;31 (2):391 - 391 [J]gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  13. Tison GH, Sanchez JM, Ballinger B, Singh A, Olgin JE, Pletcher MJ,等。使用市售智能手表被动检测心房颤动。JAMA Cardiol 2018;3(5):409-416 [j]gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  14. Turakhia MP, Hoang DD, Zimetbaum P, Miller JD, Froelicher VF, Kumar UN等。一种新型无导线心律失常监测装置的诊断应用。[J]中华医学杂志,2013;31 (4):559 - 564 [J]gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  15. Galloway CD, Valys AV, peterson FL, Gundotra VP, Treiman DL, Albert DE等。利用智能手机心电图和人工智能无创检测高钾血症。中华心血管病杂志,2018;31(11):391 - 391。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  16. Galloway CD, Valys AV, Shreibati JB, Treiman DL, peterson FL, Gundotra VP等。从心电图中筛选高钾血症的深度学习模型的开发和验证。JAMA Cardiol 2019; 01;4(5):428-436 [j]gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  17. Quer G, Gouda P, Galarnyk M, Topol EJ, Steinhubl SR.每日静息心率的个体间和内部变异及其与年龄、性别、睡眠、BMI和时间的关系:92,457名成年人的回顾性纵向队列研究。PLoS One 2020 Feb 5;15(2):e0227709 [j]gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  18. Sopic D, Aminifar A, Aminifar A, Atienza D.实时事件驱动分类技术在可穿戴系统上的早期检测和预防心肌梗死。电子工程学报,2018,31(5):982-992。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  19. 李建军,李建军,李建军,李建军,等。使用人工智能心电图筛查心脏收缩功能障碍。中华医学杂志,2019,25(1):70-74。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  20. 斯特拉斯SJ,罗利TW。促进身体活动的可穿戴设备。中华临床医学杂志,2018;64(1):53-63。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  21. 张建新,Davila S, Yang C, Hii AA, Pua CJ, Yap J,等。消费者可穿戴设备的数字表型识别出与睡眠相关的心血管疾病风险和生物衰老标志物。大众生物2019年10月4日;2:361 [j]gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  22. 郭超,陆敏,陈健。时间序列汇总统计量作为临床预测任务特征的评价。中国医学杂志2020年3月05日;20(1):48 [j]gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  23. Schroeder EB, Liao D, Chambless LE, Prineas RJ, Evans GW, Heiss G.高血压、血压和心率变异性:社区动脉粥样硬化风险(ARIC)研究。高血压;2003;42(6):1106-1111。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  24. 廖D, Carnethon M, Evans GW, Cascio WE, Heiss G.低心率变异性与糖尿病患者冠心病的发展相关:社区动脉粥样硬化风险(ARIC)研究。糖尿病2002;12(12):3524-3531。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  25. [6]王晓明,王晓明,王晓明,等。5分钟心率变异性对冠心病的影响。心脏2011年6月09日;97(增刊1):A38-A39。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  26. 哈佛健康出版社职员。心率变异性:它如何表明健康。哈佛健康,2021年12月1日。URL:gydF4y2Bahttps://www.health.harvard.edu/blog/heart-rate-variability-new-way-track-well-2017112212789gydF4y2Ba[2021-09-07]访问gydF4y2Ba
  27. Oura团队。睡眠时的心率:寻找以下3种模式。2020年2月11日。URL:gydF4y2Bahttps://ouraring.com/blog/heart-rate-during-sleep/gydF4y2Ba[2021-09-07]访问gydF4y2Ba
  28. 杨建军,杨建军,李建军,等。可穿戴技术在心血管疾病研究中的应用。心血管医学趋势2018年2月;28(2):144-150 [j]gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  29. 尼尔森BW,艾伦NB。在生态有效的24小时内,消费者可穿戴心率测量的准确性:个体验证研究。[j] Mhealth Uhealth 2019年3月11日;7(3):e10828]gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  30. Godino JG, Wing D, de Zambotti M, Baker FC, Bagot K, Inkelis S,等。商用可穿戴多传感器(Fitbit Charge HR)在测量健康儿童身体活动和睡眠方面的性能。PLoS One 2020 Sep 4;15(9):e0237719 [j]gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  31. 谢军,王军,王建军,李建军,等。DeepHeart:用于心血管风险预测的半监督序列学习。人工智能学报,2018;32(1):2079-2086 [j]gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  32. Tison GH, Singh AC, Ohashi DA, Hsieh JT, Ballinger BM, Olgin JE,等。摘要21042:使用现成可穿戴设备和多任务深度学习算法进行心血管风险分层。2017年11月14日发行;136(suppl_1):A21042。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  33. 新加坡国立心脏中心。体力活动、动态血压和钙评分对正常人心血管健康的影响(SingHEART) -报告编号:: NCT02791152。临床试验。2016。URL:gydF4y2Bahttps://clinicaltrials.gov/ct2/show/NCT02791152gydF4y2Ba[2021-11-01]访问gydF4y2Ba
  34. Yap J, Lim WK, sahlsamn A, chincw, Chew KM, Davila S,等。利用技术和分子分析了解亚洲心血管疾病的发展:一项前瞻性队列研究(SingHEART)。BMC心血管疾病2019 11月21日;19(1):259 [j]gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  35. 富尔彻BD,琼斯NS。高度可比性的基于特征的时间序列分类。电子信息学报,2014,12(12):3026-3037。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  36. 富尔彻BD,琼斯NS。Hctsa:一个使用大量特征提取的自动时间序列表型的计算框架。Cell system 2017, 11月22日;5(5):527-31。e3 (gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  37. 刘建军,刘建军,刘建军,等。基于可扩展假设检验的时间序列特征提取(tsfresh -一个Python包)。2018年9月13日;307:72-77。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  38. 李建军,李建军,李建军,等。基于时间序列特征提取的工业大数据分析方法。arXiv 2017 5月19日[gydF4y2Ba免费全文gydF4y2Ba]gydF4y2Ba
  39. Lubba CH, Sethi SS, Knaute P, Schultz SR, Fulcher BD, Jones NS。catch22:规范时间序列特征。Data Min Knowl Disc 2019 Aug 09;33(6):1821-1852。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  40. 刘建军,刘建军,刘建军。研究可穿戴光学心率传感器不准确的来源。中华医学杂志2020年2月10日;3:18 [j]gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  41. 李建军,李建军,李建军,李建军,李建军,李建军。IEEE Trans Vis computer Graph 2014;20(12):1983-1992 [j]gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  42. Conway JR, Lex A, Gehlenborg N. UpSetR:用于交叉集及其属性可视化的R包。生物信息学2017 Sep 15;33(18):2938-2940 [j]gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  43. 布雷曼L.随机森林。Mach Learn 2001 Oct 1;45(1):5-32。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  44. 刘建军,刘建军。基于随机森林的分类回归算法。R新闻2002;2(3):18-22。gydF4y2Ba
  45. 陈晨,刘安,Breiman L.基于随机森林的不平衡数据学习。加州大学伯克利分校统计学系,2004年7月1日。URL:gydF4y2Bahttps://statistics.berkeley.edu/tech-reports/666gydF4y2Ba[2021-09-07]访问gydF4y2Ba
  46. 荆棘GW。以概率表示的预测的验证。星期一-星期Rev 1950年1月1日;78(1):1-3。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  47. 布列曼L.袋外估价。加州大学伯克利分校。1996。URL:gydF4y2Bahttps://www.stat.berkeley.edu/~breiman/OOBestimation.pdfgydF4y2Ba[2021-11-01]访问gydF4y2Ba
  48. 刘建军,刘建军。控制错误发现率:一种实用且强大的多重测试方法。[J] .中国生物医学工程学报,2003;31(1):391 - 391。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  49. 多基因评分(PGS)目录。后卫目录。URL:gydF4y2Bahttps://www.pgscatalog.org/gydF4y2Ba[2021-09-07]访问gydF4y2Ba
  50. Lundberg S, Lee SI。解释模型预测的方法之间出人意料的统一。In: Advances In Neural Information Processing Systems. 2016 12;2016年12月5日至10日;巴塞罗那,西班牙gydF4y2Bahttp://arxiv.org/abs/1611.07478gydF4y2Ba
  51. Molnar C, Casalicchio G, Bischl B. [j]:一个可解释机器学习的R包。[J]开源软件2018;3(27):786。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  52. 李建军,李建军,李建军,等。基于神经网络的疼痛强度评估方法研究。公共科学图书馆学报,2021;16(7):e0254108 [j]gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  53. 胡斌,陈毅,Keogh E.更现实假设下的流时间序列分类。数据最小知识磁盘2015年6月3日;30(2):403-437。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  54. 陈丽娟,陈丽娟,李建平。心血管疾病风险与心率变异性的相关性研究。中华流行病学杂志,2017,27(10):619-25。e2 (gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  55. van de Vegte YJ, van der Harst P, Verweij N.停止运动后10秒心率恢复预测死亡。中华心脏杂志2018年4月5日;7(8):e008341 [J]gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  56. Georgiopoulou VV, Kalogeropoulos AP, Chowdhury R, Binongo JN, Bibbins-Domingo K, Rodondi N,健康ABC研究。老年人的运动能力、心力衰竭风险和死亡率:健康ABC研究预防医学2017年2月;52(2):144-153 [J]gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  57. Niemelä M, Kangas M, Farrahi V, Kiviniemi A, Leinonen AM, Ahola R,等。中年人体力活动强度和时间模式与心血管疾病风险的关系2019年7月;124:33-41 [j]gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  58. Khera AV, Emdin CA, Drake I, Natarajan P, Bick AG, Cook NR,等。遗传风险,坚持健康的生活方式,以及冠心病。中华医学杂志,2016;37 (4):349- 358 [J]gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  59. MA, Verweij N, van der Harst P.在英国生物银行的研究中,结合遗传和生活方式风险与心血管疾病和糖尿病的关联。中国医学杂志2018;3(8):693-702 [j]gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  60. 个人获得基因组疾病风险因素对生活方式有有益的影响。《科学日报》。2018年6月15日。URL:gydF4y2Bahttps://www.sciencedaily.com/releases/2018/06/180615185408.htmgydF4y2Ba[2021-09-07]访问gydF4y2Ba
  61. 基因-环境交互作用:定义与研究设计。前医学1996;25(6):764-770 [j]gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  62. 研究候选通路中基因与环境相互作用的方法和全基因组关联研究。中华卫生杂志;2010;31:21-36 [j]gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  63. 李,李X,张年代,斯奈德m基因-环境相互作用在精密医学的时代。Cell 2019 Mar 21;177(1):38-44 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  64. 张建军,张建军,张建军,等。英国生物银行:一个开放获取的资源,用于确定各种复杂的中老年疾病的原因。PLoS Med 2015 Mar 31;12(3):e1001779 [j]gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  65. Muggeridge DJ, Hickson K, Davies AV, Giggins OM, Megson IL, Gorely T,等。使用极性OH1和Fitbit充电3可穿戴设备测量健康成年人在轻度、中度、剧烈和冲刺运动中的心率:验证研究。JMIR Mhealth Uhealth 2021年3月25日;9(3):e25313 [j]gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  66. Lubitz SA, Faranesh AZ, Atlas SJ, McManus DD, Singer DE, Pagoto S,等。一项大型人群研究的基本原理和设计,以验证从消费者追踪器或智能手表获得的数据评估心房颤动的软件:Fitbit心脏研究。我的心[J] [J]; 2021; 38:16-26。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  67. 国家超级计算中心。URL:gydF4y2Bahttps://www.nscc.sg/gydF4y2Ba[2022-07-04]访问gydF4y2Ba


‎gydF4y2Ba
Catch22:gydF4y2Ba标准时间序列特征gydF4y2Ba
MDA:gydF4y2Ba平均精度下降gydF4y2Ba
OOB:gydF4y2Baout-of-baggydF4y2Ba
后卫:gydF4y2Ba多基因的分gydF4y2Ba
世鹏科技电子:gydF4y2Ba沙普利加法解释gydF4y2Ba


R库卡夫卡编辑;提交09.11.21;G . Chevance的同行评审;对作者04.12.21的评论;修订版本收到12.04.22;接受29.05.22;发表29.07.22gydF4y2Ba

版权gydF4y2Ba

©周伟庄,陈宇恩,符川生,张敬贤,张敬贤,张敬贤,Sonia Davila,黄伟霆,Jonathan Yap, Stuart Cook, Patrick Tan, Calvin Woon-Loong Chin, Khung Keong Yeo, Weng Khong Lim, Pavitra Krishnaswamy。原载于医学互联网研究杂志(//www.mybigtv.com), 2022年7月29日。gydF4y2Ba

这是一篇在知识共享署名许可(https://creativecommons.org/licenses/by/4.0/)下发布的开放获取文章,该许可允许在任何媒介上不受限制地使用、分发和复制,前提是原始作品首次发表在《医学互联网研究杂志》上,并适当引用。必须包括完整的书目信息,到//www.mybigtv.com/上原始出版物的链接,以及版权和许可信息。gydF4y2Ba


Baidu
map