卡塔尔世界杯8强波胆分析|卡塔尔世界杯4强波胆分析

JCARD

JMIR有氧运动

2561 - 1011

卡塔尔世界杯8强波胆分析

加拿大多伦多

v6i2e38040

36322114

10.2196/38040

原始论文

时间范围对分类准确性的影响:机器学习在冠心病事件预测中的应用

梁

蒂芙尼

安迪

Anietie

Uludag

Kadir也

胡福特

麦肯齐

Verran

黛博拉

西蒙

史蒂文

英航博士 1

心脏病科科罗拉多大学医学院

13001 E 17室

Aurora, CO, 80045

美国 1 303 724 6946 steven.simon@cuanschutz.edu

https://orcid.org/0000-0001-5385-3574

Mandair

Divneet

英航博士 2

https://orcid.org/0000-0002-4629-0387

Albakri

阿卜杜勒•

英航博士 2

https://orcid.org/0000-0003-1761-663X

焚风

艾莉森

博士学位 3.

https://orcid.org/0000-0003-4231-3331

西蒙

诺亚

博士学位 4

https://orcid.org/0000-0002-8985-2474

兰格

莱斯利

博士学位 5

https://orcid.org/0000-0002-4220-6766

比格斯

玛丽

博士学位 6

https://orcid.org/0000-0003-0687-9610

穆卡马尔

肯尼斯

医学博士 7

https://orcid.org/0000-0001-8450-6970

Psaty

布鲁斯

医学博士 3. 8

https://orcid.org/0000-0002-7278-2190

罗森博格

迈克尔

医学博士 1

https://orcid.org/0000-0002-6708-1648

1 心脏病科科罗拉多大学医学院

奥罗拉有限公司

美国 2 科罗拉多大学医学院

奥罗拉有限公司

美国 3. 流行病学系华盛顿大学

西雅图,华盛顿州

美国 4 生物统计系华盛顿大学

西雅图,华盛顿州

美国 5 生物医学信息学和个性化医学处“，科罗拉多大学安舒茨医学院

奥罗拉有限公司

美国 6 心血管健康研究小组华盛顿大学

西雅图,华盛顿州

美国 7 医学系贝斯以色列女执事医疗中心

波士顿

美国 8 医学系华盛顿大学

西雅图,华盛顿州

美国

通讯作者:Steven Simon steven.simon@cuanschutz.edu

Jul-Dec 2022

2 11 2022

6 2

e38040

16 3. 2022 12 5 2022 28 6 2022 9 8 2022

©Steven Simon, Divneet Mandair, Abdel Albakri, Alison Fohner, Noah Simon, Leslie Lange, Mary Biggs, Kenneth Mukamal, Bruce Psaty, Michael Rosenberg。最初发表在JMIR Cardio (https://cardio.www.mybigtv.com)， 02.11.2022。

2022

这是一篇开放获取的文章，根据创作共用署名许可协议(https://creativecommons.org/licenses/by/4.0/)的条款发布，允许在任何媒体上不受限制地使用、分发和复制，前提是正确引用了首次发表在JMIR Cardio上的原创作品。必须包括完整的书目信息，https://cardio.www.mybigtv.com上的原始出版物的链接，以及此版权和许可信息。

背景

许多机器学习方法仅限于结果分类，而不是纵向预测。在临床风险预测中使用机器学习的一种策略是在给定的时间范围内对结果进行分类。然而，如何确定风险预测的最佳时间范围并不为人所知。

客观的

在这项研究中，我们的目标是利用机器学习方法，随着时间范围的增加，确定事件心肌梗死(MI)分类的最佳时间范围。此外，我们试图将这些模型的性能与传统的弗雷明汉心脏研究(FHS)冠心病性别特异性Cox比例风险回归模型进行比较。

方法

我们分析了5201名心血管健康研究参与者的单次临床访问数据。我们检查了从基线检查中收集的61个变量，包括人口统计学和生物学数据、病史、药物、血清生物标志物、心电图和超声心动图数据。我们比较了几种机器学习方法(如随机森林、L1回归、梯度增强决策树、支持向量机和k-最近邻)，以预测在500-10,000天的随访时间范围内发生的心肌梗死事件。使用受试者工作特征曲线下面积(AUROC)在20%保留测试集上比较模型。随机森林和L1回归模型跨时间点的变量重要性被执行。我们将结果与FHS冠心病性别特异性Cox比例风险回归函数进行比较。

结果

有4190名参与者被纳入分析，其中2522名(60.2%)女性参与者，平均年龄为72.6岁。随访1万多天，共发生813例心肌梗死事件。机器学习模型在中等程度的随访时间范围内(即1500-2500天)最有预测性。总体而言，L1 (Lasso)逻辑回归在所有时间范围内显示出最强的分类准确性。该模型在1500天随访时最具预测性，AUROC为0.71。最具影响力的变量因随访时间和模型而异，在所有时间框架内，性别是L1回归和随机森林模型权重的最重要特征。与Framingham Cox函数相比，L1和随机森林模型在超过1500天的所有时间框架上表现更好。

结论

在无冠心病的人群中，机器学习技术可用于在不同时间范围内以合理的准确性预测心肌梗死，在中等随访期预测准确性最强。需要在其他人群中验证，以确认这种方法在风险预测中的有效性。

冠心病风险预测机器学习心心脏病临床风险心肌性别

简介

心血管疾病(CVD)是美国和世界范围内发病率和死亡率的主要原因。美国成年人心血管疾病的患病率已达48%，预计到2035年，美国将有超过1.3亿成年人患有心血管疾病，总费用预计将达到1.1万亿美元[ 1］．心血管疾病导致死亡的主要原因是冠心病，其次是中风、高血压和心力衰竭[ 1］．仅在今年，大约有60.5万美国人将发生心肌梗死(MI)，超过11万人将死于心肌梗死[ 1］．鉴于心肌梗死的高患病率，人们非常重视识别那些最有可能发生冠心病的人群[ 2- 5］．如果正确识别，初级预防药理学和生活方式策略可应用于风险最高的人群[ 6］．

历史上，风险预测模型是通过将传统的统计模型(即基于回归的模型和Cox)应用于队列数据而开发的[ 7- 10］．这些分析提供了关于CVD风险的广泛信息，并在临床上非常有用，因为它们在少数变量和感兴趣的结果之间具有直接关系[ 11- 16］．然而，当应用于新的数据集时，这些风险评分通常不能达到高可靠性[ 10, 17］．目前，大约一半的心肌梗死和中风发生在心血管疾病风险不高的人群中。 18］．

机器学习作为一种处理大量数据的新方法被引入，主要关注于准确预测，而不是理解风险因素对疾病的相对影响。在一些应用中，机器学习方法被发现可以改进传统的回归模型来预测各种心血管结果[ 19- 22］．应用机器学习方法的一个关键方面是偏差-方差权衡或平衡模型对训练数据的拟合精度(偏差)和它在样本外测试或验证数据中广泛应用的程度(方差)[ 23］．机器学习模型在处理大量协变量和非线性或复杂的协变量关系时往往表现出色，通常以过度拟合特定训练集为代价[ 24］．然而，随着对协变量之间复杂相互作用建模能力的增强，对风险因素与结果之间关系的理解也在下降。此外，许多机器学习方法的一个关键限制是，它们通常是分类模型，不包括完善的方法来合并有关时间到事件数据的信息。研究人员通常选择单一的时间范围进行分类，但不同的时间范围如何影响相对预测精度是机器学习方法中一个相对未探索的方面。我们假设在预测时间范围的选择中存在权衡，其中使用较短的时间范围提供了与结果和更大的效应大小的预测因素的增加相关性。当时间范围持续时间较长时，这与事件数量的增加相平衡。基于这种权衡，我们可以预测中等时间范围将具有最高的预测准确性。

通过这项调查，我们检查了不同时间范围对心肌梗死事件预测的影响。使用来自心血管健康研究(CHS)的数据[ 25]，我们检查了多种机器学习算法在500天到10,000天随访的不同时间框架内的预测准确性，以确定突发心肌梗死。此外，我们使用弗雷明汉心脏研究(FHS)冠心病性别特异性Cox比例风险回归模型与机器学习模型进行比较。我们的目标是找出哪个时间范围具有最高的预测准确性，并研究如何将其与FHS回归模型的预测准确性进行比较。

方法道德的考虑

数据由心血管健康研究政策和程序委员会批准使用，并附有数据和材料分发协议。

数据集创建

我们使用了来自CHS的匿名数据[ 25]，其设计和目标已在前面介绍。简单地说，CHS是一项针对65岁或以上年龄的男性和女性的纵向研究，从宾夕法尼亚州匹兹堡、北卡罗来纳州福赛斯县、加利福尼亚州萨克拉门托和马里兰州黑格斯敦的符合医疗保险资格的随机样本中招募。最初的5201名参与者于1989-1990年被招募，并作为本研究的样本。在该队列中获得基线数据，并定期进行常规门诊访问和电话采访。

我们从队列中排除了有心肌梗死基线史的患者。我们检查了从基线检查中收集的61个变量，包括人口统计学和生物学数据(表S1) 多媒体附件1）.

使用事件MI的终点，我们在不同的时间范围内应用了多种机器学习方法来定义最佳风险预测。在基线人口统计和实验室数据中，变量数据缺失的情况相当少见。虽然总体上不常见，但心电图变量的缺失数据更常见。在这些数据缺失的情况下，使用中值替换连续变量和最常见的替换类别变量( 图1）.

图1

分析流程图。心血管健康研究。

统计分析

数据集被随机分为训练集(80%)和测试或验证集(20%)。利用训练数据集构建5种机器学习模型:随机森林、L1 (LASSO)回归、支持向量机、k-近邻和梯度增强决策树。使用验证集执行超参数调优，以确定在训练过程中未学习到的参数的最优值。然后将这些模型应用于测试集，以检查模型性能，使用接受者工作特征曲线(AUROC)下的面积进行评估。此外，我们使用FHS冠心病Cox比例风险回归模型与机器学习模型进行比较(表S2) 多媒体附件1) [ 7, 9, 26］．

从500天开始，我们在500天的时间范围内循环每个模型，以确定到10,000天的随访时间的最佳预测范围。对于每个时间范围，变重要度算法应用于L1回归和随机森林模型。在L1回归模型中，对模型帮助较小的系数被缩小为零，从而完全删除了不需要的变量。剩下的系数是选定的变量。由于模型使用归一化的输入，可以根据每个输入的平均系数的绝对值进行系数的直接比较。在随机森林算法中，我们执行了“置换”特征选择，通过测量给定变量在模型中基本无效时精度的下降来测量每个变量的预测强度。

初步分析确定了与在保留的分割样本中选择的案例相关的高度偏倚，因此我们使用不同的随机种子进行了50次分析，并为每个模型、时间范围和种子数量存储了单独的结果(每种类型的模型总共有1000个独立模型)。根据每个模型的平均AUROC、系数值(L1回归)和杂质或准确性(随机森林)编译结果。采用种子数为随机效应，非结构化协方差矩阵模式的线性混合效应模型进行模型比较。

所有建模都使用R软件(版本1.1.463;统计计算R基金会)。中提供了用于分析的代码多媒体附件1．模型比较(混合效应模型)使用Stata IC(版本14;占据公司)。

结果

研究参与者的基线特征显示在表1．共有4190名参与者参与。队列的平均年龄为72.6岁，2522名(60.2%)参与者为女性。基线时，2201人(53%)有吸烟史，2300人(55%)诊断为高血压，389人(9.3%)诊断为糖尿病。在30年的随访中，共发生813起心肌梗死事件，中位随访时间为4725天。

表1

研究参与者的基线特征。

特征	值(N = 4190)
年龄(年)，平均值(SD)	72.6 (5.6)
性别(男性)，n (%)	1668 (39.8)
烟草消费量，n (%)	2201 (53)
高血压，n (%)	2300 (55)
糖尿病，n (%)	389 (9.3)
总胆固醇(mg/dL)，平均值(SD)	211 (38)
BMI，平均值(SD)	26.4 (1.9)

跨时间范围预测模型的比较

中显示了机器学习方法与FHS模型的相对性能图2作为AUROC在时间范围内的切点。机器学习模型通常在1500-2500天的中等时间范围内最有预测性。

除了检查AUROC，我们还检查了精度-召回曲线下的面积( 图3)，这有利于较晚的时间范围，但模型性能的顺序没有变化。L1回归模型在各个时间点上仍然具有最高的性能。

L1逻辑回归在所有时间点上的总体预测能力最强( 图4)，在1500天时间范围内预测精度最高，AUROC为0.71。k-最近邻模型在所有时间点上的表现相对较差。

与FHS模型相比，L1模型在500天的随访中表现较差，但在所有后续随访时间中预测精度较高。随机森林模型在1500天的随访中比FHS模型表现更好。其余的机器学习模型在所有时间框架上的预测能力都不如FHS模型( 图2）.

图2

在不同时间范围内的预测准确性。FHS:弗雷明汉心脏研究;KNN: k-最近邻;RF:随机森林;ROC:受试者工作特征;支持向量机:支持向量机。

图3

利用精度-召回曲线下面积的预测精度。KNN: k-最近邻;公关:precision-recall;RF:随机森林;支持向量机:支持向量机。

图4

所有时间范围的预测精度。AUC:曲线下面积;KNN: k-最近邻;RF:随机森林;支持向量机:支持向量机。

特征选择

一些机器学习算法允许分析模型的变量贡献。对于本分析，在L1回归和随机森林模型的所有时间点上执行特征重要性( 表2）.

表2

特征选择(顶部特征)。

模型	短期随访(500-1000天)	中期随访(1500-2500天)	长期随访(>2500天)
L1回归	性别(0.90) 钙通道阻滞剂(0.47) IVCD^一个通过心电图^b(0.40) 糖尿病(0.32) 吸烟(0.22) 收缩压(0.21)	性别(1.03) 糖尿病(0.33) 钙通道阻滞剂(0.42) 高血压(0.27) 酒精(每周)(-0.21)	性别(0.50) 钙通道阻滞剂(0.33) 糖尿病(0.20)
随机森林	重量残^c 身体质量指数高度低密度^d	重量残身体质量指数高度性别	重量总胆固醇身体质量指数高度低密度

^一个IVCD:脑室传导延迟。

^b心电图:心电图。

^cFEV1: 1秒用力呼气量。

^dLDL-C:低密度脂蛋白胆固醇。

对于L1回归，短期随访间隔(即<1000天)中最重要的变量(基于应用于归一化输入的系数绝对值)是性别、糖尿病史、使用钙通道阻滞剂或β-阻滞剂以及心电图显示是否有心室传导缺陷。在中期随访间隔(1500-2500天)，最重要的变量是性别、钙通道阻滞剂的使用、糖尿病史和高血压史。在较长的随访时间(即>2500天)中，最重要的变量是性别、钙通道阻滞剂的使用和糖尿病史。

在基于准确性的随机森林变量选择中，短期随访间隔(即<1000天)最重要的变量是体重、肺功能检测的用力呼气量(FEV)、BMI、身高和低密度脂蛋白(LDL)胆固醇。在中间随访期(1500-2500天)，最重要的变量是体重、FEV、BMI、身高和性别。在较长的随访时间(即>2500天)中，最重要的变量是体重、身高、BMI、LDL胆固醇和总胆固醇。

讨论主要研究结果

这项研究证明了在队列数据的不同时间范围内使用机器学习方法预测突发心肌梗死的能力。使用AUROC作为模型性能的主要指标，所有模型的预测在中等随访期(即1500-2500天)最为准确。L1正则化回归在所有时间框架内提供了最准确的预测，其次是随机森林算法。这两个模型与FHS冠心病预测变量相比较，特别是在较长的随访间隔中。应用排序变量重要性算法演示了所选择的变量如何随时间和不同模型而不同。

在中度随访期预测最为准确。我们怀疑这是由于积累了足够多的事件，同时仍然接近基线数据收集的平衡。在时间上与结果更接近的预测器更有可能与预测相关，随着时间的推移，越来越多的事件积累，识别预测模型的能力也会增强。先前的研究着眼于机器学习在短期和中期随访时间对冠心病的预测;然而，据我们所知，这是第一个将模型应用于从短期到长期随访的年度时间范围的研究[ 27］．

L1正则化回归通常在所有时间框架内提供最准确的预测。这些正则化回归模型通过在拟合回归模型之前在所有变量中搜索预测因子的最佳子集来扩展传统回归模型。L1 (Lasso)回归与其他正则化回归模型的不同之处在于，它可以将许多变量的重要性缩小到零，除了防止过拟合外，还允许特征选择。因此，它在使用许多变量时非常有用，例如在队列或电子健康记录数据中。先前的研究发现，这些模型可与更先进的机器学习方法相媲美，用于预测临床结果[ 28］．随机森林模型也表现得很好。随机森林是一种正则化的分类和回归树模型，它根据结果搜索最适合分割数据的协变量，然后继续使用额外的协变量进行分割，直到形成许多决策“树”。这些模型避免了过拟合，也可以克服非线性和处理许多变量。与之前的工作相比，我们的研究中基于AUROC的L1回归和随机森林预测模型的准确性是合理的[ 29］．值得注意的是，我们在L1回归中没有包括相互作用或多项式项，因此，该模型将无法以与随机森林相同的方式识别预测因子之间的非线性效应。我们的研究发现，尽管存在这种局限性，但L1回归提供了更高的预测准确性，这表明非线性效应对冠状动脉疾病或心肌梗死的预测因素可能不那么重要，尽管还需要进一步的工作来支持这一说法。

在机器学习模型中，任何一个变量和结果之间的关系都不像标准回归模型那样清晰。但是，有些方法可以提供每个变量对模型创建的相对重要性。我们对L1回归和随机森林模型进行了排序变量分析。我们发现，一般来说，模型发现传统的风险因素是最重要的;然而，这些最重要的变量随着时间的推移而变化。

随机森林变量重要性发现，体重、身高、低密度脂蛋白胆固醇和BMI在时间框架内非常重要。FEV在中短期随访中很重要，但在长期随访中不太重要。对于L1回归，性别、糖尿病史和钙通道阻滞剂的使用是所有时间范围内的重要变量。虽然这些关联很有趣，但因果关系不能应用于这些分析，它只能建议进一步研究这些变量的重要性。

限制

这项研究有一些明显的局限性。首先，CHS [ 25]事故MI的数据是故障时间数据，由于缺乏随访，我们的模型不允许审查观察。其次，测试和验证都只在CHS队列中进行。虽然一方面，这是对特定人群的重要检查，但它限制了我们的发现对全球人群的适用性。机器学习模型对训练人群非常敏感，当在一个人群中创建并应用于另一个人群时，已经发现它是有偏见的。由于CHS队列由65岁以上的个体组成，因此该分析提供了一个研究该组机器学习模型的机会。我们使用了在CHS中登记的5201名参与者的原始队列，这省略了随后的主要是非裔美国人队列，使得结果不太适用于全球人口。考虑到这些局限性，这一分析需要在新的队列中进行验证。此外，该模型不容易直接应用于临床实践;然而，这项研究提出了一个在更多临床适用的数据集(包括电子健康记录数据)中进行类似分析的模型。我们的目标是在未来的研究中实现这一目标。

结论

在无冠心病的人群中，机器学习技术可用于准确预测不同时间范围内心肌梗死的发展。考虑到接近基线数据和允许大量事件发生之间的平衡，适度的随访时间范围似乎具有最准确的预测。未来的研究需要在更多的人群中验证这项技术。

多媒体附件1

用于模型分析的表和代码。

缩写

AUROC

接收机工作特性曲线下面积

CHS

心血管健康研究

化学汽相淀积

心血管病

FEV

用力呼气量

FHS

弗雷明汉心脏研究

心肌梗死

这项研究得到了75N92021D00006, HHSN268201200036C, HHSN268200800007C, N01HC55222, N01HC85079, N01HC85080, N01HC85081, N01HC85082, N01HC85083和N01HC85086的支持，以及来自国家心脏，肺和血液研究所(NHLBI)的U01HL080295和U01HL130114的资助，以及国家神经疾病和中风研究所(NINDS)的额外贡献。国家老龄化研究所(NIA)的R01AG023629提供了额外的支持。主要CHS调查员和机构的完整名单可在CHS- nhlbi.org网站上找到。这项工作也得到了国家卫生研究所/NHLBI (MAR: 5K23 HL127296, R01 HL146824)的资助。

没有宣布。

便雅悯

Muntner

阿隆索

一个

Bittencourt

米

卡拉威

卡森

一个

心脏病和中风统计数据-2019年更新:美国心脏协会的一份报告

循环 2019 137 12 e493

阿隆索

一个

Norby

预测心房颤动及其并发症

中国保监会J 2016 80 5 1061 1066

10.1253 / circj.cj - 16 - 0239

施纳贝尔

沙利文

莱维

Pencina

乔丹

马萨罗

达

Newton-Cheh

山本

摩根富林明

马格纳尼

Tadros

有

白平衡

王

Ellinor

狼

巴勒斯坦权力机构

Vasan

便雅悯

房颤风险评分的开发(弗雷明汉心脏研究):一项基于社区的队列研究

《柳叶刀》 2009 02 373 9665 739 745

10.1016 / s0140 - 6736 (09) 60443 - 8

张伯伦

我

阿加瓦尔

福尔松的

基于“增大化现实”技术

苏

易之

Chambless

勒

乌鸦

安布罗斯

米

阿隆索

一个

双种族前瞻性队列中房颤的临床风险评分(来自社区动脉粥样硬化风险[ARIC]研究)

Am J Cardiol 2011 01 107 1 85 91

10.1016 / j.amjcard.2010.08.049

21146692

s0002 - 9149 (10) 01732 - 7

PMC3031130

阿隆索

一个

Krijthe

英国石油公司

Aspelund

Stepas

卡

Pencina

乔丹

莫泽

罪人

曼氏金融

Sotoodehnia

丰特斯

詹森

ACJW

Kronmal

类风湿性关节炎

马格纳尼

Witteman

张伯伦

我

Lubitz

施纳贝尔

阿加瓦尔

麦克马纳斯

Ellinor

拉森

毫克

伯克

Launer

Hofman

一个

莱维

Gottdiener

Kaab

年代

库伯

哈里斯

结核病

苏

易之

斯特里克

六氯

Gudnason

Heckbert

老

便雅悯

简单的风险模型预测了不同种族和地理人群中房颤的发生率:房颤收费联盟

JAHA 2013 03 12 2 2 e000102

10.1161 / jaha.112.000102

周

丹娜

Blazina

我

Daeges

米

珍妮

他汀类药物用于预防成人心血管疾病:美国预防服务工作组的证据报告和系统综述

《美国医学会杂志》 2016 11 15 316 19 2008 2024

10.1001 / jama.2015.15629

27838722

2584057

威尔逊

PWF

达

R B

莱维

Belanger

我

Silbershatz

有

白平衡

利用危险因素分类预测冠心病

循环 1998 05 12 97 18 1837 47

10.1161/01. cir.97.18.1837

9603539

高夫

钟马田

班尼特

柯迪

年代

达

吉本斯

格陵兰岛

拉克兰

莱维

奥唐纳

罗宾逊

詹

施瓦兹

Shero

圣

史密斯

Sorlie

石头

新泽西

威尔逊

PWF

2013年ACC/AHA心血管风险评估指南

循环 2014 06 24 129 25 _suppl_2 S49 73

10.1161/01. cir.0000437741.48606.98

24222018

01. cir.0000437741.48606.98

达

心胸狭窄的人

年代

沙利文

威尔逊

冠心病风险预测组

弗雷明汉冠心病预测评分的验证:多种族调查结果

《美国医学会杂志》 2001 07 11 286 2 180 7

10.1001 / jama.286.2.180

11448281

joc10098

DeFilippis

美联社

年轻的

McEvoy

Michos

艾德

Sandfort

Kronmal

类风湿性关节炎

麦克勒兰德

Blaha

乔丹

风险评分高估:个体心血管危险因素和预防疗法对现代多种族队列中美国心脏协会-美国心脏病学会-动脉粥样硬化性心血管疾病风险评分表现的影响

Eur Heart J 2017 02 21 38 8 598 608

10.1093 / eurheartj / ehw301

27436865

ehw301

PMC5837662

ARIC调查人员

社区(ARIC)动脉粥样硬化风险研究:设计和目标

Am J流行病 1989 129 4 687 702

10.1093 / oxfordjournals.aje.a115184

纳西尔

蔡

米

罗森

双相障碍

费尔南德斯

Bluemke

达

福尔松的

基于“增大化现实”技术

秘鲁首都利马

晶澳

同型半胱氨酸升高与局部左心室功能降低有关

循环 2007 01 16 115 2 180 187

10.1161 / circulationaha.106.633750

《图片报》

Bluemke

伯克

Detrano

Diez Roux

福尔松的

一个

格陵兰岛

雅各

博士

Kronmal

刘

纳尔逊

奥利里

萨德

曼氏金融

非洲酪脂树

年代

Szklo

米

特蕾西

动脉粥样硬化的多民族研究:目标和设计

Am J流行病 2002 11 01 156 9 871 81

10.1093 / aje / kwf113

12397006

罗森博格

米

Gottdiener

Heckbert

年代

穆卡马尔

超声心动图舒张参数与心房颤动风险:心血管健康研究

Eur Heart J 2012 04 33 7 904 12

10.1093 / eurheartj / ehr378

21990265

ehr378

PMC3345546

罗森博格

妈

洛佩兹

Bůž剥

佩特拉

Adabag

年代

陈

Sotoodehnia

Kronmal

类风湿性关节炎

Siscovick

阿隆索

一个

巴克斯顿

一个

福尔松的

基于“增大化现实”技术

穆卡马尔

身高与心源性猝死风险:社区和心血管健康研究中的动脉粥样硬化风险

安论文 2014 03 24 3. 174 179. e2

10.1016 / j.annepidem.2013.11.008

24360853

s1047 - 2797 (13) 00446 - 8

PMC3945001

罗森博格

米

巴顿

Sotoodehnia

卡拉斯

米

Kizer

Zimetbaum

常

Siscovick

Gottdiener

Kronmal

类风湿性关节炎

Heckbert

老

穆卡马尔

身高对心房颤动风险的影响:心血管健康研究

Eur Heart J 2012 11 33 21 2709 17

10.1093 / eurheartj / ehs301

22977225

ehs301

PMC3681530

Christophersen

即

阴

拉森

毫克

Lubitz

马格纳尼

麦克马纳斯

Ellinor

便雅悯

弗雷明汉心脏研究中CHARGE-AF和CHA2DS2-VASc风险评分预测房颤的比较

Am Heart J 2016 08 178 45 54

10.1016 / j.ahj.2016.05.004

27502851

s0002 - 8703 (16) 30061 - 8

PMC5344697

Ridker

点

能源部

丰

足总

Genest

Gotto

我

Kastelein

Koenig

利比

Lorenzatti

举办

詹

Nordestgaard

牧羊人

Willerson

格林

瑞舒伐他汀预防男性和女性c反应蛋白升高的血管事件

N英语J医学 2008 11 20. 359 21 2195 2207

10.1056 / nejmoa0807646

Shouval

Hadanny

一个

什洛莫

Iakobishvili

昂格尔

Zahger

Alcalai

阿塔尔

年代

戈特利布

年代

Matetzky

年代

戈登伯格

我

Beigel

机器学习预测ST段抬高型心肌梗死后30天死亡率:一项急性冠状动脉综合征以色列调查数据挖掘研究

国际J心脏 2017 11 01 246 7 13

10.1016 / j.ijcard.2017.05.067

28867023

s0167 - 5273 (16) 32869 - 8

20.

Mansoor

Elgendy

西格尔

Bavry

扁

st段抬高型心肌梗死女性住院死亡率的风险预测模型:一种机器学习方法

心肺 2017 11 46 6 405 411

10.1016 / j.hrtlng.2017.09.003

28992993

s0147 - 9563 (17) 30160 - 7

李

刘

杨

谢

徐

米

杨

利用机器学习模型预测st段抬高型心肌梗死患者的住院死亡率

种马健康技术通知 2017 245 476 480

29295140

Kakadiaris

Vrigkas

米

日元

库兹涅佐娃

Budoff

米

Naghavi

米

在MESA中，机器学习优于ACC/AHA CVD风险计算器

JAHA 2018 11 20. 7 22 e009476

10.1161 / jaha.118.009476

黑斯蒂

Tibshirani

弗里德曼

《统计学习的要素:数据挖掘、推断、预测》第二版 2009

纽约州纽约

斯普林格出版社

793

Gorodeski

易之

Ishwaran

Kogalur

乌兰巴托

百仕通

嗯

Hsich

张

Vitolins

曼森

我

抑制

马丁

Prineas

劳尔

女士

使用数百种心电图生物标志物预测绝经后妇女的死亡率

心血管质量结果 2011 09 4 5 521 532

10.1161 / circoutcomes.110.959023

炸

Borhani

没有

恩莱特

Furberg

Gardin

Kronmal

类风湿性关节炎

库

韩

Manolio

助教

Mittelmark

纽曼

一个

奥利里

Psaty

Rautaharju

特蕾西

维勒

心血管健康研究:设计和基本原理

安论文 1991 2 1 3. 263 276

10.1016 / 1047 - 2797 (91) 90005 - w

安德森

公里

威尔逊

Odell

点

有

白平衡

更新的冠状动脉风险概况。给健康专家的声明

循环 1991 01 83 1 356 62

10.1161/01. cir.83.1.356

1984895

多根

米

海滩

年代

西蒙斯

Lendasse

一个

Penaluna

菲尔波特

在弗雷明汉心脏研究中，通过机器学习预测5年冠心病发病风险的基于血液的生物标志物

基因(巴塞尔) 2018 12 18 9 12 641

10.3390 / genes9120641

30567402

genes9120641

PMC6315411

女子

(

吉隆坡

史密斯

德

兴

戈什

罗森博格

妈

评估机器学习模型应用于协调的电子健康记录数据预测房颤

美国医学会网络公开赛 2020 01 03 3. 1 e1919396

10.1001 / jamanetworkopen.2019.19396

31951272

2758859

PMC6991266

Ambale-Venkatesh

杨

吴

有限公司

刘

Hundley

工作组

麦克勒兰德

戈麦斯

作为

福尔松的

基于“增大化现实”技术

非洲酪脂树

年代

Guallar

Bluemke

达

秘鲁首都利马

晶澳

心血管事件的机器学习预测

中国保监会Res 2017 10 13 121 9 1092 1101

10.1161 / circresaha.117.311312