本文的预印本(早期版本)可在以下网站获得https://preprints.www.mybigtv.com/preprint/32366,第一次出版
机器学习派生的产前预测风险模型指导干预,防止妊娠期糖尿病发展为2型糖尿病:预测模型开发研究

机器学习派生的产前预测风险模型指导干预,防止妊娠期糖尿病发展为2型糖尿病:预测模型开发研究

机器学习派生的产前预测风险模型指导干预,防止妊娠期糖尿病发展为2型糖尿病:预测模型开发研究

原始论文

1新加坡临床科学研究所,科学技术和研究局,新加坡,新加坡

2新加坡科学技术与研究局生物信息研究所,新加坡

3.新加坡国立大学公共卫生学院,国立大学卫生系统,新加坡,新加坡

4新加坡国立大学荣禄林医学院儿科学系,新加坡,新加坡

5新加坡KK妇女儿童医院妇产科,新加坡

6新加坡,杜克-新加坡国立大学研究生医学院,产科和妇科学术临床项目

7新加坡国立大学医学院妇产科及人类潜能转化研究项目,新加坡,新加坡

8新加坡KK妇女儿童医院生殖医学系,新加坡

9癌症和干细胞生物学,杜克-新加坡国立大学医学院,新加坡,新加坡

10英国南安普顿大学MRC生命过程流行病学部门

11联合王国南安普顿南安普顿大学医院国民保健服务基金会信托南安普顿国家保健和护理研究所南安普顿生物医学研究中心

12赫尔辛基大学全科和初级保健系,芬兰赫尔辛基

13Folkhälsan芬兰赫尔辛基研究中心

14新加坡国立大学数据科学研究所,新加坡,新加坡

15新加坡国立大学医学院生物化学系,新加坡,新加坡

*这些作者贡献相同

通讯作者:

Neerja Karnani博士

新加坡临床科学研究所

科学技术与研究局

布伦纳分子医学中心

30医疗开车

新加坡,117609年

新加坡

电话:65 64074041

电子邮件:neerja_karnani@sics.a-star.edu.sg


背景:妊娠期糖尿病(GDM)患病率的增加令人担忧,因为妊娠期糖尿病(GDM)的女性在晚年患2型糖尿病(T2D)的风险较高。这种风险的巨大程度突出了早期干预的重要性,以防止GDM发展为T2D。产后筛查率并不理想,在亚洲国家往往低至13%。在一些卫生保健系统中,通过结构化产后筛查缺乏预防性护理,公众意识低是进行产后糖尿病筛查的主要障碍。

摘要目的:在这项研究中,我们开发了一个机器学习模型,用于在常规产前GDM筛查后早期预测产后T2D。在产前护理中对产后T2D的早期预测将有助于实施有效的糖尿病预防干预策略。据我们所知,这是第一项在亚洲裔产前人群中使用机器学习进行产后T2D风险评估的研究。

方法:前瞻性多民族数据(华人、马来和印度民族)来自新加坡最具表现型的母亲-后代队列研究——新加坡成长走向健康结果——中的561名孕妇,用于预测建模。纳入的特征变量包括人口统计、病史或产科史、身体测量、生活方式信息和GDM诊断。Shapley值与CatBoost树集成相结合,执行特征选择。我们的博弈论预测分析方法使人口子类型和模式发现数据驱动的精确护理成为可能。预测模型使用4种机器学习算法进行训练:逻辑回归、支持向量机、CatBoost梯度增强和人工神经网络。我们使用5次分层交叉验证,以保持每次T2D病例的相同比例。建立了网格搜索管道来评估最佳性能的超参数。

结果:建立了一种高性能的产后T2D预测模型,包括两个妊娠中期特征-妊娠中期体重增加后的BMI和gdm诊断(BMI_GDM CatBoost模型:AUC=0.86, 95% CI 0.72-0.99)。仅孕前BMI不足以预测产后T2D风险(ppBMI CatBoost模型:AUC=0.62, 95% CI 0.39-0.86)。餐后2小时血糖试验(bmi_2h CatBoost模型:AUC=0.86, 95% CI 0.76-0.96)显示,与空腹血糖试验(bmi_空腹CatBoost模型:AUC=0.76, 95% CI 0.61-0.91)相比,产后T2D风险预测效果更强。当使用国际糖尿病和妊娠研究小组协会(IADPSG) 2018年GDM诊断的修正两点标准(BMI_GDM CatBoost模型:AUC=0.84, 95% CI 0.72-0.97)时,BMI_GDM模型也是稳健的。妊娠总体重增加与产后T2D结局呈负相关,独立于孕前BMI和GDM诊断(P=.02;或0.88,95% ci 0.79-0.98)。

结论:孕中期体重增加的影响,结合妊娠期间GDM的代谢紊乱,预示着新加坡妇女未来患T2D的风险。还需要进一步的研究来检查怀孕期间的代谢适应对产后产妇代谢健康结果的影响。最先进的机器学习模型可以作为产前护理期间的快速风险分层工具。

试验注册:ClinicalTrials.gov NCT01174875;https://clinicaltrials.gov/ct2/show/NCT01174875

JMIR糖尿病2022;7 (3):e32366

doi: 10.2196/32366

关键字



妊娠期糖尿病(GDM)的患病率在全球范围内呈上升趋势,每6个妊娠中就有1个受到影响[1].GDM具有长期影响,因为有GDM病史的妇女发展为2型糖尿病(T2D)的风险是血糖正常妊娠的妇女的10倍[2].在“在新加坡走向健康结果的成长”(GUSTO)研究中,GDM妇女在产后4-6年发生T2D的风险是无GDM妇女的12倍[3.].从公共卫生角度来看,对GDM妇女的早期干预可能有助于解决T2D造成的日益加重的全球卫生负担。T2D流行在东南亚尤其令人担忧;目前有8800万成年人患有糖尿病,但预计到2045年这一数字将增加到1.53亿[1].此外,在东南亚,57%的糖尿病患者未得到诊断,增加了心脏病和中风等并发症的风险[1].

美国糖尿病协会指南建议GDM女性在产后4-12周进行75克口服葡萄糖耐量试验(OGTT) [4].产后OGTT正常的孕妇建议每1-3年进一步检测空腹血糖、血红蛋白A1 c或HbA1 c,或OGTT [4].然而,随着GDM的解决,产后血糖监测在全球卫生保健系统中仍然很低。在亚洲国家,产后糖尿病筛查率可低至13% [5].产后糖尿病筛查的障碍包括卫生保健系统缺乏结构化的产后预防护理,患者对未来T2D风险缺乏认识,以及由于产妇承诺而造成的时间限制[56].

机器学习模型能够预测人口风险分层。Allalou等人在一项前瞻性代谢组学研究中[7],在产后6-9周确定了21种代谢物,以预测妇女从GDM到T2D的过渡。使用决策树的代谢物模型表现良好,接受者工作特征曲线(AUC)下面积为0.77。在Joglekar等人的另一项GDM到T2D过渡研究中[8],在产后12周纳入循环microRNA (miR-369-3p)增强了对临床模型(年龄、BMI、妊娠空腹血糖、产后空腹血糖、胆固醇和三酰甘油)的预测,AUC从0.83提高到0.92(逻辑回归算法)。除了GDM患者产后检测依从性低之外,这两个机器学习模型在现实世界中实施的其他障碍包括成本和在常规临床访问中获得代谢组学检测和microRNA聚合酶链式反应的途径。

在产前护理中对产后T2D的早期预测将有助于实施有效的糖尿病预防干预策略。到目前为止,尚未有使用机器学习对亚洲裔产前人群进行产后T2D风险评估的研究。在这项来自新加坡的研究中,我们开发了一个机器学习模型,用于在常规产前GDM筛查中早期预测产后T2D。我们的机器学习模型是使用前瞻性GUSTO队列研究数据(NCT01174875)实现的。


伦理批准

本研究已由国家医疗保健集团领域特定审查委员会和SingHealth集中机构审查委员会(CIRB/E/2019/2655)审查。

研究设计

GUSTO是一项前瞻性的多民族(华人、马来和印度民族)母亲-后代队列研究。2009年6月至2010年10月期间,从新加坡两家主要的公立妇产医院——国立大学医院和KK妇幼医院——招募了怀孕早期的母亲。

混合种族或招募时自我报告T2D的参与者被排除在模型训练之外。共有561名母亲拥有完整的人口统计数据、病史或产科史、身体测量、生活方式信息、产前OGTT和产后4-8年OGTT。世界卫生组织(卫生组织)1999年标准[9]用于诊断GDM,而世卫组织2006年的标准[10]用于诊断产后糖耐量受损(IGT)、空腹血糖受损(IFG)和T2D。异常糖代谢(AGM)结果包括IGT、IFG和T2D诊断。

特征变量

人口学信息(产妇年龄、产妇种族)和病史或产科史(自我报告的孕前体重、糖尿病家族史、高血压家族史、心血管疾病家族史、GDM家族史、妊娠高血压家族史和胎次)来自于妊娠前三个月的问卷调查。在妊娠中期记录收缩压和舒张压(中位26.7,IQR 26.1-27.6周),并从医院病例记录中获取。平均动脉血压是舒张压加倍,收缩压加起来,总和除以3。孕妇在妊娠中期测量人体测量(中位26.9,IQR 26.4-27.6周)。产妇上臂中围测量到最近的0.1 cm,肩峰和鹰嘴突之间的中间位置(使用Seca 212)。产妇身高测量到最接近的0.1厘米(使用Seca 213)。孕妇在妊娠中期的体重被测量到最接近的0.1公斤(使用Seca 803), BMI被计算为体重除以身高的平方(kg/m)2).妊娠总增重由最后一次产前就诊体重(中位数38.1,IQR 37.3-39.1周)减去首次产前就诊体重(中位数9.0,IQR 7.3-11.0周)得出。通过问卷收集有关自述吸烟、环境吸烟暴露和酒精消费的生活方式信息。GDM的诊断基于产前OGTT评估(中位数26.9,IQR 26.4-27.7周)。

机器学习方法和统计分析

我们的方法新颖之处在于将联合博弈论的概念与机器学习结合起来。SHapley加法解释(SHAP)框架与CatBoost树集成相结合,用于特征选择和模型可解释性[1112].SHAP框架利用合作博弈论中的经典Shapley值将最优信用分配与局部解释联系起来。伦德伯格和李[11]提出了SHAP作为唯一满足博弈论两个重要属性的可加性(局部精度)和单调性(一致性)的可加性特征归因方法。在博弈论中,Shapley值是在所有可能的参与者排列中,一个参与者的平均期望边际贡献(即,团队成员组成和团队规模的平均影响)。Shapley值帮助决定所有玩家的收益,当每个玩家在联盟中比其他玩家贡献更多或更少的时候。在机器学习中,游戏参与者是特征,集体支付是模型预测。SHAP框架提供了基于精确Shapley值的局部解释,以理解全局模型结构。对于每一种可能的特征排序,特征每次被引入到模型输出的条件期望函数中,期望的变化归因于引入的特征,并以公平的方式在所有可能的特征排序中平均。SHAP值表示日志比值比的变化。我们的博弈论预测分析方法使人口子类型和模式发现数据驱动的精确护理成为可能。

在JupyterLab计算环境中,使用Python编程语言(版本3.7.9)的Anaconda分布构建监督机器学习模型。预测模型使用以下4种机器学习算法进行训练,以解决算法偏差:逻辑回归(广义线性模型)、支持向量机(线性支持向量分类)、CatBoost梯度增强(基于树的)和人工神经网络(多层感知器)。我们采用5次分层交叉验证,以保持每次AGM/T2D病例的相同比例。使用最大绝对标量作为预处理器,在不破坏稀疏性的情况下扩展每个特征。构建了一个网格搜索管道来评估每个机器学习模型的最佳性能超参数。采用95% CI的AUC对模型性能进行评估。其中包含了机器学习算法的实现细节多媒体附录1

利用妊娠中期临床特征对AGM结果进行特征选择模型训练,将SHAP值量级大于零的顶级预测因子纳入AGM/T2D预测模型。采用国际糖尿病和妊娠研究小组(IADPSG) 2018年修订的两点标准进行敏感性分析,以探索诊断GDM的预测效果[9]而不是WHO 1999标准(GUSTO研究不包括1小时血糖测量),以及持续禁食或2小时血糖测量和孕前BMI的预测效果。我们还评估了妊娠总增重与产后AGM和T2D结局之间的关系。所有关联分析均使用Stata/MP软件(版本16.1;StataCorp LP)。


与T2D显著相关的特征与SHAP特征选择模型中的顶级特征对齐

所有特征变量与产后AGM和T2D结局之间的关系由Pearson相关热图(图1而且2).GDM、中上臂围和BMI的诊断是建立产后AGM/T2D机器学习模型的最佳特征。

表1介绍了妊娠中期特征与产后AGM和T2D结局之间的单变量关联。既往GDM病史、平均动脉血压、中上臂围、BMI和GDM诊断与后期T2D风险相关。影响SHAP模型输出的前4个特征是中上臂围、平均动脉血压、BMI和GDM诊断(图3).身高的SHAP值为负值,说明母体身高对AGM的预测没有贡献。

图1。异常糖代谢(AGM)的皮尔逊相关热图。GDM:妊娠糖尿病。
把这个图
图2。皮尔逊2型糖尿病相关热图(T2D)。GDM:妊娠糖尿病。
把这个图
表1。妊娠中期特征与产后糖代谢异常(AGM)或2型糖尿病(T2D)结局(产后4-8年)之间的关系。
特征 AGM (n = 139) T2D (n = 32)

一个(95%置信区间) P值 或(95%置信区间) P值
母亲的年龄(年) 1.05 (1.01 - -1.09) 02b 1.06 (0.99 - -1.14) .10
华人vs马来人和印度人 0.81 (0.55 - -1.19) 陈霞 0.71 (0.34 - -1.44)
马来人vs华人和印度人 1.20 (0.79 - -1.83) .40 1.64 (0.78 - -3.43) .19
印度vs中国和马来民族 1.12 (0.68 - -1.84) 0.87 (0.33 - -2.31) 尾数就
糖尿病家族史 1.72 (1.15 - -2.56) .008b 1.55 (0.75 - -3.21)
有高血压家族史 0.88 (0.60 - -1.32) 55 0.70 (0.33 - -1.51) .37点
家族心血管病史 1.04 (0.57 - -1.90) .90 0.51 (0.12 - -2.19) .37点
既往妊娠期糖尿病史 5.96 (2.16 - -16.43) 措施b 7.98 (2.62 - -24.27) <措施b
既往妊娠期高血压病史 1.86 (0.66 - -5.21) 2.45 (0.53 - -11.29) 二十五分
奇偶校验 1.02 (0.69 - -1.50) 公布 1.38 (0.66 - -2.89)
平均动脉血压(mmhg) 1.05 (1.03 - -1.07) <措施b 1.07 (1.03 - -1.11) <措施b
中上臂围(厘米) 1.18 (1.12 - -1.25) <措施b 1.23 (1.13 - -1.33) <措施b
母亲的身高(厘米) 0.96 (0.92 - -0.99) . 01b 0.96 (0.90 - -1.02) .10
BMI(公斤/米2 1.14 (1.09 - -1.18) <措施b 1.16 (1.09 - -1.24) <措施b
怀孕期间吸烟 1.14 (0.30 - -4.36) .85 N/Ac N/A
在家接触环境烟草烟雾 1.07 (0.72 - -1.60) 0.98 (0.46 - -2.08) .96点
工作场所接触环境烟草烟雾 0.76 (0.38 - -1.51) 1.37 (0.46 - -4.06) .57
怀孕期间饮酒 1.14 (0.30 - -4.36) .85 1.67 (0.21 - -13.50)
GDM的诊断d(他e1999标准) 5.49 (3.51 - -8.58) <措施b 9.57 (4.45 - -20.55) <措施b

一个或:优势比。

b具有统计学意义的值。

cN / A:不适用;由于该变量对似然估计没有贡献,所以没有得到固定效应回归估计。

dGDM:妊娠糖尿病。

e世卫组织:世界卫生组织。

图3。SHapley加法解释(SHAP)特征选择模型的总结图。世卫组织:世界卫生组织。
把这个图

妊娠期母亲肥胖和GDM潜在的代谢紊乱预示着未来T2D风险

尽管所有机器学习模型的详细训练参数和结果如表S1-S6所示(多媒体附录2),我们重点描述了CatBoost机器学习模型的结果,因为该算法具有最佳的整体性能。的表S1-S6给出了各数据集5次分层交叉验证的结果和交叉验证的平均值多媒体附录2.妊娠中期的中上臂围(AUC=0.78, 95% CI 0.71-0.86)和妊娠中期的BMI (AUC=0.74, 95% CI 0.53-0.96)比GDM诊断具有更强的预测能力(AUC=0.73, 95% CI 0.51-0.95;表S2多媒体附录2).GDM诊断的加入提高了基线模型的性能(MUAC_GDM模型:AUC=0.88, 95% CI 0.79-0.96, BMI_GDM模型:AUC=0.86, 95% CI 0.72-0.99;表S4多媒体附录2).仅孕前BMI不足以预测产后T2D风险(AUC=0.62, 95% CI 0.39-0.86;表S6多媒体附录2).

尽管中上臂围与BMI (r=0.91), BMI在临床环境中更可靠、更常用,因此,基于BMI的妊娠模型是我们提出的解决方案(图4).表2总结了logistic回归、支持向量机、人工神经网络和CatBoost梯度增强算法的详细训练参数,以及提出的产后T2D预测模型(包括妊娠增重后的妊娠中期BMI和GDM特征诊断)的结果。妊娠总增重与产后AGM和T2D结局呈负相关,独立于孕前BMI和GDM诊断(表3).

图5-7给出了BMI_GDM CatBoost模型训练过程中得到的验证曲线。CatBoost模型的候选超参数如下:

  • 学习率:[' 0 ' - 0.00001,' 1 ' - 0.0001' 2 ' - 0.001, 3 - 0.01, 4 - 0.03, 5 - 0.05, 6 - 0.1, - 0.2“7”,“8”- 0.3)
  • L2叶正规化:(0 - 1.0,' 1 ' - 2.0,' 2 ' - 3.0,3 - 4.0,' 4 ' - 5.0, ' 5 ' - 6.0]
  • 随机强度:[' 0 ' - 1.0,' 1 ' - 2.0,' 2 ' - 3.0,3 - 4.0,' 4 ' - 5.0, ' 5 ' - 6.0]

CatBoost模型指定了1000次迭代,最大深度为6棵树,树生长策略对称。用网格搜索调优的超参数学习率为0.0001,L2叶正则化为5.0,随机强度为5.0。BMI_GDM CatBoost分类器在这种优化配置下运行良好。

图4。BMI_GDM模型的SHapley相加解释(SHAP)总结图。世卫组织:世界卫生组织。
把这个图
表2。提出的产后2型糖尿病预测模型包括妊娠体重增加后的妊娠中期BMI和妊娠期糖尿病(GDM)特征的诊断(基于世界卫生组织1999年标准)。
模型规范(BMI_GDM) 使用网格搜索调优超参数 平均AUC一个(95%置信区间)
逻辑回归(L2正则化惩罚,随机平均梯度下降求解器)
  • 正则化强度的逆=1.0
0.85 (0.72 - -0.98)
支持向量机(线性核,L2正则化惩罚)
  • L2正规化点球= 1.0
  • 损失函数= '平方铰链'
0.85 (0.72 - -0.98)
神经网络(3个隐层,每层10个神经元,ReLU激活函数,Adam求解器,200次迭代)
  • L2正规化点球= 0.01
  • 最初的学习速率= 0.1
0.85 (0.73 - -0.97)
CatBoostb(1000次迭代,最大6棵树深度,对称树生长策略)
  • L2叶正规化= 5.0
  • 学习速率= 0.0001
  • 随机强度= 5.0
0.86 (0.72 - -0.99)b

一个AUC:接收器工作特性曲线下的面积。

b说明了本研究开发的主要预测模型。

表3。妊娠总体重增加与产后糖代谢异常(AGM)或2型糖尿病(T2D)结局(产后4-8年)之间的关系。
分析 AGM (n = 128) T2D (n = 31)

一个(95%置信区间) P值 或(95%置信区间) P值
未经调整的分析

妊娠总增重(kg) 0.87 (0.82 - -0.91) <措施b 0.79 (0.72 - -0.87) <措施b
调整分析c

妊娠总增重(kg) 0.93 (0.87 - -0.98) . 01b 0.88 (0.79 - -0.98) 02b

一个或:优势比。

b具有统计学意义的值。

c根据母亲的种族、年龄、胎次、糖尿病家族史、孕前BMI和妊娠糖尿病诊断进行调整。

图5。CatBoost算法验证曲线-可变学习率。AUC:接收器工作特性曲线下的面积。
把这个图
图6。CatBoost算法验证曲线-变L2叶正则化。AUC:接收器工作特性曲线下的面积。
把这个图
图7。CatBoost算法验证曲线-随机强度变化。AUC:接收器工作特性曲线下的面积。
把这个图

与空腹血糖相比,餐后两小时血糖是产后T2D风险更强的预测因子

当将产前血糖测量作为连续特征建模时,餐后2小时血糖(AUC=0.86, 95% CI 0.76-0.96)比空腹血糖显示出更强的产后T2D风险预测效果(AUC=0.76, 95% CI 0.61-0.91;表S6多媒体附录2).在敏感性分析中,BMI_GDM模型在使用修正的2点IADPSG 2018标准时的预测性能也很好(AUC=0.84, 95% CI 0.72-0.97;表S6多媒体附录2).


主要结果

我们将基于博弈论的特征选择与机器学习相结合,构建了一个有效的产后T2D预测模型。SHAP值恢复预测建模特征,以获得最佳性能,使模型可解释性与人类直觉一致。在新加坡人群中,我们的BMI_GDM模型在2个妊娠中期特征(妊娠中期BMI和根据世卫组织1999年标准诊断的GDM)的早期预测产后T2D风险方面达到了0.86的极好AUC。当使用修正的2点IADPSG 2018 GDM诊断标准时,模型也具有鲁棒性(AUC=0.84)。在常规GDM筛查中,BMI_GDM机器学习模型可作为风险分层工具,识别出发展为T2D的高风险亚洲女性,从而实现早期干预。如果患者无法获得GDM诊断特征,bmi_2h模型(AUC=0.86)可以作为临床实施过程中的替代设计。经过训练的分类器可以使用web应用程序进行部署,使临床医生能够识别有T2D风险的妇女,并制定产后管理计划。

2特征妊娠中期BMI模型(AUC=0.86)在预测产后T2D方面优于孕前BMI模型(AUC=0.62),提示妊娠中期增重效应结合GDM和胎胎盘单位的代谢紊乱预示着未来T2D风险。因为怀孕对新陈代谢有诱发糖尿病的作用[13],需要进一步的研究来检查妊娠和产后产妇代谢健康结果中的代谢适应。

在我们的BMI_GDM模型敏感性分析中,我们观察到在新加坡妇女中,产前2小时OGTT葡萄糖峰值比空腹葡萄糖峰值(AUC=0.76)更能预测产后T2D (AUC=0.86)。对于GDM诊断标准的不同糖耐量阈值,产后T2D风险是否异质性,还需要有更大统计能力的未来研究来证实。

限制

由于纵向数据的缺乏,本研究存在一定的局限性。GUSTO研究中没有对产后4-12周的OGTT以及产后OGTT正常的患者每隔1-3年进行进一步的检测,可能在一定程度上低估了产后血糖异常的发展,导致偏倚。然而,参与GUSTO的母亲在分娩2年后自我报告T2D状态,没有自我报告T2D病例。我们的预测模型是在561个孕妇的有限队列中进行训练的,需要使用更大的队列(如电子健康记录数据库)进一步验证。通过单个种族群体进行的子队列分析可以用更大的数据集进行训练。

与之前工作的比较

与现有的基于分子生物标志物的T2D风险预测算法相比,我们在产前护理中早期实施的T2D风险预测算法使患者早期参与和远程监测成为可能[78为产后护理开发的。从我们的机器学习工作流程中发现的2个妊娠中期临床特征(妊娠体重增加后的妊娠中期BMI和GDM诊断)在常规产前GDM筛查中成本低且容易获得。从我们的工作中确定的数字生物标志物将指导产前研究,防止GDM发展为T2D。

结论

本研究的关键优势在于将基于机器学习的预测分析在产前护理中应用于产后T2D的早期预测。这种机器学习模型可以作为预防性干预的风险分层工具。

致谢

我们感谢GUSTO研究团队在获取研究数据方面的帮助,以及他们与参与者进行的重要工作。GUSTO出生队列研究由代谢性疾病发展途径转化临床研究旗舰项目(授予NMRC/TCR/004-NUS/2008, NMRC/TCR/012-NUHS/2014)和开放基金-大型合作赠款(OFLCG/MOH-000504)项目支持,由国家研究基金会资助,由新加坡国家医学研究委员会(NMRC)管理。该研究由NMRC的开放基金-大型合作基金支持,标题为“亚洲妇女及其儿童的代谢健康”(award OFLCG19may-0033)。英国医学研究理事会(MC_UU_12011/4)支持KMG;国家卫生研究所(NIHR)、NIHR高级研究员(NF-SI-0515-10042)和NIHR南安普顿生物医学研究中心(IS-BRC-1215-20004);和英国心脏基金会(RG/15/17/3174)。数据分析的其他资金由战略定位基金和通过新加坡科学、技术和研究机构(A*STAR)提供给NK的IAF-PP基金(H17/01/a0/005)支持(SPF 002/2013)。

数据可用性

支持本研究结果的数据可根据合理要求从相应作者处获得。为再现这项研究而生成的代码可在GitHub [14].

产后T2D预测模型(CatBoost算法)已部署到web应用程序中[15].

作者的贡献

作者JGE, MF和NK是本出版物的联合高级作者。

MK贡献了研究研究设计,数据策划,机器学习建模,统计分析,结果的解释,和写作的稿件。LTA和CH为临床数据整理做出了贡献。SES和SYC对GUSTO队列中表型数据的收集和手稿的批判性阅读做出了贡献。KHT、JKYC、KMG和YSC对GUSTO队列研究的设计、数据收集和手稿的批判性阅读做出了贡献。JGE对结果的解释、手稿的撰写和GUSTO队列数据的收集做出了贡献。MF对研究的监督、结果的解释和稿件的撰写做出了贡献。NK参与了研究的监督、结果的解释、稿件的撰写以及GUSTO队列研究数据的收集。MF和NK对这项工作承担全部责任,有权访问数据,并控制了论文的发表决定。

的利益冲突

NK、KMG、SYC和YSC是一个学术财团的一部分,该财团获得了雅培营养、Nestec Inc、BenevolentAI Bio Ltd和达能的研究资金。MF得到了新加坡国家研究基金会AI新加坡项目(授予AISG-GC-2019-001-2A)的部分支持。其他作者声明没有利益冲突。

多媒体附录1

机器学习算法的实现细节。

DOCX文件,19 KB

多媒体附录2

表S1-S6;所有机器学习模型的详细训练参数和结果。

DOCX文件,74 KB

  1. IDF糖尿病图集第9版。国际糖尿病联合会2019。URL:https://diabetesatlas.org/atlas/ninth-edition/[2022-05-24]访问
  2. Vounzoulaki E, Khunti K, Abner SC, Tan BK, Davies MJ, Gillies CL。有已知妊娠糖尿病史的女性进展为2型糖尿病:系统回顾和荟萃分析。BMJ 2020 5月13日;369:m1361 [免费的全文] [CrossRef] [Medline
  3. 陈琳,苏世胜,丁敏,吕淑玲,叶芳,谭克杰,等。结合妊娠期糖尿病和孕妇孕前至产后体重状况分析2型糖尿病的未来发展。Sci Rep 2021 Mar 03;11(1):5021 [免费的全文] [CrossRef] [Medline
  4. 美国糖尿病协会。糖尿病的分类和诊断:糖尿病医疗保健标准-2020。糖尿病护理2020年1月20日;43(增刊1):S14-S31。[CrossRef] [Medline
  5. Nouhjah S, Shahbazian H, Amoori N, Jahanfar S, Shahbazian N, Jahanshahi A,等。有已知妊娠糖尿病病史的亚洲妇女的产后筛查做法、异常糖耐量的进展及其相关危险因素:一项系统综述和荟萃分析Diabetes Metab Syndr 2017 Dec;11 supply 2:S703-S712。[CrossRef] [Medline
  6. Sanderson H, loeman E, Colquitt J, Royle P, Waugh N, Tan BK.在全民医疗环境中提高妊娠期糖尿病妇女产后血糖检测的吸收:一项系统综述。J clinin Med 2018 Dec 20;8(1):4 [免费的全文] [CrossRef] [Medline
  7. Allalou A, Nalla A, Prentice KJ,刘勇,张敏,戴ff,等。妊娠期糖尿病向2型糖尿病转变的预测代谢特征。糖尿病2016年9月23日;65(9):2529-2539 [免费的全文] [CrossRef] [Medline
  8. Joglekar MV, Wong WKM, Ema FK, Georgiou HM, Shub A, Hardikar AA,等。产后循环microRNA增强了既往妊娠糖尿病妇女未来2型糖尿病的预测能力。糖尿病学2021 7月23日;64(7):1516-1526。[CrossRef] [Medline
  9. 妊娠期首次发现高血糖的诊断标准和分类。谁。2013.URL:https://apps.who.int/iris/handle/10665/85975[2022-05-20]访问
  10. 糖尿病和中度高血糖的定义和诊断:WHO/IDF会诊报告。谁。2006.URL:https://apps.who.int/iris/handle/10665/43588[2022-05-20]访问
  11. Lundberg SM, Erion G, Chen H, DeGrave A, Prutkin JM, Nair B,等。从本地解释到对树木的可解释人工智能的全球理解。Nat Mach Intell 2020 Jan;2(1):56-67 [免费的全文] [CrossRef] [Medline
  12. Prokhorenkova L, Gusev G, Vorobev A, Veronika DA, Gulin A. CatBoost:带有分类特征的无偏增强。出来了。预印本于2017年6月28日在线发布[免费的全文] [CrossRef
  13. 曾铮,刘芳,李珊。妊娠期代谢适应研究进展。Ann Nutr Metab 2017 3月16日;70(1):59-65 [免费的全文] [CrossRef] [Medline
  14. GUSTO_Type-2-Diabetes-Mellitus。GitHub。URL:https://github.com/mukkeshkumar/GUSTO_Type-2-Diabetes-Mellitus[2022-05-31]访问
  15. 机器学习导出产前预测风险模型,指导干预,防止妊娠期糖尿病发展为2型糖尿病。早晨好。URL:https://www.mornin-feng.com/all-projects-and-demos#gdm2[2022-05-31]访问


AGM:葡萄糖代谢异常
AUC:接收器工作特性曲线下的面积
GDM:妊娠期糖尿病
爱好:在新加坡成长迈向健康的结果
IADPSG:国际糖尿病和妊娠研究小组协会
种:空腹血糖受损
IGT:葡萄糖耐量
OGTT:口服糖耐量试验
世鹏科技电子:沙普利加解释
T2D:2型糖尿病
人:世界卫生组织


K Mizokami-Stout编辑;提交26.07.21;同行评议:CL Lu, A Hakemi;评论作者09.10.21;修订版收到27.11.21;接受21.03.22;发表05.07.22

版权

©Mukkesh Kumar, Li Ting Ang, Cindy Ho, Shu E Soh, Kok Hian Tan, Jerry Kok Yen Chan, Keith M Godfrey, Shiao-Yng Chan, Yap Seng Chong, Johan G Eriksson, Mengling Feng, Neerja Karnani。最初发表于JMIR Diabetes (https://diabetes.www.mybigtv.com), 05.07.2022。

这是一篇开放获取的文章,根据创作共用署名许可协议(https://creativecommons.org/licenses/by/4.0/)发布,该协议允许在任何媒体上不受限制地使用、分发和复制,前提是必须正确引用最初发表在《JMIR Diabetes》上的原始作品。必须包括完整的书目信息,https://diabetes.www.mybigtv.com/上的原始出版物链接,以及版权和许可信息。


Baidu
map