医学互联网研究杂志-妊娠期糖尿病的机器学习预测模型:元分析gydF4y2Ba

原始论文gydF4y2Ba

Zheqing张gydF4y2Ba^1gydF4y2Ba,大麻gydF4y2Ba ；gydF4y2Ba
Luqian杨gydF4y2Ba^1gydF4y2Ba,黑带大师gydF4y2Ba ；gydF4y2Ba
Wentao汉gydF4y2Ba^1gydF4y2Ba,黑带大师gydF4y2Ba ；gydF4y2Ba
Yaoyu吴gydF4y2Ba^1gydF4y2Ba,黑带大师gydF4y2Ba ；gydF4y2Ba
Linhui张gydF4y2Ba^1gydF4y2Ba,黑带大师gydF4y2Ba ；gydF4y2Ba
春高gydF4y2Ba^1gydF4y2Ba,黑带大师gydF4y2Ba ；gydF4y2Ba
江亏gydF4y2Ba^1gydF4y2Ba,硕士gydF4y2Ba ；gydF4y2Ba
Yun刘gydF4y2Ba^{2，gydF4y2Ba}^3.gydF4y2Ba博士gydF4y2Ba ；gydF4y2Ba
Huiqun吴gydF4y2Ba^1gydF4y2Ba博士gydF4y2Ba

^1gydF4y2Ba南通大学医学院医学信息系，南通，中国gydF4y2Ba

^2gydF4y2Ba南京医科大学附属第一医院信息科，中国南京gydF4y2Ba

^3.gydF4y2Ba南京医科大学生物医学工程与信息学院医学信息系，南京gydF4y2Ba

通讯作者:gydF4y2Ba

吴惠群，博士gydF4y2Ba

医学信息学系gydF4y2Ba

南通大学医学院gydF4y2Ba

崇川区gydF4y2Ba

启秀路19号gydF4y2Ba

南通,226001gydF4y2Ba

中国gydF4y2Ba

电话:86 513 85051891gydF4y2Ba

传真:86 513 85051820gydF4y2Ba

电子邮件:gydF4y2Bawuhuiqun@ntu.edu.cngydF4y2Ba

背景:gydF4y2Ba妊娠期糖尿病(GDM)是一种常见的内分泌代谢疾病，涉及妊娠期间不同严重程度的碳水化合物不耐受。gdm相关并发症和不良妊娠结局的发生率已经下降，部分原因是早期筛查。机器学习(ML)模型越来越多地用于识别风险因素并实现GDM的早期预测。gydF4y2Ba

摘要目的:gydF4y2Ba本研究的目的是对已发表的预测GDM风险的预后模型进行荟萃分析和比较，并确定适用于这些模型的预测因子。gydF4y2Ba

方法:gydF4y2Ba我们搜索了四个可靠的电子数据库，以寻找在一般人群中而不是仅在高危人群中建立GDM ML预测模型的研究。采用新型预测模型偏倚风险评估工具(PROBAST)对ML模型的偏倚风险进行评估。采用Meta-DiSc软件(1.4版)进行meta分析和异质性测定。为了限制异质性的影响，我们还进行了敏感性分析、元回归和亚组分析。gydF4y2Ba

结果:gydF4y2Ba共分析了25项研究，其中包括18岁以上无重大疾病史的女性。ML模型预测GDM的受试者工作特征曲线(AUROC)下的合并面积为0.8492;合并敏感性为0.69 (95% CI 0.68-0.69;gydF4y2BaPgydF4y2Ba<措施;我gydF4y2Ba^2gydF4y2Ba=99.6%)，合并特异性为0.75 (95% CI 0.75-0.75;gydF4y2BaPgydF4y2Ba<措施;我gydF4y2Ba^2gydF4y2Ba= 100%)。作为最常用的ML方法之一，逻辑回归模型的总体AUROC为0.8151，而非逻辑回归模型表现更好，其总体AUROC为0.8891。此外，母亲年龄、糖尿病家族史、BMI和空腹血糖是各种特征选择方法建立的模型中最常用的四个特征。gydF4y2Ba

结论:gydF4y2Ba与目前的筛选策略相比，ML方法在预测GDM方面更有吸引力。为扩大其使用范围，应进一步强调质量评估和统一诊断标准的重要性。gydF4y2Ba

中国医学网络学报，2018;24(3):e26634gydF4y2Ba

doi: 10.2196/26634gydF4y2Ba

关键字gydF4y2Ba

数字医疗gydF4y2Ba；gydF4y2Ba 妊娠期糖尿病gydF4y2Ba；gydF4y2Ba 机器学习gydF4y2Ba；gydF4y2Ba 预测模型gydF4y2Ba；gydF4y2Ba 预后模型gydF4y2Ba

根据国际糖尿病联合会最新发布的《全球糖尿病地图》(第9版)，全球妊娠期糖尿病患者人数不断增加，约2040万(15.8%)女性患有高血糖;其中83.6%的病例是由于妊娠期糖尿病[gydF4y2Ba1gydF4y2Ba］．GDM是一种常见的代谢性疾病，通常是妊娠期间的一种短暂性疾病，在分娩时消失。患有GDM的孕妇出现不良妊娠结局的风险更大，威胁到正常分娩。通常建议在妊娠24 ~ 28周进行口服葡萄糖耐量试验(OGTT)筛查GDM。医生通常在患者摄入葡萄糖1 ~ 2小时后测量空腹血糖浓度[gydF4y2Ba2gydF4y2Ba］．美国糖尿病协会建议妇女在第一次产前检查时进行筛查，以帮助早期识别高血糖风险。然而，GDM筛查建议在国际组织中存在争议，主要体现在以下四个方面:(1)普遍筛查与选择性筛查，(2)妊娠早期筛查(即孕前或第一次产前检查与24-28孕周筛查)，(3)一步法与两步法，以及(4)诊断标准不一致(多媒体附录1表S1) [gydF4y2Ba3.gydF4y2Ba］．gydF4y2Ba

机器学习(ML)方法已成为疾病预防和管理的有利工具。例如，多元逻辑回归(LR)模型是一种公认的ML算法，用于预测糖尿病及其并发症。此外，随机森林(RF)、极限梯度增强(XGBoost)、轻梯度增强机(LightGBM)等方法也被应用于糖尿病相关问题。越来越多的研究使用这种方法来识别GDM的危险因素，并构建疾病的早期预测模型[gydF4y2Ba4gydF4y2Ba，gydF4y2Ba5gydF4y2Ba］．ML为分析大量不同的医疗保健数据和增强医生的能力提供了一个强大的工具。然而，ML存在局限性，在某些临床场景中可能导致不准确的预测，并且在现实世界的研究中强调了其评估的重要性[gydF4y2Ba6gydF4y2Ba］．美国食品和药物管理局(FDA)发布了关于软件作为医疗设备的指南，解释了医疗保健中人工智能(AI)工具所需的风险分层以及分析和临床验证。IDx-DR是fda批准的第一个用于帮助做出筛查决定的ML应用程序，在初级保健诊所中对糖尿病视网膜病变实现了高敏感性(87%)和特异性(91%)[gydF4y2Ba7gydF4y2Ba］．大多数已发表的GDM预后模型也显示出可接受的鉴别和校正[gydF4y2Ba8gydF4y2Ba]，但它们的质量参差不齐，表现也不一致。gydF4y2Ba

目前对GDM的ML模型的系统分析很少。在这里，我们使用预测模型风险偏倚评估工具(PROBAST)进行质量评估，对ML在GDM中的预测价值进行了全面的荟萃分析，并将ML模型与通用和选择性筛查方法进行了比较。从本质上讲，我们想知道ML是否可以成为一种新的GDM筛查选项。gydF4y2Ba

研究设计gydF4y2Ba

本研究根据PRISMA (Preferred Reporting Items for Systematic Reviews and meta - analysis)指南(表S2)进行gydF4y2Ba多媒体附件1gydF4y2Ba) [gydF4y2Ba9gydF4y2Ba］．gydF4y2Ba

搜索方法gydF4y2Ba

检索PubMed、Web of Science、IEEE Xplore和中国国家知识基础设施数据库，检索2019年8月至2020年10月期间发表的英文或中文文章。我们根据PICO(人口、干预、控制和结果)原则建立了搜索策略;在我们的研究中，“P”代表GDM人群，“I”代表ML方法作为干预措施，“C”代表金标准作为对照，“O”代表预测和诊断的结果，如敏感性、特异性和准确性(表S3)gydF4y2Ba多媒体附件1gydF4y2Ba)．搜索关键字的详细信息列在文本框S1中gydF4y2Ba多媒体附件1gydF4y2Ba．此外，手动检索每个确定的研究的参考文献列表，以确定任何其他研究。NoteExpress 3.2(爱琴海)[gydF4y2Ba10gydF4y2Ba]及EndNote X7 (Clarivate) [gydF4y2Ba11gydF4y2Ba]来管理研究并删除重复的项目。gydF4y2Ba

纳入和排除标准gydF4y2Ba

所有入选研究均须符合以下标准:(1)以英文或中文发表;(2)纳入一般人群中的孕妇，明确GDM诊断定义;(3)纳入用于GDM预测的ML模型，并对ML模型进行了清晰的描述;(4)显示了ML模型的性能，包括足够的数据来推断敏感性和特异性。gydF4y2Ba

其他语言的文章、其他类型的文章(如报告和评论)或使用其他方法检测GDM的文章被排除在外。四名研究者(LY、WH、YW和CG)参与了文献筛选，以回顾所有符合纳入标准的研究。每一篇被选中的文章都被筛选了至少两次，不同意见由审稿人(ZZ)解决。保留提供最详细的变量和结果指标信息的研究，以供参考。gydF4y2Ba

数据提取gydF4y2Ba

数据提取由两名研究者(LY和LZ)根据现有文献和个体预后或诊断多变量预测模型透明报告(TRIPOD)标准化协议独立完成[gydF4y2Ba12gydF4y2Ba］．最终共选择了25项研究进行分析。从每项研究中提取了以下数据:(1)人口统计学信息(即，收集数据的国家、环境、数据源、研究设计、预测时间性和结果定义);(2)数据划分方法，特征选择算法，模型特征训练，ML预测模型类型，以及模型验证与应用;(3)预测结果，包括准确性、敏感性、特异性和受试者工作特征曲线下面积(AUROC);(4)资金和伦理批准。gydF4y2Ba

质量和偏倚评估gydF4y2Ba

PROBAST [gydF4y2Ba13gydF4y2Ba]，其中包括四个领域(即参与者、预测因素、结果和分析)共20个信号问题，被用作评估每个纳入研究的偏倚风险和适用性的工具。gydF4y2Ba

统计分析gydF4y2Ba

使用区分和校准的主要结果测量来描述每个ML模型的性能。模型鉴别指数或一致性指数(C-index)与AUROC相似[gydF4y2Ba14gydF4y2Ba]，并表示其诊断或预后辨别能力为无(AUROC≤0.6)、差(AUROC >0.6至0.7)、一般(AUROC >0.7至0.8)、良好(AUROC >0.8至0.9)或最佳(AUROC >0.9至1)。模型校准是一种拟合优度指标，用于评估观测结果与预测结果之间的一致性，并通过校准图反映模型的稳定性。诊断比值比(DOR)也通过以下公式计算:gydF4y2Ba

Dor = PLR / NLRgydF4y2Ba(1）gydF4y2Ba

其中PLR为正似然比，NLR为负似然比。计算PLR和NLR来表达模型预测GDM患者与非GDM患者的GDM的频率，使用以下公式:gydF4y2Ba

PLR =敏感性/(1−特异性)gydF4y2Ba(2)gydF4y2Ba

NLR =(1 -敏感性)/特异性gydF4y2Ba（3）gydF4y2Ba

在本次元分析中，Meta-DiSc软件程序(1.4版)[gydF4y2Ba15gydF4y2Ba]用于计算AUROC、敏感性、特异性、PLR、NLR和DOR的汇总估计值。它用于总结纳入研究的数据，并以图形方式调查研究之间的同质性。我的gydF4y2Ba^2gydF4y2Ba检验用于评估纳入研究之间的统计学异质性。一个我gydF4y2Ba^2gydF4y2Ba值大于75%表明研究间存在高度异质性[gydF4y2Ba16gydF4y2Ba］．纳入研究的分析分为主组分析和亚组分析，以判断ML方法在不同临床情况下预测GDM的性能。还进行了敏感性分析、亚组分析和元回归，以深入了解由于选择器或纳入标准偏倚导致的研究间异质性的潜在来源。不同的ML算法(如LR、贝叶斯模型、TreeNet和GA-CatBoost[遗传算法类别增强])预测GDM的能力将在子组分析部分进行讨论。从敏感性分析中剔除四个最高和最低值的预测模型，以评估异常值对合并敏感性和特异性的影响。gydF4y2Ba

研究选择gydF4y2Ba

最初共确定了27,071项研究;其中1256篇(4.6%)讨论了GDM，进行了抽象筛选。共对67篇研究进行全文综述;其中25例(37%)纳入荟萃分析[gydF4y2Ba17gydF4y2Ba-gydF4y2Ba33gydF4y2Ba］．gydF4y2Ba图1gydF4y2Ba所示为研究选择过程的PRISMA流程图。gydF4y2Ba

图1。用于研究选择的PRISMA(系统评价和元分析首选报告项目)流程图。CNKI:中国知识基础设施。gydF4y2Ba

研究特点gydF4y2Ba

文章的发表年份为2004年至2020年;25篇论文中有10篇(40%)发表于2020年(图S1)gydF4y2Ba多媒体附件1gydF4y2Ba)．所有研究对象均为18岁以上、无心脑血管疾病史或重要器官功能障碍的女性。在25项研究中，9项(36%)纳入了有GDM史的患者，而其他研究排除了有GDM史的患者(表S4-S6)gydF4y2Ba多媒体附件1gydF4y2Ba)．ML培训的源数据大多来自医疗中心和妇产医院;有些还包括自我填写的问卷。在25项研究中，9项(36%)使用了基于人群的前瞻性队列或多中心研究的数据。纳入研究的样本量从134人到66687人不等。gydF4y2Ba

特征选择是机器学习训练的重要步骤。熊等[gydF4y2Ba19gydF4y2Ba]开发了妊娠前19周GDM风险的预测模型，包括几种肝、肾和凝血功能测量;他们观察到凝血酶原时间和活化部分凝血活酶时间的截止点可以可靠地预测GDM，敏感性为88.3%，特异性为99.47%，AUROC为94.2%。母亲年龄、糖尿病家族史、BMI和空腹血糖是所建立模型中最常用的四个特征，而与妊娠相关的血浆蛋白A、瘦素、脂脂素-2、脂联素、体重增加和妊娠期间软饮料摄入量分别只在一到两个模型中使用。gydF4y2Ba表1gydF4y2Ba［gydF4y2Ba17gydF4y2Ba-gydF4y2Ba41gydF4y2Ba]总结了预后模型中最常见的特征。gydF4y2Ba

表1。妊娠期糖尿病风险预测模型中最常见的因素。gydF4y2Ba

研究第一作者，年份gydF4y2Ba	模型中包含的因素gydF4y2Ba
	妈gydF4y2Ba^{一个gydF4y2Ba}(n = 19)gydF4y2Ba	FHDgydF4y2Ba^bgydF4y2Ba(n = 14)gydF4y2Ba	BMI (n = 12)gydF4y2Ba		台塑gydF4y2Ba^cgydF4y2Ba(n = 11)gydF4y2Ba	PBMIgydF4y2Ba^dgydF4y2Ba(n = 8)gydF4y2Ba	高清gydF4y2Ba^egydF4y2Ba(n = 8)gydF4y2Ba	种族(n = 6)gydF4y2Ba	TGgydF4y2Ba^fgydF4y2Ba(n = 5)gydF4y2Ba	HbAgydF4y2Ba_{1 cgydF4y2Ba}^ggydF4y2Ba(n = 4)gydF4y2Ba	SBPgydF4y2Ba^hgydF4y2Ba(n = 3)gydF4y2Ba	高度(n = 3)gydF4y2Ba	hsCRPgydF4y2Ba^我gydF4y2Ba(n = 3)gydF4y2Ba
高，2020 [gydF4y2Ba21gydF4y2Ba］gydF4y2Ba	✓gydF4y2Ba^jgydF4y2Ba	✓gydF4y2Ba	✓gydF4y2Ba								✓gydF4y2Ba	✓gydF4y2Ba
刘，2020 [gydF4y2Ba17gydF4y2Ba］gydF4y2Ba	✓gydF4y2Ba			✓gydF4y2Ba		✓gydF4y2Ba
苗，2020 [gydF4y2Ba28gydF4y2Ba］gydF4y2Ba		✓gydF4y2Ba		✓gydF4y2Ba					✓gydF4y2Ba
谭，2020 [gydF4y2Ba41gydF4y2Ba］gydF4y2Ba	✓gydF4y2Ba	✓gydF4y2Ba		✓gydF4y2Ba		✓gydF4y2Ba
吴，2020 [gydF4y2Ba18gydF4y2Ba］gydF4y2Ba	✓gydF4y2Ba	✓gydF4y2Ba		✓gydF4y2Ba			✓gydF4y2Ba
熊，2020 [gydF4y2Ba19gydF4y2Ba］gydF4y2Ba
叶，2020 [gydF4y2Ba20.gydF4y2Ba］gydF4y2Ba	✓gydF4y2Ba		✓gydF4y2Ba	✓gydF4y2Ba		✓gydF4y2Ba	✓gydF4y2Ba		✓gydF4y2Ba	✓gydF4y2Ba
张，2020 [gydF4y2Ba39gydF4y2Ba］gydF4y2Ba	✓gydF4y2Ba	✓gydF4y2Ba		✓gydF4y2Ba		✓gydF4y2Ba	✓gydF4y2Ba			✓gydF4y2Ba	✓gydF4y2Ba		✓gydF4y2Ba
斯奈德，2020 [gydF4y2Ba40gydF4y2Ba］gydF4y2Ba	✓gydF4y2Ba					✓gydF4y2Ba		✓gydF4y2Ba
崔，2019 [gydF4y2Ba25gydF4y2Ba］gydF4y2Ba	✓gydF4y2Ba	✓gydF4y2Ba				✓gydF4y2Ba
郑，2019 [gydF4y2Ba24gydF4y2Ba］gydF4y2Ba	✓gydF4y2Ba		✓gydF4y2Ba	✓gydF4y2Ba					✓gydF4y2Ba
Nombo, 2018年[gydF4y2Ba26gydF4y2Ba］gydF4y2Ba		✓gydF4y2Ba	✓gydF4y2Ba
甜甜，2018 [gydF4y2Ba27gydF4y2Ba］gydF4y2Ba		✓gydF4y2Ba	✓gydF4y2Ba				✓gydF4y2Ba	✓gydF4y2Ba	✓gydF4y2Ba
肖，2018 [gydF4y2Ba38gydF4y2Ba］gydF4y2Ba	✓gydF4y2Ba		✓gydF4y2Ba	✓gydF4y2Ba					✓gydF4y2Ba	✓gydF4y2Ba		✓gydF4y2Ba
黄，2017 [gydF4y2Ba23gydF4y2Ba］gydF4y2Ba	✓gydF4y2Ba	✓gydF4y2Ba		✓gydF4y2Ba		✓gydF4y2Ba
吴，2017 [gydF4y2Ba22gydF4y2Ba］gydF4y2Ba	✓gydF4y2Ba		✓gydF4y2Ba	✓gydF4y2Ba								✓gydF4y2Ba	✓gydF4y2Ba
Gabbay-Benziv, 2015 [gydF4y2Ba30.gydF4y2Ba］gydF4y2Ba	✓gydF4y2Ba		✓gydF4y2Ba				✓gydF4y2Ba	✓gydF4y2Ba			✓gydF4y2Ba
Thériault, 2015 [gydF4y2Ba29gydF4y2Ba］gydF4y2Ba	✓gydF4y2Ba	✓gydF4y2Ba	✓gydF4y2Ba				✓gydF4y2Ba	✓gydF4y2Ba		✓gydF4y2Ba			✓gydF4y2Ba
Eleftheriades, 2014 [gydF4y2Ba31gydF4y2Ba］gydF4y2Ba	✓gydF4y2Ba
Pintaudi, 2013 [gydF4y2Ba32gydF4y2Ba］gydF4y2Ba		✓gydF4y2Ba		✓gydF4y2Ba		✓gydF4y2Ba
萨沃纳-文图拉，2013 [gydF4y2Ba33gydF4y2Ba］gydF4y2Ba	✓gydF4y2Ba			✓gydF4y2Ba
Tran, 2013 [gydF4y2Ba34gydF4y2Ba］gydF4y2Ba	✓gydF4y2Ba		✓gydF4y2Ba
Teede, 2011年[gydF4y2Ba35gydF4y2Ba］gydF4y2Ba	✓gydF4y2Ba	✓gydF4y2Ba					✓gydF4y2Ba	✓gydF4y2Ba
Vanleeuwen, 2009 [gydF4y2Ba36gydF4y2Ba］gydF4y2Ba		✓gydF4y2Ba	✓gydF4y2Ba				✓gydF4y2Ba	✓gydF4y2Ba
卡利斯坎，2004年[gydF4y2Ba37gydF4y2Ba］gydF4y2Ba	✓gydF4y2Ba	✓gydF4y2Ba	✓gydF4y2Ba

^{一个gydF4y2Ba}MA:母亲年龄。gydF4y2Ba

^bgydF4y2BaFHD:糖尿病家族史。gydF4y2Ba

^cgydF4y2BaFPG:空腹血糖。gydF4y2Ba

^dgydF4y2BaPBMI:孕前BMI。gydF4y2Ba

^egydF4y2BaHD:糖尿病史。gydF4y2Ba

^fgydF4y2BaTG:甘油三酸酯。gydF4y2Ba

^ggydF4y2BaHbAgydF4y2Ba_{1 cgydF4y2Ba}:血红蛋白AgydF4y2Ba_{1 cgydF4y2Ba}．gydF4y2Ba

^hgydF4y2BaSBP:收缩压。gydF4y2Ba

^我gydF4y2BahsCRP:高敏c反应蛋白。gydF4y2Ba

^jgydF4y2Ba复选符号(gydF4y2Ba✓gydF4y2Ba)表示包含了该因素。gydF4y2Ba

在25项研究(n= 17,68%)中，LR模型是用于预测GDM风险最普遍使用的模型，而5项(20%)研究评估了其他ML方法(即GA-CatBoost、XGBoost、贝叶斯模型、TreeNet、梯度增强决策树[GBDT]、自适应增强[AdaBoost]、LightGBM、Vote和RF)的性能。在衡量深度学习性能时，AUROC和尤登指数是最常用的。AUROC用于未提供c指数的研究。在25项研究中，2项(8%)没有报告模型歧视的指标。在25项研究中，只有7项(28%)提出了校准措施。13项研究(52%)使用随机分裂或k-fold交叉验证和自举进行内部验证。25项研究中只有4项(16%)进行了外部验证。gydF4y2Ba

质量评估gydF4y2Ba

PROBAST检查清单中的项目(gydF4y2Ba多媒体附件2gydF4y2Ba)用于评估偏倚风险和预后预测模型研究的适用性。根据标准，25项研究中有4项(16%)参与者的偏差[gydF4y2Ba30.gydF4y2Ba，gydF4y2Ba31gydF4y2Ba，gydF4y2Ba33gydF4y2Ba，gydF4y2Ba36gydF4y2Ba]是适度的，主要是由于标准有争议，而其他研究的偏差很低。在25项研究中，24个(96%)研究组的预测因子偏倚较低，而1个(4%)研究组[gydF4y2Ba32gydF4y2Ba]有中度偏倚风险，因为预测评估是在了解结果数据的情况下创建的。6项(24%)研究的结果偏倚[gydF4y2Ba22gydF4y2Ba，gydF4y2Ba30.gydF4y2Ba，gydF4y2Ba33gydF4y2Ba，gydF4y2Ba35gydF4y2Ba-gydF4y2Ba37gydF4y2Ba]根据诊断标准为中度，而其他均为低水平。共有8组(32%)具有中度偏倚分析[gydF4y2Ba21gydF4y2Ba，gydF4y2Ba23gydF4y2Ba，gydF4y2Ba27gydF4y2Ba，gydF4y2Ba31gydF4y2Ba-gydF4y2Ba33gydF4y2Ba，gydF4y2Ba36gydF4y2Ba，gydF4y2Ba37gydF4y2Ba]及1 (4%)[gydF4y2Ba30.gydF4y2Ba]显示出较高的偏倚风险，因为有结果的参与者数量不合理。10组(40%)总体偏倚评分[gydF4y2Ba21gydF4y2Ba-gydF4y2Ba23gydF4y2Ba，gydF4y2Ba27gydF4y2Ba，gydF4y2Ba30.gydF4y2Ba，gydF4y2Ba32gydF4y2Ba，gydF4y2Ba33gydF4y2Ba，gydF4y2Ba35gydF4y2Ba-gydF4y2Ba37gydF4y2Ba是温和的。7项研究(28%)的适用性评级的总体担忧[gydF4y2Ba21gydF4y2Ba-gydF4y2Ba23gydF4y2Ba，gydF4y2Ba27gydF4y2Ba，gydF4y2Ba29gydF4y2Ba，gydF4y2Ba32gydF4y2Ba，gydF4y2Ba33gydF4y2Ba]为中等，因为模型特征过多，实际使用中难以收集数据，而其他则较低(表S7)gydF4y2Ba多媒体附件1gydF4y2Ba)．gydF4y2Ba

ML模型在GDM预测中的性能gydF4y2Ba

预测GDM的ML模型的总体合并AUROC为0.8492 (gydF4y2Ba图2gydF4y2Ba)．附加值如下:灵敏度0.69 (95% CI 0.68-0.69;gydF4y2BaPgydF4y2Ba<措施;我gydF4y2Ba^2gydF4y2Ba= 99.6%;gydF4y2Ba图3gydF4y2Ba）;特异性0.75 (95% CI 0.75-0.75;gydF4y2BaPgydF4y2Ba<措施;我gydF4y2Ba^2gydF4y2Ba= 100%;gydF4y2Ba图4gydF4y2Ba）;Dor 13.78 (95% ci 9.53-19.94;gydF4y2BaPgydF4y2Ba<措施;我gydF4y2Ba^2gydF4y2Ba= 99.1%);PLR 4.02 (95% ci 3.13-5.17;gydF4y2BaPgydF4y2Ba<措施;我gydF4y2Ba^2gydF4y2Ba= 99.6%);NLR 0.31 (95% CI 0.26 ~ 0.38;gydF4y2BaPgydF4y2Ba<措施;我gydF4y2Ba^2gydF4y2Ba= 98.7%)。gydF4y2Ba

图2。预测妊娠期糖尿病的机器学习模型的受试者工作特征曲线(AUROC)下的总池面积。Q*: SROC曲线与直线交点处的敏感性(敏感性=特异性);SROC:总体接受者工作特征。gydF4y2Ba

图3。机器学习模型预测妊娠期糖尿病的总体敏感性。每项研究的第一作者沿y轴列出。垂直的红色虚线是集合灵敏度的95% ci。由:贝叶斯;DNN:深度神经网络;GA-CB: GA-CatBoost(遗传算法类别增强);GBDT:梯度增强决策树;KNN: k-最近邻;LGB: LightGBM(轻型梯度提升机); LR: logistic regression; SVM: support vector machine; Tnet: TreeNet; XGB: XGBoost (extreme gradient boosting).

图4。机器学习在妊娠期糖尿病预测中的总体特异性。每项研究的第一作者沿y轴列出。垂直的红色虚线是集合特异性的95% CI。由:贝叶斯;DNN:深度神经网络;GA-CB: GA-CatBoost(遗传算法类别增强);GBDT:梯度增强决策树;KNN: k-最近邻;LGB: LightGBM(轻型梯度提升机); LR: logistic regression; SVM: support vector machine; Tnet: TreeNet; XGB: XGBoost (extreme gradient boosting).

敏感性分析gydF4y2Ba

在排除4个(16%)敏感性和特异性最低和最高的模型后，随机效应荟萃分析得出估计的合并敏感性为0.73 (95% CI 0.72-0.74;gydF4y2BaPgydF4y2Ba<措施;我gydF4y2Ba^2gydF4y2Ba=98.3%)，合并特异性为0.73 (95% CI 0.72-0.73;gydF4y2BaPgydF4y2Ba<措施;我gydF4y2Ba^2gydF4y2Ba= 99.8%)。因此，合并估计被认为对排除异常值不敏感(图S2)gydF4y2Ba多媒体附件1gydF4y2Ba)．gydF4y2Ba

亚组分析gydF4y2Ba

GDM预测性能结果的比较如图所示gydF4y2Ba表2gydF4y2Ba；图S3-S8所示gydF4y2Ba多媒体附件1gydF4y2Ba．gydF4y2Ba

本研究利用LR模型建立了19个预测模型[gydF4y2Ba17gydF4y2Ba，gydF4y2Ba18gydF4y2Ba，gydF4y2Ba20.gydF4y2Ba-gydF4y2Ba23gydF4y2Ba，gydF4y2Ba26gydF4y2Ba-gydF4y2Ba33gydF4y2Ba，gydF4y2Ba35gydF4y2Ba-gydF4y2Ba39gydF4y2Ba]，预测GDM的LR模型的总体合并AUROC为0.8151 (gydF4y2Ba图5gydF4y2Ba)．非lr模型用于预测GDM的总体合并AUROC为0.8891 (gydF4y2Ba图6gydF4y2Ba)，是这些子组中的最高值。对这些非lr方法的进一步分析表明，两种支持向量机模型[gydF4y2Ba19gydF4y2Ba，gydF4y2Ba20.gydF4y2Ba]的AUROC值分别为0.82和0.98(图S9)gydF4y2Ba多媒体附件1gydF4y2Ba)，而两个贝叶斯模型[gydF4y2Ba24gydF4y2Ba，gydF4y2Ba34gydF4y2Ba]的AUROC值分别为0.766和0.71(图S10)gydF4y2Ba多媒体附件1gydF4y2Ba)．有趣的是，Ye等人[gydF4y2Ba20.gydF4y2Ba]开发了gbdt、AdaBoost、LightGBM、LR、Vote、XGBoost、决策树(DT)和rf等8种常见ML方法和2种常见回归模型，对822242例患者的数据集进行了GDM发生的预测。GBDT, AdaBoost和LightGBM (AUROC 0.70-0.75)是该研究中排名前三的模型，而DT和RF是最差的模型(AUROC 0.5-0.68)。使用490人的数据比较了三种ML方法的能力[gydF4y2Ba21gydF4y2Ba］．深度神经网络模型的AUROC最高，为0.92，而支持向量机和k-最近邻(KNN)模型的AUROC分别为0.82和0.68。25项研究中有4项(16%)使用XGBoost、LightGBM、GA-CatBoost和TreeNet, AUROC值分别为0.742、0.942、0.872和0.676 [gydF4y2Ba17gydF4y2Ba，gydF4y2Ba19gydF4y2Ba，gydF4y2Ba21gydF4y2Ba，gydF4y2Ba25gydF4y2Ba) (gydF4y2Ba表2gydF4y2Ba)．gydF4y2Ba

表2。机器学习模型在妊娠期糖尿病(GDM)预测中应用于不同亚组的性能比较。gydF4y2Ba

子群gydF4y2Ba	型号(N=30)， N (%)gydF4y2Ba	AUROCgydF4y2Ba^{一个gydF4y2Ba}	敏感度(95% CI)gydF4y2Ba	特异性(95% CI)gydF4y2Ba	PLRgydF4y2Ba^bgydF4y2Ba(95%置信区间)gydF4y2Ba	NLRgydF4y2Ba^cgydF4y2Ba(95%置信区间)gydF4y2Ba	金龟子gydF4y2Ba^dgydF4y2Ba(95%置信区间)gydF4y2Ba
整体gydF4y2Ba	30 (100)gydF4y2Ba	0.8492gydF4y2Ba	0.69 (0.68 - -0.69)gydF4y2Ba	0.75 (0.75 - -0.75)gydF4y2Ba	4.02 (3.13 - -5.17)gydF4y2Ba	0.31 (0.26 - -0.38)gydF4y2Ba	13.78 (9.53 - -19.94)gydF4y2Ba
诊断前0-13周gydF4y2Ba	16 (53)gydF4y2Ba	0.8667gydF4y2Ba	0.74 (0.73 - -0.75)gydF4y2Ba	0.64 (0.64 - -0.64)gydF4y2Ba	3.89 (2.92 - -5.19)gydF4y2Ba	0.28 (0.22 - -0.36)gydF4y2Ba	16.55 (9.52 - -28.77)gydF4y2Ba
诊断前14-28周gydF4y2Ba	14 (47)gydF4y2Ba	0.8365gydF4y2Ba	0.64 (0.63 - -0.65)gydF4y2Ba	0.85 (0.84 - -0.85)gydF4y2Ba	3.90 (2.76 - -5.53)gydF4y2Ba	0.35 (0.25 - -0.48)gydF4y2Ba	11.67 (7.59 - -18.02)gydF4y2Ba
有GDM历史gydF4y2Ba	11 (37)gydF4y2Ba	0.8759gydF4y2Ba	0.67 (0.66 - -0.68)gydF4y2Ba	0.85 (0.85 - -0.86)gydF4y2Ba	5.29 (3.39 - -8.25)gydF4y2Ba	0.28 (0.18 - -0.44)gydF4y2Ba	19.82 (11.49 - -34.13)gydF4y2Ba
无GDM历史记录gydF4y2Ba	19 (63)gydF4y2Ba	0.8330gydF4y2Ba	0.70 (0.66 - -0.68)gydF4y2Ba	0.65 (0.64 - -0.65)gydF4y2Ba	3.12 (2.52 - -3.86)gydF4y2Ba	0.35 (0.30 - -0.41)gydF4y2Ba	8.27 (5.14 - -13.29)gydF4y2Ba
逻辑回归gydF4y2Ba	19 (63)gydF4y2Ba	0.8151gydF4y2Ba	0.71 (0.70 - -0.72)gydF4y2Ba	0.67 (0.67 - -0.67)gydF4y2Ba	3.04 (2.37 - -3.89)gydF4y2Ba	0.37 (0.32 - -0.43)gydF4y2Ba	8.73 (5.99 - -12.73)gydF4y2Ba
Non-logistic回归gydF4y2Ba	11 (37)gydF4y2Ba	0.8891gydF4y2Ba	0.66 (0.65 - -0.67)gydF4y2Ba	0.85 (0.85 - -0.86)gydF4y2Ba	6.80 (4.45 - -10.37)gydF4y2Ba	0.24 (0.15 - -0.38)gydF4y2Ba	31.85 (15.93 - -63.69)gydF4y2Ba

^{一个gydF4y2Ba}AUROC:受试者工作特征曲线下面积。gydF4y2Ba

^bgydF4y2BaPLR:正似然比。gydF4y2Ba

^cgydF4y2BaNLR:负似然比。gydF4y2Ba

^dgydF4y2BaDOR:诊断优势比。gydF4y2Ba

图5。预测妊娠期糖尿病的logistic回归模型中受试者工作特征曲线(AUROC)下的总合并面积。Q*: SROC曲线与直线交点处的敏感性(敏感性=特异性);SROC:总体接受者工作特征。gydF4y2Ba

图6。预测妊娠期糖尿病的非logistic回归模型的受试者工作特征曲线(AUROC)下的总合并面积。Q*: SROC曲线与直线交点处的敏感性(敏感性=特异性);SROC:总体接受者工作特征。gydF4y2Ba

多元回归gydF4y2Ba

由于高水平的研究间异质性，进行了meta回归分析[gydF4y2Ba42gydF4y2Ba］．样本量、数据收集的国家、发表年份、使用的ML方法和模型质量均不影响诊断准确性(gydF4y2BaPgydF4y2Ba= 13)。所得到的估计参数的反对数转换可以解释为相应协变量的相对DOR，表明在所研究的试验的诊断性能随协变量的单位增加而变化(表S8)gydF4y2Ba多媒体附件1gydF4y2Ba)．gydF4y2Ba

主要研究结果gydF4y2Ba

本研究是一项试点元分析，评估ML模型预测GDM的性能。其对25项研究的总体汇总估计表明，ML模型在GDM患者的早期识别中具有很高的准确性。ML模型可以根据妊娠8 ~ 24周的数据进行预测。甚至有一个模型使用孕前特征提前28周预测结果，这表明ML模型对GDM预测的重要性。与人口普查或现有的筛选方法相比，ML方法具有一定的优势。普遍筛查可使通常根据OGTT检测做出决定的医生100%被发现，这可能会给个别妇女和卫生保健资源带来不必要的负担。目前的选择性筛查策略基于危险因素列表，具有固定的敏感性(±65%)和特异性(±80%)。尽管ML方法不能提供比目前可用的筛查策略更大的好处，但其优点是可以在敏感性和特异性之间选择一个优先的权衡[gydF4y2Ba43gydF4y2Ba］．统计方法的选择更多的是计算现有数据的定量度量，而不是以一般可行的方式预测未知数据[gydF4y2Ba44gydF4y2Ba］．gydF4y2Ba

根据亚组分析，使用非lr方法创建的模型获得了最高的AUROC，这表明研究人员应该测试更多的候选模型。一项研究旨在回顾和比较LR和其他ML算法的预测性能，以开发或验证妊娠护理的多变量预后预测模型;该研究还建议通过将现有LR模型与应用标准指南的算法进行比较，重新分析几种妊娠结局的现有LR模型[gydF4y2Ba45gydF4y2Ba］．在非lr模型中，LightGBM和GA-CatBoost等由多个较弱模型组成的独立训练的集成方法得到了满意的结果。GBDT模型中的变量强调了识别非线性关系的优势。支持向量机模型也取得了较好的结果;该方法构建了一个模型，将新示例分配到一个类别或另一个类别，使其成为一个非概率二进制线性分类器。KNN、DT和RF等方法的表现不如LightGBM和GA-CatBoost方法，这可能是因为DT分类是基于底部的单一条件，因此微小的变化可能会导致错误。对于射频，医疗数据的高维使分类和预测变得复杂。同样，KNN也不能用于高维特征空间。一些研究人员[gydF4y2Ba23gydF4y2Ba]的研究发现，两种方法之间的差异没有统计学意义，因为LR模型适用于变量与结果之间具有线性关系的简单数据。我们的研究还发现，根据总结接受者工作特征曲线，LR模型有利于获得更稳定的性能。诊断前0 ~ 13周的亚组获得了最高的汇总敏感性，而诊断前14 ~ 28周的亚组获得了最高的特异性，这意味着ML可以帮助临床医生在早期筛查中识别更多的患者，并避免在妊娠中期过度误诊。gydF4y2Ba

特征选择对模型性能和解释也至关重要。在这25项研究中，有19项研究将母亲年龄作为特征，这在我们的研究中得到了先前的报道和验证。纳入的一项研究报道，GDM发病率在25岁以后增加，主要原因是随着年龄的增长，胰岛β细胞的功能下降，因此老年孕妇的胰岛素拮抗作用加重[gydF4y2Ba46gydF4y2Ba］．8个模型认为GDM历史是预测GDM的重要因素。当将GDM病史作为预测未来GDM的危险因素时，DOR值为21.09。先前的研究发现，患有GDM的女性更有可能有2型糖尿病家族史和GDM史，部分原因是这两种疾病之间的遗传基础重叠[gydF4y2Ba18gydF4y2Ba］．在其他研究中，GDM与GDM病史无显著相关性，这是因为在他们的研究中，绝大多数未生育的女性没有发生GDM的风险。GDM与甘油三酯(TG)、高密度脂蛋白(高密度脂蛋白)、低密度脂蛋白(LDL)等血脂指标之间的关系已被研究，其中TG水平与GDM的关系最为密切[gydF4y2Ba47gydF4y2Ba］．我们的研究还发现，虽然在大多数纳入研究中，GDM组的TG、总胆固醇和LDL水平高于正常孕妇，但在特征选择后，只有TG水平是GDM的高危因素。一项包括母体脂肪分布和血清炎症因子的超声数据的新模型观察到，GDM孕妇的内脏脂肪厚度和皮下脂肪厚度更大;该模型还表明，皮下和内脏脂肪的增加可能导致肌肉和脂肪组织胰岛素抵抗的增加[gydF4y2Ba36gydF4y2Ba］．甜甜等[gydF4y2Ba27gydF4y2Ba]观察到患有GDM的女性瘦素和脂脂素-2水平较高，脂联素水平较低，并提出脂肪因子是GDM的特征。gydF4y2Ba

优势与局限gydF4y2Ba

这项研究的主要优势在于它的方法是合乎逻辑的，并且描述得足够详细，可以重现。这项荟萃分析几乎包括了所有已发表的GDM预后模型，以便进行比较。数据收集表基于GDM预测模型的特点。此外，新型PROBAST被用于评估偏倚风险和预后预测模型研究的适用性。诊断准确性研究质量评估(QUADAS)工具是一种广泛使用的工具，用于估计主要诊断准确性研究的偏倚和适用性，但并不完全适合预测模型[gydF4y2Ba48gydF4y2Ba］．在系统综述和元分析中，越来越多的研究人员倾向于使用PROBAST而不是QUADAS工具来评估基于人工智能的模型的偏倚;这是因为模型的更多细节，如数据源、处理、每个变量的事件数量、特征选择、模型开发和模型验证，都被集中检查了[gydF4y2Ba49gydF4y2Ba-gydF4y2Ba52gydF4y2Ba］．我们发现14项发展研究在方法学质量或适用性方面存在偏倚风险，这可能导致预测模型过拟合。值得注意的是，根据PROBAST，最近模型的质量高于先前发布的模型。如果研究人员根据TRIPOD计划报告他们的研究，就可以防止一些偏见[gydF4y2Ba12gydF4y2Ba］．gydF4y2Ba

尽管我们的研究证实了ML模型对GDM有很好的预测能力，但我们的研究还存在一些局限性。主要的局限性来自于研究间的异质性。首先，不同研究的样本量和分布不同，影响了每个模型的性能和适用性。此外，特征选择方法也各不相同。一些研究人员倾向于选择与GDM有统计学显著相关性的特征，而另一些研究人员则将基于先前建立的模型中现有知识的因素与预测器的可靠性、一致性、适用性、可用性和成本相结合。其次，当忽略对模型内部偏差的分析时，低质量模型的性能可能被高估。由于一些研究存在不同程度的偏差，本分析中的研究结果必须谨慎应用。值得注意的是，与为传统诊断方法设计的其他工具相比，PROBAST更有可能识别预测模型中的偏差。另一个限制是很少有模型经过外部验证来测试其可扩展性。然而，之前的一项研究[gydF4y2Ba8gydF4y2Ba]对12个已发表的GDM预测模型进行了外部验证，表明大多数已发表的模型显示出可接受的甄别性和校准性，但作者指出，由于不同人群中GDM发病率的差异，这些模型可能存在异质性。gydF4y2Ba

临床意义gydF4y2Ba

虽然已经开发了几种GDM评分系统，但目前的指南中没有一个是广泛推荐的。基于以上讨论，为了使ML模型在临床实践中预测GDM的优势最大化，模型研究者或决策者必须考虑以下几个方面。对于前者，我们建议关于使用哪种特征选择方法和ML算法的决定应该基于临床需要，而不是准确性。在常规医学中难以获得的具有多余特征的模型不太可能被广泛应用。研究人员还应提供数据预处理过程和验证、判别、校准、分类结果，从多个角度阐述模型的性能。对于决策者，我们建议数据来源，例如为GDM研究设计的基于人群的队列，具有统一的国际诊断标准，在这一目标中推广ML方法。研究表明，尽管电子健康记录为新型ML方法提供了各种数据，包括时间序列和图像，但它们具有固有的偏差，受患者与医疗保健系统相互作用的影响。相比之下，基于社区的预测可能强有力地捕捉到更多无症状高危病例[gydF4y2Ba53gydF4y2Ba］．根据国际糖尿病与妊娠研究小组协会(IADPSG)和国家健康与护理卓越研究所(21.72%)的GDM发病率，比人民卫生出版社出版的中国妇产科学教材第7版(6.08%)的标准高出3倍以上[gydF4y2Ba54gydF4y2Ba］．中国的一些专家主张实施IADPSG标准，因为他们认为这将指导研究人员更好地了解GDM在不同地区的患病率，并确保中国的标准与国际标准保持一致。然而，研究人员怀疑IADPSG的发现是否适用于所有人群，因为这些标准主要适用于白人女性。总之，尽快统一GDM诊断标准确实是有帮助的。本荟萃分析报告了ML模型的优势和需要注意的因素。一项类似的ML模型和深度学习算法的元分析报告称，基于人工智能的自动化工具为降低筛查成本提供了巨大的好处，并可以取代早期治疗[gydF4y2Ba55gydF4y2Ba］．gydF4y2Ba

综上所述，ML方法表现出较高的性能，将是一种更具选择性和成本效益的GDM筛查方法。应进一步强调质量评价和统一诊断标准的重要性。gydF4y2Ba

致谢gydF4y2Ba

国家重点研发计划项目(资助2018YFC1314900和2018YFC1314902)，南通市“226计划”项目，江苏省高校“青蓝计划”优秀骨干教师项目，南通市科技计划项目(资助MS12020037)，江苏省学生创新创业培养平台计划项目(资助201910304108Y)，江苏省研究生科研创新计划项目(资助KYCX20_2836)。gydF4y2Ba

作者的贡献gydF4y2Ba

HW监督了这项研究。LY、WH、YW、LZ、CG进行文献检索和数据提取。KJ和YL提供技术支持。ZZ进行实验设计和数据处理，并撰写稿件。gydF4y2Ba

利益冲突gydF4y2Ba

没有宣布。gydF4y2Ba

‎gydF4y2Ba

多媒体附件1gydF4y2Ba

补充材料。gydF4y2Ba

DOCX文件，2194 KBgydF4y2Ba

‎gydF4y2Ba

多媒体附件2gydF4y2Ba

偏差风险评估工具(PROBAST)的预测模型检查表。gydF4y2Ba

DOCX文件，22 KBgydF4y2Ba

袁磊，李志强，李志强，等。2019年及以后妊娠期高血糖患病率预测:国际糖尿病联合会糖尿病地图集，第9版结果2019年11月;157:107841。［gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba］gydF4y2Ba
美国糖尿病协会。糖尿病的诊断和分类。糖尿病护理2013年12月19日;37日(补充_1):S81-S90。［gydF4y2BaCrossRefgydF4y2Ba］gydF4y2Ba
Caissutti C, Berghella V. GDM筛查和管理的不同选择的科学证据:文献的争议和回顾。Biomed Res Int 2017;2017:2746471 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba］gydF4y2Ba
王娟。基于机器学习的妊娠期糖尿病预测[硕士论文;中文文件]。成都:西南财经大学;2019.URL:gydF4y2Bahttps://tinyurl.com/yck82cvxgydF4y2Ba
阿兹，谢洛，哈达尔，罗斯曼，巴巴什-哈赞，本-哈鲁什，等。基于全国电子健康档案的妊娠糖尿病预测。医学2020年1月;26(1):71-76。［gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba］gydF4y2Ba
Ngiam KY, Khor IW。医疗保健服务的大数据和机器学习算法。《柳叶刀》2019年5月;20(5):e262-e273。［gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba］gydF4y2Ba
《21世纪治愈法案第3060节对现有医疗软件政策的变更:工业和食品药品监督管理局工作人员指南》马里兰州罗克维尔:美国食品和药物管理局;2019年9月gydF4y2Bahttps://tinyurl.com/yy8zuajcgydF4y2Ba
Lamain-de Ruiter M, Kwee A, Naaktgeboren CA, de Groot I, Evers IM, Groenendaal F，等。一个荷兰队列中预测妊娠糖尿病风险的预后模型的外部验证:前瞻性多中心队列研究英国医学杂志2016 Aug 30;354:i4338 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba］gydF4y2Ba
Moher D, Liberati A, Tetzlaff J, Altman DG, PRISMA Group。系统评价和元分析的首选报告项目:PRISMA声明。PLoS Med 2009 7月21日;6(7):e1000097 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba］gydF4y2Ba
NoteExpress。URL:gydF4y2Bahttp://www.inoteexpress.com/wiki/index.php/%E9%A6%96%E9%A1%B5gydF4y2Ba[2020-11-01]访问gydF4y2Ba
Eapen B. EndNote 7.0。麻风皮肤性病杂志2006;72(2):165-166。［gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba］gydF4y2Ba
Collins GS, Reitsma JB, Altman DG, Moons KG。透明报告个人预后或诊断的多变量预测模型(TRIPOD): TRIPOD声明。欧洲临床医学杂志2015年2月;45(2):204-214。［gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba］gydF4y2Ba
穆恩斯KG，沃尔夫RF，赖利RD，怀廷PF，韦斯特伍德M，柯林斯GS，等。PROBAST:评估偏倚风险和预测模型研究适用性的工具:解释和阐述。安实习医学2019年1月1日;170(1):W1。［gydF4y2BaCrossRefgydF4y2Ba］gydF4y2Ba
Steyerberg EW, Vickers AJ, Cook NR, Gerds T, Gonen M, Obuchowski N，等。评估预测模型的性能。流行病学2010;21(1):128 - 138。［gydF4y2BaCrossRefgydF4y2Ba］gydF4y2Ba
Zamora J, Abraira V, Muriel A, Khan K, Coomarasamy A. Meta-DiSc:测试精度数据的元分析软件。BMC medical Res methodo2006 7月12日;6:31 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba］gydF4y2Ba
希金斯分卫，汤普森得分后卫，Deeks JJ, Altman DG。测量元分析中的不一致性。英国医学杂志2003 Sep 06;327(7414):557-560 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba］gydF4y2Ba
刘辉，李娟，冷杰，王辉，刘娟，李伟，等。天津孕早期妊娠糖尿病的机器学习风险评分预测糖尿病Metab Res Rev 2021 7月09日;37(5):e3397。［gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba］gydF4y2Ba
吴勇，张超，Mol BW, Kawai A，李超，陈琳，等。通过先进的机器学习对中国人群妊娠糖尿病的早期预测。J clinical Endocrinol Metab 2021 march 08; 21 (3):e1191-e1205 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba］gydF4y2Ba
熊勇，林林，陈勇，Salerno S，李勇，曾霞，等。利用机器学习技术预测怀孕前19周的妊娠糖尿病。J母胎新生儿医学2020年8月6日1-7。［gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba］gydF4y2Ba
叶勇，熊勇，周强，吴娟，李霞，肖霞。利用常规临床数据预测妊娠糖尿病的机器学习方法与常规logistic回归的比较:一项回顾性队列研究。J Diabetes Res 2020;2020:4168340 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba］gydF4y2Ba
高松，冷杰，刘华，王松，李伟，王勇，等。用于预测中国孕妇妊娠糖尿病的早期妊娠风险评分的开发和验证。BMJ Open Diabetes Res Care 2020 april;8(1):e000909 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba］gydF4y2Ba
吴波，黄红，姚强，邓睿，李红，梁涛。大数据和人工智能方法在妊娠期糖尿病预测中的应用。中华卫生杂志2017;14(6):832-837。［gydF4y2BaCrossRefgydF4y2Ba］gydF4y2Ba
黄艳。基于广西出生队列的妊娠糖尿病风险模型构建及其对妊娠结局的影响分析[硕士论文;中文文件]。广西:广西医科大学;2017.URL:gydF4y2Bahttps://tinyurl.com/2p8tredxgydF4y2Ba[2020-09-14]访问gydF4y2Ba
郑涛，叶伟，王霞，李霞，张娟，小娟，等。预测中国妇女妊娠8 ~ 20周妊娠糖尿病风险的简单模型。BMC妊娠分娩2019年7月19日;19(1):252 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba］gydF4y2Ba
崔波。Cascade GA-CatBoost在妊娠期糖尿病预测诊断中的研究[硕士论文;中文文件]。中国太原:太原理工大学;2019.URL:gydF4y2Bahttp://150.138.141.24/kcms/detail/detail.aspx?filename=1019872456.nh&dbcode=CMFD&dbname=CMFDREFgydF4y2Ba[2022-01-25]访问gydF4y2Ba
AP Nombo, Mwanri AW, Brouwer-Brolsma EM, Ramaiya KL, Feskens EJ。妊娠糖尿病风险评分:预测坦桑尼亚妊娠糖尿病风险的实用工具。糖尿病临床研究2018年11月;145:130-137。［gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba］gydF4y2Ba
王俊杰，王晓明，王晓明，王晓明，等。一种新的妊娠糖尿病早期妊娠风险预测模型。中华儿科杂志2019;45(2):76-84。［gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba］gydF4y2Ba
高张苗族Z,吴H, Y, Y,江Y,赵Y, et al。不同孕前体重指数孕早期糖脂代谢指标对妊娠糖尿病的预测价值。中华糖尿病杂志2020;12(7):462-468。［gydF4y2BaCrossRefgydF4y2Ba］gydF4y2Ba
Thériault S, Giguère Y, Massé J, Girouard J, Forest J.妊娠期糖尿病的早期预测:结合临床和生化指标的实用模型。临床化学实验室医学2016年3月;54(3):509-518。［gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba］gydF4y2Ba
Gabbay-Benziv R, Doyle L, Blitzer M, Baschat A.孕早期孕妇血糖状态预测。围产医学杂志2015年5月;43(3):283-289。［gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba］gydF4y2Ba
Eleftheriades M, Papastefanou I, Lambrinoudaki I, Kappou D, Lavranos D, Akalestos A，等。妊娠11-14周胎盘生长因子浓度升高预测妊娠糖尿病代谢2014 11月;63(11):1419-1425。［gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba］gydF4y2Ba
Pintaudi B, Di Vieste G, Corrado F, Lucisano G, Pellegrini F, Giunta L，等。通过更准确地定义高危人群，改进妊娠糖尿病的选择性筛查策略。欧洲内分泌杂志2013 Nov 22;170(1):87-93 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba］gydF4y2Ba
Savona-Ventura C, Vassallo J, Marre M, Karamanos BG, MGSD-GDM研究组。地中海妇女妊娠期糖尿病筛查的综合风险评估模型。中华妇产科杂志2013年3月;120(3):240-244。［gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba］gydF4y2Ba
Tran TS, Hirst JE, Do MAT, Morris JM, Jeffery HE。越南妊娠期糖尿病的早期预测:目前推荐诊断标准的临床影响。糖尿病护理2013 Mar;36(3):618-624 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba］gydF4y2Ba
Teede H, Harrison C, Teh W, Paul E, Allan C.妊娠糖尿病:早期风险预测工具的开发，以促进预防机会。中华妇产科杂志2011;51(6):499-504。［gydF4y2BaCrossRefgydF4y2Ba］gydF4y2Ba
van Leeuwen M, Opmeer B, Zweers E, van Ballegooie E, ter Brugge HG, de Valk HW，等。妊娠期糖尿病风险评估:基于患者特征和病史的临床预测模型中国医学杂志2010年1月;17(1):69-75。［gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba］gydF4y2Ba
Caliskan E, Kayikcioglu F, Oztürk N, Koc S, Haberal A.基于人群的危险因素评分将减少不必要的妊娠糖尿病诊断检测。中华妇产科杂志2004年6月;83(6):524-530 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba］gydF4y2Ba
肖欣，董欣，李欣，尹晨。孕妇基本特征及14-20周糖脂代谢指标对妊娠期糖尿病的早期预测价值。中华实用妇科杂志2018;34(04):429-432。［gydF4y2BaCrossRefgydF4y2Ba］gydF4y2Ba
张勇，周琳，田玲，李霞，张刚，秦杰，等。基于母体状况结合超声和血清学结果的妊娠中期妊娠糖尿病风险预测模型2020年7月;20(1):293-300 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba］gydF4y2Ba
Snyder BM, Baer RJ, Oltman SP, Robinson JG, Breheny PJ, Saftlas AF，等。利用产前筛查生物标志物预测未生育妇女妊娠糖尿病风险。糖尿病Res临床实践2020年5月;163:108139 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba］gydF4y2Ba
谭艳。中国长春地区妊娠糖尿病模型的临床研究。中国妇幼保健2020;35(16):2957-2959。［gydF4y2BaCrossRefgydF4y2Ba］gydF4y2Ba
Lijmer JG, Bossuyt PMM, Heisterkamp SH.探讨诊断试验系统综述中的异质性来源。统计医学2002年6月15日;21(11):1525-1537。［gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba］gydF4y2Ba
Meertens LJE, Scheepers HCJ, van Kuijk SMJ, Roeleveld N, Aardenburg R, van Dooren IMA，等。妊娠期糖尿病预后预测模型的外部验证和临床应用:一项前瞻性队列研究。中华妇产科杂志2020 july;99(7):891-900 [j]gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba］gydF4y2Ba
张晓东，李志强，李志强。统计学与机器学习的比较。Nat Methods 2018 Apr;15(4):233-234 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba］gydF4y2Ba
陈勇，郭志刚，叶涛，等。多变量逻辑回归和其他机器学习算法在妊娠护理预后预测研究中的比较:系统回顾和荟萃分析。JMIR Med Inform 2020年11月17日;8(11):e16503 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba］gydF4y2Ba
刘颖，杜丽。衰老因素对妊娠结局的影响[杂志]。临床医学工程2011;18(3):365-366 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba］gydF4y2Ba
Niromanesh S, Shirazi M, dasgerdy E, Sharbaf FR, Shirazi M, Khazaeipour Z.高甘油三酯血症与子痫前期、早产、妊娠糖尿病和子宫动脉搏动指数的关系。中国医学杂志，2012;26(5):369 - 369。［gydF4y2BaMedlinegydF4y2Ba］gydF4y2Ba
Whiting PF, Rutjes AWS, Westwood ME, Mallett S, Deeks JJ, Reitsma JB, QUADAS-2 Group。QUADAS-2:诊断准确性研究质量评估的修订工具。安实习医学2011年10月18日;155(8):529-536 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba］gydF4y2Ba
Palazón-Bru A, Mares-García E, López-Bru D, Mares-Arambul E, Folgado-de la Rosa DM, de Los Ángeles Carbonell-Torregrosa M，等。口咽癌患者死亡率和复发预测模型的临床适用性和偏倚风险的关键评估:系统综述。头颈2020年4月;42(4):763-773。［gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba］gydF4y2Ba
Di Tanna G, Wirtz H, Burrows K, Globe G.评估成人心力衰竭的风险预测模型:一项系统的文献综述。科学通报2020;15(1):e0224135 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba］gydF4y2Ba
陈勇，陈志强，陈志强，陈志强，等。人工智能与临床医生:深度学习研究的设计、报告标准和声明的系统回顾。BMJ 2020 3月25日;368:m689 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba］gydF4y2Ba
朱晓燕，王晓燕，王晓燕，等。预测导管消融后房颤复发:预后模型的系统回顾。2020年5月1日;22(5):748-760 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba］gydF4y2Ba
Silva KD, Lee WK, Forbes A, Demmer RT, Barton C, Enticott J.机器学习模型在社区环境中用于2型糖尿病预测的使用和性能:系统回顾和荟萃分析。Int J Med Inform 2020年11月;143:104268。［gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba］gydF4y2Ba
何忠，谢辉，梁硕，唐勇，丁伟，吴勇，等。不同诊断标准对中国妊娠期糖尿病发病率及医疗费用的影响J Diabetes investigation 2019 Sep;10(5):1347-1357 [gydF4y2Ba免费全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba］gydF4y2Ba
Islam MM, Yang H, Poly TN, Jian W, Li YCJ。在视网膜眼底照片中检测糖尿病视网膜病变的深度学习算法:系统回顾和荟萃分析。计算方法程序生物医学2020年7月;191:105320。［gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba］gydF4y2Ba

‎gydF4y2Ba

演算法:gydF4y2Ba自适应增强gydF4y2Ba

人工智能:gydF4y2Ba人工智能gydF4y2Ba

AUROC:gydF4y2Ba接收机工作特性曲线下面积gydF4y2Ba

c指数:gydF4y2Ba一致性指标gydF4y2Ba

金龟子:gydF4y2Ba诊断优势比gydF4y2Ba

DT:gydF4y2Ba决策树gydF4y2Ba

食品药品监督管理局:gydF4y2Ba食品和药物管理局gydF4y2Ba

GA-CatBoost:gydF4y2Ba遗传算法类别增强gydF4y2Ba

GBDT:gydF4y2Ba梯度增强决策树gydF4y2Ba

GDM:gydF4y2Ba妊娠期糖尿病gydF4y2Ba

IADPSG:gydF4y2Ba国际糖尿病和妊娠研究小组协会gydF4y2Ba

资讯:gydF4y2Ba再邻居gydF4y2Ba

低密度脂蛋白:gydF4y2Ba低密度脂蛋白gydF4y2Ba

LightGBM:gydF4y2Ba轻型梯度提升机gydF4y2Ba

LR:gydF4y2Ba逻辑回归gydF4y2Ba

ML:gydF4y2Ba机器学习gydF4y2Ba

NLR:gydF4y2Ba负似然比gydF4y2Ba

OGTT:gydF4y2Ba口服糖耐量试验gydF4y2Ba

皮科:gydF4y2Ba人口、干预、控制和结果gydF4y2Ba

PLR:gydF4y2Ba正似然比gydF4y2Ba

棱镜:gydF4y2Ba系统评价和元分析的首选报告项目gydF4y2Ba

PROBAST:gydF4y2Ba风险偏差评估工具的预测模型gydF4y2Ba

显得无用:gydF4y2Ba诊断准确性研究的质量评估gydF4y2Ba

射频:gydF4y2Ba随机森林gydF4y2Ba

支持向量机:gydF4y2Ba支持向量机gydF4y2Ba

TG:gydF4y2Ba甘油三酸酯gydF4y2Ba

三脚架:gydF4y2Ba个体预后或诊断的多变量预测模型的透明报告gydF4y2Ba

XGBoost:gydF4y2Ba极端梯度增强gydF4y2Ba

G·艾森巴赫(G Eysenbach)编辑;提交19.12.20;对作者16.01.21的评论;修订本于11.03.21收到;接受10.12.21;发表16.03.22gydF4y2Ba

这是一篇开放获取的文章，根据创作共用署名许可(https://creativecommons.org/licenses/by/4.0/)的条款发布，允许在任何媒介上无限制地使用、分发和复制，前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息，//www.mybigtv.com/上的原始出版物的链接，以及此版权和许可信息。gydF4y2Ba

本文内容如下gydF4y2Bae-collection /主题问题:gydF4y2Ba

妊娠期糖尿病的机器学习预测模型:元分析gydF4y2Ba

妊娠期糖尿病的机器学习预测模型:元分析gydF4y2Ba

原始论文gydF4y2Ba

通讯作者:gydF4y2Ba

摘要gydF4y2Ba

关键字gydF4y2Ba

简介gydF4y2Ba

方法gydF4y2Ba

研究设计gydF4y2Ba

搜索方法gydF4y2Ba

纳入和排除标准gydF4y2Ba

数据提取gydF4y2Ba

质量和偏倚评估gydF4y2Ba

统计分析gydF4y2Ba

结果gydF4y2Ba

研究选择gydF4y2Ba

研究特点gydF4y2Ba

质量评估gydF4y2Ba

ML模型在GDM预测中的性能gydF4y2Ba

敏感性分析gydF4y2Ba

亚组分析gydF4y2Ba

多元回归gydF4y2Ba

讨论gydF4y2Ba

主要研究结果gydF4y2Ba

优势与局限gydF4y2Ba

临床意义gydF4y2Ba

结论gydF4y2Ba

致谢gydF4y2Ba

作者的贡献gydF4y2Ba

利益冲突gydF4y2Ba

参考文献gydF4y2Ba

缩写gydF4y2Ba