这是一篇开放获取的文章,根据创作共用署名许可(https://creativecommons.org/licenses/by/4.0/)的条款发布,允许在任何媒介上无限制地使用、分发和复制,前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。gydF4y2Ba
胶囊内窥镜图像或电影的解释依赖于操作人员和耗时。因此,计算机辅助诊断(CAD)已被应用于提高审查过程的有效性和准确性。之前的两项荟萃分析报告了CAD模型在胶囊内窥镜中对胃肠道溃疡或出血的诊断性能。然而,目前系统综述不够,无法确定CAD模型的真正诊断有效性。gydF4y2Ba
目的评价无线胶囊内窥镜图像对消化道溃疡或出血的CAD模型诊断检验的准确性。gydF4y2Ba
我们在核心数据库中搜索了基于CAD模型的研究,用于使用胶囊内窥镜诊断溃疡或出血,并提供了诊断性能数据。进行系统回顾和诊断检验准确性meta分析。gydF4y2Ba
总共纳入了39项研究。CAD模型诊断溃疡(或糜烂)的曲线下面积、敏感性、特异性和诊断优势比分别为0.97(95%置信区间,0.95 - 0.98)、0.93(0.89 - 0.95)、0.92(0.89 - 0.94)和138(79-243)。CAD模型诊断出血(或血管扩张)的曲线下面积、敏感性、特异性和诊断优势比分别为0.99(.98 -.99)、0.96(.94 - 0.97)、0.97(.95 -.99)和888(343-2303)。亚组分析显示了稳健的结果。meta回归显示,发表年份、训练图像数量和目标疾病(溃疡vs糜烂、出血vs血管扩张)是异质性的来源。未检测到发表偏倚。gydF4y2Ba
CAD模型在无线胶囊内窥镜下对消化道溃疡和出血的光学诊断中表现出良好的性能。gydF4y2Ba
无线胶囊内窥镜(WCE)允许以一种无创的方式调查胃肠道粘膜病变。这提供了大约50,000至60,000个视频帧,并允许在一次检查中可视化整个胃肠道粘膜,而不会引起患者不适或程序相关不良事件的风险[gydF4y2Ba
人工智能技术已应用于胃肠道内镜检查,对内镜图像或电影异常病变的自动检测或诊断已被广泛研究[gydF4y2Ba
以前的研究已经报道了在WCE中使用人工智能的计算机辅助诊断(CAD)模型的性能[gydF4y2Ba
以往荟萃分析与当前研究的比较。gydF4y2Ba
参数gydF4y2Ba | 本研究gydF4y2Ba | 索弗等[gydF4y2Ba |
莫汉等[gydF4y2Ba |
纳入研究数量gydF4y2Ba | 消化道溃疡20例,消化道出血19例gydF4y2Ba | 消化道溃疡5项,消化道出血5项gydF4y2Ba | 9项消化道溃疡或出血的诊断研究(未对溃疡和出血进行单独分析)gydF4y2Ba |
主要结果gydF4y2Ba | CAD单独诊断性能gydF4y2Ba一个gydF4y2Ba使用WCE建立胃肠溃疡或出血模型gydF4y2BabgydF4y2Ba | 基于WCE的CAD模型对消化道溃疡或出血的独立诊断性能gydF4y2Ba | 使用WCE对消化道溃疡和出血的CAD模型的汇总诊断性能(不是使用DTA的荟萃分析)gydF4y2BacgydF4y2Ba;每项研究都没有考虑溃疡或出血的患病率,因此没有计算TPgydF4y2BadgydF4y2Ba,《外交政策》gydF4y2BaegydF4y2Ba, FNgydF4y2BafgydF4y2Ba,或TNgydF4y2BaggydF4y2Ba在每项研究中)gydF4y2Ba |
搜索策略gydF4y2Ba | 通过PubMed、Web of Science和Cochrane图书馆搜索MEDLINE(2位独立作者搜索数据库)gydF4y2Ba | 通过PubMed检索MEDLINE(2位独立作者检索数据库)gydF4y2Ba | 搜索ClinicalTrials.gov, Ovid EBMgydF4y2BahgydF4y2BaReviews、Ovid、Embase、Ovid MEDLINE、Scopus和Web of Science(一个医学图书管理员搜索了所有数据库)gydF4y2Ba |
TP/FP/FN/TN计算(编码)不准确gydF4y2Ba | N/AgydF4y2Ba我gydF4y2Ba | 研究数据中发现计算不准确gydF4y2Ba | 不是DTA的元分析;每项研究都没有考虑溃疡或出血的患病率,因此没有计算TP、FP、FN或TNgydF4y2Ba |
研究间异质性的确定gydF4y2Ba | 敏感性和特异性的对数之间的相关系数,HSROC的betagydF4y2BajgydF4y2Ba模型,目测SROC曲线gydF4y2Ba |
|
|
质量评估gydF4y2Ba | QUADAS-2gydF4y2BakgydF4y2Ba | QUADAS-2gydF4y2Ba | 没有评估gydF4y2Ba |
发表偏倚gydF4y2Ba | Deeks漏斗图不对称检验gydF4y2Ba | 没有评估gydF4y2Ba | 没有评估gydF4y2Ba |
一个gydF4y2BaCAD:计算机辅助诊断。gydF4y2Ba
bgydF4y2Ba无线胶囊内窥镜。gydF4y2Ba
cgydF4y2BaDTA:诊断测试准确性。gydF4y2Ba
dgydF4y2BaTP:真正。gydF4y2Ba
egydF4y2BaFP:假阳性。gydF4y2Ba
fgydF4y2BaFN:假阴性。gydF4y2Ba
ggydF4y2BaTN:真否定。gydF4y2Ba
hgydF4y2Ba循证医学。gydF4y2Ba
我gydF4y2BaN/A:不适用。gydF4y2Ba
jgydF4y2BaHSROC:分级汇总接收者工作特征。gydF4y2Ba
kgydF4y2BaQUADAS-2:诊断准确性研究质量评估第二版。gydF4y2Ba
本研究根据DTA研究的PRISMA(系统评价和元分析的首选报告项目)的声明进行[gydF4y2Ba
作者利用与CAD模型在使用WCE图像检测溃疡或出血的性能相关的关键词建立了搜索公式。使用医学主题词(MeSH)术语关键词建立检索公式(gydF4y2Ba
数据库:MEDLINE(通过PubMed)gydF4y2Ba
# 1。“人工智能”[tiab]或“AI”[tiab]或“深度学习”[tiab]或“机器学习”[tiab]或“计算机”[tiab]或“神经网络”[tiab]或“CNN”[tiab]或“自动”[tiab]或“自动化”[tiab]: 532189gydF4y2Ba
# 2。“胶囊内窥镜”[tiab] OR“胶囊内窥镜”[Mesh]: 5110gydF4y2Ba
# 3。“溃疡”或“溃疡”[网格]或“侵蚀”[tiab]: 138857gydF4y2Ba
# 4。1、2、3:29gydF4y2Ba
# 5。英语[朗]:29gydF4y2Ba
数据库:Web of SciencegydF4y2Ba
# 1。人工智能或AI或深度学习或机器学习或计算机或神经网络或CNN或自动或自动:1236876gydF4y2Ba
# 2。胶囊内窥镜:3524gydF4y2Ba
# 3。溃疡:33664gydF4y2Ba
# 4。1、2、3:49gydF4y2Ba
数据库:Cochrane LibrarygydF4y2Ba
# 1。人工智能:ab, ti, kw;OR AI: ab, ti, kw;OR深度学习:ab, ti, kw;OR机器学习:ab, ti, kw;或计算机:ab, ti, kw;OR神经网络:ab, ti, kw;OR CNN: ab, ti, kw;或自动:ab, ti, kw;或自动化:ab, ti, kw: 60327gydF4y2Ba
# 2。MeSH描述符:[胶囊内窥镜]爆炸所有树:131gydF4y2Ba
# 3。胶囊内窥镜:ab, ti, kw: 724gydF4y2Ba
# 4。#2或#3:724gydF4y2Ba
# 5。网格描述符:[溃疡]爆炸所有树:1413gydF4y2Ba
# 6。溃疡:ab, ti, kw;OR侵蚀:ab, ti, kw: 20844gydF4y2Ba
# 7。#5或#6:20844gydF4y2Ba
# 8。#1, #4和#7:2次试验gydF4y2Ba
数据库:MEDLINE(通过PubMed)gydF4y2Ba
# 1。“人工智能”[tiab]或“AI”[tiab]或“深度学习”[tiab]或“机器学习”[tiab]或“计算机”[tiab]或“神经网络”[tiab]或“CNN”[tiab]或“自动”[tiab]或“自动化”[tiab]: 532189gydF4y2Ba
# 2。“胶囊内窥镜”[tiab] OR“胶囊内窥镜”[Mesh]: 5110gydF4y2Ba
# 3。"出血"或"出血"或"血管扩张"[补片]:475519gydF4y2Ba
# 4。1、2、3:82gydF4y2Ba
# 5。英语[朗]:79gydF4y2Ba
数据库:Web of SciencegydF4y2Ba
# 1。人工智能或AI或深度学习或机器学习或计算机或神经网络或CNN或自动或自动:1236876gydF4y2Ba
# 2。胶囊内窥镜:3524gydF4y2Ba
# 3。出血或出血或血管扩张:146789gydF4y2Ba
#4 #1 #2和#3:87gydF4y2Ba
数据库:Cochrane LibrarygydF4y2Ba
# 1。人工智能:ab, ti, kw;OR AI: ab, ti, kw;OR深度学习:ab, ti, kw或机器学习:ab, ti, kw;或计算机:ab, ti, kw;OR神经网络:ab, ti, kw;OR CNN: ab, ti, kw;或自动:ab, ti, kw;或自动化:ab, ti, kw: 60327gydF4y2Ba
# 2。MeSH描述符:[胶囊内窥镜]爆炸所有树:131gydF4y2Ba
# 3。胶囊内窥镜:ab, ti, kw: 724gydF4y2Ba
# 4。#2或#3:724gydF4y2Ba
# 5。网格描述符:爆炸所有树:14887gydF4y2Ba
# 6。出血:ab, ti, kw;OR血管扩张:ab, ti, kw: 46708gydF4y2Ba
# 7。#5或#6:53831gydF4y2Ba
# 8。#1和#4和#7:8(试)gydF4y2Ba
CAD,计算机辅助诊断;WCE:无线胶囊内镜;Tiab:搜索标题和摘要的代码;网格:医学主题标题;Ab, ti, kw:摘要,标题和关键词的搜索代码;朗:搜索语言代码;Lim:通过限制某些条件来搜索代码。gydF4y2Ba
CSB和JJL两位作者使用预先建立的搜索公式,从开始到2021年5月,通过PubMed、Web of Science和Cochrane Library独立地对MEDLINE的核心数据库进行了搜索。重复的文章被排除。对所有确定的文章的标题和摘要进行审查,排除不相关的文章。随后进行全文回顾,以确定在确定的文献中是否满足预先建立的纳入标准。我们也回顾了相关文章的参考文献,以确定是否有其他研究。CSB和JJL在搜索过程中对结果的任何分歧都是通过与另一位作者(GHB)讨论或协商解决的。gydF4y2Ba
本系统综述的文献符合以下纳入标准:旨在评估基于WCE图像的CAD模型对胃肠道溃疡或出血的诊断性能;CAD模型诊断性能的表现,包括灵敏度、特异性、似然比、预测值或准确性,从而能够估计CAD模型的TP、FP、FN和TN值;并且是用英语写的。排除标准如下:叙述性综述文章、数据不完整的研究、系统综述或荟萃分析、评论、只有摘要的程序或研究方案。有PDF文件的全文出版物被认为是一篇全文文章。符合至少1项排除标准的文章被排除在本研究之外。gydF4y2Ba
CSB和JJL使用第二版的诊断准确性研究质量评估(QUADAS-2)评估纳入文章的方法学质量。该工具包括4个领域,包括“患者选择”、“指标测试”、“参考标准”和“流程和时间”,前3个领域具有“适用性”评估。CSB和JJL评估每个部分的偏倚风险为高、低或不明确[gydF4y2Ba
CSB和JJL分别从每篇收录的文章中提取数据,并对提取的数据进行交叉核对。如果数据不清楚,通过电子邮件联系该研究的通讯作者以获得原始数据集的见解。通过系统回顾过程进行描述性综合,如果纳入的研究足够均匀,则进行DTA元分析。gydF4y2Ba
主要结果是每项研究中的TP、FP、FN和TN值。对于使用WCE图像的消化道溃疡或出血的CAD,主要结局定义如下:TP, CAD模型发现阳性且WCE图像证明有溃疡或出血的患者数量;FP, CAD模型阳性且基于WCE图像没有溃疡或出血的患者数量;FN, CAD模型阴性且经WCE图像证实有溃疡或出血的患者数量;TN为CAD模型阴性且WCE图像未出现溃疡或出血的患者数量。根据这些定义,计算每项纳入研究的TP、FP、FN和TN值。gydF4y2Ba
对于额外的分析,如亚组分析或元回归,作者从每个纳入的研究中提取了以下变量:发表年份、数据的地理来源(即西方vs亚洲vs公开数据或未知数据)、CAD模型类型、内窥镜图像类型、纳入的总图像数量、测试数据集类型(内部测试vs外部测试)和目标疾病(溃疡vs侵蚀、出血或血管扩张)。gydF4y2Ba
DTA meta分析采用分层汇总受试者工作特征(HSROC)方法[gydF4y2Ba
通过对3个数据库的文献检索,共确定了254项研究(80项研究消化道溃疡或糜烂的CAD, 174项研究消化道出血的WCE CAD)。另有15项研究通过书目手工筛选确定。在排除重复研究后,在对标题和摘要进行审查后,排除了额外的文章。其余54篇和118篇文章的全文版本根据上述每个主题的纳入和排除标准进行了全面审查。其中133篇文章被排除在最终的入组范围之外。最后,20项研究[gydF4y2Ba
无线胶囊内窥镜对胃肠道溃疡或糜烂的计算机辅助诊断性能的搜索流程流程图gydF4y2Ba
无线胶囊内窥镜计算机辅助诊断胃肠道出血诊断性能的搜索流程流程图gydF4y2Ba
在20项研究中[gydF4y2Ba
十项研究[gydF4y2Ba
在19项研究中[gydF4y2Ba
五项研究[gydF4y2Ba
由于CAD模型是利用基线训练数据的学习特征建立的,因此基线训练数据的质量和数量非常重要。为了建立实用的CAD模型,需要足够数量的训练图像,为了准确地准备训练数据,需要内镜专家参与标注工作。我们也不能保证在互联网上搜索的公共数据库中图像的质量。我们确定,正确的学习需要至少30张来自内窥镜专家标记的真实临床医院数据(质量标准)的训练图像(数量标准)。如果质量和数量标准都得到满足,则认为在患者选择领域存在低偏倚风险。如果这些质量或数量标准中只有一项得到满足,则认为存在不明确的偏倚风险。如果两者都不满意,则认为存在较高的偏倚风险。gydF4y2Ba
在WCE中胃肠道溃疡或糜烂的CAD方面,仅有7项研究[gydF4y2Ba
在WCE消化道出血的CAD方面,仅有3项研究[gydF4y2Ba
无线胶囊内窥镜中计算机辅助诊断胃肠道溃疡或糜烂的方法学质量总结图。gydF4y2Ba
无线胶囊内窥镜计算机辅助诊断消化道出血方法学质量总结图。gydF4y2Ba
在20项研究中[gydF4y2Ba
在19项研究中[gydF4y2Ba
计算机辅助诊断模型中灵敏度和特异性的耦合森林图用于无线胶囊内窥镜图像中胃肠道溃疡或糜烂的诊断。gydF4y2Ba
计算机辅助诊断模型中灵敏度和特异性的耦合森林图用于无线胶囊内窥镜图像中胃肠道溃疡或糜烂的诊断。AUC:曲线下面积;SENS:敏感性;规范:特异性;SROC:总体接受者工作特征。gydF4y2Ba
用于计算机辅助诊断胃肠道溃疡或无线胶囊内窥镜图像糜烂的Fagan nomogram。gydF4y2Ba
计算机辅助诊断模型中灵敏度和特异性的耦合森林图在无线胶囊内窥镜图像中诊断胃肠道出血。gydF4y2Ba
总结了具有95%置信区间和预测区间的接受者工作特征曲线的计算机辅助诊断模型对无线胶囊内窥镜图像消化道出血的诊断。AUC:曲线下面积;SENS:敏感性;规范:特异性;SROC:总体接受者工作特征。gydF4y2Ba
无线胶囊内窥镜图像中用于计算机辅助诊断小肠出血的Fagan nomogram。gydF4y2Ba
对于WCE中胃肠道溃疡或糜烂的CAD,我们首先观察到logit转换敏感性与特异性之间存在正相关系数(gydF4y2Ba
对于WCE中消化道出血的CAD,我们首先观察到logit转换敏感性与特异性之间存在正相关系数(gydF4y2Ba
WCE中胃肠道溃疡或糜烂研究的Deeks漏斗图相对于回归线(gydF4y2Ba
计算机辅助诊断模型的Deeks漏斗图用于无线胶囊内窥镜图像中胃肠道溃疡或糜烂的诊断。gydF4y2Ba
计算机辅助诊断模型的Deeks漏斗图用于无线胶囊内窥镜图像中消化道出血的诊断。gydF4y2Ba
在本研究中,CAD模型对WCE图像中胃肠道溃疡或糜烂出血的诊断具有较高的性能值。Fagan nomogram的实用价值表明CAD模型在临床实践中的应用潜力。虽然主要分析发现纳入的研究之间存在一些异质性,但元回归显示了造成异质性的共同原因(发表年份、训练图像数量、目标疾病溃疡vs糜烂和出血vs血管扩张),亚组分析表明,最近发表的具有更大量训练数据的研究(与10年前发表的研究相比)(与少于100张训练图像的研究相比)显示出更好的CAD模型性能。彻底的亚组分析表明证据质量可靠。gydF4y2Ba
WCE图像的解释是胃肠病学家的一项重要任务。由于WCE显示的是整个胃肠道的图像,因此可以识别传统内镜难以发现的病变。在WCE检查中也可以发现微小但重要的罪魁祸首病变。该检查的非侵入性和患者的舒适性也促进了该技术在诊断隐蔽性胃肠道出血或小肠疾病中的应用。但是,翻译过程很繁琐。内窥镜医师至少需要30至120分钟的阅读时间[gydF4y2Ba
在CAD学习方式的背景下,基于神经网络的CAD模型的性能略高于传统的基于机器学习的CAD模型(gydF4y2Ba
虽然已经发表了相同主题的荟萃分析,但本研究采用标准方法,使用WCE图像评估胃肠道溃疡或出血CAD模型的DTA (gydF4y2Ba
尽管这项荟萃分析证据确凿,但也发现了一些不可避免的局限性。首先,所有的性能数据仅在每个纳入研究的内部测试设置中测量。建模是一种假设,即观察结果遵循一定的统计规则,而外部验证是一种检查这种假设是否正确或是否可推广的方法。因此,在训练或内部测试过程中,使用未使用的数据确认已建立的CAD模型的性能是至关重要的[gydF4y2Ba
综上所述,CAD模型在WCE消化道溃疡和出血的光学诊断中表现出良好的性能。gydF4y2Ba
所纳入研究的临床特征,用于诊断溃疡或侵蚀的无线胶囊内窥镜图像使用计算机辅助诊断。gydF4y2Ba
本研究采用计算机辅助诊断无线胶囊内窥镜影像中消化道出血的临床特点。gydF4y2Ba
应用计算机辅助诊断无线胶囊内窥镜图像中溃疡或糜烂的研究的表现总结和亚组分析。gydF4y2Ba
应用计算机辅助诊断无线胶囊内窥镜图像出血的研究的性能总结和亚组分析。gydF4y2Ba
曲线下面积gydF4y2Ba
计算机辅助诊断gydF4y2Ba
诊断优势比gydF4y2Ba
诊断测试的准确性gydF4y2Ba
假阳性gydF4y2Ba
假阴性gydF4y2Ba
分级汇总接收者操作特性gydF4y2Ba
医学学科标题gydF4y2Ba
系统评价和元分析的首选报告项目gydF4y2Ba
国际系统评价前瞻性登记gydF4y2Ba
诊断准确性研究质量评估的第二版gydF4y2Ba
真阳性gydF4y2Ba
真正的负gydF4y2Ba
无线胶囊内窥镜gydF4y2Ba
这项工作得到了韩国政府(MSIT)资助的信息与通信技术规划与评估研究所(IITP)的资助(资助号2020-0-01604)。gydF4y2Ba
CSB负责概念化、数据整理、形式分析、资金获取、调查、方法、项目管理、资源、监督、撰写初稿以及审查和编辑最终稿。JJL负责数据管理、形式化分析、调查和资源。GHB负责数据管理、形式分析、调查和资源。gydF4y2Ba
没有宣布。gydF4y2Ba