这是一篇在知识共享署名许可(https://creativecommons.org/licenses/by/4.0/)下发布的开放获取文章,该许可允许在任何媒介上不受限制地使用、分发和复制,前提是原始作品首次发表在《医学互联网研究杂志》上,并适当引用。必须包括完整的书目信息,到//www.mybigtv.com/上原始出版物的链接,以及版权和许可信息。gydF4y2Ba
人工智能(AI)在医疗保健领域的应用正以前所未有的速度增长,包括疾病诊断、分诊或筛查、风险分析、外科手术等。尽管在医疗保健人工智能的开发和验证方面进行了大量研究,但在临床实践的第一线实际实施的应用很少。gydF4y2Ba
本研究的目的是系统地回顾人工智能在现实临床实践中的应用。gydF4y2Ba
我们在PubMed、Embase、Cochrane Central和CINAHL进行了文献检索,以确定2010年1月至2020年5月间发表的相关文章。我们还手工检索了主要的计算机科学期刊和会议以及注册的临床试验。如果研究报告了在现实世界的临床环境中实施的人工智能应用程序,则将其纳入研究。gydF4y2Ba
我们确定了51项报告人工智能在临床实践中应用的实施和评估的相关研究,其中13项采用随机对照试验设计,8项采用实验设计。人工智能应用程序针对各种临床任务,如筛查或分诊(n=16)、疾病诊断(n=16)、风险分析(n=14)和治疗(n=7)。最常见的疾病和病症是败血症(n=6)、乳腺癌(n=5)、糖尿病视网膜病变(n=4)、息肉和腺瘤(n=4)。关于评估结果,我们发现26项研究考察了人工智能应用在临床环境中的表现,33项研究考察了人工智能应用对临床医生结果的影响,14项研究考察了人工智能应用对患者结果的影响,一项研究考察了与人工智能实施相关的经济影响。gydF4y2Ba
这一综述表明,尽管人工智能应用的临床应用潜力巨大,但研究仍处于早期阶段。更多的研究需要通过更严格的方法来评估临床人工智能应用的益处和挑战。gydF4y2Ba
在过去十年中,人工智能(AI)在医疗保健领域得到了极大的扩展。特别是,人工智能应用已被应用于从临床数据中发现信息,并协助医疗保健提供者完成广泛的临床任务,如疾病诊断、分诊或筛查、风险分析和外科手术[gydF4y2Ba
“人工智能”一词是麦卡锡在20世纪50年代创造的,指的是计算机科学的一个分支,在这个分支中,算法被开发出来,以模拟人类的认知功能,如学习、推理和解决问题。gydF4y2Ba
研究人员在医疗保健人工智能应用的开发上投入了大量的精力。自2000年以来,谷歌学术数据库中相关文章的数量呈指数级增长。然而,它们在现实临床实践中的实施并不普遍[gydF4y2Ba
据我们所知,这篇综述是第一次系统地研究人工智能应用在现实临床环境中的作用。我们注意到,在卫生保健人工智能领域进行了许多审查。一组综述概述了人工智能技术在特定临床领域的现状,如乳腺癌诊断[gydF4y2Ba
另一方面,我们注意到一些观点文章提供了医疗保健人工智能的总体前景[gydF4y2Ba
本系统综述的目的是识别和总结已经在现实临床实践中实施的人工智能应用的现有研究。这有助于我们更好地了解在常规护理环境中实施人工智能的好处和挑战,例如增强临床决策能力,改善护理流程和患者结果,以及降低医疗成本。具体而言,我们根据(1)研究特征,(2)人工智能应用特征,(3)评估结果和关键发现综合相关研究。考虑到研究与实践之间的差距,我们还为未来的研究提供了建议,以检查和评估人工智能在临床实践中的实施。gydF4y2Ba
系统检讨是按照“系统检讨及综合分析的首选报告项目”指引进行的[gydF4y2Ba
我们使用两组关键词来识别出版物的标题、摘要和关键词中的术语。第一组关键词是与人工智能相关的术语,包括“人工智能”、“机器学习”和“深度学习”。值得注意的是,人工智能是一个广泛的术语,也包括特定的人工智能技术,如神经网络、支持向量机、决策树和自然语言处理。然而,使用这些技术的研究极有可能在摘要或关键词中使用“人工智能”或“机器学习”[gydF4y2Ba
我们使用EndNote X9 (Thomson Reuters)下载并导入了所有已识别的文章,以便进行引文管理。在去除重复后,两位研究者(JY和KYN)独立筛选了被识别文章的标题和摘要,以确定他们的资格。分歧通过作者之间的讨论来解决,直到达成共识。纳入标准如下:(1)该研究在现实临床环境中对患者或医疗保健提供者实施了人工智能应用;(2)人工智能应用通过模拟医疗保健提供者的临床决策过程(如医学图像解读和临床风险评估)提供决策支持。医疗硬件设备,如x光机、超声波机、手术机器人和康复机器人,不在我们的范围之内。gydF4y2Ba
排除标准如下:(1)研究讨论了临床AI算法的开发和验证,但没有实际实施;(2)人工智能应用提供了自动化(例如,自动胰岛素输送和监测),而不是决策支持;(3)针对非临床任务的人工智能应用,如生物医学研究、操作任务和流行病学任务。我们还排除了会议摘要、综述、评论、模拟论文和正在进行的研究。gydF4y2Ba
在文章选择之后,我们创建了一个数据图表形式,从纳入的文章中提取以下方面的信息:(1)研究特征,(2)人工智能应用特征,(3)评估结果和关键发现(gydF4y2Ba
作者,年gydF4y2Ba
研究设计gydF4y2Ba
涉及的患者和医疗保健提供者gydF4y2Ba
参与研究的医院和国家gydF4y2Ba
应用程序描述gydF4y2Ba
使用的人工智能技术(如神经网络、随机森林和自然语言处理)gydF4y2Ba
针对性临床任务gydF4y2Ba
目标疾病领域和条件gydF4y2Ba
人工智能应用的性能gydF4y2Ba
临床医生的结果gydF4y2Ba
病人的结果gydF4y2Ba
成本效益gydF4y2Ba
我们在2020年6月的初步检索总共返回了17,945篇期刊文章(PubMed 6830篇,Embase 9124篇,CINAHL 839篇,Cochrane Central 1152篇)(gydF4y2Ba
基于系统评价和荟萃分析首选报告项目(PRISMA)声明的文献检索流程图。gydF4y2Ba
在研究设计方面,51项研究包括20项观察性研究(17项前瞻性研究和3项回顾性研究)、13项随机对照试验(rct)、8项实验性研究、4项前后对照研究、3项调查、1项随机交叉试验、1项非随机试验和1项结构化访谈。值得注意的是,观察性研究可以根据数据收集的时间分为前瞻性和回顾性研究。在前瞻性研究中,研究人员在任何受试者患病或产生其他感兴趣的结果之前设计研究并计划数据收集程序。在回顾性研究中,研究人员收集当前和过去受试者的现有数据,即在研究人员开始研究设计和数据收集之前,受试者可能患有该疾病或出现其他感兴趣的结果。gydF4y2Ba
在51项研究中,29项(57%)明确提到了所涉及的患者,其中两项的样本量小于30人。另一方面,28项(55%)研究提供了有关所涉保健提供者的信息,其中17项研究只有10个或更少的提供者。gydF4y2Ba
此外,46项(90%)研究提到了涉及的医院或诊所(gydF4y2Ba
纳入研究的特点。gydF4y2Ba
作者,年gydF4y2Ba | 研究设计gydF4y2Ba | 样本特征gydF4y2Ba | 医院(国家)gydF4y2Ba | 评价结果gydF4y2Ba |
Abràmoff等人,2018 [gydF4y2Ba |
观察性研究(前瞻性)gydF4y2Ba | 819名患者gydF4y2Ba | 10个初级保健诊所(美国)gydF4y2Ba | 美联社gydF4y2Ba一个gydF4y2Ba(灵敏度、特异度、可成像率)gydF4y2Ba |
Aoki等,2020 [gydF4y2Ba |
实验研究(交叉设计)gydF4y2Ba | 6个医生gydF4y2Ba | 东京大学医院(日本)gydF4y2Ba | 有限公司gydF4y2BabgydF4y2Ba(阅读时间、黏膜破溃检出率)gydF4y2Ba |
Arbabshirani等人,2018 [gydF4y2Ba |
观察性研究(前瞻性)gydF4y2Ba | 347常规头部CTgydF4y2BacgydF4y2Ba病人的扫描gydF4y2Ba | 盖辛格卫生系统(美国)gydF4y2Ba | 美联社(AUCgydF4y2BadgydF4y2Ba(准确性、灵敏度、特异性)gydF4y2Ba |
Bailey等人,2013 [gydF4y2Ba |
交叉个随机对照试验gydF4y2BaegydF4y2Ba | 20031名患者gydF4y2Ba | 巴恩斯-犹太医院(美国)gydF4y2Ba | 阿宝gydF4y2BafgydF4y2Ba(加护病房gydF4y2BaggydF4y2Ba转诊,医院死亡率,医院LOSgydF4y2BahgydF4y2Ba)gydF4y2Ba |
Barinov等人,2019 [gydF4y2Ba |
实验(受试者内部)gydF4y2Ba | 3放射科医生gydF4y2Ba | NRgydF4y2Ba我gydF4y2Ba | 美联社(AUC)gydF4y2Ba |
Beaudoin et al ., 2016 [gydF4y2Ba |
观察性研究(前瞻性)gydF4y2Ba | 350名患者(515张处方)gydF4y2Ba | 舍布鲁克大学医院中心(加拿大)gydF4y2Ba | AP(触发建议的数量、精度、召回率、准确性)gydF4y2Ba |
Bien等,2018 [gydF4y2Ba |
实验研究(受试者内部)gydF4y2Ba | 9临床专家gydF4y2Ba | 斯坦福大学医学中心(美国)gydF4y2Ba | 美联社(AUC)gydF4y2Ba |
Brennan等人,2019 [gydF4y2Ba |
非随机化试验gydF4y2Ba | 20个医生gydF4y2Ba | 学术四级护理机构(美国)gydF4y2Ba | 美联社(AUC)gydF4y2Ba |
Chen等,2020 [gydF4y2Ba |
个随机对照试验gydF4y2Ba | 437名患者gydF4y2Ba | 武汉大学人民医院gydF4y2Ba | CO(盲区率)gydF4y2Ba |
Connell等人,2019 [gydF4y2Ba |
之后的研究gydF4y2Ba | 2642名患者gydF4y2Ba | 皇家自由医院,巴尼特总医院(英国)gydF4y2Ba | 肾脏恢复率,其他临床结果,护理过程gydF4y2Ba |
Eshel等,2017 [gydF4y2Ba |
观察性研究(前瞻性)gydF4y2Ba | 6位显微镜专家gydF4y2Ba | 金奈阿波罗医院(印度);阿迦汗大学医院(肯尼亚)gydF4y2Ba | AP(灵敏度、特异性、物种识别准确性、器械寄生虫计数)gydF4y2Ba |
Giannini等,2019 [gydF4y2Ba |
之后的研究gydF4y2Ba | 22280例患者处于沉默期,32184例患者处于警戒期gydF4y2Ba | 宾夕法尼亚大学卫生系统3所城市急症医院(美国)gydF4y2Ba | AP(敏感性、特异性)gydF4y2Ba |
Ginestra等人,2019 [gydF4y2Ba |
调查gydF4y2Ba | 43名护士和44名保健人员gydF4y2Ba | 费城一家三级教学医院(美国)gydF4y2Ba | 文书主任(护士和提供者的看法)gydF4y2Ba |
Gómez-Vallejo等人,2016 [gydF4y2Ba |
观察性研究(回顾性)gydF4y2Ba | 1800例患者(2569例样本)gydF4y2Ba | 西班牙国家卫生系统医院(西班牙)gydF4y2Ba | 美联社(精度)gydF4y2Ba |
Grunwald等人,2016 [gydF4y2Ba |
观察性研究(回顾性)gydF4y2Ba | 15名患者,3名神经放射学家gydF4y2Ba | 综合中风中心(德国)gydF4y2Ba | AP (e-ASPECTS绩效)gydF4y2Ba |
Kanagasingam等人,2018 [gydF4y2Ba |
观察性研究(前瞻性)gydF4y2Ba | 193个病人,4个医生gydF4y2Ba | 米德兰(澳大利亚)的初级保健实践gydF4y2Ba | 敏感性,特异性,PPVgydF4y2BajgydF4y2Ba,净现值gydF4y2BakgydF4y2Ba)gydF4y2Ba |
龙骨等人,2018 [gydF4y2Ba |
调查gydF4y2Ba | 96名患者gydF4y2Ba | 圣文森特医院,吉朗大学医院(澳大利亚)gydF4y2Ba | AP(敏感性和特异性,评估时间)gydF4y2Ba |
Kiani等,2020 [gydF4y2Ba |
实验研究(受试者内部)gydF4y2Ba | 11病理学家gydF4y2Ba | 斯坦福大学医学中心(英国)gydF4y2Ba | 美联社(精度)gydF4y2Ba |
Lagani et al ., 2015 [gydF4y2Ba |
观察性研究(前瞻性)gydF4y2Ba | 2 .卫生保健提供者gydF4y2Ba | Chorleywood保健中心(联合王国)gydF4y2Ba | AP(系统性能)gydF4y2Ba |
Lin等人,2019 [gydF4y2Ba |
个随机对照试验gydF4y2Ba | 350名患者gydF4y2Ba | 5家眼科诊所(中国)gydF4y2Ba | AP(精度、PPV、NPV)gydF4y2Ba |
Lindsey等人,2018 [gydF4y2Ba |
实验研究(受试者内部)gydF4y2Ba | 40名急诊临床医生gydF4y2Ba | 特殊外科医院(美国)gydF4y2Ba | 美联社(AUC)gydF4y2Ba |
刘等,2020 [gydF4y2Ba |
个随机对照试验gydF4y2Ba | 1026名患者gydF4y2Ba | 中国人民解放军联勤保障部队第988医院gydF4y2Ba | 公司(美国存托凭证gydF4y2BalgydF4y2Ba, PDRgydF4y2Ba米gydF4y2Ba(腺瘤及息肉数目)gydF4y2Ba |
Mango等,2020 [gydF4y2Ba |
实验研究(受试者内部)gydF4y2Ba | 15个医生gydF4y2Ba | 13个不同的医疗中心(美国)gydF4y2Ba | AP (AUC,敏感性,特异性)gydF4y2Ba |
Martin et al, 2012 [gydF4y2Ba |
观察性研究(前瞻性)gydF4y2Ba | 214名患者gydF4y2Ba | 13个不同的医疗中心(美国)gydF4y2Ba | 灵敏度,PPVgydF4y2Ba |
McCoy and Das, 2017 [gydF4y2Ba |
之后的研究gydF4y2Ba | 1328名患者gydF4y2Ba | 开普地区医疗中心(美国)gydF4y2Ba | PO(医院死亡率、医院LOS、再入院率)gydF4y2Ba |
McNamara et al, 2019 [gydF4y2Ba |
观察性研究(前瞻性)gydF4y2Ba | 3位乳腺癌专家gydF4y2Ba | 约翰·泰勒癌症中心(美国)gydF4y2Ba | 文书主任(决策)gydF4y2Ba |
Mori等人,2018 [gydF4y2Ba |
观察性研究(前瞻性)gydF4y2Ba | 791名患者,23名内窥镜医师gydF4y2Ba | 日本昭和大学北横滨医院gydF4y2Ba | 美联社(NPV)gydF4y2Ba |
Nagaratnam et al, 2020 [gydF4y2Ba |
观察性研究(回顾性)gydF4y2Ba | 1例gydF4y2Ba | 皇家伯克郡医院(联合王国)gydF4y2Ba | PO(病人护理和临床结果)gydF4y2Ba |
Natarajan et al, 2019 [gydF4y2Ba |
观察性研究(前瞻性)gydF4y2Ba | 213名患者gydF4y2Ba | 大孟买市政公司(印度)药房gydF4y2Ba | AP(敏感性、特异性)gydF4y2Ba |
Nicolae et al, 2020 [gydF4y2Ba |
个随机对照试验gydF4y2Ba | 41岁的病人gydF4y2Ba | Sunnybrook Odette癌症中心(加拿大)gydF4y2Ba | AP(第30天剂量测定)gydF4y2Ba |
Park等人,2019 [gydF4y2Ba |
实验研究(受试者内部)gydF4y2Ba | 8个临床医生gydF4y2Ba | 斯坦福大学医学中心(美国)gydF4y2Ba | CO(特异性、敏感性、准确性、诊断一致性、诊断时间)gydF4y2Ba |
Romero-Brufau et al, 2020 [gydF4y2Ba |
张后调查gydF4y2Ba | 临床人员81人gydF4y2Ba | 威斯康星州西南部的3个初级保健诊所(美国)gydF4y2Ba | 对人工智能的态度gydF4y2BaogydF4y2Ba在工作场所)gydF4y2Ba |
Rostill等人,2018 [gydF4y2Ba |
个随机对照试验gydF4y2Ba | 204名病人,204名护理人员gydF4y2Ba | 萨里和汉普郡国民保健服务(英国)gydF4y2Ba | 文书主任(系统评估)gydF4y2Ba |
Segal等人,2014 [gydF4y2Ba |
观察性研究(前瞻性)gydF4y2Ba | 16名儿科神经科医生gydF4y2Ba | 波士顿儿童医院(美国)gydF4y2Ba | CO(诊断错误、诊断相关性、检查项目数)gydF4y2Ba |
Segal等人,2016 [gydF4y2Ba |
观察性研究(前瞻性)gydF4y2Ba | 26个临床医生gydF4y2Ba | 波士顿儿童医院(美国)gydF4y2Ba | CO(诊断错误)gydF4y2Ba |
Segal等人,2017 [gydF4y2Ba |
结构化面试gydF4y2Ba | 10名医学专家gydF4y2Ba | 盖辛格保健系统和山间保健(美国)gydF4y2Ba | 文书主任(系统知觉)gydF4y2Ba |
Segal等人,2019 [gydF4y2Ba |
观察性研究(前瞻性)gydF4y2Ba | 3160例患者(315例处方提醒)gydF4y2Ba | 示巴医疗中心(以色列)gydF4y2Ba | AP(准确性、临床有效性和有用性)gydF4y2Ba |
Shimabukuro等,2017 [gydF4y2Ba |
个随机对照试验gydF4y2Ba | 142名患者gydF4y2Ba | 加州大学旧金山医学中心(美国)gydF4y2Ba | PO (LOS,住院死亡率)gydF4y2Ba |
Sim等,2020 [gydF4y2Ba |
观察性研究(前瞻性)gydF4y2Ba | 12放射科医生gydF4y2Ba | 4个医疗中心(美国和韩国)gydF4y2Ba | 灵敏度,FPPIgydF4y2BapgydF4y2Ba)gydF4y2Ba |
Steiner等人,2018 [gydF4y2Ba |
实验研究(受试者内部)gydF4y2Ba | 6名解剖病理学家gydF4y2Ba | NRgydF4y2Ba | CO(灵敏度,每张图像的平均审查,解释难度)gydF4y2Ba |
苏等,2020 [gydF4y2Ba |
个随机对照试验gydF4y2Ba | 623名病人,6名内窥镜医生gydF4y2Ba | 山东大学齐鲁医院gydF4y2Ba | CO (ADR, PDR,腺瘤和息肉数量,停药时间,肠准备充足率)gydF4y2Ba |
Titano等,2018 [gydF4y2Ba |
个随机对照试验gydF4y2Ba | 2放射科医生gydF4y2Ba | NRgydF4y2Ba | CO(诊断时间、急症排队)gydF4y2Ba |
Vandenberghe et al ., 2017 [gydF4y2Ba |
观察性研究(前瞻性)gydF4y2Ba | 病理学家1名,HER2评分员2名gydF4y2Ba | NRgydF4y2Ba | CO(决策协调、决策修改)gydF4y2Ba |
Voerman等人,2019 [gydF4y2Ba |
之后的研究gydF4y2Ba | NRgydF4y2Ba | 波卡洪塔斯五河医疗中心(美国)gydF4y2Ba | CEgydF4y2Ba问gydF4y2Ba(每位患者的平均总费用)gydF4y2Ba |
Wang et al ., 2019 [gydF4y2Ba |
个随机对照试验gydF4y2Ba | 1058名病人,8名医生gydF4y2Ba | 四川省人民医院(中国)gydF4y2Ba | CO (ADR, PDR,每个患者腺瘤数)gydF4y2Ba |
Wang et al ., 2019 [gydF4y2Ba |
个随机对照试验gydF4y2Ba | 75名患者gydF4y2Ba | 布里格姆妇女医院附属的4个初级保健诊所(美国)gydF4y2Ba | CO(抗凝处方)gydF4y2Ba |
Wang等,2020 [gydF4y2Ba |
个随机对照试验gydF4y2Ba | 962名患者gydF4y2Ba | 四川省人民医院草堂分院gydF4y2Ba | CO (ADR, PDR,每次结肠镜检查腺瘤和息肉的数量)gydF4y2Ba |
Wijnberge et al ., 2020 [gydF4y2Ba |
个随机对照试验gydF4y2Ba | 68名患者gydF4y2Ba | 阿姆斯特丹UMC(荷兰)gydF4y2Ba | PO(低血压中位时间加权平均,低血压中位时间,治疗,干预时间,不良事件)gydF4y2Ba |
Wu等,2019 [gydF4y2Ba |
观察性研究(前瞻性)gydF4y2Ba | 3600居民gydF4y2Ba | 3名眼科医生,社区卫生保健中心(中国)gydF4y2Ba | 美联社(AUC)gydF4y2Ba |
Wu等,2019 [gydF4y2Ba |
个随机对照试验gydF4y2Ba | 303名患者,6名内窥镜医师gydF4y2Ba | 武汉大学人民医院gydF4y2Ba | AP(照片文件的准确性、完整性)gydF4y2Ba |
Yoo等人,2018 [gydF4y2Ba |
观察性研究(前瞻性)gydF4y2Ba | 50个病人,1个放射科医生gydF4y2Ba | NR(韩国)gydF4y2Ba | AP(敏感性、特异性、PPV、NPV、准确性)gydF4y2Ba |
一个gydF4y2BaAP:应用程序性能。gydF4y2Ba
bgydF4y2BaCO:临床结果。gydF4y2Ba
cgydF4y2BaCT:计算机断层扫描。gydF4y2Ba
dgydF4y2BaAUC:曲线下面积。gydF4y2Ba
egydF4y2BaRCT:随机对照试验。gydF4y2Ba
fgydF4y2BaPO:患者结果。gydF4y2Ba
ggydF4y2BaICU:重症监护病房。gydF4y2Ba
hgydF4y2BaLOS:停留时间。gydF4y2Ba
我gydF4y2Ba尼科布:没有报道。gydF4y2Ba
jgydF4y2BaPPV:阳性预测值。gydF4y2Ba
kgydF4y2BaNPV:负预测值。gydF4y2Ba
lgydF4y2BaADR:腺瘤检出率。gydF4y2Ba
米gydF4y2BaPDR:息肉检出率。gydF4y2Ba
ngydF4y2BaACSC:门诊护理敏感入院。gydF4y2Ba
ogydF4y2BaAI:人工智能。gydF4y2Ba
pgydF4y2BaFFPI:每个图像的假阳性。gydF4y2Ba
问gydF4y2BaCE:成本效益。gydF4y2Ba
2010年至2020年收录文章的分布。gydF4y2Ba
涉及医院的国家分布情况。gydF4y2Ba
考虑到纳入研究类型的异质性,我们仅使用Cochrane协作偏倚风险工具(Cochrane Collaboration risk of bias)评估了13项rct的偏倚风险(gydF4y2Ba
在这51项研究中,有两项没有披露有关所使用人工智能技术的任何信息。在剩下的49项研究中,最受欢迎的ML技术是神经网络(n=22),其次是随机森林(n=3)、贝叶斯模式匹配(n=3)、支持向量机(n=2)、决策树(n=2)和深度强化学习(n=2)。我们还发现,纳入的AI应用程序主要在以下四类临床任务中提供决策支持:疾病筛查或分诊(n=16)、疾病诊断(n=16)、风险分析(n=14)和治疗(n=7)。此外,人工智能在46项(94%)研究中的应用针对一种或多种特定疾病和病症。最常见的疾病和病症是败血症(n=6)、乳腺癌(n=5)、糖尿病视网膜病变(n=4)、息肉和腺瘤(n=4)、白内障(n=2)和中风(n=2)。人工智能应用特征的详细信息见gydF4y2Ba
我们将回顾研究中的评估结果分为以下四种类型:人工智能应用的性能、临床结果、患者结果和成本效益gydF4y2Ba
26项研究评估了人工智能应用在现实临床环境中的表现[gydF4y2Ba
相反,两项研究发现,人工智能应用未能超越医疗服务提供者,需要进一步改进[gydF4y2Ba
33项研究考察了人工智能应用对临床医生结果的影响,即临床医生的决策、临床医生的工作流程和效率,以及临床医生对人工智能应用的评估和接受程度[gydF4y2Ba
人工智能应用具有提供临床决策支持的潜力。从我们的综述来看,有16项研究表明人工智能应用可以提高临床决策能力[gydF4y2Ba
7项研究针对临床医生的工作流程和效率[gydF4y2Ba
最后,七项研究调查了临床医生对人工智能应用的看法和接受程度[gydF4y2Ba
14项研究报告了患者的预后[gydF4y2Ba
三项研究调查了患者如何评估人工智能应用,所有研究都报告了积极的结果[gydF4y2Ba
只有一项研究涉及人工智能在临床实践中的经济影响[gydF4y2Ba
人工智能应用在增强临床医生决策、改善临床护理流程和患者治疗效果以及降低医疗成本方面具有巨大潜力。我们的综述旨在识别和总结已经在现实临床实践中实施的人工智能应用的现有研究。它产生了以下有趣的发现。gydF4y2Ba
首先,我们注意到,考虑到关于医疗保健人工智能的大量研究,纳入的研究数量少得惊人。特别是,大多数卫生保健人工智能研究都是概念验证研究,重点是人工智能算法的开发和使用回顾性临床数据集的验证。相比之下,只有少数研究在临床环境中实施和评估人工智能。然而,为了确保安全采用,人工智能应用程序应该提供可靠的科学证据,证明其相对于护理标准的有效性。因此,我们敦促卫生保健人工智能研究界与卫生保健提供者和机构密切合作,展示人工智能在现实临床环境中的潜力。gydF4y2Ba
其次,超过三分之二的纳入文章来自发达经济体,其中一半以上来自美国,这表明发达国家处于卫生保健人工智能开发和部署的前沿。这与顶级健康人工智能公司和初创企业(如谷歌健康、IBM沃森健康和巴比伦健康)主要位于美国和欧洲的事实是一致的。这一发现应该谨慎解释,因为我们排除了非英语写作的文章,尽管我们的搜索已经确定了890篇非英语出版物。我们没有纳入这些非英语文章,因为由于翻译困难和差异,很难进行公正的分析。文章在国家或经济发展状况上的分布不平衡,可能是由于低收入国家的研究人员发表率非常低。gydF4y2Ba
然而,值得注意的是,我们的文章中有8篇(16%)来自中国,这表明中国一直在广泛应用医疗人工智能并开展医疗人工智能研究。事实上,医院、科技公司和中国政府一直在推动临床人工智能的部署,目的是缓解医生短缺,缓解医疗资源不平等,降低医疗成本[gydF4y2Ba
第三,未来临床人工智能评价的研究质量有待提高。我们的综述显示,只有13项(26%)研究是随机对照试验,其中大多数存在中至高偏倚风险。8项研究为实验研究,均采用交叉设计或受试者内设计,易受混杂效应影响。在样本信息方面,只有8项(16%)研究同时提供了患者和卫生保健提供者的信息,14项(28%)研究使用的样本量小于20 (gydF4y2Ba
第四,我们的分析表明,尽管在某些情况下,人工智能应用程序可以提供有效的决策支持。例如,人工智能在临床决策能力中的增强作用可能会受到专业水平的影响。特别是,两项研究表明,初级医生比高级医生更有可能从人工智能中受益,因为他们在遇到不确定的人工智能建议时,更倾向于重新考虑和修改他们的临床决策[gydF4y2Ba
在接受人工智能方面,我们观察到,在两项研究中,卫生保健提供者对人工智能表达了负面情绪[gydF4y2Ba
第五,对于大多数纳入的关于患者结局的研究,我们发现他们没有详细检查临床过程和干预措施。然而,如果没有适当和有用的干预措施,人工智能应用可能无法改善患者的预后。例如,Bailey等人[gydF4y2Ba
此外,有三项纳入的研究表明,由于医疗人工智能的便利性和高效性,患者及其家属对其非常满意[gydF4y2Ba
最后,根据埃森哲的一项调查,超过一半的医疗机构乐观地认为,尽管实施人工智能的初始成本很高,但人工智能将降低成本并提高收入[gydF4y2Ba
这篇综述有几个局限性。首先,我们只收录了同行评议的英文期刊文章。一些相关的文章是用其他语言写的,或者是在会议、研讨会和新闻报道中发表的。如前所述,这可能部分解释了审评文章的国家分布不平衡。此外,我们没有包括2010年之前发表的文章,因为人工智能在过去十年中才开始在临床领域取得进展,这在我们的搜索结果中很明显。此外,我们只回顾了高级计算机科学会议和期刊,而没有全面检查工程和计算机科学数据库。这应该不是一个问题,因为我们发现计算机科学会议和期刊主要关注新的人工智能算法的训练和验证,而没有实际部署。不过,未来的研究可以扩大搜索范围,以更深入地了解最先进的临床人工智能算法。gydF4y2Ba
另一个担忧是,一些人工智能应用可能已经在现实世界的临床实践中实施,但没有任何公开的出版物。例如,IDx-DR是第一个获得fda批准的人工智能系统,已在爱荷华大学医疗保健等20多家医疗机构实施。gydF4y2Ba
人工智能应用在改善患者治疗效果和改善护理过程方面具有巨大潜力。根据本综述中提出的文献,随着越来越多的高质量证据的产生,人们对开发人工智能工具来支持临床工作流程非常感兴趣。然而,目前还没有足够的一级证据支持常规使用卫生保健人工智能进行决策支持,这阻碍了卫生保健人工智能的发展,并对患者安全构成潜在风险。因此,我们得出结论,重要的是进行稳健的随机对照试验,将人工智能辅助护理过程和结果与当前最佳实践相比较。对医疗保健人工智能进行严格、稳健和全面的评估将有助于从理论转向临床实践。gydF4y2Ba
搜索策略。gydF4y2Ba
基于Cochrane协作偏倚风险工具的随机对照试验质量评估。gydF4y2Ba
人工智能应用特点。gydF4y2Ba
纳入研究的评价结果及主要结果。gydF4y2Ba
人工智能gydF4y2Ba
深度学习gydF4y2Ba
美国食品药品监督管理局gydF4y2Ba
加护病房gydF4y2Ba
机器学习gydF4y2Ba
自然语言处理gydF4y2Ba
negative-predictive价值gydF4y2Ba
积极预测价值gydF4y2Ba
随机对照试验gydF4y2Ba
本研究由NSCP资助(批准号:N-171-000-499-001),来自新加坡国立大学。它还得到了迪恩战略基金-卫生信息学的支持(批准号:C-251-000-068-001),来自新加坡国立大学。gydF4y2Ba
没有宣布。gydF4y2Ba