医学互联网研究杂志-人工智能转化为卫生保健实践的实施框架:范围审查

审查

¹瑞典哈尔姆斯塔德哈尔姆斯塔德大学商业、创新与可持续发展学院

²巴西圣卡塔琳娜州立大学行政与经济科学学院Florianópolis

^3.哈尔姆斯塔德大学卫生与福利学院，瑞典哈尔姆斯塔德

⁴帝国理工学院商学院卫生经济与政策创新中心，英国伦敦

通讯作者:

Fábio伽马博士

创新与可持续发展商学院

哈尔姆斯塔德大学

克里斯蒂安四世:s väg

哈尔姆斯塔德,30118

瑞典

电话:46 0702628937

电子邮件:fabio.gama@hh.se

背景:在开发用于改善卫生保健的人工智能(AI)解决方案方面作出了重大努力。尽管热情高涨，但医疗保健专业人员仍在努力在日常实践中实施人工智能。

摘要目的:本文旨在确定用于理解人工智能在医疗保健实践中的应用的实施框架。

方法:使用Cochrane、循证医学评论、Embase、MEDLINE和PsycINFO数据库进行范围审查，以确定报告有关卫生保健中人工智能实施的框架、模型和理论的出版物。本综述的重点是自2000年以来用英语发表的研究，并调查了人工智能在医疗保健中的应用。从数据库中检索到2541份独特的出版物，并由2名独立审稿人对标题和摘要进行筛选。根据尼尔森实施框架分类法和格林哈尔格医疗保健技术的不采用、放弃、扩大、传播和可持续性(NASSS)框架，对选定的文章进行了主题分析。

结果:总共有7篇文章符合纳入审查的所有资格标准，2篇文章包括直接涉及人工智能实施的正式框架，而其他文章对影响实施的要素提供了有限的描述。总的来说，这7篇文章确定了与所有NASSS领域一致的要素，但没有一篇文章全面考虑了已知的影响技术实施的因素。确定了新的领域，包括对数据输入和现有流程的依赖、共同决策、人类监督的作用以及人口影响和不平等的伦理，这表明现有框架没有充分考虑人工智能实施的独特需求。

结论:这篇文献综述表明，了解如何在卫生保健实践中实施人工智能仍处于早期发展阶段。我们的研究结果表明，需要进一步的研究来提供制定实施框架所需的知识，以指导人工智能在临床实践中的未来实施，并强调利用实施科学领域现有知识的机会。

中国医学信息学报;2009;31 (1):322 - 322

doi: 10.2196/32215

关键字

实现框架; 人工智能; 范围审查

背景

人工智能(AI)有可能将医疗保健数据转化为有意义和可操作的见解[1];然而，人工智能尚未在医疗保健实践中得到广泛应用。这种从研究到实践的转化差距主要是由于人工智能实施中的挑战[2，3.]。本文旨在评估与人工智能实施相关的学术知识的现状，并评估这些知识在多大程度上借鉴了一般医疗保健技术实施的知识，并与之进行了对比。

由于在实践中吸收缓慢和变化不定，往往错过了新卫生技术对患者的潜在益处[4]。实施科学这一新兴领域对有效吸收和部署新的卫生技术的障碍和促进因素产生了许多见解[5认识到与其他工业环境相比，在复杂的卫生保健系统中进行干预的独特挑战。实施科学的典型产出是可概括的实施理论、模型和框架，这些理论、模型和框架用于描述影响实施的因素，预测成功实施所需的条件，并为开展和评估卫生保健领域的实施工作提供指导[5-7]。这些框架提供了对在卫生保健环境中引入新技术的挑战的一般理解。

重要的是，对于人工智能技术的发展，实施科学已经证明，被动传播和扩散医疗保健技术的方法很少有效[8]。相反，需要有目的的实施努力将创新纳入组织或卫生保健系统的主流[9]。然而，迄今为止，大多数关于人工智能在医疗保健领域的研究文献都涉及先进分析技术和模型的开发、应用和评估[10-12]，主要在计算机科学、工程和医学信息学领域。关于实施人工智能以改善现有临床工作流程的文献更加零散，并且主要基于概念验证研究的非经验数据[1，13]跨多个主题领域，如数据治理[14]，伦理[15]，责任[3.]，可解释性[16]和规管[17]。这意味着影响人工智能在现实世界医疗机构实施的因素存在不确定性[10医疗保健专业人员缺乏如何在日常实践中实施人工智能的指导[18]。

如果要在实践中实现人工智能技术的价值，开发基于证据的人工智能实施方法非常重要。虽然普遍化的实现理论、模型和框架很可能能够为人工智能技术的实现提供有价值的指导，但人工智能特性的本质很可能会增加新的复杂性，并为有效实现带来额外的挑战[2]。首先，与其他技术相比，人工智能在增强或限制医疗保健专业人员工作方面的潜力有所不同。这种差异将人们的注意力从预测的成功实现转移开被动技术(如远程医疗或学长警报)，以了解卫生保健专业人员和人工智能如何相互作用，为患者和其他用户创造价值。其次，人工智能挑战了我们将人类能力和机器能力划分为两类的信念。最近的人工智能发展使人类能够感知情绪、对话，并最终实现创造力。这种能力使人工智能能够进入以前只有人类才能进入的领域。第三，人工智能的实施非常复杂，需要涵盖技术开发人员、系统监管机构、组织和个人、专业人员、患者和护理人员等广泛利益相关者的活动。这使得人工智能处于实施科学研究的更复杂的一端，而实施科学往往是定义良好的有限干预。综上所述，这些差异表明有必要为实施开发一个人工智能特定的证据基础，并在人工智能特定的实施理论、模型和框架中分享关于人工智能实施的可推广知识。

目标

本研究旨在通过评估任何特定于将人工智能转化为医疗保健实践的实施理论、框架或模型，探索人工智能实施的学术知识现状。研究的目的是评估以下方面:

在卫生保健领域存在什么(如果有的话)针对人工智能的实施框架?
这些针对人工智能的实施框架如何借鉴并与更普遍的卫生技术实施框架进行比较?
任何特定于人工智能的实施框架都揭示了人工智能实施的挑战?

研究设计

解释性范围审查被认为是回答研究问题的最合适方法，因为它提供了一个确定领域内知识的系统综合，目的是探索和绘制关键概念、可用证据和现有研究中的缺点[19，20.]。采取以下步骤:(1)确定定义，(2)系统地检索数据库，(3)选择和筛选研究，(4)提取和分析数据。

决定定义

术语实现、框架和AI的操作定义列在表1。这些广泛的术语用于搜索涵盖任何文献，特别是组合使用这些术语。该综述使用广义术语进行搜索，而不是更专业的例证术语，旨在涵盖所有关于人工智能转化为医疗实践的实施框架的文献，这些框架是在这些广义术语的框架内构建的，因此可以被解释为普遍适用于这一背景。我们对执行的操作定义受到Greenhalgh等人的启发[9]，指的是“积极地、有计划地努力使创新在组织内成为主流”。根据这一定义，执行工作是有目的的，并有足够详细的描述，以便独立观察员能够认识到积极和有计划的行动的存在和力度。虽然存在其他实现的定义，但我们选择了这个定义，因为它很广泛，使我们能够从先前的人工智能相关研究中识别出多个元素。

表1。关键概念的操作定义。

术语	操作型定义	医疗保健方面的例子
实现	干预:旨在改变、适应或将干预纳入日常生活的有意的努力[9]。	采用心衰预测软件 ‎ 改变临床决策支持系统 ‎
人工智能	一种基于一组核心能力和计算算法的通用技术，旨在模仿人类的认知功能来分析复杂数据[2]。	预测死亡率的机器学习 ‎ 放射学非结构化图像数据分析 ‎
框架	一种简化的结构、概述、系统或多个描述类别或元素(即结构、概念和变量)的计划，使对现象的解释更加简化[21]。	nass^一个框架(卫生和保健技术)[5］ ‎ 转变^b证据(7］ ‎

^一个NASSS:不采用、放弃、扩大规模、传播和可持续性。

^b转变:通过转化证据成功改善卫生保健。

数据库系统检索

MEDLINE, Embase, EBM的系统搜索评论,PsycINFO和Cochrane数据库按照PRISMA(系统评价和荟萃分析的首选报告项目)流程图(图1)。检索仅限于2000年1月1日至2020年3月1日发表的文献，以及描述基于卫生保健研究的人工智能具体实施框架的所有原始出版物。搜索词包括与实现(implementat*)、框架(模型和理论)， i (人工智能)，以及机器学习(毫升;多媒体附录1)。几个不同的术语可能被用作术语AI的同义词，并作为搜索术语包含在内。然而，由于本研究的目的是探索关于人工智能特定实施框架的文献，我们的出发点是只包括那些专门针对人工智能和机器学习的总体概念提出此类框架的研究。Wolff等人使用了类似的策略[22来定义搜索词。使用MeSH(医学主题词)词汇表来准确定义搜索词，并且MeSH术语有监督和无监督ML都被术语捕获机器学习。这一策略的动机是对人工智能的初步文献综述，与人工智能专家和图书馆员的咨询。

图1所示。PRISMA(系统评价和荟萃分析的首选报告项目)流程图显示了评价过程。AI:人工智能;循证医学。

选择和筛选研究

如果研究是用英文撰写的，并且涉及在卫生保健环境中实施人工智能(例如，ML)，则符合纳入条件。所有研究设计或出版物类型都有资格纳入，以确定是否存在指导人工智能在卫生保健中使用的实施框架。会议摘要、社论和技术报告被排除在外。排除的其他原因包括:研究没有关注人工智能，没有明确关注与人工智能实施框架、模型或理论相关的实施，没有关注卫生保健环境，或者专注于非人类方面(如动物健康)。题目和摘要由两名独立审稿人(FG和DT)使用Rayyan网络平台筛选纳入。分歧以协商一致的方式解决，必要时，会有第三个审稿人参与(JB)。筛查过程中的一致性评分相当高(κ评分>0.8)。

数据提取与分析

根据Arksey等人的分析框架，采用4步流程进行数据提取和分析[19]。首先，4位审稿人(FG、DT、JN和PS)在同一篇最终纳入的文章上独立地试用了一个结构化数据提取工具。审稿人讨论和比较他们的分析，任何分歧都通过讨论和共识来解决。遵循Arksey等人的指南[19]，提取与国家、研究设计、实践领域、目标人群、研究重点、研究目的以及被引用为框架开发提供信息的任何文献相关的信息，以了解主要感兴趣的领域。

其次，由于这一研究领域相对较新，我们认为对纳入的文章进行质量评估很重要，即使这不是范围界定审查的典型方法[19，23]。因此，我们有意解决了在范围评估中缺乏质量评估使研究结果的解释和翻译更具挑战性的问题[24]。所选研究的质素是使用“关键评估技巧计划”(CASP)进行评估[25]。两位作者(FG和PS)独立对文章进行评级，并通过共识解决分歧(多媒体附录2［26-32])。CASP评估清单包括多个研究设计，因此被选为评估所选文章的最合适工具。正如其他研究表明的那样，文章没有因为质量差而被排除在外[33]。相反，在讨论人工智能实施框架和要素的存在时，我们考虑了分析阶段中高质量和低质量研究的相对贡献。

第三，为了对文献进行专题分析，按照尼尔森实施框架5类分类法对纳入研究中使用的框架进行分类[21]。这些类别包括过程模型、决定框架、经典理论、实现理论和评估框架。这个概念基础很重要，因为它有助于理解与实现相关的挑战。过程模型旨在指导或描述将研究转化为实践的过程(例如，阶段和阶段)。决定性框架旨在解释或理解变量对实施结果的影响(例如，障碍和促成因素)。决定因素框架涉及5种类型的决定因素，这些决定因素侧重于单个要素的特征，包括对象(如人工智能)、用户或采用者、最终用户(如患者)、环境和策略。经典理论和实施理论都不同于从研究到实践的模型，尽管它们解释了变化是如何在没有雄心壮志的情况下发生的。这两种理论的不同之处在于，经典理论是从实施科学之外的领域(即心理学和社会学)发展起来的，而实施理论则是由实施科学领域的研究者发展起来的。所有理论的共同点是，它们都试图具有某种预测能力，并解释因果机制。评估框架指定了评估和确定实施成功的实施方面(例如，检查清单和标准)。 To further strengthen the analysis even further, the included studies were categorized as either including a formal (explicitly integrated body of knowledge) or informal framework (implicit assumptions, beliefs, and views), all following the definitions provided by Nilsen [21]。

第四，为了分析与这些发现在多大程度上借鉴了现有实施框架相关的文献，进行了演绎主题分析。这需要根据卫生技术的不采用、放弃、扩大规模、传播和可持续性(NASSS)框架对纳入的研究进行演绎编码[5]。该框架提出了一系列与理解如何实施卫生技术相关的子领域，从特定的卫生状况到更广泛的监管和社会文化系统。它代表了最先进的结构，并已在其他人工智能研究中使用[2]。五位审稿人(FG、DT、JN、JR和PS)解释了在描述性主题中捕获的实现元素如何在NASSS领域中相互关联。NASSS框架域是条件、技术、价值主张、采用者、组织、更广泛的系统，以及随时间的嵌入和适应。这涉及对文章发现的广泛反思以及这些发现如何与领域相关。这个过程开始于对每篇文章的发现进行演绎评估，然后评估它们与NASSS域的关联。通过将每个纳入研究的领域制表，包括识别不适合现有NASSS框架的新子领域，开发了一个分析总结矩阵。最后，总结了NASSS子域和新确定的子域的实施元素，以评估所包含文章中元素的包含情况。

出版文学的特点

最初的搜索返回了2541篇独特的文章。我们根据排除标准对所有摘要进行筛选，排除了98.86%(2512/2541)的论文。“执行框架”一词广泛分布于卫生保健的不同领域，因此产生了大量不相关的论文。摘要筛选后，29篇文章进行全文综述，其中76% (n=22)的文章不符合纳入标准。最终，24%(7/29)的文章被纳入。

在7篇文章中，只有2篇(29%)包含了直接解决在卫生保健中实施人工智能的正式框架。由于符合纳入标准的文章数量有限，部分符合标准的文章也被纳入:14%(1/7)的文章包含了解决伦理和人工智能问题的正式框架(这是对现实世界人工智能实施高度重要的主题)，57%(4/7)的文章包含了影响实施的因素的描述(重点是医生意见、患者意见以及影响在急诊科和外科环境中使用人工智能的因素)。

这些文章采用异质研究设计。其中57%(4/7)采用文献综述法，29%(2/7)采用定性方法，71%(1/14)采用定量调查资料。所选文章的实践领域和重点是分散的。这些论文集中在患者和临床医生对人工智能的看法(n=2)，决策和决策支持系统(n=2)，道德和可信赖方面(n=1)，实施人工智能的好处和挑战(n=1)，以及指导人工智能采用的实施要素(n=1)。纳入研究的进一步特征见表2。

表2。纳入论文的特征(n=7)。

研究	国家	研究设计	业务范围	目标人群	研究的焦点	研究的目的是
Beil等人[26］	德国	文献综述	重症监护	N/A^一个	重症监护的道德和信任方面	讨论关于人工智能的伦理考虑^b用于重症监护的预测。
Diprose等[27］	新西兰	定量研究	初级护理	医生(n = 170)	临床医生对理解、解释和信任人工智能结果的看法	调查医生对人工智能输出的理解、他们向患者解释这些输出的能力以及他们信任人工智能输出的意愿之间的关系。
Fernandes等[28］	葡萄牙	文献综述	急诊科	N/A	聪明的信用违约掉期^c的分类	评估分诊的智能CDSS如何有助于提高急诊科的护理质量^d以及确定他们在执行方面所面临的挑战。
lottus等人[29］	美国	文献综述	手术室	外科医生	手术中的决策	提出人工智能模型将消除这些弱点，并与床边评估相结合，以增强手术决策。
Nelson等[30.］	美国	定性研究	皮肤科诊所	普通皮肤科门诊患者(n=48)	患者对与皮肤癌筛查相关的人工智能的认知	探讨患者对人工智能的概念和对使用人工智能进行皮肤癌筛查的看法。
Ngiam等[31］	新加坡	文献综述	卫生保健	N/A	人工智能在肿瘤学中的益处和挑战	讨论大数据和机器学习在医疗保健领域的一些好处和挑战。
Truong等[32］	加拿大	定性研究	卫生保健	卫生保健领域的专题专家(n=8)	指导人工智能采用的实施要素	创建一个实施框架，帮助医疗保健组织了解关键考虑因素，并指导人工智能的实施工作。

^一个-不适用。

^bAI:人工智能。

^c临床决策支持系统。

^d急诊科。

质量评估

总体而言，质量评估显示43%(3/7)的文章[26，31，32由于对方法学程序的描述有限，达到CASP标准的30%以下。总共有43%(3/7)的文章[27-29]符合50%至60%的标准，而14%(1/7)的文章[30.达到了70%的标准。每篇论文与CASP核对表的质量分数载于(多媒体附录2)。

实现AI的框架类别

分析确定了三种主要框架类别的使用:决定框架、过程模型和评估框架。经典理论和实施理论尚未确定。在这7篇文章中，数据分析表明，3篇(43%)文章包含明确的框架:决定性框架[32]、过程模型[31]和评估框架[26]。其余的文章(4/7,57%)没有包括全面的框架;相反，可以确定与实施有关的要素。例如，Beil等人[26]讨论了道德结构在人工智能实现中的适用性，而Diprose等人[27]探讨了医生对实施要素的意见，而Nelson等人[30.从患者的角度提出实施要素。这些文章没有确定或描述任何概念或组织框架来说明实现元素之间的关系。框架的类型和每个框架的元素(例如，决定因素、步骤或方面)在表3。29%(2/7)的文章除外[31，32]，大多数文章缺乏对所识别的元素的清晰描述(表3)。

数据分析确定了NASSS所有7个领域中存在实施要素(表4)。实现元素不均匀地分布在域和子域之间。每篇论文中确定的实施要素及其与NASSS子领域的关系的完整描述载于数据分析矩阵(多媒体附录3［26-32])。在所有论文中，技术是所有文章中最常包含的领域(7/ 7,100%)，而嵌入和随时间的适应是较不频繁包含的领域(1/ 7,14%)。总的来说，这些论文明确涵盖了91%(20/22)的NASSS子域;然而，子域之间和个别文章之间的分布不均匀。在这7篇文章中，最常被识别的子域是材料和技术特点(7/7, 100%),生成的数据类型(7/7, 100%员工(角色和身份)， 6/7, 86%)。较少识别的子域包括随着时间的推移适应的范围(1/ 7,14 %)例行程序需要改变的程度(1/7, 14%)。

在个别文章中，Nelson等[30.]和Beil等人[26]的子域覆盖率最高，分别为68%(15/22)和55%(12/22)。Diprose等[27]和Fernandes等人[28]覆盖的子域最少，只有23%(5/22)的子域。元素的存在并不是相互排斥的，因为一些元素被分类到多个域。例如，Beil等人[26]在技术、采用者和更广泛的系统领域中将实现元素分类为可解释性。类似地，Ngiam等人的实现元素人机交互[31]在技术、采用者、组织和更广泛的系统中被分类。

总共确定了7个新的子域，它们不明确适合NASSS框架(表4)。三个要素被归类为属于技术领域:数据输入类型，对当地环境的依赖/适应,有效性评价。的输入数据的类型强调人工智能算法的基本数据输入及其对现有(自动化)电子健康记录数据的可用性和质量的依赖[29]。对当地环境的依赖/适应涉及人工智能技术如何依赖于当地不同的其他护理实践，例如正在使用的其他技术、数据记录方法和当地护理过程(例如，患者转诊系统)，这些过程会影响人工智能的数据输入或当地从业者信任并根据人工智能输出采取行动的能力[28]。有效性评价明确指出需要进行临床试验和其他验证机制，以确定人工智能算法的有效性、可靠性和可信度[32]。在价值主张域下，我们确定了需求方价值(相对于人口)，指的是一项医学伦理原则，要求在人口层面实施人工智能时实现公平和社会福祉，并在技术的价值主张范围内考虑数据偏差和对健康不平等的影响等问题[26]。对于领域采用者，我们确定共同决策患者、专业人员、护理人员之间的关系，以及人工智能在决策过程中作为第四声音的作用[30.]。最后，对于领域更广的系统，我们进行了识别道德(人口公平/歧视)和人类监督的作用。道德表明在人口层面上的有益和无害的医学道德原则，反映了对新技术在人口层面上的健康平等影响进行正式监管和考虑的必要性[26，29]。人类的监督考虑技术在有或没有人为监督的情况下运行的可能性或可取程度。综上所述，人工智能不应损害医护专业人员的自主权，也不应引起不利影响[26，29]。

表3。所纳入文章中框架和框架元素的描述(n=7)。

研究	明确的框架?	框架类型^一个和目的	框架元素(阶段、决定因素或方面)	元素描述的清晰度^b	框架开发的参考指南或文献
Beil等人[26］	是的	评价框架;道德的人工智能^c	仁慈、无害、公正、自主、可解释性、医学观点、技术要求、以病人或家庭为中心、以系统为中心	部分	欧盟委员会指南
Diprose等[27］	没有	N/A^d;元素描述了医生对人工智能的看法	医生的理解和预期的医生行为，可解释性，优先于可解释性方法	部分	缺席
Fernandes等[28］	没有	N / A;元素描述了在ED中开发和实施AI的限制^e伤检分类	数据的可用性、系统的主观性、方法和建模技术、验证和地理(来自同一地理区域的数据)	部分	缺席
lottus等人[29］	没有	N / A;元素描述了人工智能在手术决策中的挑战和潜力	手术决策方面的挑战(复杂性、价值观和情感、时间限制和不确定性、启发式和偏见)、传统预测分析和临床决策支持(决策辅助和预后评分系统)、人工智能预测分析和增强决策(机器学习、深度学习和强化学习)、实施(自动化电子健康记录数据、移动设备输出和人类直觉)、采用的挑战(安全和监控、数据标准化和技术基础设施、可解释性和伦理挑战)	部分	缺席
Nelson等[30.］	没有	N / A;元素描述了患者对人工智能的看法	AI概念，AI收益，AI风险，AI优势，AI劣势，^f人工智能实施(共生、可信度、诊断工具、设置和集成到电子健康记录中)。挑战包括医疗事故、对人工智能的误解和法规、应对人类和人工智能临床决策之间的冲突、对人工智能准确性的责任、对人工智能数据隐私的责任、人工智能推荐	有限的	缺席
Ngiam等[31］	是的	流程模型;人工智能的开发和实施	临床问题定义或重新定义、数据提取选择和提炼、数据分析和验证、人机交互、纸质试验、前瞻性临床试验、医疗器械注册和临床部署	显式的	缺席
Truong等[32］	是的	行列式框架;人工智能的实现	数据质量和数量、信任、道德、变革准备、专业知识、购买(价值创造)、监管策略、可扩展性和评估	显式的	缺席

^一个根据Nilsen分类法的架构类型[21]。

^bExplicit:明确的定义;部分:有一些讨论，但没有明确的定义;限制:仅列出构造名称，但不提供定义或讨论。

^cAI:人工智能。

^d-不适用。

^e急诊科。

^f只有与人工智能实现相关的类别才会完整显示。

表4。文献中确定的要素与规模扩大、传播和可持续性(NASSS)框架领域的不采用、放弃和挑战的比较。(n = 7)。

条件			技术		价值主张		采用者		组织		更广泛的系统		随着时间的推移嵌入和适应
原始NASSS子域
	条件性质^一个(n = 0) ‎ 共病、社会文化影响(n=0) ‎	材料及工艺特点(n=7) ‎ 生成的数据类型(n=7) ‎ 需要使用的知识(n=5) ‎ 技术供给模型(n=2) ‎		供给侧价值(对开发商);n = 2) ‎ 需求方价值(对患者;n = 2) ‎		工作人员(角色和身份;n = 6) ‎ 耐心(简单vs复杂输入);n = 3) ‎ 护理人员(可用，输入性质;n = 2) ‎		创新能力(n=1) ‎ 对变化的准备程度(n=2) ‎ 采用或资助决策的性质(n=1) ‎ 改变到新例程的程度(n=1) ‎ 实现变更所需的工作(n=2) ‎		政治或政策(n=2) ‎ 法规或法律(n=5) ‎ 专业(n = 2) ‎ 社会文化(n = 2) ‎		随时间变化的适应范围(n=1) ‎ 组织弹性(n=1) ‎
新的NASSS子域
	不确定 ‎	输入数据类型(n=3) ‎ 对其他本地过程和实践的依赖(n=2) ‎ 有效性评价(n=3) ‎		需求方价值(对人口而言);n = 1) ‎		共同决策(n=3) ‎		不确定 ‎		伦理(人口公平或歧视;n = 2) ‎ 人类监督的作用^b(n = 3) ‎		不确定 ‎

^一个这些要素没有在框架或要素列表中明确提及，但它们在稿件中得到了考虑(条件的性质，6篇文章;合并症和社会文化影响，2篇文章)。

^b可以跨多个领域考虑。

主要研究结果

这篇文献综述表明，了解如何在卫生保健实践中实施人工智能仍处于早期发展阶段。虽然我们的研究检索词识别了大量的文章，但只有7篇文章被纳入最终的分析。这些文章中只有29%(2/7)包含了直接解决在医疗保健中实施人工智能的正式框架，其他71%(5/7)的文章描述了影响这种实施的因素。

许多被拒绝的文章都强调了发展关于如何在医疗保健中实施人工智能的知识的重要性，但尽管承认这一点，这些文章很少或根本没有提供支持其主张的实质内容，也没有提供如何向前发展的指导。在筛选过程中，强调了在这一领域建立知识的挑战，其中许多文章提到了人工智能，但被排除在外，因为它们关注的是与人工智能无关的医疗保健技术;例如，电子保健和远程医疗。将技术不恰当地贴上人工智能的标签，可能反映了围绕人工智能概念的炒作，以及采用时尚术语来增加关注度、读者群和发表可能性的趋势[34，35]。这种对人工智能术语的误用给试图在这一新兴领域综合学习的研究人员带来了模糊的前景和模糊性。

鉴于认识到实施人工智能的重要性和挑战[2]，但令人惊讶的是，所确定的文章中没有一篇提到为数据分析或框架开发提供信息的现有实现文献。尽管与其他卫生技术相比，人工智能可能有特定的要求，但有大量关于实施挑战和促进因素的文献(例如，Xiang等人[36])，可以为人工智能领域提供信息并加速学习。唯一一篇关于框架开发的论文[26是欧盟委员会制定的《可信赖人工智能道德准则》。这表明，人工智能社区内部试图就与人工智能在现实世界中的使用有关的关键问题达成协议，但这些努力尚未与实施科学界的见解联系起来。

为了了解人工智能具体实施挑战与更一般的卫生技术之间的重叠问题，我们将7篇论文中列出的要素映射到NASSS框架，该框架是专门为指导卫生技术的采用而开发的[5]。这些文件中确定的大多数要素都与NASSS框架内的要素相对应，这表明人工智能实施的关切与一般卫生技术之间存在很大程度的重叠，尽管应该指出的是，对这些要素的描述普遍缺乏澄清，这意味着它们有时可以进行解释。在这7篇人工智能论文中，NASSS领域最多的是技术，包括子领域材料特点的技术和生成的数据类型，均被纳入7篇论文。的重要性采用者(人员角色)最常被提及(6/7,86%)，其次是更广泛的系统监管或法律问题(5/7, 71%)。所有其他NASSS域和子域都在1或2篇其他论文中被确定(除了条件域，它没有正式出现在任何框架或元素列表中，但在大多数论文中仍然是上下文讨论的一部分)。这些发现表明，所有NASSS要素都与人工智能在卫生保健中的实施有关，但目前人工智能社区对所有这些领域的认识和认识都很低。这突出了在人工智能社区内部以及在人工智能和实施科学界之间分享发现的价值，以建立更全面的理解。

7篇论文中确定的少数元素与现有的NASSS子域不一致。因此，我们提出了7个新的子域来补充NASSS框架。在新确定的子领域中，一些突出的问题可能与所有形式的卫生技术有关，并可能对人工智能产生具体影响。例如，新识别的子域共同决策认识到需要支持员工、患者和职业(技术采用者)之间的沟通、讨论和决策的流程和行为，这可能与许多数据驱动的技术相关[37-39]。然而，在人工智能的情况下，人工智能提供了第四个的声音在决策过程中，对如何以情感敏感的方式处理这种交流有特殊影响，对不同意见和偏好给予多少重视[38，40]，以及它如何能够在不损害保健专业人员对病人护理的主要责任和义务的情况下支持临床决策[41]。同样的，需要有效性评价对所有卫生技术都很重要[42，43]，但对于人工智能来说，如果要取代或补充临床判断，这在证明数据输出的可信度方面可能尤为重要。

的子域名人类监督的作用已经成为跨多个领域的独特实现特性。这个词人类的监督强调人工智能不应损害医护专业人员的自主权，亦不应造成不良影响[26，29]。患者接受人工智能的使用，但医疗保健专业人员需要监督人工智能的结果，并决定何时以及如何使用人工智能产生的信息。例如，在特定情况下，医疗保健专业人员可能能够推翻人工智能做出的决定。不像共同决策它建议人类和机器合作进行个体患者护理，人类的监督强调卫生保健专业人员对人工智能建议的授权是监管和系统层面的关键要素。这一子领域在灰色文献中也有类似的术语，如人在循环中、人在循环中或人在指挥中[44]。

与其他形式的卫生技术相比，其他新确定的子领域似乎与人工智能高度相关或可能存在问题。例如，理解需求价值(人口效益)和伦理(人口公平或歧视)似乎对人工智能特别重要，因为它们对大量(人口规模)数据的依赖或影响。在整个人群中推荐决策的可能性有可能加强系统性偏见(例如，白人或男性)，这可能会无意中歧视少数民族和健康状况更复杂或不寻常的患者。这反过来又与监管和法律制度的重要性日益增加有关，这些制度监督人工智能的引入，并仔细考虑个人、专业团体和政府的影响和责任，以确保新的数据驱动技术的安全性、有效性、道德和公平性[40]。

对实践和研究的启示

我们的研究结果强调，需要制定一个特定的人工智能实施框架，利用与人工智能实施工作相关的实证研究，并利用实施科学界的现有知识和经验。从科学文献的实施中汲取见解，以加强和加速人工智能的实施，这是一个巨大的、目前尚未实现的机会。没有必要重复错误或重复已经取得的学习成果，并且有机会利用其他人的理论和实践见解来提供基于证据的基础，以加速在卫生保健中实施人工智能。

我们的研究结果表明，人工智能的实施是通过一个狭窄的镜头来看待的，重点是技术的设计及其与直接用户的交互。实施科学的经验教训表明，需要将注意力扩大到了解技术将如何影响其实施的环境并与之相互作用，包括了解每个地方环境中现有的护理过程和做法，以及系统如何在微观、中观和宏观层面上支持或阻碍技术的采用。这些见解只能通过相关利益相关者、一线员工、患者和职业的积极参与来获得，他们的参与对于理解基于人工智能的新技术将如何被接受，以及如何建立信任以确保设计以卫生保健系统的需求和实际限制和要求为中心(即产生有用的、可信的、相关的和可操作的知识)至关重要。实施科学的经验教训表明，获得这种知识、利用它为技术设计提供信息以及解决更广泛的实施问题需要耗费大量时间，并且依赖于不同的、经常相互冲突的利益相关者群体之间良好的关系。然而，实现文献一次又一次地证明了这项工作对于成功实现的必要性。利用这些见解可以为负责在实践中实施人工智能的医疗保健专业人员提供指导，为决策者和政策制定者提供指导，以确保制定有效的实施计划，并为人工智能设计者和推动者提供指导，他们需要了解实际部署的影响，以确保人工智能产品适合实施。

任何人工智能实施框架还需要认识到在医疗保健中引入人工智能的更高的、可能是独特的需求和挑战，包括有意义的决策支持、道德困境(隐私和同意)、透明度、有效性、可解释性和建立信任黑盒技术(2，45，46]。人工智能与系统之间的共生关系、卫生保健系统为人工智能提供信息的数据输入之间的动态和相互依赖关系、人工智能数据输出对同一系统的影响，以及理解和解决问题所需的重要技术、分析和临床专业知识，使实施变得更加复杂。此外，人工智能在人口层面上的操作具有更大的潜力和风险，以及确保任何此类技术在个人层面上提供公平的人口护理和安全、有效和富有同情心的护理的道德和监管要求。

方法论的注意事项

虽然本研究是以结构化和系统化的方式进行的，但只有少数论文符合纳入标准，而且这些论文在方法的清晰度和严谨性以及对影响人工智能实施的要素的描述和定义的清晰度方面质量较低。此外，纳入的基于经验数据的研究仅在3个高收入国家进行，限制了研究结果在其他背景下的推广。例如，人工智能在低收入国家的卫生保健领域的使用仍处于初级阶段，因此NASSS框架的一些子领域可能在这方面(如法律、监管和社会文化)得到不规则的推进。这些特点强调了反思节俭发现的重要性。总之，这些限制了我们分析累积结果的可靠性和普遍性，并突出了文献中的空白，需要进一步的实证和理论研究。

我们选择使用NASSS框架对纳入的论文进行演绎分析，因为它代表了致力于理解医疗保健技术实施的最先进框架之一，并通过广泛的实证研究和文献综述[2]。尽管NASSS框架的使用为理解人工智能实施文献中的发现提供了一种有用的方法，但该框架的使用是说明性的，其他框架也可以用于支持对结果的审查和解释。例如，NASSS架构主要以创新者为中心，了解如何将新技术引入医疗保健系统，而其他架构则以服务为中心，了解前线医疗服务的需要和运作情况，以及新技术如何适应和干扰现有的工作方法[47]。可以进行进一步的研究，以考虑不同实现框架的优点和局限性，从而为人工智能的实现提供见解。

范围审查经常寻找复杂的、紧急的或定义不清的概念的识别和概念化。与传统的由定义良好的结构指导的系统综述不同，筛选和综合关于一个紧急主题的所有相关文献可能是不可行的[48]。由于我们的目的仅仅是了解在医疗保健实践中应用人工智能时使用了哪些实施框架，因此我们确定所有符合条件的研究的努力在某些方面受到限制。此外，尽管本综述的结果基于7项研究，但实证数据仅来自5个面向卫生保健的数据库。尽管集中抽样技术减少了环境差异，从而有助于提供可靠的发现，但在医疗保健环境之外工作的医疗保健专业人员在解释研究结果时应考虑环境特定的差异。

结论

本文献综述表明，关于医疗保健中人工智能实施的研究文献缺乏理论发展，并且与实施科学中开发的现有实施框架或模型联系不足。这意味着围绕人工智能实施的潜在具体挑战在很大程度上未被揭示，需要进一步的基于经验的研究来提供必要的知识，以制定实施框架，指导未来在临床实践中实施人工智能。

致谢

本研究的资助者是瑞典政府创新机构Vinnova(赠款2019-04526)和知识基金会(赠款20200208 01H)。资助者不参与研究设计、收集、分析、数据解释的任何方面，也不参与写作或发表过程。

作者的贡献

所有作者(FG, DT, JN, JR, JB和PS)都对原论文做出了重要贡献。所有作者都为研究设计做出了贡献。PS和JN提出了资金和合作协议的申请。FG、DT和JB识别并选择相关研究，FG和DT绘制数据图表，FG、DT、JN、JR和PS分析、总结并报告结果。原稿由FG、DT、JN、JR、PS共同起草，所有作者都对论文的重要知识内容进行了批判性修改。所有作者都已阅读并批准了提交的最终版本。

利益冲突

没有宣布。

‎

多媒体附录1

医疗保健数据库搜索语法。

DOCX文件，31 KB

‎

多媒体附录2

入选论文的质量评价。

DOCX文件，36kb

‎

多媒体附录3

数据分析矩阵。

DOCX文件，97 KB

刘建军，刘建军，刘建军。基于大数据分析和人工智能的医疗保健转型研究。中国生物医学工程学报(英文版);2009;31(1):391 - 391。［CrossRef] [Medline］
Shaw J, Rudzicz F, Jamieson T, Goldfarb A.人工智能及其实现挑战。中国医学与互联网杂志，2019;21(7):113659。［CrossRef] [Medline］
何军，Baxter SL，徐军，徐军，周翔，张凯。人工智能技术在医学中的实际应用。中华医学杂志，2019;25(1):30-36。［CrossRef] [Medline］
杨建军，杨建军，张建军，等。数字医疗技术在心血管疾病治疗中的应用研究进展。中华心脏杂志2020;41(增刊2):ehaa946.3500。［CrossRef］
李建军，李建军，李建军，等。超越采用:一个新的框架，用于理论和评估不采用、放弃以及对卫生和保健技术的扩大、传播和可持续性的挑战。医学与互联网研究，2017;19(11):e367 [J]免费全文] [CrossRef] [Medline］
Damschroder LJ, Aron DC, Keith RE, Kirsh SR, Alexander JA, Lowery JC。促进将卫生服务研究成果付诸实践:促进实施科学的综合框架。实施科学学报2009;4:50 [j]免费全文] [CrossRef] [Medline］
Reed JE, Howe C, Doyle C, Bell D.从复杂系统中翻译证据的成功医疗保健改进(SHIFT-evidence):指导实践和研究的简单规则。国际卫生杂志，2019;31(3):238-244。［CrossRef] [Medline］
李建平，李建平。基于信息技术的心理健康服务评估系统的设计与实施。特别部分的介绍。行政与卫生，2016;43(3):344-349。［CrossRef] [Medline］
李建军，李建军，李建军。服务组织创新扩散的系统评价与实证研究。中国生物医学工程学报，2004;32 (4):591 - 591 [j]免费全文] [CrossRef] [Medline］
Alhashmi SF, Alshurideh M, Al Kurdi B, saloum SA。影响人工智能在卫生保健部门实施的因素的系统审查。1 . Hassanien AE, Azar A, Gaber T, Oliva D, Tolba F，编辑。人工智能与计算机视觉国际会议论文集(AICV2020)。纽约:斯普林格出版社;2020:37-49。
Horgan D, Romao M, morr SA, Kalra D.人工智能:文明的力量——以及更好的医疗保健。公共卫生基因组学2019;22(5-6):145-161。［CrossRef] [Medline］
蒋峰，蒋勇，志辉，董勇，李宏，马生，等。医疗保健中的人工智能:过去、现在和未来。中华脑卒中杂志，2017;2(4):230-243 [j]免费全文] [CrossRef] [Medline］
Ben-Israel D, Jacobs WB, Casha S, Lang S, Ryu WH, de lotbinier - bassett M，等。机器学习对病人护理的影响:系统回顾。[j] .中国生物医学工程学报，2010;33(3):591 - 591。［CrossRef] [Medline］
Lam K, Iqbal FM, Purkayastha S, Kinross JM。调查手术中人工智能的伦理和数据治理问题:德尔菲研究的协议。红外光谱与红外光谱研究进展，2011;10(2):562 - 562。［CrossRef] [Medline］
Murphy K, Di Ruggiero E, Upshur, Willison DJ, Malhotra N, Cai JC，等。促进健康的人工智能:伦理文献的范围审查。BMC医学伦理2021;22(1):14。［CrossRef] [Medline］
王维布欣，吴克成，Zeger SL.基于黑盒算法可视化显示的机器学习临床翻译方法的开发与验证。中华医学杂志，2020;8(6):591 - 591。［CrossRef] [Medline］
Asan O, Bayrak AE, Choudhury A.人工智能和医疗保健中的人类信任:关注临床医生。中国医学信息学报，2020;22(6):15154。［CrossRef] [Medline］
esmaiilzadeh P.基于人工智能的医疗保健工具的使用:一项从消费者角度的调查研究。中华医学杂志，2020;20(1):170 [j]免费全文] [CrossRef] [Medline］
Arksey H, O'Malley L.范围研究:走向方法论框架。国际医学杂志，2005;8(1):19-32。［CrossRef］
刘建军，李建军，刘建军，等。范围审查:明确定义、方法和报告的时间。中华临床流行病学杂志，2014;37(12):1291-1294。［CrossRef] [Medline］
理解实现理论、模型和框架。实施科学2015;10:53 [免费全文] [CrossRef] [Medline］
刘建军，刘建军，李建军，等。人工智能在医疗保健中的经济影响:系统评价。[J] .中国医学信息学报，2016;22(2):866 - 866。［CrossRef] [Medline］
崔科，李丽娟，李建平，李建平，等。PRISMA范围审查扩展(PRISMA- scr):清单和解释。中华医学杂志;2018;36(7):467-473。［CrossRef] [Medline］
levacd, Colquhoun H, O'Brien KK。范围界定研究:推进方法论。实施科学学报2010;5:69 [j]免费全文] [CrossRef] [Medline］
Nadelson S, Nadelson LS。基于证据的实践文章回顾了使用CASP工具:一种教学EBP的方法。基于Worldviews Evid的护理，2014;11(5):344-346。［CrossRef] [Medline］
Beil M, prof I, van Heerden D, Sviri S, van Heerden PV。重症监护中人工智能预测的伦理考虑。重症监护医学杂志2019;7(1):70。［CrossRef] [Medline］
Diprose WK, Buist N, Hua N, Thurier Q, Shand G, Robinson R.基于假设机器学习风险计算器的医生理解、可解释性和信任。中华医学杂志，2016;27(4):592-600。［CrossRef] [Medline］
Fernandes M, Vieira SM, Leite F, Palos C, Finkelstein S, Sousa JM。应用智能系统的急诊科分诊临床决策支持系统综述[j] .中国生物医学工程学报，2014;22(2):591 - 591。［CrossRef] [Medline］
Loftus TJ, Tighe PJ, Filiberto AC, Efron PA, Brakenridge SC, Mohr AM，等。人工智能和手术决策。中华外科杂志，2020;15(2):148-158。［CrossRef] [Medline］
李世杰，李俊杰，罗凯，Manjaly P，等。患者对使用人工智能进行皮肤癌筛查的看法:一项定性研究。中国生物医学工程杂志，2015;31(5):591 - 591。［CrossRef] [Medline］
Ngiam KY, Khor IW。医疗保健服务的大数据和机器学习算法。《柳叶刀·癌症杂志》2019;20(5):e262-e273。［CrossRef] [Medline］
张建军，张建军，张建军。人工智能在医疗保健中的应用。种猪卫生技术通报2019;264:1993-1994。［CrossRef] [Medline］
Thomas J, Harden A.系统综述中定性研究的主题综合方法。中华医学杂志2008;8:45 [j]免费全文] [CrossRef] [Medline］
Dwivedi YK, Hughes L, Ismagilova E, Aarts G, Coombs C, Crick T，等。人工智能(AI):对新出现的挑战、机遇和研究、实践和政策议程的多学科视角。[J]中国生物医学工程学报，2013;17(5):1093 - 1094。［CrossRef］
Fröhlich H, Balling R, Beerenwinkel N, Kohlbacher O, Kumar S, Lengauer T，等。从炒作到现实:数据科学实现个性化医疗。中国医学杂志，2018;16(1):150。［CrossRef] [Medline］
向勇，赵磊，刘志，吴旭，陈杰，龙娥，等。人工智能在医学中的实施:现状分析及发展建议。[j] .中国生物医学工程学报，2020;42(2):1070 - 1080。［CrossRef] [Medline］
李建军，李建军。深度学习时代的共享决策与产妇护理:遗传障碍的识别与克服。[J]中华临床医学杂志，2011;27(3):497-503。［CrossRef] [Medline］
张建军，张建军。人工智能技术在临床应用中的应用。科学通报，2020;34(2):349-371。［CrossRef］
Elwyn G, Nelson E, Hager A, Price A.合作生产:当用户定义质量。中华医学杂志，2020;29(9):711-716。［CrossRef] [Medline］
[3]李建平，李建平。基于算法和数据驱动技术的心理健康研究。中国生物医学工程学报;2011;8(6):563 - 568。［CrossRef] [Medline］
李思泰，林海燕，夏菲斯，英坚。医疗保健中的人工智能辅助决策:大数据在健康和研究中的伦理框架应用。生物学报，2019;11(3):299-314。［CrossRef] [Medline］
Mueller D, Tivey D, Croce D.卫生技术评估:其在加强发展中国家卫生系统中的作用。南非公共卫生杂志，2017;2(1):6-11。［CrossRef］
李建军，李建军，李建军。电子健康的卫生技术评估框架:系统审查。国际医学杂志，2020;36(3):204-216。［CrossRef] [Medline］
人工智能高级别专家组。可信赖人工智能的伦理准则。欧盟委员会通信网络、内容和技术总司。布鲁塞尔:欧洲联盟出版署;2019.URL:https://ec.europa.eu/newsroom/dae/document.cfm?doc_id=60419[2021-07-10]访问
张建军，张建军。人工智能在公共部门的应用与挑战。国际公共行政学报，2019;42(7):596-615。［CrossRef］
刘建军，张建军，张建军，等。人工智能在信息系统研究中的应用。人工智能系统学报;2021;22(2):10。［CrossRef］
李建军，李建军，李建军，等。复杂系统的证据翻译:实施和改进框架的比较回顾。国际卫生杂志，2019;31(3):173-182。［CrossRef] [Medline］
Pham MT, rajiki A, Greig JD, Sargeant JM, Papadopoulos A, McEwen SA。范围审查的范围审查:推进方法并增强一致性。合成方法，2014;5(4):371-385。［CrossRef] [Medline］

‎

人工智能:人工智能

比赛:关键评估技能课程

网:医学主题词

nass:不采用、放弃、扩大规模、传播和可持续性

棱镜:系统评价和荟萃分析的首选报告项目

G·艾森巴赫编辑;提交19.07.21;S Nilsson, M Fernandes, H Hah;对作者的评论11.08.21;收到修订版本02.09.21;接受27.12.21;发表27.01.22

©Fábio Gama, Daniel Tyskbo, Jens Nygren, James Barlow, Julie Reed, Petra Svedberg。原发表于医学互联网研究杂志(//www.mybigtv.com)， 2022年1月27日。

这是一篇在知识共享署名许可(https://creativecommons.org/licenses/by/4.0/)下发布的开放获取文章，该许可允许在任何媒介上不受限制地使用、分发和复制，前提是原始作品首次发表在《医学互联网研究杂志》上，并适当引用。必须包括完整的书目信息，到//www.mybigtv.com/上原始出版物的链接，以及版权和许可信息。

本文内容如下e-collection /主题问题:

人工智能转化为卫生保健实践的实施框架:范围审查