发表在第22卷第二名(2020): 2月

本文的预印本(早期版本)可在https://preprints.www.mybigtv.com/preprint/16866,首次出版
人工智能在医疗保健中的经济影响:系统回顾

人工智能在医疗保健中的经济影响:系统回顾

人工智能在医疗保健中的经济影响:系统回顾

审查

1慕尼黑工业大学维亨斯蒂芬生命科学学院,德国弗莱辛

2数字健康战略研究所,德国汉堡

*所有作者贡献相同

通讯作者:

Justus Wolff,理学硕士

慕尼黑工业大学生命科学学院

慕尼黑工业大学

Maximus-von-Imhof-Forum 3

Freising 85354

德国

电话:49 40329012 0

电子邮件:justus.wolff@syte-institute.com


背景:积极的经济影响是支持或反对在医疗保健行业投资人工智能(AI)解决方案的关键决策因素。它与护理提供者和保险公司以及制药和医疗技术部门最为相关。虽然在文献中已经多次评估了数字医疗解决方案的广泛经济影响,也分析了对患者和社会的好处,但人工智能在医疗保健领域的具体经济影响只是偶尔被提及。

摘要目的:本研究旨在系统地回顾和总结医疗保健领域人工智能的成本效益研究,并评估它们是否符合既定的质量标准。

方法:在第一步中,经济影响研究的质量标准是根据既定的和调整后的成本影响评估标准方案确定的。第二步,基于定性和定量纳入和排除标准进行了系统的文献综述,以确定相关出版物,进行深入的经济影响评估分析。在最后一步,根据确定的成本效益研究质量标准对确定的经济影响研究的质量进行评估。

结果:很少有出版物彻底讨论了人工智能的经济影响评估,审查的人工智能出版物的经济评估质量显示出严重的方法缺陷。根据列入标准,66份出版物中只有6份可以列入分析的第二步。在这6项研究中,没有一项包括方法上完整的成本影响分析。在今后的研究中,有两个方面需要改进。首先,需要包括人工智能基础设施和服务的初始投资和运营成本。其次,必须评估实现类似影响的替代方案,以提供全面的比较。

结论:这一系统的文献分析证明,现有的影响评估显示出方法上的缺陷,即将进行的评估需要更全面的经济分析,才能做出支持或反对在医疗保健中实施人工智能技术的经济决策。

中国医学杂志,2020;22(2):e16866

doi: 10.2196/16866

关键字



背景

在以价值为基础的医疗保健时代,也因为医疗保健行业在整体经济中的高份额,经济影响评估越来越重要。例如,在美国19.4万亿美元(18%)的国内生产总值(GDP)中,医疗支出约占3.5万亿美元;在德国3.7万亿美元(11.5%)的国内生产总值中,医疗支出约占0.4万亿美元[12].因此,在一些研究中也分析了数字健康应用的成本影响。

2002年,Whitten等人在远程医疗干预的背景下回顾了成本效益研究[3.]显示,在612篇确定的文章中,只有55篇提供了实际的成本效益数据,这些数据被要求包含在详细的审查中。此外,在分析这些文章后,作者得出结论,所提供的证据不足以评估远程医疗是否代表一种具有成本效益的提供医疗保健的手段[3.].

十多年后的2014年,埃尔伯特等人[4]在一篇关于电子健康(eHealth)干预躯体疾病的系统综述和荟萃分析的综述中描述,在31篇综述中,7篇论文得出结论,数字健康是有效的或具有成本效益,13篇强调证据是有希望的,其他11篇仅发现有限或不一致的证据。他们还强调,需要大力加强制定和评估战略,以便在日常实践中实施有效或具有成本效益的电子保健举措[4].

在2018年另一项关于电子医疗技术经济评估的系统回顾研究中,Sanyal等人[5]分析了2010年至2016年出版的多个数据库。在符合纳入标准的11项研究的基础上,作者发现大多数研究通过随机对照试验和统计建模证明了干预的有效性和成本效益。但是,没有提供充分的资料说明采用这些建模技术的可行性。因此,本文强调,目前的证据水平是不确定的,需要更多的研究来评估可能的长期成本效益[5].

这一领域的研究不断加强,在若干研究中,数字健康的成本效益,例如用于远程骨科会诊的远程医疗[6], 2型糖尿病和高血压的数字行为干预[7],以及基于互联网的心理健康干预措施[8]进行了详细分析。

人工智能(AI)作为数字健康领域的关键新兴技术之一,有望显著提高医疗质量和节约成本,因此,人工智能在医疗保健领域的经济影响评估对医疗保健领域的所有利益相关者都具有至关重要的作用,因此需要详细分析。

客观的

系统地调查了现有的成本效益评估是否符合既定的质量标准,以便就在医疗保健中实施人工智能做出全面决策。在这些彻底的经济评估的基础上,将提供决定在医院、行业和付款人环境中应用人工智能的必要信息。


系统的文献综述如下所述。

搜索策略

文献检索使用PubMed数据库,并使用中提供的检索词表1

表1。PubMed分析中的搜索词(标题和摘要)(2019年7月29日进行)。
组件 语法 来袭,n
人工智能或机器学习和成本效益 (人工智能[标题/摘要]或机器学习[标题/摘要])和成本效益[标题/摘要] 54
人工智能或机器学习和经济影响 (人工智能[标题/摘要]或机器学习[标题/摘要])和经济影响[标题/摘要] 9
人工智能或机器学习和成本节约 (人工智能[标题/摘要]或机器学习[标题/摘要])和成本节约[标题/摘要] 3.

搜索词人工智能而且机器学习对于整个部分并不详尽如:决策树支持向量机,或深度神经网络也可以用作数据库查询的搜索词。然而,由于基于经济影响的战略决策大多是在战略管理和医疗层面上做出的,没有特定的技术背景,因此使用最多的搜索词是关于医疗保健领域的人工智能。此外,很有可能关于,例如,深度神经网络还包括诸如人工智能支持向量机,机器学习至少在理论上是这样的。最后,决定使用谷歌趋势分析,比较过去12个月全球医疗保健领域人工智能最常用的搜索词[9]:条款人工智能而且机器学习是迄今为止使用最多的,如多媒体附件1

入选标准

对于通过PubMed搜索确定的出版物,已对标题、摘要和全文进行了审查。如果出版物是(1)发表过的期刊文章,(2)用英语写的,并且(3)发表时间不超过5年,则纳入后续分析。就内容而言,如果出版物集中于以下内容领域中的至少一个,则包括:(1)对AI功能的全面描述,(2)对AI功能的经济效率和结果的评估,以及(3)至少一个医疗保健系统中AI功能的定量结果。此外,只有描述具体医疗和经济结果的出版物,例如每年每个患者节省的成本,以及比较人工智能解决方案的评论或元分析。

排除标准

一篇文章的排除标准定义如下:(1)标题没有涉及与医疗保健中的人工智能相关的主题;(2)标题和摘要均未包含人工智能在医疗保健中的应用描述;或(3)标题、摘要或全文未详细说明人工智能在医疗保健应用于任何医疗保健系统的数量经济结果。与之前的其他研究回顾方法相比,如Elbert等人选择的方法[4或Ekeland et al [10],覆盖第三个排除标准。虽然这大大限制了所包括的成本效益研究的数量,但它用于比较不同的成本效益分析方法,而不仅仅是从国家或国际卫生保健的角度比较没有量化经济影响的与健康或过程相关的结果。

在通过PubMed搜索确定纳入的潜在研究后,如前所述,评估分两步进行(图1).首先,对所有标题、摘要和全文进行筛选,以满足纳入和排除标准。其次,使用质量标准目录对可纳入的出版物进行评估,该目录将在“经济影响评估的质量标准”一节中进行解释。

图1。研究选择和识别流程图。
查看此图

经济影响评价质量标准

设计了成本效益研究的综合标准目录。除自身的标准外,还考虑了来自经典医疗保健效果研究和数字健康评估的其他评估方面[511].质量标准总结在表2

表2。经济影响评价的质量标准。
标准 解释
人工智能的成本效益描述一个解决方案 成本效益解释的详细程度 作者
假设制定 分析是否制定了一个全面的问题,允许AI成本效益评估(例如,将AI方法与推荐的指南例程进行比较) Haycox和Walley的研究[11
成本效益的角度 独立功能成本变化的影响vs整体护理负担的减少 Haycox和Walley的研究[11
成本替代方案的考虑 分析如果采用替代策略是否也可以达到节约成本的结果 Haycox和Walley的研究[11
今天的好处 人工智能服务的净现值,包括前期投资和运行成本 Haycox和Walley的研究[11
基本案例的验证 基于基准案例数据的基准测试,分析人工智能解决方案的成本效益 Sanyal等的研究[5

一个AI:人工智能。


质量标准评估

应用质量标准对经济影响评估进行了1至3级的评估(1=表面覆盖,2=坚实覆盖,3=详细解释)。如上所述,6种出版物已根据所述的经济影响评价质量标准进行了评估。有关刊物的分析概述[12-17]是在多媒体附件2

质量评估结果

我们首先得出的结论是,成本效益测量描述的详细程度总体较高,因为大部分描述都是精确和详细的,例如,“对于25,000欧元/质量调整生命年的增量成本效益阈值,人工智能工具将导致略差的结果(1.98%),但成本降低(5.42%)”[14].总体而言,6篇论文中有5篇具有非常高的详细程度,只有1篇研究在一般描述中具有中等程度的详细程度(只有积极/消极的成本节约影响描述,没有提供进一步的结果解释[13])。

第二,假设公式(例如,通过基于机器学习的预测模型来节省成本,以确定疾病管理计划的最佳心力衰竭患者,以避免30天的再入院[17)在所有出版物中都是清晰准确的。所有这些都包含了解释良好和连贯的假设公式。

第三,成本效益视角在所有情况下都有一个卫生保健体系背景,尽管可以包括其他角度,如门诊或护士的角度。此外,5项研究展示了综合医疗保健系统的视角,而1项研究可以从医院扩展到整体系统的视角[13].

第四,对费用替代的考虑,即对是否也可以实现节省费用的结果的分析,基本上没有。只有2篇论文详细阐述了不同的替代方案,例如,区分各自患者群体的风险水平或不同的治疗方案。除了这两本刊物外[1216]的报告中提到了各种节省开支的办法,但其余4份刊物完全没有详细说明这些节省开支的考虑。

第五,目前实现的效益,即净现值(NPV),不仅包括效益,还包括人工智能实施的必要投资和人工智能服务交付的运营成本,在6项研究中都没有包括在内。只有一项研究比较了人工智能和非人工智能的情况,但没有提供NPV计算。因此,所有6项研究都包括了经济结果的量化,但未能计算出总体NPV。

最后,在6项研究中使用不同的方法对基础案例进行验证。大多数可靠的数据源都是在专注于人工智能的研究中收集的,这些研究基于,例如,有/没有算法的成本比较,报销代码分析,或将结果与其他诊所报告的性能进行基准比较。所有论文都提出了基于综合比较数据集的成本-效果测量。

在整个分析中出现的另一个方面是资源使用的测量,(几乎)在所有论文中都是通过自上而下的方法进行的,这意味着从整体医疗保健的角度出发,而不是从每项任务的单个成本分配出发。这样,潜在的重要成本驱动因素隐藏的利益相关者可能被遗漏(例如,如果医院治疗改变,门诊护理的额外工作量)。


主要研究结果

总的来说,上述分析的结果可以分为两类,即根据研究的纳入和排除标准,分析的一般反馈和对已纳入评审过程的研究的详细评估。

一般来说,关于人工智能在医疗保健领域的经济影响评估的出版物很少。根据不同的搜索词,包括迄今为止在此部分中最常被搜索的短语(人工智能而且机器学习),并结合经济影响(成本效益经济的影响成本节约),《PubMed》只有66个热门游戏。由于人工智能战略和随之而来的决策过程依赖于可靠的数据作为决策的基础,这对管理层和医务人员来说都是一个重大挑战,例如,当讨论关于人工智能的一般支持和反对决策以及具体实施时。

考虑到卫生保健出版物中确定的人工智能中给出的细节,经济评估质量显示出未来需要克服的若干缺陷。66份出版物中只有6份(9%)可以列入详细评估。在这6项研究中,没有一项包含完整的成本效益分析;相反,它们都集中在分散的成本或节省成本方面。

改善空间(图2)主要表现在两个方面:

  • 首先,人工智能基础设施和服务的初始投资和运营成本需要纳入评估。这是任何战略决策过程的核心要素,人工智能解决方案的完整初始和运营投资成本必须与预期的经济效益进行比较,以提供具体的决策支持。
  • 其次,必须评估实现类似影响的其他选项,以便为全面和透明的决策提供充分的基础,允许在不同的战略和投资选项之间进行比较(例如,也可以应用基因测序过程或不同的医疗专业知识分配,以改善诊断和治疗结果,而不是人工智能驱动的患者筛查)。
图2。人工智能(AI)在医疗保健中的经济影响评估的文献综述结果和改进领域。
查看此图

所进行的审查只专注于人工智能在医疗保健领域的经济和商业角度。然而,文献综述揭示了人工智能的进一步重要成功因素,例如,在法律框架方面,如遵守数据安全、保护和隐私政策,以及普遍接受的技术要求,以实现全面的数据收集和分析内容,同时遵守数据隐私要求。尽管在辅助诊断和治疗决策方面有好处,但到目前为止,这些法律和技术问题还没有定义标准,这些方面应该在未来的研究中进行更广泛的分析。

此外,除了单纯的经济数量方面,人工智能在患者和社会医疗保健中的定性方面也需要进一步研究。例如,在初级保健医生数量有限的农村地区,人工智能可以通过集中测试支持取代流程,例如,针对2型糖尿病,从而应对人口变化的挑战[18].AI和医生在诊断性能方面的比较表明,AI可以提供相同的结果,例如,在图像识别相关领域[19].除其他外,这还可以支持重新分配医疗能力。此外,人工智能还可以实现从一般化到更加个性化的治疗的转变。人工智能引导的结果预测和临床决策支持流程今天已经被用于放射治疗患者[20.].

之前在数字健康领域的评论将结果分为几类,例如,计算机化决策支持系统,基于网络的体育活动干预,互联网提供的认知行为疗法和远程医疗。此外,还区分了用户的年龄(如儿童和老年患者),并强调了缺乏短期和长期成本节约差异等缺点[5].他们还讨论了超出成本效益方面的挑战,并提到,例如,在日常实践中实施数字健康的方式仍然不清楚[4]或需要耐心的观点和各种利益相关者之间的合作方法[10].

请注意,与对数字健康的典型评论相比,关注医疗保健中的人工智能需要考虑新的因素和完善的搜索策略,从而导致不同的结果。首先,与其他评论相比,谷歌Trends已被证明是一种有效的工具,可以为具有代表性的结果集合缩小搜索空间。在谷歌趋势分析的基础上,提出了关键短语人工智能而且机器学习可以被认为是迄今为止使用最频繁的术语。其次,在应用定义的纳入和排除标准后,该综述涵盖了更高比例的纳入研究(9%的分析论文被纳入),而之前的综述的纳入率要低得多——Whitten等人的研究中有8% (55/612)[3.], 2%(31/1657)在Elbert等人的研究中[4],或0.1% (11/1625)[5])。这是因为两个原因:(1)人工智能作为商业和工业数字健康的一个子部分,在科学出版物中仍然没有得到很好的报道;(2)作为纳入标准所需的定量报告结果非常重要。第三,从管理角度用质量标准目录对成本效益研究进行了评价。由于人工智能的实施是成本和劳动密集型的,决策并不完全由医疗改善率驱动,因此企业管理决策制定基础被选择为积极的实施决策和随后的大规模应用的关键。企业管理观点的增加包括经典的成本因素(一次性和运行费用),以及在提供尖端卫生服务的不同战略之间的决策。

结论

目前的研究对人工智能在医疗保健中的影响评估相当适度,并显示出方法上的定性缺陷。今后的成本效益分析需要增加数量和质量。它们应包括初始投资和运行成本,以及与替代技术的比较。通过这种方式,可以提供全面而清晰的成本效益评估,这将作为人工智能实施决策的充分基础。

致谢

作者要感谢Julia Menacher在创建本出版物时的编辑支持。JB非常感谢Villum青年研究员13154号资助。此外,JB的部分工作得到了H2020项目RepoTrial(编号777111)的资助。JP的捐款由巴伐利亚州科学和艺术部在中心数字化框架内资助。巴伐利亚(拜仁数字中心)。

利益冲突

没有宣布。

多媒体附件1

谷歌对过去12个月全球医疗保健人工智能相关搜索词的趋势分析(2019年10月9日进行)的截图。

PNG文件,176 KB

多媒体附件2

分析所纳入的经济影响研究。

PNG文件,396 KB

  1. 菲尔普斯CE。卫生经济学。牛津郡阿宾顿:劳特利奇;2017.
  2. Statistisches Bundesamt。2017年卫生支出:+4.7%https://www.destatis.de/DE/Presse/Pressemitteilungen/2019/03/PD19_109_23611.html[2019-10-03]访问
  3. Whitten PS, Mair FS, Haycox A, May CR, Williams TL, Hellmich S.远程医疗干预成本效益研究的系统综述。Br Med J 2002 Jun 15;324(7351):1434-1437 [免费全文] [CrossRef] [Medline
  4. 埃尔伯特N, van Os-Medendorp H, van Renselaar W, Ekeland A, Hakkaart-van Roijen L, Raat H,等。躯体疾病电子健康干预的有效性和成本效益:系统综述和荟萃分析的系统综述。J Med Internet Res 2014年4月16日;16(4):e110 [免费全文] [CrossRef] [Medline
  5. 王晓明,王晓明,王晓明。电子医疗技术的经济评价:系统评价。PLoS One 2018;13(6):e0198112 [免费全文] [CrossRef] [Medline
  6. Buvik A, Bergmo TS, Bugge E, smabrekke A, Wilsgaard T, Olsen JA。远程医疗在远程骨科会诊中的成本效益:随机对照试验。J Med Internet Res 2019 Feb 19;21(2):e11330 [免费全文] [CrossRef] [Medline
  7. Nordyke RJ, Appelbaum K, Berman MA。评估新型数字疗法对2型糖尿病和高血压的影响:健康经济分析J Med Internet Res 2019 10月9日;21(10):e15814 [免费全文] [CrossRef] [Medline
  8. Le LK, Sanci L, Chatterton ML, Kauer S, Buhagiar K, Mihalopoulos C.促进年轻人心理健康求助的互联网干预的成本效益:随机对照试验。J Med Internet Res 2019 7月22日;21(7):e13065 [免费全文] [CrossRef] [Medline
  9. 谷歌趋势。比较网址:https://trends.google.com/trends/explore?cat=45&q=Artificial%20Intelligence,机器学习% 20,神经网络% 20,线性% 20回归、支持向量% % 20 20% 20台机器[2019-10-09]访问
  10. Ekeland AG, Bowes A, Flottorp S.远程医疗的有效性:综述的系统回顾。国际医学杂志2010年11月;79(11):736-771。[CrossRef] [Medline
  11. 药物经济学:评估评估者。中国临床药物学杂志1997 5;43(5):451-456 [免费全文] [CrossRef] [Medline
  12. 李鸿章,金瑞,冯勇,Bain PA, Goffinet J, Baker C,等。TJR再入院预测和成本效益干预的分析框架。IEEE生物医学健康通报2019年7月;23(4):1760-1772。[CrossRef] [Medline
  13. Gönel A.临床生物化学测试消除器,提供五种算法的成本效益。临床杂志2018年12月25:1-5。[CrossRef] [Medline
  14. Bremer V, Becker D, Kolovos S, Funk B, van Breda W, Hoogendoorn M,等。使用基线特征预测个性化治疗建议的治疗成功和成本:数据驱动分析。J Med Internet Res 2018 Aug 21;20(8):e10275 [免费全文] [CrossRef] [Medline
  15. Grover D, Bauhoff S, Friedman J.使用监督学习选择基于绩效的卫生筹资的审计目标:来自赞比亚的例子。PLoS One 2019;14(1):e0211262 [免费全文] [CrossRef] [Medline
  16. Lee I, Monahan S, Serban N, Griffin P, Tomar S.评估东南部六个州医疗补助注册儿童预防性牙科服务的成本节约。卫生服务决议2018年10月;53(5):3592-3616 [免费全文] [CrossRef] [Medline
  17. 高志刚,柴原勇,阿格博拉,大泷勇,佐藤勇,中叶勇,等。预测心力衰竭患者30天再入院风险的机器学习模型:对电子病历数据的回顾性分析BMC Med Inform Decis Mak 2018年6月22日;18(1):44 [免费全文] [CrossRef] [Medline
  18. Spänig S, Emberger-Klein A, Sowa J, Canbay A, Menrad K, Heider D.虚拟医生:基于深度学习的糖尿病无创预测交互式临床决策支持系统。Artif Intell Med 2019年9月;100:101706。[CrossRef] [Medline
  19. 沈娟,张长杰,姜斌,陈杰,宋杰,刘忠,等。疾病诊断中的人工智能与临床医生:系统回顾。JMIR Med Inform 2019年8月16日;7(3):e10010 [免费全文] [CrossRef] [Medline
  20. 马丽丽,李志强,李志强,等。利用人工智能提高放射治疗质量和安全性。J Am Coll Radiol 2019 9月16日(9 Pt B):1267-1272。[CrossRef] [Medline


人工智能:人工智能
电子健康:电子健康
国内生产总值:国内生产总值
净现值:净现值


G·艾森巴赫(G Eysenbach)编辑;提交01.11.19;D Heider, N Przulj, E van der Velde同行评审;对作者07.12.19的评论;订正版本收到18.12.19;接受19.12.19;发表20.02.20

版权

©Justus Wolff, Josch Pauling, Andreas Keck, Jan Baumbach。最初发表于《医疗互联网研究杂志》(//www.mybigtv.com), 2020年2月20日。

这是一篇开放获取的文章,根据创作共用署名许可(https://creativecommons.org/licenses/by/4.0/)的条款发布,允许在任何媒介上无限制地使用、分发和复制,前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。


Baidu
map