发表在第21卷,第11期(2019):11月

本文的预印本(早期版本)可在https://preprints.www.mybigtv.com/preprint/16323,首次出版
《最后一英里:人工智能遇到现实

《最后一英里:人工智能遇到现实

《最后一英里:人工智能遇到现实

本文作者:

恩里科Coiera1 作者:Orcid

的观点

澳大利亚健康创新研究所,麦考瑞大学,澳大利亚悉尼

通讯作者:

Enrico Coiera, MBBS,博士

澳大利亚卫生创新研究所

澳大利亚麦考瑞大学

塔拉维拉路75号6层

悉尼,2109年

澳大利亚

电话:61 298502403

电子邮件:enrico.coiera@mq.edu.au


相关的文章评论://www.mybigtv.com/2019/10/e16194/

尽管很多努力都集中在提高人工智能的技术性能上,但有令人信服的理由更多地关注这类技术的实现,以解决现实世界的应用。在实现的“最后一英里”中存在许多复杂的挑战,这些挑战可能会使技术上高性能的系统表现不佳。与其将人工智能开发视为从算法开发到最终部署的线性过程,不如采取更灵活的方法,在最终将被使用的环境中迭代地开发和测试人工智能。

中国医学与互联网杂志,2019;21(11):563 - 563

doi: 10.2196/16323

关键字


试图将信息技术与人们使用它的方式分开,就像试图将呼吸与吸入它的肺分开一样。我们与科技有着千丝万缕的联系,我们塑造科技的同时,科技也塑造了我们。人类和机器共同构成一个更大的社会技术系统,这一观点是我们理解现代世界的基础。1]。

过去对人工智能(AI)等新兴技术的社会技术教训应该不足为奇[2]。在这些古老的教训中有一条格言,即技术的应用应由手头的问题而不是技术来决定。[3.]。虽然技术创新开辟了新的解决方案类别,但只有现实世界才能告诉我们哪些问题最值得解决,哪些解决方案类别最合适。由此推论,技术驱动的解决问题的成功演示并不一定意味着它是该问题的最佳解决方案,甚至也不意味着该问题很重要。

因此,人工智能研究有两大议程[4]。第一个是技术上的,追求新的方法、架构和技术,推动机器智能的边界。第二个是应用议程,我们关注实施问题,扩展我们对如何在社会技术世界中最好地利用技术的理解。

我们对新技术的热爱所付出的风险是,我们可能看不到技术的体系。对于人工智能,许多研究都集中在展示技术在临床任务上的成功,如图像解释、诊断或治疗方案[5]。有许多令人信服的理由让我们将这种技术演示的平衡转移到实际应用中,尤其是因为仍然需要许多技术飞跃来解决具有挑战性的实际问题。

数据驱动技术(如机器学习)的发展分为三个阶段(图1).一旦诊断等任务被选择用于算法开发,在“第一英里”中,数据将被获取,可能被标记,并进行预处理或“清理”。接下来是中间一英里,重点是开发和测试使用这些数据构建的不同算法的技术性能。只有在最后一英里,算法才会嵌入到现实世界的流程中,并测试对现实世界结果的影响。

图1所示。人工智能技术发展的三个阶段。
查看此图

每一英里都有自己的挑战。“第一英里问题”包括收集和管理高质量数据的基本挑战。对于机器学习等通常依赖于大量高质量数据的技术来说,数据采集的瓶颈转化为技术应用的障碍。中间一英里是数据驱动算法开发的所有挑战的大本营,包括管理偏差、可复制性、因果推理、避免对训练数据的过度拟合,以及增强所开发的任何模型和算法的通用性。

在最后一英里,我们面对的现实是,人工智能不能自己做任何事情。它必须以某种方式连接到现实世界的流程,并且它对这些流程的影响需要是相应的。正是在这一点上,为自己而开发的技术很快就会陷入困境。例如,证明机器学习可以像人类一样,甚至比人类更好地解释甲状腺癌扫描是一回事——这是一项技术壮举。6];这是另一个有意义的壮举。在目前的情况下,甲状腺癌被过度诊断和过度治疗,我们不一定需要更好的诊断。相反,我们需要更细致、不那么激进的管理方法。7]。

因此,最后一英里的挑战是实施的挑战,对于研究人员来说,是实施科学的挑战。这些挑战存在于许多层面,包括:

  • 测量人工智能性能的标准指标与它完成分配任务的程度有关。我们传统上使用诸如灵敏度、特异性和受检者工作特性曲线下面积(AUC)等性能指标。然而,在高技术性能和对临床结果的实际影响之间必须发生一长串事件。在这个信息价值链的早期阶段取得成功是必要的,但不足以保证在现实世界中产生影响[8]。因此,评估真实世界的性能需要从测量技术准确性转向评估对过程和人员的影响。像AUC这样的测量方法在临床环境中也会产生误导[9]。AUC衡量算法在整个接收机工作特性曲线上的整体性能,而理想的实际操作可能最好限制在其中的一个部分[10]。
  • 概化与校准当人工智能在历史数据上进行训练时,其未来的表现取决于新数据与历史数据的匹配程度。一个常见的实现挑战是,在一个群体的数据上开发的高性能算法在用于另一个群体时性能会下降,这反映了数据集中事件的频率和性质的潜在差异。出于这个原因,人工智能可能需要针对特定的终端人群进行调整。在许多情况下,这一最终种群也将是动态的,由于季节性疾病转移等经常性事件、种群特征的变化以及疾病暴发等意外新事件而变化。这意味着人工智能可能需要定期或动态地重新校准,以反映人口的变化。我们还需要密切监测人工智能的表现,以发现其行为的变化,表明需要重新校准[11]。更具挑战性的事实是,人工智能改善结果的效率越高,其性能可能会下降得越快,因为它的成功可以改变其模型中的预测因子与结果之间的关联[12]。
  • 当地的环境实现科学的一个基本原则是,嵌入技术的上下文的差异与性能的变化有关。如果我们把一个组织看作一个由人员、流程和技术组成的网络,那么支撑任何两个组织的网络显然是不同的。实施可以被看作是将一项新技术或过程融入一个预先存在的组织网络的行为,技术与网络的契合度将对组织绩效产生任何影响[13]。总的来说,对于人工智能,对于数字健康,或者对于任何新的流程或技术,都是如此。更复杂的是,组织网络本身是动态的。因此,一项技术的影响将随着时间的推移而变化,因为它“适应”组织网络的方式会发生变化,也可能是因为它自己的存在——过去的连接将消失或被新的连接所取代。

软件世界已经进行了根本性的转变,从将软件开发视为从用户需求开始并以最终用户测试结束的线性过程,转变为将用户嵌入快速迭代过程的敏捷过程,该过程自适应地使软件适合用户。实现科学必须走同样的道路,尤其是动态变化的人工智能。

人工智能的发展不应被视为从第一英里延伸到最后一英里的线性旅程。这样做的风险是最终产品不能满足现实世界的需求,就像软件一样。相反,实现应该被看作是一个敏捷的、迭代的、轻量级的过程,即获取训练数据、开发算法,并将其制作成工具和工作流。在再利用一般技术和建筑之间找到适当的平衡,以满足当地的需要是至关重要的。[14]。无论哪种方式,人工智能都不应该在远离使用它们的地方被创造出来。理想情况下,他们应该出生在他们最终生活的网络深处。

利益冲突

没有宣布。

  1. 张建军,张建军,张建军,等。信息通信技术在医疗卫生服务中的应用。方法中华医学杂志2003;42(4):297-301。[Medline]
  2. M.人工智能在医学中的社会组织时代。中华医学杂志;2001;23(1):25-47。[Medline]
  3. Coiera E.医学信息学。英国医学杂志1995年5月27日;310(6991):1381-1387。[CrossRef] [Medline]
  4. Coiera电子战。医学中的人工智能:未来的挑战。中华医学杂志,1996;3(6):363-366 [J]免费全文] [CrossRef] [Medline]
  5. Topol EJ。高性能医学:人类与人工智能的融合。中华医学杂志,2019,25(1):44-56。[CrossRef] [Medline]
  6. 李欣,张生,张强,魏鑫,潘勇,赵军,等。应用超声图像的深度卷积神经网络模型诊断甲状腺癌:一项回顾性、多队列、诊断研究。《柳叶刀肿瘤学》2019年2月;20(2):193-201。[CrossRef]
  7. Coiera E.论算法、机器和医学。Lancet Oncol 2019 Feb;20(2):166-167。[CrossRef] [Medline]
  8. 郭文华。基于信息价值链理论的技术成败评估。猪健康技术通报2019年7月30日;263:35-48。[CrossRef] [Medline]
  9. 受试者工作特征曲线在风险预测中的应用与误用。Circulation 2007 Feb 20;115(7):928-935。[CrossRef]
  10. Thomas G, Kenny LC, Baker PN, Tuytten R.一种用于评估预后试验的询问受试者工作特征曲线的新方法。诊断程序2017年11月15日;1(1):17。[CrossRef]
  11. Ong M, Magrabi F, Coiera E.卫生信息系统故障综合征监测的可行性研究。中华医学杂志,2013;20(3):506-512 [J]免费全文] [CrossRef] [Medline]
  12. Lenert M, Matheny ME, Walsh CG。预测模型将成为自身成功的受害者,除非....中国医学信息学报,2019年9月3日:0609。[CrossRef] [Medline]
  13. 《卫生信息学指南》第12章:实施。博卡拉顿:CRC出版社;2016:173 - 194。
  14. 李建军,李建军。敏捷软件开发在医疗保健市场中的应用。计算机支持的鸡舍2009年9月16日;18(5-6):607-634。[CrossRef]


人工智能:人工智能
AUC:接收机工作特性曲线下的面积


G·艾森巴赫编辑;提交18.09.19;D . Mendes的同行评议;接受20.10.19;发表08.11.19

版权

©Enrico Coiera。原载于2019年11月8日《医学互联网研究杂志》(//www.mybigtv.com)。

这是一篇在知识共享署名许可(https://creativecommons.org/licenses/by/4.0/)下发布的开放获取文章,该许可允许在任何媒介上不受限制地使用、分发和复制,前提是原始作品首次发表在《医学互联网研究杂志》上,并适当引用。必须包括完整的书目信息,到//www.mybigtv.com/上原始出版物的链接,以及版权和许可信息。


Baidu
map