这是一篇开放获取的文章,根据创作共用署名许可(https://creativecommons.org/licenses/by/4.0/)的条款发布,允许在任何媒介上无限制地使用、分发和复制,前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。
肿瘤学领域处于医疗保健领域人工智能(AI)进步的前沿,为研究这些技术在临床研究和患者护理中的早期整合提供了机会。人们希望人工智能将彻底改变医疗保健服务并改善临床结果,同时也担心这些技术对卫生公平的影响。
我们的目标是对文献进行范围审查,以解决这个问题,“人工智能技术对肿瘤学健康公平的当前和潜在影响是什么?”
根据PRISMA-ScR(范围评价的系统评价和元分析扩展的首选报告项目)范围评价指南,我们从2000年1月到2021年8月系统地检索了MEDLINE和Embase电子数据库,以查找涉及人工智能、卫生公平和肿瘤学关键概念的记录。我们收录了所有涉及这3个关键概念的英语文章。文章定性分析了有关人工智能对肿瘤学卫生公平影响的主题。
在14,011条记录中,有133条(0.95%)来自我们的审查。我们在文献中确定了3个一般主题:使用人工智能来减少医疗保健差距(58/ 133,43.6%),对人工智能技术和偏见的担忧(16/ 133,12.1%),以及使用人工智能来检查健康的生物和社会决定因素(55/ 133,41.4%)。总共有3%(4/133)的文章关注这些主题。
我们的范围综述揭示了人工智能对肿瘤学健康公平影响的3个主要主题,涉及人工智能帮助解决健康差异的能力,缓解或加剧偏见的潜力,以及帮助阐明健康决定因素的能力。文献中的空白包括缺乏对在低收入和中等收入国家应用人工智能技术所面临的伦理挑战的讨论,缺乏对人工智能算法中偏见问题的讨论,以及缺乏使用人工智能技术而不是传统统计方法来解决肿瘤学中特定研究问题的理由。我们的综述强调了解决这些差距的必要性,以确保在癌症研究和临床实践中更公平地整合人工智能。本研究的局限性包括其探索性、关注肿瘤学而非所有医疗保健领域以及仅对英语文章进行分析。
人工智能(AI)是一个旨在创造能够实现类似人类理解并执行通常与人类智能相关的任务的计算机的领域,它在医疗保健和公共卫生领域的应用越来越多。
尽管人工智能有其前景,但在医疗保健领域的使用引发了几个道德问题,最引人注目的是对偏见的担忧,以及人工智能系统对卫生公平产生负面影响的可能性。卫生公平被定义为"具有不同程度潜在社会优势/劣势的群体之间在健康方面不存在系统性差异" [
本文对文献的范围进行了综述,旨在解决以下问题:“人工智能应用对肿瘤学健康公平的当前和潜在影响是什么?”我们分析了当代人工智能在肿瘤学中的应用文献,重点关注对卫生公平的影响,以确定反复出现的主题以及未来研究的重要差距和领域。
我们的范围审查方案遵循先前建立的方法[
我们使用了一种敏感的搜索策略,以确定关于人工智能对肿瘤学健康公平影响的现有文献的代表性样本。基于包含受控词汇表的同义搜索的组合,例如MEDLINE中的医学主题标题或Embase中的EMTree描述符,以及使用替代单词拼写和结尾的自由文本术语的3个核心概念:
此外,使用基于网络的搜索引擎谷歌Scholar来识别未在书目数据库中索引的其他潜在相关研究。所有相关检索文章的书目也被检查,以确定进一步的相关研究。为了获取关于肿瘤学中人工智能和健康公平的文献的广度,我们没有基于研究类型施加限制,而是包括了临床研究——即应用人工智能并评估特定临床干预的研究,无论是诊断、预后、筛查还是治疗计划——评论和意见文章。对只使用英语的文章进行了限制,因为这是研究团队熟练使用的主要语言,因此可以对所选文章进行详细和严格的审查。从电子搜索中识别的所有记录都导入到Covidence系统审查软件(Veritas Health Innovation)中进行进一步分析和筛选。
在重复的记录被删除后,2名审稿人(PI和WSL)使用纳入和排除标准独立筛选所选记录的标题和摘要,这些标准是先验定义的:在标题和摘要筛选期间,如果这些记录提到了核心概念(人工智能、健康公平和肿瘤学)或相关术语,则会被选择。不符合纳入标准或涉及非人类参与者的摘要被排除在外。所有冲突都由第三个审查员(BCY)解决。然后由所有3位审稿人(PI、WSL和BCY)在全文评审中重新评估所选摘要列表,以确定与研究问题相关的记录。产生一致意见的记录被选择进行全文审查,而那些没有涉及3个关键概念的记录被排除在外。通过所有3名审稿人的讨论解决了冲突。所有3位作者都进行了进一步的全文审查,进一步应用了资格标准。
数据提取和分析包括描述性和定性成分。描述性地,我们提取了关于发表年份、高级作者所属国家、高级作者所属机构类型、研究类型、人工智能类型、癌症类型以及在可用时提出的技术成本的数据。资深作者所属的国家根据最新的联合国分类分为高收入、低收入和中等收入[
我们的搜索得到了14,011条记录。剔除重复文献后,共筛选10,468篇文献,其中133篇符合纳入标准[
用于通过数据库和登记册识别研究的PRISMA-ScR(用于系统评价和范围评价的元分析扩展的首选报告项目)流程图。AI:人工智能。
范围综述中纳入研究的特征(n=133)。
研究特点 | 研究,n (%) | ||
|
|||
|
2000 - 2017 | 9 (7.5) | |
|
2018 | 13 (9.8) | |
|
2019 | 21日(15.8) | |
|
2020 | 48 (36.1) | |
|
2021 | 42 (31.6) | |
|
|||
|
临床 | 62 (46.6) | |
|
流行病学 | 40 (30) | |
|
审查 | 15 (11.3) | |
|
评论 | 11 (8.3) | |
|
调查和访谈 | 5 (3.8) | |
|
|||
|
学术 | 121 (91) | |
|
政府和非政府组织 | 12 (9) | |
|
|||
|
筛选 | 41 (30.8) | |
|
诊断 | 41 (30.8) | |
|
治疗 | 15 (11.3) | |
|
预后 | 45 (33.8) | |
|
流行病学 | 45 (33.8) | |
|
|||
|
一般 | 28日(21.1) | |
|
妇科 | 19日(14.3) | |
|
乳房 | 16 (12) | |
|
口服 | 12 (9) | |
|
前列腺癌 | 12 (9) | |
|
皮肤 | 12 (9) | |
|
肺 | 八(6) | |
|
血液 | 6 (4.5) | |
|
大脑 | 4 (3) | |
|
肝 | 4 (3) | |
|
结直肠 | 3 (2.3) | |
|
食管 | 3 (2.3) | |
|
头颈部 | 2 (1.5) | |
|
胰腺 | 2 (1.5) | |
|
胃肠 | 1 (0.8) | |
|
甲状腺 | 1 (0.8) |
一个包容性。
b基于资深作者的从属关系。
c由于26篇文章属于多个类别,总数超过133篇。
资深作者所属国家(使用MapChart创建的地图)。
我们综述的研究调查了广泛的癌症,主要是普通肿瘤应用(28/ 133,21.1%),其次是妇科(19/ 133,14.3%)、乳腺癌(16/ 133,12%)、口腔癌(12/ 133,9%)、前列腺癌(12/ 133,9%)和皮肤科癌症(12/ 133,9%)。在关于妇科癌症的文章中,84%(16/19)属于主题1,讨论了使用人工智能技术来解决妇科癌症筛查中的差异(11/ 16,70 %)[
检查乳腺癌的文章讨论了与卫生公平有关的更广泛的主题。在16篇文章中,6篇(38%)集中于主题1 [
我们确定了与人工智能对肿瘤学健康公平影响相关的三个主要主题:(1)发展人工智能技术以减少中低收入国家和高收入国家人口面临的健康差距;(2)担心有偏见的人工智能算法可能会加剧健康不平等,而希望人工智能技术可能有助于克服人类偏见;(3)人工智能在揭示肿瘤学健康的生物学和社会决定因素方面的力量。主题在适用时进一步细分为子主题。按主题分类的文章的完整列表可以在
根据记录数量,我们的分析中最突出的主题是人工智能技术的发展,以解决肿瘤学中的健康差异(58/133,43.6%)。这包括利用人工智能来解决低收入和中等收入国家(53/133,39.8%)和高收入国家(3/133,2.3%)服务不足人群在获得筛查、诊断和治疗技术方面的差异。133项研究中,2项(1.5%)使用人工智能来解决中低收入国家和高收入国家的差异。关于这一主题的共有16篇文章是评论或评论,讨论了癌症治疗中的多种应用。在58篇文章中,有17篇(29%)被描述为试点研究。我们根据人工智能技术的类型,包括人工智能应用,进一步将该主题划分为几个子主题,以分析基因组、组织学、放射学、图像和人口统计学数据。
这一主题下的文献强调了技术如何改善向中低收入国家和高收入国家的弱势群体提供保健服务。在中低收入国家,这些技术旨在解决两个主要问题:解决卫生保健人员短缺问题,从而减少卫生保健专业人员与所服务人群比例低造成的瓶颈效应,并克服医疗设备有限造成的限制[
旨在缩小健康差距的人工智能的发展利用了一系列数据,从基因组学和成像到人口数据,所有这些数据都旨在减少对资源不足的卫生保健系统的需求,并改善现有的医疗设备。一个例子是用于乳腺癌检测的AI图像分析算法,通过将深度学习应用于新型超声技术,提高了服务不足和资源匮乏环境下的筛查[
研究报告了一系列结果,筛查和诊断技术在敏感性(75%-100%)、特异性(71%-100%)和准确性(61%-100%)方面存在很大差异。大多数关于这一主题的研究(43/ 58,74%)没有在拟议技术的性能和现有护理标准之间进行比较。当人工智能算法与护理标准直接比较时,结果有所不同。大多数文章都指出人工智能算法和护理标准之间没有区别[
尽管有几篇文章强调了人工智能如何帮助解决中低收入国家的医疗保健短缺问题,但文献中提到的一个经常性问题是缺乏对实施这些人工智能技术所需的基础设施和人力资源的考虑。为支持使用数字技术,特别是人工智能,中低收入国家既需要接受过使用特定技术培训的医疗保健提供者,也需要足够的技术基础设施,包括可以容纳硬件的建筑物和用于传输数字信号的电缆,从而实现广泛和稳定的互联网接入;换句话说,人工智能算法的性能与社会技术因素交织在一起[
此外,我们的审查发现了与人工智能技术成本相关的公平问题;这些技术可能很昂贵,在现有经济环境下,许多中低收入国家可能无法负担。爱情等[
为了确保为高收入国家设计的人工智能技术能够有效地应用于低收入和中等收入国家,这两种环境之间的合作是非常宝贵的。在低收入和中等收入国家进行的42项研究中,有11项(26%)是由来自低收入和中等收入国家的研究小组领导的,在剩余的31项记录中,有27项涉及与来自特定低收入和中等收入国家的合著者合作。当这种合作发生时,人工智能技术主要在高收入国家设计,在低收入和中等收入国家实施。由于成本问题,人工智能在全球肿瘤学领域的发展地点和实施地点之间的差异可能会对中低收入国家的整合构成障碍[
围绕人工智能在中低收入国家的使用提出的另一个问题是数据殖民主义问题[
在我们的审查中确定的第二个主题与偏见问题有关。人工智能的偏见是一个广泛讨论的话题,有可能加剧不同人群之间的健康差距;虽然偏见是所有人工智能系统的固有特征,但道德问题的主要类型是在算法开发或数据集中产生的偏见[
随着人们对人工智能偏见的担忧日益加剧[
在医疗保健领域使用人工智能技术可以发现数据集和医生行动中的偏差。例如,头颈部癌症可能自发发展,或与人乳头瘤病毒(HPV)有关,对此类癌症的定性可影响治疗决策[
我们还确定了讨论使用人工智能来减轻临床医生决策中的偏见的文章。Okoji等人在批评皮肤病学中的Fitzpatrick量表时[
本主题的最后一类是讨论使用有偏见的数据集来训练AI算法的文章;令人惊讶的是,很少有文章讨论这个话题。例如,Khor等人[
总体而言,考虑到这一担忧在人工智能伦理文献的其他地方被广泛讨论,并可能成为人工智能系统加剧卫生不平等的一种机制,因此对肿瘤学中使用人工智能导致的偏见问题的参与是有限的,这是一个意外的发现。我们的研究结果表明,在肿瘤学中的人工智能文献中,偏见仍然是一个未被充分探索的主题。同样值得注意的是,少数几篇提到偏差的文章往往在局限性部分简单地提到了偏差,通常是指有偏差的数据集如何影响AI算法的有效性和可泛化性,但没有进一步涉及如何通过未来的研究减轻或解决这些问题。
我们在综述中确定的最后一个主题是使用人工智能来调查肿瘤学健康结果的决定因素。共有41.4%(55/133)篇文章属于这一主题,并根据所审查的健康决定因素分为子主题,从生物变量(9/133,6.8%)到健康的社会决定因素(43/133,32.3%),而2.3%(3/133)篇文章同时关注这两个主题。这一类别可以理解为在肿瘤学临床和流行病学研究中使用人工智能作为传统统计模型的延伸。
这一主题下的几篇文章将人工智能应用于基因组数据,以预测癌症患者的预后。例如,Li等[
尽管有几项研究以简化的方式类似地应用人工智能,例如寻找健康差异的遗传基础[
人工智能还被用于识别癌症预后的种族差异。托萨斯等人[
人工智能还被用于研究农村和城市居民对癌症患病率和结果的影响。众所周知,农村住宅会影响癌症治疗的获得,而新的治疗方法往往集中在位于城市环境的学术中心[
对于我们综述中的大多数研究,缺乏使用人工智能的理由,更具体地说,缺乏关于为什么选择特定的人工智能算法以及它们相对于其他统计方法的优势来解决给定的研究问题的讨论。不可否认,人工智能算法是分析大量数据和选择提到人工智能优于其他统计方法的文章的强大工具[
在这篇综述中,我们评估了关于人工智能对肿瘤学健康公平影响的文献。在我们的搜索中,我们确定了14,011条记录,其中133条(0.95%)基本上涉及人工智能、卫生公平和肿瘤学的核心概念。我们的文献综述揭示了人工智能技术如何(1)帮助解决健康差异,(2)减轻或加剧有偏见的决策,(3)阐明癌症结果的生物学和社会决定因素的三个主要主题。这些主题涉及肿瘤学和医疗保健领域人工智能和卫生公平文献中讨论的几个问题。
我们在综述中指出的第一个主题是人工智能技术如何帮助解决中低收入国家和高收入国家的健康差距。先前研究人工智能在全球肿瘤学中的应用的学术研究揭示了文献中讨论过的许多实际和伦理挑战[
文献中讨论的人工智能技术在低收入和中等收入国家实施的另一个障碍是,主要在低收入和中等收入国家设计但应用于低收入和中等收入国家的算法缺乏通用性[
我们的审查还侧重于解决人工智能技术在全球卫生背景下的整合所带来的挑战,这些挑战在文献的其他地方已经提出,其中最主要的是高收入国家和中低收入国家在人工智能技术开发方面加强合作[
为了改善全球卫生研究的合作,其他人提议,发表在中低收入国家进行的研究的期刊有责任确保参与研究的至少一名作者来自有关国家[
最后,必须在全球推广现有诊断和治疗技术与发展促进全球健康的新技术之间取得平衡。我们的综述揭示了人工智能在全球肿瘤学中的试点研究特别普遍。虽然试点研究可以提供一个重要的起点,但如果没有随后进行强有力的评估来衡量这些技术的临床效果,那么这种情况只发生在少数病例中[
我们在综述中注意到的第二个主要主题是在临床决策中使用有偏见的人工智能算法,这可能会影响决策的质量和准确性,从而导致患者的不良健康结果[
尽管这些问题很紧迫,但在我们的搜索中,关于有偏见的AI算法的研究却很少,这令人惊讶。在我们的研究中发现的许多人工智能应用程序都接受了从单个机构选择数据集的训练,这产生了很高的偏差风险,这应该是一个紧迫的问题,因为算法偏差可能会加剧健康不平等[
我们在综述中确定的最后一个主题是使用人工智能来检查肿瘤学健康结果的决定因素。健康的社会决定因素,如教育、社区、社会社区和社会经济地位影响肿瘤学的健康结果[
然而,正如几位研究人员在比较使用人工智能与传统统计方法来分析大量数据时所指出的那样,在调查健康的社会决定因素方面,前者比后者有什么好处并不总是清楚[
文献中也提出了关于使用人工智能分析大量医疗数据的伦理问题。在建立医疗ML的研究伦理框架时,McCraden等人[
最后,需要指出的是,在医疗保健研究中使用人工智能有助于分析定量和分类数据,限制了其理解和解释许多社会和健康相关现象的能力。在人工智能算法中使用种族和其他有争议的社会类别,往往依赖于第三方分类,这可能会造成误解[
我们的研究有几个局限性。首先,人工智能在肿瘤学中的应用是一个快速发展的领域,因此,我们在范围审查中确定的主题和差距必然是临时的。为了帮助缓解这一问题,我们在最初的搜索9个月后进行了二次搜索,产生了额外的949篇摘要,其中21篇(2.2%)符合纳入标准。尽管进化如此之快,但我们的研究结果为人工智能对肿瘤学健康公平影响的文献现状提供了深入的见解,也可能为人工智能技术在医疗保健领域的早期整合提供了一个更广泛的视角。其次,我们将搜索战略集中在肿瘤学和当代癌症研究领域;虽然强调的主题和差距可能说明了在整个卫生保健中整合新技术所产生的更普遍的卫生公平问题,但可能还有与我们的审查未涵盖的其他卫生保健领域有关的其他主题。最后,我们的搜索仅限于用英语书写的记录;我们无法收录以其他语言发表的文章,这可能会使我们的发现偏向于在英语世界进行的研究和主题;进一步的工作可能会涉及一个多语言研究团队,以阐明非英语研究文献中的主题。
总之,我们进行了范围综述,以描述和评估关于人工智能对肿瘤学健康公平影响的文献。我们的分析确定了3个一般性主题,涉及人工智能如何用于解决健康差异,人工智能算法如何减轻或加剧偏见,以及人工智能如何帮助调查健康的社会决定因素。我们的综述还确定了几个空白和需要进一步研究的领域。其中包括促进高收入国家和中低收入国家在人工智能技术设计方面加强合作,确保培训数据集中的代表性,考虑算法开发和应用的背景以减轻偏见,并认识到使用人工智能调查癌症结果的决定因素所产生的伦理和方法问题。随着人工智能在肿瘤学中的应用不断扩大,对这些问题的关注对于防止伤害和确保这些技术的潜在利益的公平分配至关重要。
完整的搜索策略。
主题1文章:人工智能解决健康差距。
主题2文章:人工智能和偏见。
主题3文章:人工智能和健康的决定因素。
Multiple-theme文章。
人工智能
高收入国家
人类乳头状瘤病毒
中低收入国家
机器学习
系统评价和元分析扩展范围评价的首选报告项目
作者要感谢AMS医疗保健对这个项目的资助,以及Luke Stark博士对这篇手稿早期草稿的宝贵意见。
没有宣布。