这是一篇开放获取的文章,根据创作共用署名许可协议(https://creativecommons.org/licenses/by/4.0/)的条款发布,允许在任何媒介上不受限制地使用、分发和复制,前提是正确引用最初发表在JMIR围手术期医学上的原创作品。必须包括完整的书目信息,http://periop.www.mybigtv.com上的原始出版物的链接,以及此版权和许可信息。
接受原发手术的早期乳腺癌患者,腋窝淋巴结负担低,可以安全地放弃腋窝淋巴结清扫术(ANC)。然而,常规使用腋窝超声(AUS)导致该组43%的患者在AUS阳性后出现不必要的ANC。机器学习与医学的交叉可以提供创新的方法来了解大型患者数据集中的特定风险,但这还没有在乳腺癌腋窝淋巴结管理领域进行试验。
这项研究的目的是评估机器学习技术是否可以用于提高术前对低和高腋窝转移负担患者的识别。
对术前有AUS的乳腺癌患者进行单中心回顾性分析,计算AUS的特异性和敏感性。采用人工神经网络、朴素贝叶斯、支持向量机、随机森林等标准统计学方法和机器学习方法,观察能否提高术前AUS的准确性,更好地识别腋窝负荷高低。
这项研究包括459名患者;142例(31%)AUS阳性;在该组中,88例(62%)ANC有2个或更少的大转移淋巴结。Logistic回归优于AUS(特异性0.950 vs 0.809)。在所有方法中,人工神经网络的准确率最高(0.919)。有趣的是,AUS在所有方法中灵敏度最高(0.777),突出了它在这种情况下的实用性。
我们证明,机器学习可以提高对无可触及腋窝疾病、超声阳性且有2个以上转移累及淋巴结的重要亚组患者的识别。在无明显淋巴结病变的患者中,超声阴性高度提示腋窝负荷较低,目前尚不清楚前哨淋巴结活检在这种情况下是否有价值。在这种情况下,需要对更多的患者进行进一步的研究,重点关注特定的乳腺癌亚群,以完善这些技术。
当代乳腺癌腋窝的管理旨在减少不必要的干预,同时提供最佳的肿瘤安全性。从历史上看,鉴于腋窝淋巴结状况对乳腺癌预后的重要性已得到公认[
腋窝超声(AUS)在英国乳腺肿瘤中心用于乳腺癌术前评估腋窝几乎无处不在。通常情况下,在AUS上观察到的可疑淋巴结可进行活检,并可切除以帮助术中识别[
人工神经网络是一种有监督的机器学习形式,它基于神经元最简单的计算模型——感知器。“网络顺向层中节点之间的连接是概率加权的;在第一层输入了描述数据集中某个项目的变量信息(例如“狗”或“猫”)后,网络试图正确地对项目的标签进行分类。这一过程在训练数据集上重复进行,同时模型在每次迭代之间更新连接的权重,以最小化其分类的错误。一旦优化,就可以将其部署到测试集中以验证其准确性。
本研究的目的是开展一项回顾性试点研究,利用机器学习方法(即人工神经网络)和传统统计模型(即线性回归)来帮助识别临床无可达淋巴结且术前AUS阳性且腋窝淋巴结负担低的患者。这样做的理由是,更好地识别这一亚组患者可以减少在术前AUS阳性的基础上进行不必要的ANC的患者数量,这在临床上是不显著的。
该研究在英国伦敦盖伊医院伦理委员会注册为临床审计,并于2019年2月获得批准(机构参考编号7608)。
本研究的第一部分是回顾性分析我院三级护理中心乳腺癌患者术前AUS的使用情况。2012年至2014年在英国伦敦盖伊医院(Guy’s Hospital)接受治疗的确诊乳腺癌患者术前有AUS,回顾性地从部门数据库中确定。AUS结果与患者性别;年龄;出生日期;原发肿瘤的大小、分级和类型;以及受体表型记录与任何腋窝手术干预和乳房手术的结果。用超声评估淋巴结使用以下报告异常淋巴结的标准:弥漫性或局灶性皮质增大,淋巴结脂肪门丢失,淋巴结肿大[
本研究的第二部分是使用机器学习和统计方法来尝试和改善对高或低腋窝负担患者的识别。高负担患者定义为2个以上的腋窝大转移淋巴结。低负担定义为患者中有0、1、2个大转移淋巴结或分离的肿瘤细胞或微转移。
两种模型都给出了以下患者特征来预测淋巴结负担:患者年龄、雌激素受体和HER2状态、肿瘤分级、原位存在相关导管癌、肿瘤类型(如浸润性导管癌和浸润性小叶癌)、肿瘤大小、有无淋巴血管侵犯以及术前AUS结果。
数据集采集和去识别后,使用pandas对数据集进行预处理[
逻辑回归是一种众所周知和广泛使用的技术,用于预测二元变量,并在预测变量不全是正态分布的情况下进行判别分析[
逻辑回归是一种标准的方法,唯一不平凡的问题是估计敏感性和特异性。如果用拟合数据在样本内计算,这些数据可能会被高估。因此,我们使用了一种计算上可行的样本外估计方法- k-fold交叉验证;与估计保留样本的敏感性相比,这是一种更好的数据使用方法。
该模型拟合了k次,依次排除每个“折叠”,然后仅使用与其他折叠的拟合来预测该折叠。折叠是通过将高负担病例和低负担病例分别洗牌,然后对样本进行划分,使高负担病例在折叠之间的百分比尽可能相等来产生的。我们使用了5次折叠,这通常被认为是足够的,而移动到10次折叠几乎没有什么区别。
该方法不是贝叶斯方法,但可以使用“模糊先验”来实现。“我们使用拉普拉斯的积分方法来获得贝叶斯解,当这样做时,患者负担低或高的概率略微向1/2移动,大约0.02,所以贝叶斯方法给出的预测稍微不太确定。”但是,分类没有改变,所以没有使用贝叶斯细化。
共459例乳腺癌患者在SNB术前接受了AUS或ANC初次手术。患者特征详细见于
病人的特点。所有患者均为女性。
特征 | 所有患者(N=459) | 低负荷(≤2个节点;n = 392) | 高负荷(>2个节点;n = 67) | ||||
年龄(年),平均值(范围,SD) | 57.11 (28-88, 13.85) | 57.48 (29-88, 13.80) | 54.97 (28-86, 14.05) | ||||
肿瘤大小(mm),平均值(范围,SD) | 28.29 (1.1-180, 24.05) | 25.48 (1.1-180, 20.4) | 44.99 (3-180, 35.1) | ||||
|
|||||||
|
浸润性导管癌 | 319 (69.5) | 260 (66.3) | 55 (82.1) | |||
|
浸润性小叶癌 | 69 (15) | 56 (14.3) | 8 (11.9) | |||
|
其他侵入性类型 | 41 (8.9) | 39 (10) | 2 (3) | |||
|
原位隔离病 | 30 (6.5) | 30 (7.7) | 0 (0) | |||
|
|||||||
|
1 | 48 (10.5) | 45 (11.5) | 3 (4.5) | |||
|
2 | 204 (44.4) | 177 (45.2) | 27日(40.3) | |||
|
3. | 176 (38.3) | 139 (35.5) | 37 (55.2) | |||
|
未指定 | 2 (0.4) | 2 (0.5) | 0 (0) | |||
|
|||||||
|
优质 | 194/269 (72.1) | 7/222 (3.2) | 0/47 (0) | |||
|
中间级 | 68/269 (25.3) | 58/222 (26.1) | 10/47 (21.3) | |||
|
低品位 | 7/269 (2.6) | 157/222 (70.7) | 37/47 (78.7) | |||
|
|||||||
|
鲁米那一个 | 332 (72.3) | 283 (72.2) | 67 (71.6) | |||
|
腔的B | 30 (6.5) | 23日(5.9) | 48 (10.5) | |||
|
三负 | 65 (14.2) | 58 (14.8) | 6 (9) | |||
|
HER2 | 13 (2.8) | 8 (2.2) | 5 (7.5) | |||
|
未指定 | 19日(14.1) | 20 (5.1) | 1 (1.5) | |||
|
|||||||
|
WLEc | 257 (56) | 210 (53.6) | 25 (37.3) | |||
|
乳房切除术 | 193 (42) | 151 (38.5) | 41 (61.2) | |||
|
存在淋巴血管侵犯 | 114 (24.8) | 73 (18.6) | 41 (61.2) |
一个导管原位癌。
b该类患者总人数为269/459 (58.6%);低负担(≤2个淋巴结)患者222例(56.6%);高负担(>2淋巴结)患者总数为47例(70.2%)。此类别下的所有其他百分比都是根据这些分母计算的。
cWLE:局部广泛切除。
术前AUS阳性142例(31%),阴性285例(62.09%),不确定32例(6.97%)。在超声检查阳性的患者中,有54例(38.03%)腋下淋巴结多于2个,88例(62%)腋下淋巴结少于2个。在超声检查为阴性的患者中,304例(95.9%)SNB有2个或少于2个阳性淋巴结(
超声阳性和阴性患者腋窝淋巴结负担的比较。
节点的负担 | 超声阴性(N=317), N (%) | 超声阳性(N=142), N (%) |
两个或更少节点 | 304 (95.9) | 88 (62) |
2个以上节点 | 13 (4.1) | 54 (38) |
与术前AUS相比,所有应用于这些数据的机器学习和统计模型都提供了更好的特异性(
表现最好的模型是logistic回归,特异性为0.950。这是通过牺牲灵敏度(0.462)来实现的。如果在该患者队列中使用逻辑回归,66/459 (14.3%)AUS阳性且腋窝负担低的患者将被确定为AUS阳性,从而避免不必要的ANC;20/459(4.3%)患者会被错误地归类为低负担,但根据目前的做法,这些患者会经历SNB,并可能在那时被确定为高负担。通过logistic回归确定的最重要的协变量是AUS异常、淋巴血管侵犯、肿瘤大小以及浸润性导管癌和浸润性小叶癌肿瘤类型。
人工神经网络、支持向量机、朴素贝叶斯和随机森林分类器都优于术前超声的特异性,但都不能提高其敏感性(
术前超声与逻辑回归和机器学习模型的比较。
方法 | 特异性 | 灵敏度 | 精度 |
术前腋窝超声 | 0.809 | 0.777 | 0.820 |
逻辑回归 | 0.950 | 0.462 | 0.880 |
朴素贝叶斯 | 0.947 | 0.476 | 0.874 |
人工神经网络 | 0.936 | 0.727 | 0.919 |
支持向量机 | 0.934 | 0.615 | 0.904 |
随机森林 | 0.911 | 0.455 | 0.874 |
对163个时代的人工神经网络进行训练。
我们的研究结果表明,逻辑回归和机器学习方法可以有效地减少不必要的ANC患者数量。由于目前的做法导致43%的早期乳腺癌患者,腋窝淋巴结不可见,超声为阳性的患者接受了这种过度治疗,这是乳腺癌患者术前检查的一个有价值的补充,对临床实践具有重要意义。
在这个数据集中,逻辑回归表现最好。逻辑回归的高特异性的特别成功是以低敏感性为代价的。然而,这种权衡在腋窝分期的情况下是有利的,因为被认为是低风险的患者将接受SNB。因此,被逻辑回归错误地分类为低负担的潜在患者群体将被识别出来,而不是不治疗。因此,尽管人工神经网络的准确性优于其他模型,但逻辑回归是数据所呈现的问题的最佳模型。事实上
这项研究证实,机器学习可以成功地应用于乳腺癌患者的术前评估,尽管它在这项任务的特异性优化上不能优于逻辑回归。ANN的总体准确度最高,这意味着如果负性成像后的SNB不是标准护理,它将是最有用的工具。更大和更高维度的数据集可能会提供一个机器学习可以发挥优势的舞台,特别是考虑到它有潜力将使用卷积神经网络的图像分析技术和本研究中使用的标准数据结合起来[
事实上,没有一种模型能够改善AUS的敏感性,这强调了这种成像方式在临床淋巴结阴性乳腺癌人群中帮助排除腋窝疾病的价值。来自5139例患者的荟萃分析证据显示,在这种情况下,超声的阴性预测值为0.951 (95% CI 0.941-0.960) [
这项研究有几个局限性。它们主要源于这样一个事实,即这项研究是一个概念验证的想法,展示了机器学习技术在乳腺手术队列中的应用,应用于一般乳腺癌患者人群中的特定临床和放射学问题,但无法进一步描述该人群中亚组之间的重要风险差异。例如,它没有包括一些重要的患者因素和数据点,这些因素和数据点可能被证明对在现实场景中实现之前优化模型很重要;作者希望纳入进一步模型的参数示例包括绝经状态和淋巴结活检病理结果。本研究适用于临床实践的进一步限制是,它没有考虑正在接受初级全身治疗的患者,其适应证已增加[
尽管AUS作为一种具有吸引力的非侵入性和广泛可用的工具,但其较差的特异性使其无法可靠地识别临床阴性腋窝和显著淋巴结负担(即超过2个大转移淋巴结)的患者。logistic回归和机器学习方法的加入,可以根据患者特征和AUS结果提供有价值的预测,大大减少腋窝手术过度治疗,显著提高临床上无明显疾病患者高淋巴结负担的识别准确性。这两部分在术前腋窝分期方面的改进是非常可取的,有可能省去许多患者不必要的腋窝手术;然而,考虑到本研究患者群体的异质性,有必要通过国际多中心试验进一步完善模型以确认结果。
腋窝淋巴结清扫
人工神经网络
腋窝超声波
前哨淋巴结活检
没有宣布。