TY - JOUR AU - Schmitt, Max AU - Maron, Roman Christoph AU - Hekler, Achim AU - Stenzinger, Albrecht AU - Hauschild, Axel AU - Weichenthal, Michael AU - Tiemann, Markus AU - Krahl, Dieter AU - Kutzner, Heinz AU - Utikal, Jochen Sven AU - Haferkamp, Sebastian AU - Kather, Jakob Nikolas AU - Klauschen, Frederick AU - Krieghoff-Henning, Eva AU - Fröhling, Stefan AU - von Kalle, Christof AU - Brinker,提图斯约瑟夫PY - 2021 DA - 2021/2/2 TI -隐变量在深度学习数字病理及其可能造成批量效应:预测模型研究乔- J地中海互联网Res SP - e23436六世- 23 - 2 KW -人工智能KW——机器学习KW -深度学习KW -神经网络KW -卷积神经网络KW -病理KW -临床病理学KW -数字病理KW -陷阱KW -工件AB -背景:越来越多的数字病理学研究表明,人工智能(AI)有潜力利用组织学整张幻灯片图像诊断癌症,这需要大量不同的数据集。虽然多样化可能会产生更一般化的基于ai的系统,但它也可能引入隐藏变量。如果神经网络能够区分/学习隐藏变量,这些变量可能会引入损害分类系统准确性的批处理效应。目的:本研究的目的是分析典型的隐变量选择(患者年龄、切片制备日期、切片起源和扫描仪类型)的可学习性,这些隐变量通常存在于数字病理学的整个切片图像数据集中,并可能产生批处理效果。方法:我们训练了四个独立的卷积神经网络(cnn)来学习四个变量,使用来自五个不同研究所的数字化全幻灯片黑色素瘤图像数据集。为了鲁棒性,每次CNN训练和评估运行都要重复多次,只有当一个变量的平均平衡准确率的95%置信区间下界大于50.0%时,才认为该变量是可学习的。结果:即使在考虑95%置信区间的下限时,所有四个任务的平均平衡准确率也达到了50.0%以上。任务之间的表现差异很大,从56.1%(幻灯片制作日期)到100%(幻灯片起源)不等。 Conclusions: Because all of the analyzed hidden variables are learnable, they have the potential to create batch effects in dermatopathology data sets, which negatively affect AI-based classification systems. Practitioners should be aware of these and similar pitfalls when developing and evaluating such systems and address these and potentially other batch effect variables in their data sets through sufficient data set stratification. SN - 1438-8871 UR - //www.mybigtv.com/2021/2/e23436 UR - https://doi.org/10.2196/23436 UR - http://www.ncbi.nlm.nih.gov/pubmed/33528370 DO - 10.2196/23436 ID - info:doi/10.2196/23436 ER -
Baidu
map