JMIR J医学网络杂志 医学互联网研究杂志 1438 - 8871 卡塔尔世界杯8强波胆分析 加拿大多伦多 v22i5e16084 32369034 10.2196/16084 原始论文 原始论文 一个用户友好的,基于web的生存分析综合工具(ESurv):开发和验证研究 Eysenbach 冈瑟 Suh Sunghwan Borcherding 尼古拉斯 Pak Kyoungjune 医学博士 1 https://orcid.org/0000-0001-5051-1894 Sae-Ock 医学博士 2 https://orcid.org/0000-0002-9365-7831 Tae食 医学博士 3. https://orcid.org/0000-0003-1861-5647 Heo 惠金 博士学位 2 https://orcid.org/0000-0002-4929-798X Myoung-Eun 博士学位 2 https://orcid.org/0000-0001-6083-0485 Dae千 4 https://orcid.org/0000-0001-9545-4758 Chi-Seung 博士学位 5 6 https://orcid.org/0000-0002-6840-7750 唱ydF4y2Ba Hokeun 博士学位 7 https://orcid.org/0000-0001-8351-2025 Junho 8 https://orcid.org/0000-0003-3430-0960 苛性碱水 英航 8 https://orcid.org/0000-0002-8480-3913 Soohwan 英航 8 https://orcid.org/0000-0003-4434-852X Kwon 恩俊 英航 8 https://orcid.org/0000-0001-9290-5218 霁广域网 英航 8 https://orcid.org/0000-0003-2300-877X Yun Hak) 医学博士 2
医学院解剖学系 釜山大学 49 Busandaehak-ro Yangsan 50612 大韩民国 82 515108091 yunhak10510@pusan.ac.kr
8 https://orcid.org/0000-0002-9796-8266
核医学系 釜山大学医院 釜山 大韩民国 医学院解剖学系 釜山大学 Yangsan 大韩民国 整形外科 釜山大学医院 釜山 大韩民国 德勤分析集团 德勤咨询有限责任公司 首尔 大韩民国 生物医学研究所 釜山大学医院 釜山 大韩民国 医学院生物医学工程系“, 釜山大学 釜山 大韩民国 统计处 釜山大学 釜山 大韩民国 医学院生物医学信息系“, 釜山大学 Yangsan 大韩民国 通讯作者:Yun Hak Kim yunhak10510@pusan.ac.kr 5 2020 5 5 2020 22 5 e16084 2 9 2019 22 10 2019 13 11 2019 25 3. 2020 ©Kyoungjune Pak, sai - ock Oh, Tae Sik Goh, Hye Jin Heo, Myoung-Eun Han, Dae - Cheon Jeong, Chi-Seung Lee, Hokeun Sun, Junho Kang, Suji Choi, Soohwan Lee, Eun Jung Kwon, Ji Wan Kang, Yun - Hak Kim。最初发表于《医学互联网研究杂志》(//www.mybigtv.com), 2020年05月05日。 2020

这是一篇开放获取的文章,根据创作共用署名许可协议(https://creativecommons.org/licenses/by/4.0/)发布,该协议允许在任何媒体上不受限制地使用、分发和复制,前提是要正确引用最初发表在《医学互联网研究杂志》上的原始作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物链接,以及版权和许可信息。

背景

预后基因或基因签名已被广泛用于预测患者的生存和帮助作出有关治疗行动的决定。尽管一些基于网络的生存分析工具已经被开发出来,但它们有一些局限性。

客观的

考虑到这些限制,我们开发了ESurv(简单、有效和优秀的生存分析工具),这是一个基于web的工具,可以使用用户派生的数据或来自癌症基因组图谱(TCGA)的数据进行高级生存分析。用户可以使用TCGA的多组学数据进行单变量分析和分组变量选择。

方法

我们使用R编码基于TCGA多组学数据的生存分析。为了进行这些分析,我们排除了信息不足的患者和基因。当有两种类型时(例如,化疗:否或是),临床变量被分类为0和1,当特征有3个或更多结果时(例如,关于侧性:右、左或双侧),使用虚拟变量。

结果

通过单因素分析,ESurv可以通过生存曲线(中位数或最佳截止值)、曲线下面积(AUC)和受试者工作特征(ROC)来确定单基因的预后意义。用户可以根据临床变量的多组学数据或分组变量选择(套索、弹性网正则化和网络正则化高维cox -回归)获得预后变量签名,并选择与上述相同的输出。此外,用户可以使用各种感兴趣的基因为特定癌症创建定制的基因签名。ESurv最重要的功能之一是,用户可以使用自己的数据进行所有的生存分析。

结论

ESurv使用了适用于高维数据(包括遗传数据)和综合生存分析的先进统计技术,克服了以前基于web的工具的局限性,将帮助生物医学研究人员轻松地进行复杂的生存分析。

生存分析 分组变量选择 癌症基因组图谱 基于网络的工具 用户服务
简介

随着下一代测序技术的发展,大量基因组数据的积累正在为精准医疗铺平道路[ 1- 4].特别是,基因表达谱或签名已被广泛用于预测患者预后,并协助决定各种癌症的治疗策略[ 2 5- 9].

基因组数据集是高度可变的,随着患者数量的增加,这种变异性也随之增加,使其在本质上成为高维数据。为了有效地连接高维基因组数据和生存数据,统计学家在考克斯比例风险模型的基础上,开发了分组变量选择模型,包括:最小绝对收缩和选择算子(套索)、弹性网正则化(弹性网)和网络正则化高维考克斯回归(Coxnet,以下简称net) [ 2 10- 13].在这些方法中,由于考虑到生物网络的复杂性,Net被发现在这些应用中过拟合问题最少,预测性能最高[ 2 6 8 10 14].

使用大型数据库成功地识别和验证预后因素在医学研究中是必不可少的,但这对不熟悉计算机科学的研究人员来说可能是困难的。为了解决这一未被满足的临床需求,一些基于网络的生存分析工具已经被开发出来。尽管这些工具有一定的局限性,但它们已被用于一些单变量分析[ 15- 18].SurvExpress [ 19, PROGgene [ 20.],以及predicscan [ 21]是流行的基于网络的生存分析工具,仅使用信使RNA (mRNA)表达数据计算预后的统计意义[ 15- 18].以往工具的局限性包括:(1)将mRNA表达作为一个简单的分类值来提供所有患者的Kaplan-Meier曲线,而不考虑患者的特征。使用像mRNA这样的连续变量作为分类因子可能会任意地改变变量的性质,导致严重的错误。(2)在预测预后方面,这些工具并没有提供统计上优于单一基因的基因/变量特征。(3)他们没有考虑像组织学类型那样的癌症分类。(4)用户不能使用自己的数据。(5)这些工具不能提供高质量的图像和表格结果。(6)用户不能通过指定感兴趣的基因来创建风险评分系统。

为了克服这些限制,我们开发了ESurv(简单,有效,优秀的生存分析工具[ 22),这是一个从癌症基因组图谱(TCGA)或用户数据中识别泛癌症预后生物标志物的在线web资源。

方法 处理来自患者的遗传和临床信息

我们基于多组学和TCGA ( 表1),通过Broad GDAC Firebrowse获取[ 23]及GDC数据门户[ 24- 26].我们使用了三级RNAseq (RNA测序)、miRNAseq (microRNA测序)和甲基化阵列数据。排除标准:0值大于10%的基因(当缺失数据量大于10%时,结果可能有偏差)[ 27]、总体生存信息(生存时间或状态)不足的患者、TCGA中存在配对的正常组织和转移样本的患者。

ESurv中可用数据的摘要。

具有可用组学数据的癌症 信使RNA(是/否) 微rna(是/否) 甲基化(是/否) 总患者数,n
急性髓系白血病 是的 是的 是的 200
肾上腺皮质癌 是的 是的 是的 92
膀胱尿路上皮癌 是的 是的 是的 412
脑低级别胶质瘤 是的 是的 是的 515
乳腺浸润性癌 是的 是的 是的 1097
宫颈及宫颈内腔癌 是的 是的 是的 307
胆管癌 是的 是的 是的 45
结肠腺癌 是的 是的 是的 458
食管癌癌 是的 是的 是的 185
多形性成胶质细胞瘤 是的 没有 是的 595
头颈部鳞状细胞癌 是的 是的 是的 528
肾脏chromophobe 是的 是的 是的 113
肾透明细胞癌 是的 是的 是的 537
肾乳头状细胞癌 是的 是的 是的 291
肝肝细胞癌 是的 是的 是的 377
肺腺癌 是的 是的 是的 522
肺鳞癌 是的 是的 是的 504
淋巴样肿瘤弥漫性大B细胞淋巴瘤 是的 是的 是的 48
间皮瘤 是的 是的 是的 87
卵巢浆液性囊腺癌 是的 是的 没有 591
胰腺腺癌 是的 是的 是的 185
嗜铬细胞瘤和副神经节瘤 是的 是的 是的 179
前列腺腺癌 是的 是的 是的 499
直肠腺癌 是的 是的 是的 171
肉瘤 是的 是的 是的 261
皮肤皮肤黑色素瘤 是的 是的 是的 470
胃腺癌 是的 是的 是的 443
睾丸生殖细胞瘤 是的 是的 是的 134
胸腺瘤 是的 是的 是的 124
甲状腺癌 是的 是的 是的 516
子宫癌肉瘤 是的 是的 是的 57
子宫内膜癌 是的 是的 是的 548
葡萄膜黑色素瘤 是的 是的 没有 80
Net处理临床变量

临床变量(肿瘤分期、年龄、性别、癌症类型、母细胞数、组织学分级、侧度、解剖肿瘤细分、肿瘤组织部位和人乳头瘤病毒状态)可以根据癌症的种类包括在网络中,以便进行复杂的分析。当有两个类别时(例如,化疗:否或是),临床变量被分类为0和1,当临床变量可以分为三个或更多类别时(例如,侧性:右、左或双侧),使用虚拟变量。

用于创建基因/变量签名的分组变量选择

ESurv使用以下三种方法之一:最小绝对收缩和选择算子(套索)、弹性网正则化(弹性网)和网络正则化高维cox -回归(net),使用R [ 2 10 12 14].在网络分析中,我们使用r中的石墨包(3.10版本)将大型数据库(KEGG[京都基因与基因组百科全书]、Biocarta、HumanCyc、Reactome、Panther和NCI[国家癌症研究所])的拓扑路径信息转换为基因网络矩阵。用户可以设置混合参数alpha,该参数决定套索回归和山脊回归之间的平衡[ 10 14].所有分组变量的选择都使用10倍交叉验证。变量选择后,通过变量值乘以回归系数计算预后评分。

统计分析

为了确定最佳截止值,防止过度优化,我们使用了最大UNO的c指数和5倍交叉验证。对于Kaplan-Meier生存曲线,根据特定的基因表达参数(中位截止值或最佳截止值)将患者分为高危组和低危组 P由log-rank测试确定的值。用c指数和曲线下面积(area under The curve, AUC)值来评价特定变量对生存率的影响[ 28].这些结果不仅在所有患者中可见,而且在基于性别或分期的患者亚组中也可见。使用R包生存(版本2.44-1.1)、survMisc(版本0.5.5)、coin(版本1.3-0)、MASS(现代应用统计学与S,版本7.3-51.4)、edgeR(版本3.24.3)和survAUC(版本1.0-5)获得结果。ESurv的所有图形输出都使用plotly(4.9.0版本)R包绘制。本研究中所有数据清理和统计分析均使用R统计软件(版本为3.6.0,R Core Team, R Foundation for statistical Computing)进行。

实现

ESurv web服务器通过HTML5实现AngularJS,通过web查询界面显示分析数据。这些分析的结果在后台服务器上按需计算,后台服务器运行Java Servlet并结合R统计程序。

结果 运行ESurv

ESurv的运行程序的细节描述在 图1.首先,用户可以从三种方法中选择一种:单变量生存分析、分组变量选择或用户服务。

ESurv的运行过程。

在选择单变量生存分析后,用户可以选择单基因分析或全基因组log-rank检验。在单基因分析中,用户按此顺序选择癌症类型、基因数据类型(mRNA、microRNA [miRNA]或甲基化)、感兴趣的基因和接收者工作特征(ROC)曲线的时间。对于整个基因组的log-rank测试,用户选择癌症类型、基因数据类型(mRNA、miRNA或甲基化)、ROC曲线的时间和 P值阈值,按此顺序。

如果用户选择分组变量选择,他们必须选择癌症类型、基因数据(mRNA、miRNA、甲基化或综合分析)、分组变量选择方法(套索、弹性网或net)、ROC曲线的时间和alpha,按此顺序。Alpha决定了脊和套索惩罚之间的平衡;alpha越大,越接近lasso (alpha=1),选择的变量越少。如果用户选择Net,他们可以在分组变量选择中包含临床变量。

在用户服务中,用户可以在上传自己的数据后执行单变量或分组变量选择。上传数据的详细说明在手册中。一旦上传了数据,就可以进行上述所有的分析。

最后,当使用选定的变量开发基因签名时,用户应该依次为ROC曲线选择癌症类型、感兴趣的基因和时间。

单因素分析:泛癌症的单基因分析

ESurv确定了在包括性别和癌症分期(由美国癌症联合委员会定义的早期和晚期)在内的各个亚组中,单基因作为分类(带有中值或最佳截止值的Kaplan-Meier曲线)或连续变量(特定时间点的c指数和AUC值)的预后意义。为了补充分类变量的结果,将c指数和AUC值作为连续变量计算。例如,我们使用mRNA ( SLC2A1)作为膀胱尿路上皮癌的生物标志物(n=403; 图2).如 图2A和B,在所有患者中,最佳截止值的鉴别能力远优于使用中值截止值完成的分析。用户很容易获得亚组以及所有患者的生存曲线。在时间相关的ROC曲线分析中,用户可以根据随访时间识别AUC值( 图2C).选定时间的ROC曲线均可计算( 图2D)。

一个基于mrna的生存分析的例子。根据基因表达水平的最优值(A)和中值截断值(B)的比较,将基因表达水平分为低或高(分别为蓝色和红色线)。(C)每个亚组的时间依赖性曲线下面积(AUC)。(D)每个子组中选定年份的受试者工作特征(ROC)曲线。

使用变量签名的生存分析示例。根据最佳(a)和中值截断值(B)的比较,将基因表达水平分为低或高(分别为蓝色或红色线)。(C)每个亚组的时间依赖性曲线下面积(AUC)。(D)每个子组中选定年份的受试者工作特征(ROC)曲线。

单变量分析:全基因组Log-Rank检验

如果用户想要计算特定癌症中所有基因变异的预后价值,他们可以选择对整个基因组进行log-rank测试。在这里,我们对结肠腺癌的全基因组进行了log-rank测试 P< . 05。ESurv提供了结果(基因名称、c指数、用户选择时间的AUC值、 Plog-rank test的值)作为Excel文件( 多媒体附件1).

分组变量选择

分组变量选择方法已被开发出来,以利用生物技术的进步,并可用于统计模型,以准确预测患者的预后[ 2 10].为了从高维数据中选择预后基因集,有必要以系统的和统计上可靠的方式选择和最小化变量的数量。ESurv提供了具有代表性的分组变量选择方法(lasso, elastic net, net),通过考虑变量之间的关系来减少变量的数量。为了开发一个风险评分系统,我们使用了所选变量的表达式值和回归系数的线性组合。用户可以使用这些选项的任意组合在泛癌中开发一个强大的预后特征。为了说明这一点,我们使用肝细胞癌的所有临床变量(n=307; 图3).选择的变量和回归系数可以从ESurv的摘要选项卡下载为Excel文件。所有可能的亚组的结果都被记录下来,就像单基因分析的情况一样。分析的输出可以是Kaplan-Meier曲线、时间相关的ROC曲线和特定时间点的AUC值( 图3).

用户服务

用户可以通过上传自己的数据( 图1C).手册载于 多媒体附件2而且 3..如前所述,用户可以使用自己的数据集生成所有存活结果。为了保护数据完整性,用户派生的数据集受密码保护,并连接到唯一的用户ID。此外,当用户细化他们的需求时,他们可以通过电子邮件请求额外的生存分析包。要求最多的软件包将在第二年加入ESurv。

讨论 主要研究结果

为了克服现有生存分析工具的局限性,我们开发了一个基于web的用户友好的工具,称为ESurv。Kaplan-Meier曲线是医学领域进行生存分析的常用方法,它涉及根据患者的风险情况将患者分组。在这些分类分析方法中,没有明确的标准来分类连续变量,如基因表达。因此,在以前的工具中使用的中位数和四分位截止值可能会忽略单个基因的预后意义。如 图2B,中值截止点不是风险分层的合适参数,而最优截止点是风险分层的良好参数。此外,生存分析作为一个连续变量应该伴随着这些结果来评估相关基因的预后意义。研究人员可以确定一个基因(mRNA, miRNA和甲基化)作为ESurv的分类和连续变量的预后意义。

多基因预后优于单基因预后。选择基因签名的方法有很多,但在这些方法中,使用分组变量选择选择的基因被证明是最通用和可复制的[ 2 5 9 10 13 29 30.].分组变量选择方法在考虑多重共线性的同时,从高维数据集中选择和缩小变量,这在考虑生物途径时尤其有价值,使Net选项非常适合这些应用。尽管如此,分组变量选择还没有应用到许多研究中,因为其计算机编程(R, Python和Matlab)的困难。为了解决这一差距,我们在ESurv中添加了分组变量选择方法(套索、弹性网和net)。当从高维数据中选择预后基因集时,研究人员必须尽量减少变量的数量。为了有效地减少变量,我们必须提供尽可能多的连接基因及其相关途径的信息[ 2 10].使用Net比使用其他方法更容易完成外部验证,因为它使用关于每个基因的信息来执行变量选择,这些信息来自与遗传途径相关的数据库(Reactome、HumanCyc、KEGG、Biocarta、NCI和Panther) [ 2 10 29 30.].与单变量分析一样,用户可以获得连续和分类数据的结果。ESurv是第一个使用多组学数据提供分组变量选择的基于web的工具。

患者的预后可能因性别、分期等临床信息的不同而有所不同[ 9 31- 35].由于这些原因,需要亚组分析来确定分期和性别特异性的预后基因。ESurv显示了基于多种分类(癌症类型、分期和性别)考虑肿瘤异质性的生存分析结果。

局限性和未来的工作

这个软件确实有一些局限性,将在进一步的开发中加以解决。这里我们只使用了一个癌症数据库,但是还有很多,我们计划在继续开发软件的过程中将这些数据库添加到ESurv中。虽然用户可以上传自己的数据,但这仍然需要用户精通计算机;这将在软件的未来版本中解决。此外,ESurv目前只访问癌症数据库,但这种类型的分析在其他疾病中很有价值,包括几种血管和退行性疾病;我们的目标是添加这些。最后,ESurv的分析并不是穷尽无遗的,但是用户可以通过电子邮件为R请求额外的生存分析包。然后,我们将选择要求最多的包,并将其添加到ESurv每年的基础上。

结论

ESurv提供的最重要的功能是,用户可以使用该软件分析自己的数据。随着越来越多的医学数据的产生,对生存分析的需求也在增加。对个别机构创建的数据进行分析与大数据分析同样重要,但目前还没有能够进行这种分析的生存分析工具。ESurv使用先进的统计方法和全面的生存分析,克服了以往工具的局限性,允许用户使用自己的数据集。我们坚信ESurv是一种理想的工具,可以满足在小型和大型数据集中日益增长的生存分析需求。

全显著性基因的单变量结果。

单变量分析手册。

分组变量选择分析手册。

缩写 AUC

曲线下面积

弹性网

弹性网正则化

ESurv

简单,有效,优秀的生存分析工具

套索

最小绝对收缩和选择算子

microrna的

信使核糖核酸

信使核糖核酸

网络正则化高维cox回归

中华民国

接收机工作特性

, TCGA

癌症基因组图谱

这项工作得到了医学研究中心(MRC)项目和基础科学研究项目的资助,通过韩国国家研究基金会(NRF)的赠款,由韩国政府资助(NRF- 2018r1a5a2023879和NRF- 2019r1a2b5b01070163)。本研究由釜山国立大学医院生物医学研究所资助(2018B032)。

KP和TSG设计并撰写了手稿。HJH、MEH、CSL、JK、SJC和SL对数据进行采集和预处理。DCJ和HS对算法中的误差进行了修正。SOO和YHK设计并监督了该项目。所有作者阅读并批准了最终稿件。

没有宣布。

弗里德曼 AA Letai 一个 费雪 费海提 KT 下一代功能诊断的癌症精准医疗 Nat Rev癌症 2015 12 15 12 747 56 10.1038 / nrc4015 26536825 nrc4015 PMC4970460 本产品 直流 Pak K TS C J 郭良文 l CD 张成泽 司法院 W 年代 基因组大数据中固有的基因网络提高了癌症患者预后预测的准确性 Oncotarget 2017 09 29 8 44 77515 77526 10.18632 / oncotarget.20548 29100405 20548 PMC5652797 J “大酒店” 公园 SY 本产品 年代 SAC3D1:一种新的肝细胞癌预后标志物 Sci代表 2018 10 23 8 1 15608 10.1038 / s41598 - 018 - 34129 - 9 30353105 10.1038 / s41598 - 018 - 34129 - 9 PMC6199250 谢赫 基于“增大化现实”技术 孤峰 AJ 新时代 SD 道尔顿 WS 库利 乔丹 海塞 BW 大数据时代的协同生物医学:以癌症为例 J医学网络杂志 2014 04 07 16 4 e101 10.2196 / jmir.2496 24711045 v16i4e101 PMC4004150 程ydF4y2Ba H 年代 程ydF4y2Ba C G 程ydF4y2Ba C 一个 C C 接洽 H 花王 年代 常ydF4y2Ba W H C 辛格 年代 程ydF4y2Ba WJ 程ydF4y2Ba P 非小细胞肺癌的五基因特征和临床结果 N英语J医学 2007 01 04 356 1 11 20. 10.1056 / NEJMoa060096 17202451 356/1/11 宰穆尔 C Bertucci F Finetti P Chetrit B 伯恩鲍姆 D Filleron T J 利用高维cox回归模型从DNA微阵列数据预测早期乳腺癌转移 癌症的通知 2015 14 增刊2 129 38 10.4137 / CIN.S17284 25983547 cin - suppl.2 - 2015 - 129 PMC4426954 Nault J De Reynies 一个 维拉纽瓦 一个 Calderaro J Rebouissou 年代 茅草丛生的 G Decaens T 弗朗哥 D Imbeaud 年代 卢梭 F ·阿祖莱 D Saric J 布兰科 J Balabaud C Bioulac-Sage P 劳伦特 一个 Laurent-Puig P Llovet JM Zucman-Rossi J 肝细胞癌5基因评分与肝切除术后患者生存率相关 胃肠病学 2013 07 145 1 176 187 10.1053 / j.gastro.2013.03.051 23567350 s0016 - 5085 (13) 00494 - 0 J 首歌 W 程ydF4y2Ba Z J Y Lei J 程ydF4y2Ba G B J H 程ydF4y2Ba W Y H D J II期结肠癌中microRNA信号的预后和预测价值:一项microRNA表达分析 《柳叶刀》杂志 2013 12 14 13 1295 306 10.1016 / s1470 - 2045 (13) 70491 - 1 24239208 s1470 - 2045 (13) 70491 - 1 SK 加利 个人电脑 Pintilie Blackhall 跳频 C Strumpf D 约翰斯顿 先生 亲爱的 G Keshavjee 年代 Waddell TK N D 楼主的 牧羊人 足总 Jurisica Der SD 早期非小细胞肺癌的三基因预后分类器 J clinin Oncol 2007 12 10 25 35 5562 9 10.1200 / JCO.2007.12.0352 18065728 25/35/5562 唱ydF4y2Ba H W R H 用于基因组数据分析的网络正则化高维Cox回归 统计的罪 2014 07 24 3. 1433 1459 10.5705 / ss.2012.317 26316678 PMC4549005 Musoro 生理改变 Zwinderman Puhan 怪兽Riet G Geskus RB 基于套索回归的多重数据预测模型的验证 BMC医学治疗方法 2014 10 16 14 116 10.1186 / 1471-2288-14-116 25323009 1471-2288-14-116 PMC4209042 Tibshirani R Cox模型中变量选择的套索方法 地中海统计 1997 02 28 16 4 385 95 9044528 10.1002 / (SICI) 1097 - 0258(19970228)十六4 < 385::AID-SIM380 > 3.0.CO; 2 - 3 富尔顿 l 克鲁斯 CS 基于医院的背部手术:地理时空、解释和预测模型 J医学网络杂志 2019 10 29 21 10 e14609 10.2196/14609 31663856 v21i10e14609 Y 弹性网考克斯比例风险模型的解路径算法 统计的罪 2012 22 27 294 10.5705 / ss.2010.107 23226932 PMC3515861 Aguirre-Gamboa R Gomez-Rueda H Martinez-Ledesma E Martinez-Torteya 一个 Chacolla-Huaringa R Rodriguez-Barrientos 一个 Tamez-Pena Trevino V SurvExpress:在线生物标记验证工具和使用生存分析的癌症基因表达数据数据库 《公共科学图书馆•综合》 2013 8 9 e74250 10.1371 / journal.pone.0074250 24066126 玉米饼- d - 13 - 16634 PMC3774754 Goswami炮轰道: CP Nakshatri H 基于基因表达的多种癌症生存分析网络应用 临床生物信息杂志 2013 10 28 3. 1 22 10.1186 / 2043-9113-3-22 24165311 2043-9113-3-22 PMC3875898 Goswami炮轰道: CP Nakshatri H progenev2:对现有数据库的增强 BMC癌症 2014 12 17 14 970 10.1186 / 1471-2407-14-970 25518851 1471-2407-14-970 PMC4300843 美津浓 H Kitada K 南开 K 撒莱 一个 预后扫描:基因预后价值荟萃分析的新数据库 医学基因组学 2009 04 24 2 18 10.1186 / 1755-8794-2-18 19393097 1755-8794-2-18 PMC2689870 SurvExpress 2020-04-08 http://bioinformatica.mty.itesm.mx:8080/Biomatec/SurvivaX.jsp PROGgene 2020-04-08 http://www.compbio.iupui.edu/proggene PrognoScan 2020-04-08 http://dna00.bio.kyutech.ac.jp/PrognoScan/index.html ESurv 2020-04-08 https://easysurv.net Broad GDAC Firebrowse 2020-04-08 https://firebrowse.org GDC数据门户 2020-04-08 https://portal.gdc.cancer.gov/ 癌症基因组图谱研究网络 温斯坦 Collisson EA 米尔斯 GB KRM Ozenberger 英航 Ellrott K Shmulevich 砂光机 C 斯图尔特 JM 癌症基因组图谱泛癌症分析项目 Nat麝猫 2013 10 45 10 1113 20. 10.1038 / ng.2764 24071849 ng.2764 PMC3919969 J ·利希滕贝格 T Hoadley 泊松 LM 拉扎尔 AJ Cherniack 广告 Kovatich AJ 奔驰 CC 莱文 AV Omberg l DM 施赖弗 CD Thorsson V 癌症基因组图谱研究网络 H 一个集成的TCGA泛癌症临床数据资源,以推动高质量的生存结果分析 细胞 2018 04 05 173 2 400 416. e11 10.1016 / j.cell.2018.02.052 29625055 s0092 30229 - 0 - 8674 (18) PMC6066282 班尼特 D 我该如何处理学习中缺失的数据? 公共卫生 2001 10 25 5 464 9 11688629 Uno H T Pencina 乔丹 RB LJ 关于用删减生存数据评估风险预测程序总体充分性的c统计 地中海统计 2011 05 10 30. 10 1105 17 10.1002 / sim.4154 21484848 PMC3079915 TS JS 伊尔金 J 公园 YG Pak K 直流 年代 本产品 基于网络正则化高维cox回归分析和潜在治疗靶点的骨肉瘤预后评分系统 细胞物理 2019 08 234 8 13851 13857 10.1002 / jcp.28065 30604867 Pak K 本产品 Suh 年代 TS 直流 SJ IJ 年代 甲状腺乳头状癌患者风险评分系统的开发 细胞分子医学 2019 04 23 4 3010 3015 10.1111 / jcmm.14208 30729678 PMC6433682 Benedix F Kube R 迈耶 F 施密特 U Gastinger H 结肠/直肠癌(原发肿瘤)研究组 17641例左右结肠癌患者的比较:流行病学、围手术期、组织学和生存期的差异 结肠直肠 2010 01 53 1 57 64 10.1007 / DCR.0b013e3181c703a4 20010352 00003453-201001000-00012 汉森 IO 杰斯 P 左侧结肠癌与右侧结肠癌可能有更好的长期生存率——一项系统综述 Dan Med J 2012 06 59 6 A4444 22677242 A4444 年代 沉重的一击 沪元 H N 结直肠癌风险的性别差异 世界J肠胃醇 2015 05 07 21 17 5167 75 10.3748 / wjg.v21.i17.5167 25954090 PMC4419057 利伯曼 威廉姆斯 莱托 Holub 莱托 莫里斯 CD 洛根 艾森 通用汽车 卡尼 P 种族、民族和性别影响平均风险人群患>9毫米息肉的风险 胃肠病学 2014 08 147 2 351 8;测验e14-5 10.1053 / j.gastro.2014.04.037 24786894 s0016 - 5085 (14) 00593 - 9 PMC4121117 年代 利用嵌入特征选择算法识别早期肺腺癌和鳞状细胞癌患者的亚型特异性预后基因 《公共科学图书馆•综合》 2015 10 7 e0134630 10.1371 / journal.pone.0134630 26226392 玉米饼- d - 15 - 21825 PMC4520527
Baidu
map