卡塔尔世界杯8强波胆分析|卡塔尔世界杯4强波胆分析

JMIR

J医学网络杂志

医学互联网研究杂志

1438 - 8871

卡塔尔世界杯8强波胆分析

加拿大多伦多

v22i5e16084

32369034

10.2196/16084

原始论文

一个用户友好的，基于web的生存分析综合工具(ESurv):开发和验证研究

Eysenbach

冈瑟

Suh

Sunghwan

Borcherding

尼古拉斯

Pak

Kyoungjune

医学博士 1

https://orcid.org/0000-0001-5051-1894

哦

Sae-Ock

医学博士 2

https://orcid.org/0000-0002-9365-7831

吴

Tae食

医学博士 3.

https://orcid.org/0000-0003-1861-5647

Heo

惠金

博士学位 2

https://orcid.org/0000-0002-4929-798X

汉

Myoung-Eun

博士学位 2

https://orcid.org/0000-0001-6083-0485

宋

Dae千

妈 4

https://orcid.org/0000-0001-9545-4758

李

Chi-Seung

博士学位 5 6

https://orcid.org/0000-0002-6840-7750

唱ydF4y2Ba

Hokeun

博士学位 7

https://orcid.org/0000-0001-8351-2025

康

Junho

妈 8

https://orcid.org/0000-0003-3430-0960

崔

苛性碱水

英航 8

https://orcid.org/0000-0002-8480-3913

李

Soohwan

英航 8

https://orcid.org/0000-0003-4434-852X

Kwon

恩俊

英航 8

https://orcid.org/0000-0001-9290-5218

康

霁广域网

英航 8

https://orcid.org/0000-0003-2300-877X

金

Yun Hak)

医学博士 2

医学院解剖学系釜山大学

49 Busandaehak-ro

Yangsan 50612

大韩民国 82 515108091 yunhak10510@pusan.ac.kr

https://orcid.org/0000-0002-9796-8266

1 核医学系釜山大学医院

釜山

大韩民国 2 医学院解剖学系釜山大学

Yangsan

大韩民国 3. 整形外科釜山大学医院

釜山

大韩民国 4 德勤分析集团德勤咨询有限责任公司

首尔

大韩民国 5 生物医学研究所釜山大学医院

釜山

大韩民国 6 医学院生物医学工程系“，釜山大学

釜山

大韩民国 7 统计处釜山大学

釜山

大韩民国 8 医学院生物医学信息系“，釜山大学

Yangsan

大韩民国

通讯作者:Yun Hak Kim yunhak10510@pusan.ac.kr

5 2020

5 5 2020

22 5

e16084

2 9 2019 22 10 2019 13 11 2019 25 3. 2020

©Kyoungjune Pak, sai - ock Oh, Tae Sik Goh, Hye Jin Heo, Myoung-Eun Han, Dae - Cheon Jeong, Chi-Seung Lee, Hokeun Sun, Junho Kang, Suji Choi, Soohwan Lee, Eun Jung Kwon, Ji Wan Kang, Yun - Hak Kim。最初发表于《医学互联网研究杂志》(//www.mybigtv.com)， 2020年05月05日。

2020

这是一篇开放获取的文章，根据创作共用署名许可协议(https://creativecommons.org/licenses/by/4.0/)发布，该协议允许在任何媒体上不受限制地使用、分发和复制，前提是要正确引用最初发表在《医学互联网研究杂志》上的原始作品。必须包括完整的书目信息，//www.mybigtv.com/上的原始出版物链接，以及版权和许可信息。

背景

预后基因或基因签名已被广泛用于预测患者的生存和帮助作出有关治疗行动的决定。尽管一些基于网络的生存分析工具已经被开发出来，但它们有一些局限性。

客观的

考虑到这些限制，我们开发了ESurv(简单、有效和优秀的生存分析工具)，这是一个基于web的工具，可以使用用户派生的数据或来自癌症基因组图谱(TCGA)的数据进行高级生存分析。用户可以使用TCGA的多组学数据进行单变量分析和分组变量选择。

方法

我们使用R编码基于TCGA多组学数据的生存分析。为了进行这些分析，我们排除了信息不足的患者和基因。当有两种类型时(例如，化疗:否或是)，临床变量被分类为0和1，当特征有3个或更多结果时(例如，关于侧性:右、左或双侧)，使用虚拟变量。

结果

通过单因素分析，ESurv可以通过生存曲线(中位数或最佳截止值)、曲线下面积(AUC)和受试者工作特征(ROC)来确定单基因的预后意义。用户可以根据临床变量的多组学数据或分组变量选择(套索、弹性网正则化和网络正则化高维cox -回归)获得预后变量签名，并选择与上述相同的输出。此外，用户可以使用各种感兴趣的基因为特定癌症创建定制的基因签名。ESurv最重要的功能之一是，用户可以使用自己的数据进行所有的生存分析。

结论

ESurv使用了适用于高维数据(包括遗传数据)和综合生存分析的先进统计技术，克服了以前基于web的工具的局限性，将帮助生物医学研究人员轻松地进行复杂的生存分析。

生存分析分组变量选择癌症基因组图谱基于网络的工具用户服务

简介

随着下一代测序技术的发展，大量基因组数据的积累正在为精准医疗铺平道路[ 1- 4］．特别是，基因表达谱或签名已被广泛用于预测患者预后，并协助决定各种癌症的治疗策略[ 2， 5- 9］．

基因组数据集是高度可变的，随着患者数量的增加，这种变异性也随之增加，使其在本质上成为高维数据。为了有效地连接高维基因组数据和生存数据，统计学家在考克斯比例风险模型的基础上，开发了分组变量选择模型，包括:最小绝对收缩和选择算子(套索)、弹性网正则化(弹性网)和网络正则化高维考克斯回归(Coxnet，以下简称net) [ 2， 10- 13］．在这些方法中，由于考虑到生物网络的复杂性，Net被发现在这些应用中过拟合问题最少，预测性能最高[ 2， 6， 8， 10， 14］．

使用大型数据库成功地识别和验证预后因素在医学研究中是必不可少的，但这对不熟悉计算机科学的研究人员来说可能是困难的。为了解决这一未被满足的临床需求，一些基于网络的生存分析工具已经被开发出来。尽管这些工具有一定的局限性，但它们已被用于一些单变量分析[ 15- 18］．SurvExpress [ 19， PROGgene [ 20.]，以及predicscan [ 21]是流行的基于网络的生存分析工具，仅使用信使RNA (mRNA)表达数据计算预后的统计意义[ 15- 18］．以往工具的局限性包括:(1)将mRNA表达作为一个简单的分类值来提供所有患者的Kaplan-Meier曲线，而不考虑患者的特征。使用像mRNA这样的连续变量作为分类因子可能会任意地改变变量的性质，导致严重的错误。(2)在预测预后方面，这些工具并没有提供统计上优于单一基因的基因/变量特征。(3)他们没有考虑像组织学类型那样的癌症分类。(4)用户不能使用自己的数据。(5)这些工具不能提供高质量的图像和表格结果。(6)用户不能通过指定感兴趣的基因来创建风险评分系统。

为了克服这些限制，我们开发了ESurv(简单，有效，优秀的生存分析工具[ 22)，这是一个从癌症基因组图谱(TCGA)或用户数据中识别泛癌症预后生物标志物的在线web资源。

方法处理来自患者的遗传和临床信息

我们基于多组学和TCGA ( 表1)，通过Broad GDAC Firebrowse获取[ 23]及GDC数据门户[ 24- 26］．我们使用了三级RNAseq (RNA测序)、miRNAseq (microRNA测序)和甲基化阵列数据。排除标准:0值大于10%的基因(当缺失数据量大于10%时，结果可能有偏差)[ 27]、总体生存信息(生存时间或状态)不足的患者、TCGA中存在配对的正常组织和转移样本的患者。

表1

ESurv中可用数据的摘要。

具有可用组学数据的癌症	信使RNA(是/否)	微rna(是/否)	甲基化(是/否)	总患者数，n
急性髓系白血病	是的	是的	是的	200
肾上腺皮质癌	是的	是的	是的	92
膀胱尿路上皮癌	是的	是的	是的	412
脑低级别胶质瘤	是的	是的	是的	515
乳腺浸润性癌	是的	是的	是的	1097
宫颈及宫颈内腔癌	是的	是的	是的	307
胆管癌	是的	是的	是的	45
结肠腺癌	是的	是的	是的	458
食管癌癌	是的	是的	是的	185
多形性成胶质细胞瘤	是的	没有	是的	595
头颈部鳞状细胞癌	是的	是的	是的	528
肾脏chromophobe	是的	是的	是的	113
肾透明细胞癌	是的	是的	是的	537
肾乳头状细胞癌	是的	是的	是的	291
肝肝细胞癌	是的	是的	是的	377
肺腺癌	是的	是的	是的	522
肺鳞癌	是的	是的	是的	504
淋巴样肿瘤弥漫性大B细胞淋巴瘤	是的	是的	是的	48
间皮瘤	是的	是的	是的	87
卵巢浆液性囊腺癌	是的	是的	没有	591
胰腺腺癌	是的	是的	是的	185
嗜铬细胞瘤和副神经节瘤	是的	是的	是的	179
前列腺腺癌	是的	是的	是的	499
直肠腺癌	是的	是的	是的	171
肉瘤	是的	是的	是的	261
皮肤皮肤黑色素瘤	是的	是的	是的	470
胃腺癌	是的	是的	是的	443
睾丸生殖细胞瘤	是的	是的	是的	134
胸腺瘤	是的	是的	是的	124
甲状腺癌	是的	是的	是的	516
子宫癌肉瘤	是的	是的	是的	57
子宫内膜癌	是的	是的	是的	548
葡萄膜黑色素瘤	是的	是的	没有	80

Net处理临床变量

临床变量(肿瘤分期、年龄、性别、癌症类型、母细胞数、组织学分级、侧度、解剖肿瘤细分、肿瘤组织部位和人乳头瘤病毒状态)可以根据癌症的种类包括在网络中，以便进行复杂的分析。当有两个类别时(例如，化疗:否或是)，临床变量被分类为0和1，当临床变量可以分为三个或更多类别时(例如，侧性:右、左或双侧)，使用虚拟变量。

用于创建基因/变量签名的分组变量选择

ESurv使用以下三种方法之一:最小绝对收缩和选择算子(套索)、弹性网正则化(弹性网)和网络正则化高维cox -回归(net)，使用R [ 2， 10， 12， 14］．在网络分析中，我们使用r中的石墨包(3.10版本)将大型数据库(KEGG[京都基因与基因组百科全书]、Biocarta、HumanCyc、Reactome、Panther和NCI[国家癌症研究所])的拓扑路径信息转换为基因网络矩阵。用户可以设置混合参数alpha，该参数决定套索回归和山脊回归之间的平衡[ 10， 14］．所有分组变量的选择都使用10倍交叉验证。变量选择后，通过变量值乘以回归系数计算预后评分。

统计分析

为了确定最佳截止值，防止过度优化，我们使用了最大UNO的c指数和5倍交叉验证。对于Kaplan-Meier生存曲线，根据特定的基因表达参数(中位截止值或最佳截止值)将患者分为高危组和低危组 P由log-rank测试确定的值。用c指数和曲线下面积(area under The curve, AUC)值来评价特定变量对生存率的影响[ 28］．这些结果不仅在所有患者中可见，而且在基于性别或分期的患者亚组中也可见。使用R包生存(版本2.44-1.1)、survMisc(版本0.5.5)、coin(版本1.3-0)、MASS(现代应用统计学与S，版本7.3-51.4)、edgeR(版本3.24.3)和survAUC(版本1.0-5)获得结果。ESurv的所有图形输出都使用plotly(4.9.0版本)R包绘制。本研究中所有数据清理和统计分析均使用R统计软件(版本为3.6.0,R Core Team, R Foundation for statistical Computing)进行。

实现

ESurv web服务器通过HTML5实现AngularJS，通过web查询界面显示分析数据。这些分析的结果在后台服务器上按需计算，后台服务器运行Java Servlet并结合R统计程序。

结果运行ESurv

ESurv的运行程序的细节描述在图1．首先，用户可以从三种方法中选择一种:单变量生存分析、分组变量选择或用户服务。

图1

ESurv的运行过程。

在选择单变量生存分析后，用户可以选择单基因分析或全基因组log-rank检验。在单基因分析中，用户按此顺序选择癌症类型、基因数据类型(mRNA、microRNA [miRNA]或甲基化)、感兴趣的基因和接收者工作特征(ROC)曲线的时间。对于整个基因组的log-rank测试，用户选择癌症类型、基因数据类型(mRNA、miRNA或甲基化)、ROC曲线的时间和 P值阈值，按此顺序。

如果用户选择分组变量选择，他们必须选择癌症类型、基因数据(mRNA、miRNA、甲基化或综合分析)、分组变量选择方法(套索、弹性网或net)、ROC曲线的时间和alpha，按此顺序。Alpha决定了脊和套索惩罚之间的平衡;alpha越大，越接近lasso (alpha=1)，选择的变量越少。如果用户选择Net，他们可以在分组变量选择中包含临床变量。

在用户服务中，用户可以在上传自己的数据后执行单变量或分组变量选择。上传数据的详细说明在手册中。一旦上传了数据，就可以进行上述所有的分析。

最后，当使用选定的变量开发基因签名时，用户应该依次为ROC曲线选择癌症类型、感兴趣的基因和时间。

单因素分析:泛癌症的单基因分析

ESurv确定了在包括性别和癌症分期(由美国癌症联合委员会定义的早期和晚期)在内的各个亚组中，单基因作为分类(带有中值或最佳截止值的Kaplan-Meier曲线)或连续变量(特定时间点的c指数和AUC值)的预后意义。为了补充分类变量的结果，将c指数和AUC值作为连续变量计算。例如，我们使用mRNA ( SLC2A1)作为膀胱尿路上皮癌的生物标志物(n=403; 图2)．如图2A和B，在所有患者中，最佳截止值的鉴别能力远优于使用中值截止值完成的分析。用户很容易获得亚组以及所有患者的生存曲线。在时间相关的ROC曲线分析中，用户可以根据随访时间识别AUC值( 图2C).选定时间的ROC曲线均可计算( 图2D)。

图2

一个基于mrna的生存分析的例子。根据基因表达水平的最优值(A)和中值截断值(B)的比较，将基因表达水平分为低或高(分别为蓝色和红色线)。(C)每个亚组的时间依赖性曲线下面积(AUC)。(D)每个子组中选定年份的受试者工作特征(ROC)曲线。

图3

使用变量签名的生存分析示例。根据最佳(a)和中值截断值(B)的比较，将基因表达水平分为低或高(分别为蓝色或红色线)。(C)每个亚组的时间依赖性曲线下面积(AUC)。(D)每个子组中选定年份的受试者工作特征(ROC)曲线。

单变量分析:全基因组Log-Rank检验

如果用户想要计算特定癌症中所有基因变异的预后价值，他们可以选择对整个基因组进行log-rank测试。在这里，我们对结肠腺癌的全基因组进行了log-rank测试 P< . 05。ESurv提供了结果(基因名称、c指数、用户选择时间的AUC值、 Plog-rank test的值)作为Excel文件( 多媒体附件1)．

分组变量选择

分组变量选择方法已被开发出来，以利用生物技术的进步，并可用于统计模型，以准确预测患者的预后[ 2， 10］．为了从高维数据中选择预后基因集，有必要以系统的和统计上可靠的方式选择和最小化变量的数量。ESurv提供了具有代表性的分组变量选择方法(lasso, elastic net, net)，通过考虑变量之间的关系来减少变量的数量。为了开发一个风险评分系统，我们使用了所选变量的表达式值和回归系数的线性组合。用户可以使用这些选项的任意组合在泛癌中开发一个强大的预后特征。为了说明这一点，我们使用肝细胞癌的所有临床变量(n=307; 图3)．选择的变量和回归系数可以从ESurv的摘要选项卡下载为Excel文件。所有可能的亚组的结果都被记录下来，就像单基因分析的情况一样。分析的输出可以是Kaplan-Meier曲线、时间相关的ROC曲线和特定时间点的AUC值( 图3)．

用户服务

用户可以通过上传自己的数据( 图1C).手册载于多媒体附件2而且 3.．如前所述，用户可以使用自己的数据集生成所有存活结果。为了保护数据完整性，用户派生的数据集受密码保护，并连接到唯一的用户ID。此外，当用户细化他们的需求时，他们可以通过电子邮件请求额外的生存分析包。要求最多的软件包将在第二年加入ESurv。

讨论主要研究结果

为了克服现有生存分析工具的局限性，我们开发了一个基于web的用户友好的工具，称为ESurv。Kaplan-Meier曲线是医学领域进行生存分析的常用方法，它涉及根据患者的风险情况将患者分组。在这些分类分析方法中，没有明确的标准来分类连续变量，如基因表达。因此，在以前的工具中使用的中位数和四分位截止值可能会忽略单个基因的预后意义。如图2B，中值截止点不是风险分层的合适参数，而最优截止点是风险分层的良好参数。此外，生存分析作为一个连续变量应该伴随着这些结果来评估相关基因的预后意义。研究人员可以确定一个基因(mRNA, miRNA和甲基化)作为ESurv的分类和连续变量的预后意义。

多基因预后优于单基因预后。选择基因签名的方法有很多，但在这些方法中，使用分组变量选择选择的基因被证明是最通用和可复制的[ 2， 5， 9， 10， 13， 29， 30.］．分组变量选择方法在考虑多重共线性的同时，从高维数据集中选择和缩小变量，这在考虑生物途径时尤其有价值，使Net选项非常适合这些应用。尽管如此，分组变量选择还没有应用到许多研究中，因为其计算机编程(R, Python和Matlab)的困难。为了解决这一差距，我们在ESurv中添加了分组变量选择方法(套索、弹性网和net)。当从高维数据中选择预后基因集时，研究人员必须尽量减少变量的数量。为了有效地减少变量，我们必须提供尽可能多的连接基因及其相关途径的信息[ 2， 10］．使用Net比使用其他方法更容易完成外部验证，因为它使用关于每个基因的信息来执行变量选择，这些信息来自与遗传途径相关的数据库(Reactome、HumanCyc、KEGG、Biocarta、NCI和Panther) [ 2， 10， 29， 30.］．与单变量分析一样，用户可以获得连续和分类数据的结果。ESurv是第一个使用多组学数据提供分组变量选择的基于web的工具。

患者的预后可能因性别、分期等临床信息的不同而有所不同[ 9， 31- 35］．由于这些原因，需要亚组分析来确定分期和性别特异性的预后基因。ESurv显示了基于多种分类(癌症类型、分期和性别)考虑肿瘤异质性的生存分析结果。

局限性和未来的工作

这个软件确实有一些局限性，将在进一步的开发中加以解决。这里我们只使用了一个癌症数据库，但是还有很多，我们计划在继续开发软件的过程中将这些数据库添加到ESurv中。虽然用户可以上传自己的数据，但这仍然需要用户精通计算机;这将在软件的未来版本中解决。此外，ESurv目前只访问癌症数据库，但这种类型的分析在其他疾病中很有价值，包括几种血管和退行性疾病;我们的目标是添加这些。最后，ESurv的分析并不是穷尽无遗的，但是用户可以通过电子邮件为R请求额外的生存分析包。然后，我们将选择要求最多的包，并将其添加到ESurv每年的基础上。

结论

ESurv提供的最重要的功能是，用户可以使用该软件分析自己的数据。随着越来越多的医学数据的产生，对生存分析的需求也在增加。对个别机构创建的数据进行分析与大数据分析同样重要，但目前还没有能够进行这种分析的生存分析工具。ESurv使用先进的统计方法和全面的生存分析，克服了以往工具的局限性，允许用户使用自己的数据集。我们坚信ESurv是一种理想的工具，可以满足在小型和大型数据集中日益增长的生存分析需求。

多媒体附件1

全显著性基因的单变量结果。

多媒体附件2

单变量分析手册。

多媒体附件3

分组变量选择分析手册。

缩写

AUC

曲线下面积

弹性网

弹性网正则化

ESurv

简单，有效，优秀的生存分析工具

套索

最小绝对收缩和选择算子

microrna的

微

信使核糖核酸

网

网络正则化高维cox回归

中华民国

接收机工作特性

, TCGA

癌症基因组图谱

这项工作得到了医学研究中心(MRC)项目和基础科学研究项目的资助，通过韩国国家研究基金会(NRF)的赠款，由韩国政府资助(NRF- 2018r1a5a2023879和NRF- 2019r1a2b5b01070163)。本研究由釜山国立大学医院生物医学研究所资助(2018B032)。

KP和TSG设计并撰写了手稿。HJH、MEH、CSL、JK、SJC和SL对数据进行采集和预处理。DCJ和HS对算法中的误差进行了修正。SOO和YHK设计并监督了该项目。所有作者阅读并批准了最终稿件。

没有宣布。

弗里德曼

Letai

一个

费雪

德

费海提

下一代功能诊断的癌症精准医疗

Nat Rev癌症 2015 12 15 12 747 56

10.1038 / nrc4015

26536825

nrc4015

PMC4970460

金

本产品

宋

直流

Pak

吴

李

汉

米

金

郭良文

金

张成泽

司法院

查

哦

年代

基因组大数据中固有的基因网络提高了癌症患者预后预测的准确性

Oncotarget 2017 09 29 8 44 77515 77526

10.18632 / oncotarget.20548

29100405

20548

PMC5652797

汉

米

金

“大酒店”

公园

金

本产品

哦

年代

SAC3D1:一种新的肝细胞癌预后标志物

Sci代表 2018 10 23 8 1 15608

10.1038 / s41598 - 018 - 34129 - 9

30353105

10.1038 / s41598 - 018 - 34129 - 9

PMC6199250

谢赫

基于“增大化现实”技术

孤峰

新时代

道尔顿

库利

乔丹

海塞

大数据时代的协同生物医学:以癌症为例

J医学网络杂志 2014 04 07 16 4 e101

10.2196 / jmir.2496

24711045

v16i4e101

PMC4004150

程ydF4y2Ba

余

年代

程ydF4y2Ba

常

程ydF4y2Ba

元

一个

程

王

接洽

花王

年代

常ydF4y2Ba

李

刘

辛格

年代

程ydF4y2Ba

瞬

杨

非小细胞肺癌的五基因特征和临床结果

N英语J医学 2007 01 04 356 1 11 20.

10.1056 / NEJMoa060096

17202451

356/1/11

宰穆尔

Bertucci

Finetti

Chetrit

伯恩鲍姆

Filleron

啵

利用高维cox回归模型从DNA微阵列数据预测早期乳腺癌转移

癌症的通知 2015 14 增刊2 129 38

10.4137 / CIN.S17284

25983547

cin - suppl.2 - 2015 - 129

PMC4426954

Nault

De Reynies

一个

维拉纽瓦

一个

Calderaro

Rebouissou

年代

茅草丛生的

Decaens

弗朗哥

Imbeaud

年代

卢梭

·阿祖莱

Saric

布兰科

Balabaud

Bioulac-Sage

劳伦特

一个

Laurent-Puig

Llovet

Zucman-Rossi

肝细胞癌5基因评分与肝切除术后患者生存率相关

胃肠病学 2013 07 145 1 176 187

10.1053 / j.gastro.2013.03.051

23567350

s0016 - 5085 (13) 00494 - 0

张

首歌

程ydF4y2Ba

魏

廖

Lei

胡

米

程ydF4y2Ba

廖

陆

赵

程ydF4y2Ba

他

王

谢

罗

II期结肠癌中microRNA信号的预后和预测价值:一项microRNA表达分析

《柳叶刀》杂志 2013 12 14 13 1295 306

10.1016 / s1470 - 2045 (13) 70491 - 1

24239208

s1470 - 2045 (13) 70491 - 1

刘

加利

个人电脑

Pintilie

米

Blackhall

跳频

朱

Strumpf

约翰斯顿

先生

亲爱的

Keshavjee

年代

Waddell

刘

潘

楼主的

牧羊人

足总

Jurisica

我

Der

曹

米

早期非小细胞肺癌的三基因预后分类器

J clinin Oncol 2007 12 10 25 35 5562 9

10.1200 / JCO.2007.12.0352

18065728

25/35/5562

唱ydF4y2Ba

林

冯

李

用于基因组数据分析的网络正则化高维Cox回归

统计的罪 2014 07 24 3. 1433 1459

10.5705 / ss.2012.317

26316678

PMC4549005

Musoro

生理改变

Zwinderman

啊

Puhan

妈

怪兽Riet

Geskus

基于套索回归的多重数据预测模型的验证

BMC医学治疗方法 2014 10 16 14 116

10.1186 / 1471-2288-14-116

25323009

1471-2288-14-116

PMC4209042

Tibshirani

Cox模型中变量选择的套索方法

地中海统计 1997 02 28 16 4 385 95

9044528

10.1002 / (SICI) 1097 - 0258(19970228)十六4 < 385::AID-SIM380 > 3.0.CO; 2 - 3

富尔顿

克鲁斯

基于医院的背部手术:地理时空、解释和预测模型

J医学网络杂志 2019 10 29 21 10 e14609

10.2196/14609

31663856

v21i10e14609

吴

弹性网考克斯比例风险模型的解路径算法

统计的罪 2012 22 27 294

10.5705 / ss.2010.107

23226932

PMC3515861

Aguirre-Gamboa

Gomez-Rueda

Martinez-Ledesma

Martinez-Torteya

一个

Chacolla-Huaringa

Rodriguez-Barrientos

一个

Tamez-Pena

詹

Trevino

SurvExpress:在线生物标记验证工具和使用生存分析的癌症基因表达数据数据库

《公共科学图书馆•综合》 2013 8 9 e74250

10.1371 / journal.pone.0074250

24066126

玉米饼- d - 13 - 16634

PMC3774754

Goswami炮轰道:

Nakshatri

基于基因表达的多种癌症生存分析网络应用

临床生物信息杂志 2013 10 28 3. 1 22

10.1186 / 2043-9113-3-22

24165311

2043-9113-3-22

PMC3875898

Goswami炮轰道:

Nakshatri

progenev2:对现有数据库的增强

BMC癌症 2014 12 17 14 970

10.1186 / 1471-2407-14-970

25518851

1471-2407-14-970

PMC4300843

美津浓

Kitada

南开

撒莱

一个

预后扫描:基因预后价值荟萃分析的新数据库

医学基因组学 2009 04 24 2 18

10.1186 / 1755-8794-2-18

19393097

1755-8794-2-18

PMC2689870

SurvExpress 2020-04-08

http://bioinformatica.mty.itesm.mx:8080/Biomatec/SurvivaX.jsp

20.

PROGgene 2020-04-08

http://www.compbio.iupui.edu/proggene

PrognoScan 2020-04-08

http://dna00.bio.kyutech.ac.jp/PrognoScan/index.html

ESurv 2020-04-08

https://easysurv.net

Broad GDAC Firebrowse 2020-04-08

https://firebrowse.org

GDC数据门户 2020-04-08

https://portal.gdc.cancer.gov/

癌症基因组图谱研究网络温斯坦

约

Collisson

米尔斯

肖

KRM

Ozenberger

英航

Ellrott

Shmulevich

我

砂光机

斯图尔特

癌症基因组图谱泛癌症分析项目

Nat麝猫 2013 10 45 10 1113 20.

10.1038 / ng.2764

24071849

ng.2764

PMC3919969

刘

·利希滕贝格

Hoadley

卡

泊松

拉扎尔

Cherniack

Kovatich

奔驰

莱文

达

李

Omberg

狼

施赖弗

Thorsson

癌症基因组图谱研究网络胡

一个集成的TCGA泛癌症临床数据资源，以推动高质量的生存结果分析

细胞 2018 04 05 173 2 400 416. e11

10.1016 / j.cell.2018.02.052

29625055

s0092 30229 - 0 - 8674 (18)

PMC6066282

班尼特

我该如何处理学习中缺失的数据?

公共卫生 2001 10 25 5 464 9

11688629

Uno

蔡

Pencina

乔丹

达

魏

关于用删减生存数据评估风险预测程序总体充分性的c统计

地中海统计 2011 05 10 30. 10 1105 17

10.1002 / sim.4154

21484848

PMC3079915

吴

李

伊尔金

公园

Pak

宋

直流

哦

年代

金

本产品

基于网络正则化高维cox回归分析和潜在治疗靶点的骨肉瘤预后评分系统

细胞物理 2019 08 234 8 13851 13857

10.1002 / jcp.28065

30604867

30.

Pak

金

本产品

Suh

年代

吴

宋

直流

金

汉

米

哦

年代

甲状腺乳头状癌患者风险评分系统的开发

细胞分子医学 2019 04 23 4 3010 3015

10.1111 / jcmm.14208

30729678

PMC6433682

Benedix

Kube

迈耶

施密特

Gastinger

我

利

结肠/直肠癌(原发肿瘤)研究组

17641例左右结肠癌患者的比较:流行病学、围手术期、组织学和生存期的差异

结肠直肠 2010 01 53 1 57 64

10.1007 / DCR.0b013e3181c703a4

20010352

00003453-201001000-00012

汉森

杰斯

左侧结肠癌与右侧结肠癌可能有更好的长期生存率——一项系统综述

Dan Med J 2012 06 59 6 A4444

22677242

A4444

金

年代

沉重的一击

沪元

尹

李

我

金

唱

米

结直肠癌风险的性别差异

世界J肠胃醇 2015 05 07 21 17 5167 75

10.3748 / wjg.v21.i17.5167

25954090

PMC4419057

利伯曼

达

威廉姆斯

莱托

Holub

莱托

莫里斯

洛根

小

艾森

通用汽车

卡尼

种族、民族和性别影响平均风险人群患>9毫米息肉的风险

胃肠病学 2014 08 147 2 351 8;测验e14-5

10.1053 / j.gastro.2014.04.037

24786894

s0016 - 5085 (14) 00593 - 9

PMC4121117

田

年代

利用嵌入特征选择算法识别早期肺腺癌和鳞状细胞癌患者的亚型特异性预后基因

《公共科学图书馆•综合》 2015 10 7 e0134630

10.1371 / journal.pone.0134630

26226392

玉米饼- d - 15 - 21825

PMC4520527