TCGA数据库挖掘分析,这个网站好用到爆!

2017-10-21 11:14
来源:小张聊科研

关于数据库挖掘和分析,我们分别介绍过GEO和TCGA数据分析的多个工具了(如gene vesitigator,GEO2R,KM plotter,oncolnc,CRN等等),也准备了5分生信文章的还原(免费课堂:不想做实验,如何发一篇5分的文章?),依凡还专门录制了生物信息学数据库挖掘的系列课程,大家也可以单击文末原文链接直接购买学习和使用。

今天我们就来为大家介绍一个进行TCGA数据库数据挖掘的网站,简单易用。

UALCAN:http://ualcan.path.uab.edu/index.html

在主页右上角有一个Analysis选项,我们直接单击就可以打开下面的界面:

第一个功能:Scan by genes。可以直接查询多个基因在肿瘤里的表达和与预后的关系,比如我们输入10个基因:

然后单击Explore就可以打开新界面:

这里我们看到分析的链接有GEx profile和Survival Profile,说的分别是基因的表达情况和基因表达与预后的关系,而后面的HPRD,Genecards等是相关的数据库,我们先看第一个基因BMP4的GEx Profile:

大家看到左侧是肿瘤类型,右侧是分组类型,在上图中显示的红绿箱式图就是左侧的乳腺癌(Breast invasive carcinoma),分组标准是Major Cancer Stages,显示的就是BMP4基因在正常组和原发乳腺癌(Primary Tumor)组的差异和统计结果。

当然,我们可以选择其它肿瘤,比如肝癌(Liver hepatocellular carcinoma):

也可以选择分组标准,比如分期(Individual cancer stages):

再比如乳腺癌的亚型:

当然,我们还可以看到基因与患者预后的结果关系,通过一开始界面的survival profile:

或者Gex Profile界面的Visualize survial Plot都可以打开:

打开后的界面:

首先出现的是根据BMP4表达水平进行的生存曲线,我们可以直接下载为pdg格式用AI编辑,也可以继续单击next或者下面的页码(1,2,3,4,5)查看其它分类情况,比如表达和种族(Race):

表达和肿瘤分型:

等等,同样可以下载使用。

下面,我们再看第二个功能:Scan by gene Classes。在这个界面:

我们看到有各种类型的gene class,有的是蛋白类型,比如激酶kinase,泛素连接酶,蛋白酶,磷酸酶,还有根据功能划分的,比如细胞周期,凋亡,转移,还有通路的,比如p53,Hedgehog通路等。

也就是说,我们可以直接查看这一类基因在TCGA中的数据情况,这里我们以P53通路为例,选好后直接单击explore,这是我们看到的结果:

左侧是基因名,中间是基因在不同肿瘤中的表达和预后结果,最后是数据库链接,最上面的search for genes还可以直接对这个表格里面的基因进行搜索。以第一个基因CDK2为例,我们看到LIHC肝癌这个选项的LIHC是红色,表示的是CDK2表达显著上调;边框也是红色,表示总生存期显著,我们单击看一下具体的结果:

最后,我们看基因链接到的各个数据库:

第一个是HPRD:human protein reference database

可以查看CDK2的互作蛋白:

以及修饰等:

第二个是Genecards:看我们公众号的同学肯定都知道这个数据库了,收录是关于基因的综合信息:

我们就不多说了,有困难看这篇文章:听说你开题缺素材……。

第三个是Targetscan,做miRNA研究的基本都听过这个工具,这里对应的是调控CDK2基因的miRNA:

第四个是Pubmed Cancer,大家看一下:

是直接链接进行这个基因CDK2与Cancer这个关键词的搜索结果,展示的是文章的情况。

第五个是Human protein atlas,同样我们也介绍过:(工具篇)S5E50:航母级神器——蛋白组学结果大收录!

网站我们就介绍好了,大家使用的时候记得引用开发者的文章:

UALCAN: A Portal for Facilitating Tumor Subgroup Gene Expression and Survival Analyses.Neoplasia. 2017 Aug;19(8):649-658.

公众号介绍过的其它工具:

关注后获取《科研修炼手册》1、2、3、4、5。返回搜狐,查看更多

声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。

Measure

Measure

点击数:0