临床研究必备!TCGA的兄弟数据库,一站式出图,还学啥R语言???!!!

酸菜

科研话题下的优秀回答者

对于TCGA(The Cancer Genome Atlas)这个在生信研究中大佬级别的存在,想必大家伙儿都已经耳熟能详了吧?前不久我们一本八道老师对TCGA家族的好兄弟TCIA(The Cancer Immunome Atlas)做了详细介绍,大快朵颐之后,不少小伙伴不禁感慨意犹未尽。那么在今天,就来说说TCGA的另外一个好兄弟——TCPA数据库(The Cancer Proteome Atlas),大家伙儿都备好瓜子饮料小板凳,不要走开哦~!

传送门:你造么?肿瘤数据库除了TCGA,还有TCIA?!

TCPA数据库简介

TCPA数据库网址http://www.tcpaportal.org,其介绍于2013年发表在Nature Methods杂志上,至2019年更新到3.0版本,整合了来自TCGA和一些肿瘤研究项目的RPPA(Revers Phase Protein microArray)芯片数据,包含两个独立Web板块。

TCPA数据库网址http://www.tcpaportal.org ,其介绍于2013年发表在Nature Methods杂志上,至2019年更新到3.0版本,整合了来自TCGA和一些肿瘤研究项目的RPPA(Revers Phase Protein microArray)芯片数据,包含两个独立Web板块。

1 Patient Cohorts

着眼于肿瘤患者的RPPA数据,包含肿瘤基因组图谱中32种肿瘤类型共8167个肿瘤组织样本,目前设置Summary、My Protein、Visualization和Analysis四大功能模块。对于每个数据集,TCPA还提供level3和level4数据,level3数据代表来自独立批次的归一化数据,level4数据代表多个批次的合并数据。目前更新到2019年10月3.2版本。

2 Cancer Cell Lines

侧重于肿瘤细胞系的RPPA数据,包含19个谱系的超过665个独立细胞系,同样设置Data Sets、My Protein、Visualization和Analysis四大功能模块,目前更新至2020年7月2.02版本。

下面我就来为大家进行TCPA数据库功能板块与操作演示:

一、Patient Cohorts功能板块

点击Patient Cohorts进入功能界面:左侧边栏主要是,Home(首页),Overview(数据库介绍),About(版本信息),News(历史发布消息),FAQ(常见问题),Resources(数据来源),Credits(发表论文时引用信息),Forum(论坛),Contact(联系方式)和Download(下载注意事项);右边栏分别是,Summary、My Protein、Visualization和Analysis四个功能模块。

下面是FAQ两个比较重要的问题

(1)关于什么是RPPA芯片数据?

(2)关于TCPA数据Level1~4数据类型?

点击FAQ进去可查看详情。

以下是数据来源,包括Oncomine、TCGA等数据库,并提供各个数据库访问链接。

以下是四个功能模块介绍:

1 Summary

点击Summary进入详细界面,可以看到以不同肿瘤为导向的数据集来源,样本数目和相关蛋白数目,点击Show可查看详细信息,包括数据集编号、数据来源、平台信息、种属、样本数和标准化信息等。

2 My Protein

点击My Protein进入详细界面,显示蛋白详细信息,包括对应基因、验证状态、种属和抗体来源等信息,点击Gene Info栏链接(G:GeneCard或O:OncoMX)可以查看基因信息。选择感兴趣的蛋白,单击View“+”按钮得到该蛋白在不同肿瘤组织中表达丰度柱状图,鼠标悬停在图上可查看具体统计信息。

3 Visualization

点击Visualization进入详细界面,可以看到Network Visualization网络菜单和Heatmap Visualization热图菜单。

(1)点击Network Visualization进入功能界面,选择感兴趣的肿瘤数据集,点击Dataset Description可以查看该数据集详细信息。

点击Show可以得到基于HPRD数据库的蛋白互作网络图,线条的颜色和宽度取决于两个互作蛋白之间的相关性,红色表示正相关,绿色表示负相关,右侧边栏可设置显著性条件,可隐藏非显著相关的互作关系。

点击NDEx可进入在线工具进行网络图个性化设置,左下检索框可输入感兴趣蛋白查看互作关系,可以选择感兴趣的可视化形式,右下位置可下载Cytoscape格式文件,点击Type处叹号,有多种网络图类型供大家选择。

(2)点击Heatmap Visualization进入功能界面,选择感兴趣的肿瘤数据集,可以得到三张热图,K=3,4,5分别代表分3,4,5个cluster。

选择其中一个点击进入,点击左上角Dialogs可进行个性化设置,鼠标悬停某个样本可显示其详细信息,点击左上角Misc-PDF可下载PDF格式图片。

4 Analysis

点击Analysis进入详细界面,可以看到Individual Cancer Analysis和Pan-cancer Analysis两个功能菜单。

(1)点击Individual Cancer Analysis进入功能界面,有三个菜单:Correlation Analysis相关性分析,可以在不同肿瘤甚至不同组学数据间进行;Differential Analysis差异分析,可以在两种不同类型肿瘤或者两种亚型肿瘤之间进行;Survival Analysis生存分析,提供Cox proportional hazards model, log rank–test P values和Kaplan-Meier plot三种方法。

①点击进入Correlation Analysis界面,选择感兴趣的肿瘤,点击show,结果列出该肿瘤所有蛋白两两之间相关性结果,选择或Search检索目标蛋白,点击Plot查看图形结果,鼠标悬停散点上可查看具体信息。

②点击Differential Analysis进入功能界面,选择感兴趣的两种肿瘤或同一肿瘤不同亚型做差异分析,点击Show可得到差异表达结果,选择或Search检索目标蛋白,点击Plot可以出图,鼠标悬停箱图可查看具体信息。

③点击Survival Analysis进入功能界面,选择感兴趣的肿瘤数据集,点击show可得到每个蛋白生存分析结果,根据蛋白表达的中位数将患者样本分为两组,提供Cox P和Log-Rank P两个参数,选择或Search检索目标蛋白,点击Plot可以出Kaplan-Meier生存曲线图。

(2)点击Pan-cancer Analysis进入功能界面,有两个菜单:Protein Centric Analysis和Pathway Centric Abalysis。

①点击Protein Centric Analysis,可看到TCPA提供四种以蛋白为核心的基于临床信息、DNA、蛋白和RNA四个维度的分析工具。

选择Clinical,可以得到蛋白在不同肿瘤亚型、分期、病理级别和生存状态的差异性结果,Search可检索感兴趣的肿瘤或蛋白,点击plot可得到箱图结果,如下图,分别是以乳腺癌PAM50亚型和ER阳性状态分组绘图。

选择DNA,可以得到蛋白表达量在不同基因突变、甲基化和CNV拷贝数变异的差异结果,Search可检索感兴趣的肿瘤或蛋白,点击plot可得到箱图结果。

进入Protein菜单,可以得到两种蛋白相关性结果,进入RNA菜单,可以得到某蛋白与miRNA或mRNA相关性结果,此处均不做赘述。

②点击Pathway Centric Analysis,此处提示数据库更新中,可看到类似于Protein Centric Analysis菜单界面,小伙伴可自行摸索,不做赘述。

二、Cancer Cell Lines功能板块

点击Cancer Cell Lines进入功能界面:分别是Data-Sets、My Protein、Visualization和Analysis四个功能模块。

以下是四个功能模块介绍:

1 Data-Sets

点击Data-Sets进入详细界面,可以看到TCPA提供CCLE和MDACC这两个数据源的各种肿瘤RPPA数据集,选择一个点击Submit可查看具体信息。

2 My Protein

点击My Protein进入详细界面,选择CCLE或MDACC来源,选择或Search检索感兴趣的蛋白,单击Plot“+”按钮得到该蛋白在不同肿瘤组织中表达丰度柱状图。

3 Visualization

点击Visualization进入详细界面,可以看到Protein-Protein Networks和Dynamic Heatmaps菜单,后者与前述类似,点击Protein-Protein Networks进入功能界面,选择感兴趣的肿瘤,选择数据库,点击Submit,得到蛋白互作网络图,参数设置基本同前。

4 Analysis

点击Analysis进入详细界面,可以看到Protein-Protein Correlation、Protein-Drug Correlation、Protein-Mutation Correlation和Protein-Dependency Correlation菜单。点击Protein-Protein Correlation进入功能界面,选择感兴趣的肿瘤,点击Submit,得到蛋白与蛋白相关性结果,点击plot可以出图,鼠标悬停散点上可查看具体信息。

点击Protein-Drug Correlation进入功能界面,选择药物数据库和感兴趣的肿瘤,可以蛋白检索或以药物检索,点击Submit,得到与目标蛋白或目标药物相关的药物或蛋白信息,点击plot可看到蛋白-药物相关性火山图,红色代表显著正相关,绿色代表显著负相关,鼠标悬停在每个圆圈上可看到相应药物名称、相关性、p值和样本数量,点击左边小图标可下载图片。

Protein-Mutation Correlation和Protein-Dependency Correlation菜单与前述类似,小伙伴们可自行摸索。

好啦,TCGA的兄弟TCPA就介绍到这里,小伙伴们是不是都已经急不可耐去实操一遍啦,哈哈~我们下期再见了~~

点击数:0