临床研究必备!TCGA的兄弟数据库,一站式出图,还学啥R语言???!!!

临床研究必备!TCGA的兄弟数据库,一站式出图,还学啥R语言???!!!

酸菜

科研话题下的优秀回答者

对于TCGA(The Cancer Genome Atlas)这个在生信研究中大佬级别的存在,想必大家伙儿都已经耳熟能详了吧?前不久我们一本八道老师对TCGA家族的好兄弟TCIA(The Cancer Immunome Atlas)做了详细介绍,大快朵颐之后,不少小伙伴不禁感慨意犹未尽。那么在今天,就来说说TCGA的另外一个好兄弟——TCPA数据库(The Cancer Proteome Atlas),大家伙儿都备好瓜子饮料小板凳,不要走开哦~!

传送门:你造么?肿瘤数据库除了TCGA,还有TCIA?!

TCPA数据库简介

TCPA数据库网址http://www.tcpaportal.org,其介绍于2013年发表在Nature Methods杂志上,至2019年更新到3.0版本,整合了来自TCGA和一些肿瘤研究项目的RPPA(Revers Phase Protein microArray)芯片数据,包含两个独立Web板块。

TCPA数据库网址http://www.tcpaportal.org ,其介绍于2013年发表在Nature Methods杂志上,至2019年更新到3.0版本,整合了来自TCGA和一些肿瘤研究项目的RPPA(Revers Phase Protein microArray)芯片数据,包含两个独立Web板块。

1 Patient Cohorts

着眼于肿瘤患者的RPPA数据,包含肿瘤基因组图谱中32种肿瘤类型共8167个肿瘤组织样本,目前设置Summary、My Protein、Visualization和Analysis四大功能模块。对于每个数据集,TCPA还提供level3和level4数据,level3数据代表来自独立批次的归一化数据,level4数据代表多个批次的合并数据。目前更新到2019年10月3.2版本。

2 Cancer Cell Lines

侧重于肿瘤细胞系的RPPA数据,包含19个谱系的超过665个独立细胞系,同样设置Data Sets、My Protein、Visualization和Analysis四大功能模块,目前更新至2020年7月2.02版本。

下面我就来为大家进行TCPA数据库功能板块与操作演示:

一、Patient Cohorts功能板块

点击Patient Cohorts进入功能界面:左侧边栏主要是,Home(首页),Overview(数据库介绍),About(版本信息),News(历史发布消息),FAQ(常见问题),Resources(数据来源),Credits(发表论文时引用信息),Forum(论坛),Contact(联系方式)和Download(下载注意事项);右边栏分别是,Summary、My Protein、Visualization和Analysis四个功能模块。

下面是FAQ两个比较重要的问题

(1)关于什么是RPPA芯片数据?

(2)关于TCPA数据Level1~4数据类型?

点击FAQ进去可查看详情。

以下是数据来源,包括Oncomine、TCGA等数据库,并提供各个数据库访问链接。

以下是四个功能模块介绍:

1 Summary

点击Summary进入详细界面,可以看到以不同肿瘤为导向的数据集来源,样本数目和相关蛋白数目,点击Show可查看详细信息,包括数据集编号、数据来源、平台信息、种属、样本数和标准化信息等。

2 My Protein

点击My Protein进入详细界面,显示蛋白详细信息,包括对应基因、验证状态、种属和抗体来源等信息,点击Gene Info栏链接(G:GeneCard或O:OncoMX)可以查看基因信息。选择感兴趣的蛋白,单击View“+”按钮得到该蛋白在不同肿瘤组织中表达丰度柱状图,鼠标悬停在图上可查看具体统计信息。

3 Visualization

点击Visualization进入详细界面,可以看到Network Visualization网络菜单和Heatmap Visualization热图菜单。

(1)点击Network Visualization进入功能界面,选择感兴趣的肿瘤数据集,点击Dataset Description可以查看该数据集详细信息。

点击Show可以得到基于HPRD数据库的蛋白互作网络图,线条的颜色和宽度取决于两个互作蛋白之间的相关性,红色表示正相关,绿色表示负相关,右侧边栏可设置显著性条件,可隐藏非显著相关的互作关系。

点击NDEx可进入在线工具进行网络图个性化设置,左下检索框可输入感兴趣蛋白查看互作关系,可以选择感兴趣的可视化形式,右下位置可下载Cytoscape格式文件,点击Type处叹号,有多种网络图类型供大家选择。

(2)点击Heatmap Visualization进入功能界面,选择感兴趣的肿瘤数据集,可以得到三张热图,K=3,4,5分别代表分3,4,5个cluster。

选择其中一个点击进入,点击左上角Dialogs可进行个性化设置,鼠标悬停某个样本可显示其详细信息,点击左上角Misc-PDF可下载PDF格式图片。

4 Analysis

点击Analysis进入详细界面,可以看到Individual Cancer Analysis和Pan-cancer Analysis两个功能菜单。

(1)点击Individual Cancer Analysis进入功能界面,有三个菜单:Correlation Analysis相关性分析,可以在不同肿瘤甚至不同组学数据间进行;Differential Analysis差异分析,可以在两种不同类型肿瘤或者两种亚型肿瘤之间进行;Survival Analysis生存分析,提供Cox proportional hazards model, log rank–test P values和Kaplan-Meier plot三种方法。

①点击进入Correlation Analysis界面,选择感兴趣的肿瘤,点击show,结果列出该肿瘤所有蛋白两两之间相关性结果,选择或Search检索目标蛋白,点击Plot查看图形结果,鼠标悬停散点上可查看具体信息。

②点击Differential Analysis进入功能界面,选择感兴趣的两种肿瘤或同一肿瘤不同亚型做差异分析,点击Show可得到差异表达结果,选择或Search检索目标蛋白,点击Plot可以出图,鼠标悬停箱图可查看具体信息。

③点击Survival Analysis进入功能界面,选择感兴趣的肿瘤数据集,点击show可得到每个蛋白生存分析结果,根据蛋白表达的中位数将患者样本分为两组,提供Cox P和Log-Rank P两个参数,选择或Search检索目标蛋白,点击Plot可以出Kaplan-Meier生存曲线图。

(2)点击Pan-cancer Analysis进入功能界面,有两个菜单:Protein Centric Analysis和Pathway Centric Abalysis。

①点击Protein Centric Analysis,可看到TCPA提供四种以蛋白为核心的基于临床信息、DNA、蛋白和RNA四个维度的分析工具。

选择Clinical,可以得到蛋白在不同肿瘤亚型、分期、病理级别和生存状态的差异性结果,Search可检索感兴趣的肿瘤或蛋白,点击plot可得到箱图结果,如下图,分别是以乳腺癌PAM50亚型和ER阳性状态分组绘图。

选择DNA,可以得到蛋白表达量在不同基因突变、甲基化和CNV拷贝数变异的差异结果,Search可检索感兴趣的肿瘤或蛋白,点击plot可得到箱图结果。

进入Protein菜单,可以得到两种蛋白相关性结果,进入RNA菜单,可以得到某蛋白与miRNA或mRNA相关性结果,此处均不做赘述。

②点击Pathway Centric Analysis,此处提示数据库更新中,可看到类似于Protein Centric Analysis菜单界面,小伙伴可自行摸索,不做赘述。

二、Cancer Cell Lines功能板块

点击Cancer Cell Lines进入功能界面:分别是Data-Sets、My Protein、Visualization和Analysis四个功能模块。

以下是四个功能模块介绍:

1 Data-Sets

点击Data-Sets进入详细界面,可以看到TCPA提供CCLE和MDACC这两个数据源的各种肿瘤RPPA数据集,选择一个点击Submit可查看具体信息。

2 My Protein

点击My Protein进入详细界面,选择CCLE或MDACC来源,选择或Search检索感兴趣的蛋白,单击Plot“+”按钮得到该蛋白在不同肿瘤组织中表达丰度柱状图。

3 Visualization

点击Visualization进入详细界面,可以看到Protein-Protein Networks和Dynamic Heatmaps菜单,后者与前述类似,点击Protein-Protein Networks进入功能界面,选择感兴趣的肿瘤,选择数据库,点击Submit,得到蛋白互作网络图,参数设置基本同前。

4 Analysis

点击Analysis进入详细界面,可以看到Protein-Protein Correlation、Protein-Drug Correlation、Protein-Mutation Correlation和Protein-Dependency Correlation菜单。点击Protein-Protein Correlation进入功能界面,选择感兴趣的肿瘤,点击Submit,得到蛋白与蛋白相关性结果,点击plot可以出图,鼠标悬停散点上可查看具体信息。

点击Protein-Drug Correlation进入功能界面,选择药物数据库和感兴趣的肿瘤,可以蛋白检索或以药物检索,点击Submit,得到与目标蛋白或目标药物相关的药物或蛋白信息,点击plot可看到蛋白-药物相关性火山图,红色代表显著正相关,绿色代表显著负相关,鼠标悬停在每个圆圈上可看到相应药物名称、相关性、p值和样本数量,点击左边小图标可下载图片。

Protein-Mutation Correlation和Protein-Dependency Correlation菜单与前述类似,小伙伴们可自行摸索。

好啦,TCGA的兄弟TCPA就介绍到这里,小伙伴们是不是都已经急不可耐去实操一遍啦,哈哈~我们下期再见了~~

点击数:0

Nature论文深度解读!首次构建出人类心脏的细胞和分子图谱,有

每日医学资讯

09/29/2020

Nature论文深度解读!首次构建出人类心脏的细胞和分子图谱,有助开发个性化的心脏病治疗方法!

在一项新的研究中,来自美国哈佛医学院、布莱根妇女医院、英国韦尔科姆基金会桑格研究所、伦敦帝国理工学院和德国马克斯-德尔布吕克分子医学中心等研究机构的研究人员构建出健康的人类心脏的详细细胞和分子图谱,以了解这一重要器官如何发挥功能并阐明心血管疾病的问题所在。相关研究结果于2020年9月24日在线发表在Nature期刊上,论文标题为“Cells of the adult human heart”。

图片来自Frontiers in Cardiovascular Medicine, 2018, doi:10.3389/fcvm.2018.00101。

这些作者分析了近50万个细胞,建立了迄今为止最全面的人类心脏细胞图谱。该图谱显示了细胞的巨大多样性,并揭示了心肌细胞类型、心脏保护性免疫细胞和错综复杂的血管网络。它还预测了这些细胞如何进行交流以保持心脏正常工作。

这项研究是“人类细胞图谱(Human Cell Atlas)”计划的一部分,该计划旨在绘制人体的每一种细胞类型。新的有关心脏的分子和细胞知识有望让人们更好地了解心脏疾病,并指导开发高度个性化的治疗方法。这些作者表示,这项研究也为在未来开发出基于再生医学的疗法奠定了基础。

在人的一生中,心脏平均要向身体发出20多亿次维持生命的跳动。在这样做的过程中,它帮助向细胞、组织和器官输送氧气和营养物,并使二氧化碳和废弃物得以清除。每天,心脏在四个不同的腔室中单向跳动约100000次,它的跳动速度随着休息、运动和压力的变化而发生变化。每一次的跳动都需要心脏不同部位的各个细胞保持极其复杂而又完美的同步。当这种复杂的协调出现问题时,就会导致心血管疾病,这是全球主要的死亡原因,估计每年有1790万人死亡。

详细了解健康心脏细胞内的分子过程,对于了解心脏病中哪些方面出错至关重要。这些知识可以为各种形式的心血管疾病带来更精确、更好的治疗策略。

论文共同通讯作者、哈佛医学院布拉瓦特尼克研究所医学教授Christine Seidman说,“数百万人正在接受心血管疾病治疗。了解健康的心脏将帮助我们了解细胞类型和细胞状态之间的相互作用,以及这些细胞在疾病中的差异。”

Seidman说,“最终,这些基本的见解可能会提出特定的靶标,从而在未来实现个性化治疗,创造个性化的心脏病药物,并改善每名患者的治疗效果。”

这些作者研究了来自14名心脏健康但不适合移植的器官供者的心脏6个不同区域的近50万个细胞和细胞核。通过联合使用单细胞分析、机器学习和成像技术,他们可以观察到每个细胞中到底有哪些基因开启和关闭。

这些作者发现,心脏不同区域的细胞存在重大差异。他们还观察到,心脏的每个区域都有特异性的细胞亚群—这一发现指向不同的发育起源,并表明这些细胞对治疗的反应可能会有所不同。

论文共同第一作者、哈佛医学院遗传学研究员Daniel Reichart说,“这个项目标志着对心脏是如何利用单细胞构建的新理解的开始,毕竟许多细胞具有不同的细胞状态。随着对整个心脏的区域性差异的了解,我们可以开始考虑年龄、运动和疾病的影响,并帮助推动心脏病学领域走向精准医学时代。”

论文共同通讯作者、马克斯-德尔布吕克分子医学中心授Norbert Hübner说,“这是第一次有人在这种尺度下观察人类心脏的单个细胞,这只有在大规模单细胞测序下才有可能。这项研究显示了单细胞基因组学和国际合作的力量。了解全部心脏细胞及其基因活性是了解心脏功能和开始揭示它如何应对压力和疾病的基本必要条件。”

作为这项研究的一部分,这些作者还以前所未有的细节观察了穿过心脏的血管。该图谱显示了这些静脉和动脉中的细胞如何适应不同的压力和位置,以及这如何帮助人们了解在冠心病期间血管中出现了什么问题。

论文共同通讯作者、伦敦帝国理工学院的Michela Noseda说,“我们的国际合作阐明将血液泵送到全身的心脏细胞的分子和细胞细节,为科学界提供了一组宝贵的信息。我们绘制了可能会被SARS-CoV-2感染的心脏细胞,并发现小血管中的特定细胞也是这种病毒感染的靶标。我们的数据集是了解心脏病细微之处的信息宝库。”

这些作者还把重点放在理解心脏修复上,研究健康心脏中的免疫细胞如何与其他细胞进行相互作用和沟通,以及它们与骨骼肌有何不同。进一步的研究将包括探究是否可以诱导任何心脏细胞进行自我修复。

论文共同通讯作者、韦尔科姆基金会桑格研究所的Sarah Teichmann说,“这项伟大的合作努力是全球人类细胞图谱计划的一部分,该计划旨在构建人体的'谷歌地图'。”

她说,“心脏细胞图谱向全世界的科学家们开放,它是一种奇妙的资源,将导致人们对心脏健康和疾病的新理解,开发新的治疗方法,甚至可能找到再生受损心脏组织的方法。”

参考资料:

1.Monika Litviňuková et al. Cells of the adult human heart. Nature, 2020, doi:10.1038/s41586-020-2797-4.

2.Highly detailed map of the human heart could guide personalized heart treatments

medicalxpress.com/news/2020-09-highly-human-heart-personalized-treatments.html

来源:生物谷

点击数:0