在我们介绍的数据库中,TCGA、oncomine等等这些都是以肿瘤为主,后台有些非肿瘤的同学就不乐意了,让我们推荐一些非肿瘤方向的数据库,今天我们推荐一些给大家。

1. 数据库名称:RGD Disease数据库

网址:http://rgd.mcw.edu/wg/portals/

是否需要注册:是

所属分类:综合性数据库

功能:包括了肿瘤、血液病、心血管、糖尿病、神经系统、免疫等相关的各个分支。可以查询疾病的基因信息,包括了基因在人类、大鼠、小鼠三个物种中的信息,GO注释的信息,以及更多的每个基因的注释信息,包括疾病、物种保守性、作用的化合物、miRNA等。除了疾病之外,还有很多其他功能可以应用。

2. 数据库名称:GEO数据库

网址:http://www.ncbi.nlm.nih.gov/geo

是否需要注册:是

所属分类:综合性数据库

功能:NCBI于2000年创建并维护至今的高通量基因表达数据库,收录并整理了全球范围内研究者上传的微阵列芯片、二代测序以及其他形式的高通量基因组数据,并提供免费下载。GE0涵盖500多种生物、300k个样本、16亿个基因表达丰度数据。GEO分为GEO DataSets和GEO Profiles两个子数据库,GEO DataSets以数据集为单位,存储同一个实验中的数据,GEO Profiles以基因为单位,存储基因在数据集中的表达谱。通过GEO数据库,可进行差异基因挖掘和基因表达数据挖掘等,GEO还提供在线分析工具GEO2R,可对GEO的系列数据进行分析。

3. 数据库名称:ArrayExpress数据库

网址:https://www.ebi.ac.uk/arrayexpress/

是否需要注册:公共数据无需注册登陆,私有或预先发表的需要

所属分类:综合性数据库

功能:欧洲生物信息学研究所EBI旗下的微阵列基因表达数据的公共数据库,设计用来保存来自所有芯片和高通量测序的数据,数据库目前已收集了73321次实验的57.81TB存档数据,是GEO数据库良好的补充。ArrayExpress数据的检索非常简单,在Browse中可以查看所有的实验,通过在搜索框中输入关键字直接搜索或在Filtering results设定物种、实验类型、平台等信息进行高级搜索。此外,数据库提供用于访问ArrayExpress并构建数据结构的R包ArrayExpress Bioconductor package。

4. 数据库名称:GeneCard数据库

网址:https://www.genecards.org/

是否需要注册:否

所属分类:综合性数据库

功能:GeneCard是一个整合的数据库,由以色列魏茨曼科学研究所皇冠人类基因组中心于1997年创建并维护至今,目的是将分散的基因信息汇总整合,便于迅速获取基因的全部信息。数据库提供所有注释和预测的人类基因信息,收集了来自约150个网络资源的以基因为中心的数据,包括基因组、转录组、蛋白质组、遗传、临床和功能信息。目前是5.0版本,涵盖270168条基因数据,包括18871个疾病相关的基因,20916蛋白编码基因,75839lincRNA等,是目前信息最全的基因注释网站之一。

5.数据库名称:OMIM数据库

网址:https://omim.org/

是否需要注册:否

所属分类:信息数据库

功能:OMIM数据库主要关注人类基因变异和表型性状之间的关系。对于等位基因,每一条记录都有一个唯一的MIM 编号,由点号分隔的两部分构成,点基因和表型之间的关联,号之前是突变位点对应的OMIM 编号,点号之后是一个由4位数字构成的唯一ID, 用来记录等位基因。数据库中的记录,分成了5个类别,即基因相关信息,基因和表型间的关联,表型相关分子机制,疾病相关遗传突变位点和其他类型的记录。

6.数据库名称:ENCORI

网址:http://starbase.sysu.edu.cn/

是否需要注册:否

所属分类:综合性数据库

功能:该数据库主要为研究RNA相互作用提供帮助,可用数据库来分析miRNA与其靶标mRNA/lncRNA/cirRNA/sncRNA之间的相互作用,或者RNA与RNA(lncRNA/cirRNA/sncRNA/miRNA)其相互作用的证据来源包括有多个软件预测、CLIP实验、RNA-RNA interactome等。还可以分析ceRNA机制,搜索RBP(RNA结合蛋白)与靶标的相互作用,RBP与motif的结合,RBP与疾病的关系。还可以进行通路富集分析,另外也可以对TCGA的数据进行相关性表达分析和生存分析。

7.名称:细胞定位及标志物数据库CellMarker

网址:http://biocc.hrbmu.edu.cn/CellMarker/

是否需要注册:否

所需功能分类:CellMarker数据库收录了158种组织/亚组织的467种人细胞类型, 81种组织/亚组织的389种鼠细胞类型。数据主要来源于文献和数据库,包括单细胞测序数据和生物实验数据。数据库使用简单,物种包括了人和小鼠,可搜索,可浏览,可下载

点击细胞或组织可以快速查找标志物;进入Marker的词云图,可知星形胶质细胞的最常用的标志物是GFAP;Brain RNA-Seq数据库查询GFAP也证实了其为星形胶质细胞特异性标志物;Cell search展示了方法2的搜索结果,展示了特定组织、特定细胞,同时可以在下面的伸缩框中选择组织、细胞进行重新搜索

8. 心血管系统数据库:CVDHD

网址:http://pkuxxj.pku.edu.cn/CVDHD/index.php

是否需要注册:是

所属分类:心血管系统数据库

功能:该数据库可以说是心内科医生的福音啦,里面心内科方向疾病有很多种,包括常见的高脂血症、冠状动脉硬化、高血压等常见专科疾病的基因组、蛋白质组、转录组、遗传和功能信息,用户介面很友好,如想详细了疾病,还提供了该疾病的现代流行病学,临床特征,分子遗传学水平的发病机理等。待会我一截图大家就明白了,正好昨天有学员讨论到这个问题,今天就碰到了!

9.数据库名称:Drugbank数据库

网址:http://drugbank.ca/

是否需要注册:否

所属分类:综合性药物数据库

功能:DrugBank是一个混合了生物信息学与化学计量学资源的数据库,它将详尽的药物数据(比如化学、药理与制药)与综合药物靶标信息(比如序列、结构与途径)相结合,可以用来检索药物,靶点,转运蛋白及生物相互作用信息。也就是说,检索药物的时候,可以用来发现药物相关用途,相关疾病,药效学,作用机制以及结合蛋白等。药物靶点来说,可以观察靶蛋白相关药物。通常,在DrugBank库中可进行大规模的计算机模拟药物筛选。

10.数据库名称:AlzBase

网址:https://bigd.big.ac.cn/databasecommons/database/id/1793

是否需要注册:是

所属分类:转录组学数据库

功能:AlzBase知识库收集了若干组代表性的AD脑转录组研究结果,并结合AD研究中的一些热点问题整合了近几年发表的AD外周血转录组数据和几种被认为与AD相近的神经推行性疾病的研究结果,使得知识库既可提供AD相关基因扰动知识又可在扰动特异性等方面提供有价值的参考信息。用户可根据检索需求进行单个基因的查询,也可进行批量搜索;AlzBase知识库的核心信息是基因在各个数据集中的扰动频率信息,高扰动频率意味着有多组独立实验的支持,因此更具参考意义。除扰动频率信息外,知识库还提供了基因与疾病进程相关性信息以及基因功能和基因调控方面的注释信息,这些信息的加入使得AlzBase对AD基因知识的注释更加全面,相关的检索工作更加方便快捷。AlzBase提供了四种与阿尔茨海默病(AD)有关的基因信息:1)AD、衰老及相关疾病的基因失调。2)多级注释,包括与AD严重程度的相关性。3) 基因网络包括大脑共表达网络。4)AD基因研究综述

11. 数据库名称:qphos

网址:http://qptm.omicsbio.info/

是否需要注册 否

所属分类:信息数据库

功能:磷酸化修饰是蛋白翻译后修饰的一种常见修饰方式,该数据库收集了目前已发表的所有人类相关研究中的所有定量磷酸化数据,包括在484个条件下,共199071个位点的3537533个定量事件。用户可以比较不同实验条件下或者不同细胞类型中,不同蛋白的各个磷酸化位点的磷酸化水平差异,为研究磷酸化相关的分子机制提供有效帮助。另外,用户还可以通过提交定量磷酸化信息,来分析相关激酶的激活情况。

12.数据库名称:Gene to phenotype

网址:https://www.ebi.ac.uk/gene2phenotype

是否需要注册:否

所属分类:综合数据库

功能:G2P是一个可公开访问的在线系统,在G2P中,每个数据集都集中在与孟德尔疾病的临床诊断相关的疾病分组或定义的临床表现类别上。旨在促进开发,验证,管理和分发大规模的,基于证据的数据集,以用于诊断变量过滤。每个G2P条目都将等位基因需求和已定义位点的突变结果与疾病实体相关联。置信度和证据链接分配给每个条目。

13.数据库名称:shinyGEO

网址:http://gdancik.github.io/shinyGEO/

是否需要注册:是

所属分类:综合性数据库

功能:GEO数据库包含了许多非肿瘤的数据集,而shinyGEO是基于R语言中的shiny包而制作的一个web application。用户只需要提供GEO中的检索号,就可以通过shinyGEO下载表达谱数据,并对感兴趣的基因进行差异表达分析(如果是有临床信息还可以进行相关分析),并生成高质量的图片,还提供分析的R语言代码。

14. 数据库名称:Malacards

网址:https://www.malacards.org/

是否需要注册:否

所属分类:疾病数据库

功能:Malacards数据库是人类疾病及注释的综合数据库,它整合了 72 个数据库的信息,当我们要研究某种疾病时,输入相应疾病名称即可搜索,检索结果可涵盖基因与基因突变信息,组织,相关疾病,论文发表情况,通路及症状、表型药物等内容。也就是说,通过该数据库,你可以跳转到OMIM看疾病-基因之间的关系,也可以通过总结summary板块看到多个数据库对于该疾病的总结,甚至Related Diseases板块,通过认识疾病之间的相互作用关系,方便我们在研究的时候把不同的疾病联系起来。

15. 数据库名称:SEdb

网址:http://www.licpathway.net/sedb/

是否需要注册 否

所属分类:信息数据库

功能:该数据库注释了超级增强子在基因调控中的潜在功能。截止目前,SEdb记录了542个样本中总共331601个超级增强子。此外,SEdb还提供有关超级增强子的详细遗传和表观遗传注释信息。包括用于深入分析超级增强子的常见SNP,序列变化,表达定量性状基因座(eQTL),风险SNP,转录因子结合位点(TFBS),CRISPR / Cas9目标位点和DNase I超敏性位点(DHS)。SEdb可帮助阐明与超级增强子相关的功能,并发现潜在的生物学效应。

16. 数据库名称:gutMEGA

网址:http://gutmega.omicsbio.info

是否需要注册:否

所属分类:组学数据库

功能:该数据库由中山大学的研究团队建立,共收集了6457个分类单元的58132个定量事件,共有776个不同条件,涉及7个不同水平(界、门、纲、目、科、属、种)。用户可以比较不同条件下(例如高级结直肠腺瘤VS正常组,寻常痤疮患者VS正常人)肠道菌群的含量差异,网站可以自动绘图,也可以下载结果自己进行筛选。还可以查看相关研究的来源。也可以在Search模块对感兴趣的研究条件和分类进行搜索。

17.数据库名称:MENDA

网址:http://menda.cqmu.edu.cn:8080/index.php

是否需要注册:否

所属分类:疾病相关数据库

功能:整合了抑郁症代谢特征的所有可用知识和数据集。MENDA是通过手动提取信息,然后用感兴趣的词汇进行注释而开发。MENDA数据库从5个电子文献数据库和5个代谢组学数据库中筛选出了10000多条引文,包含了人类(n=283)、大鼠(n=125)、小鼠(n=49)和非人类灵长类(n=8)在内的464项研究,并从中挑选了5675个差异代谢物条目:675个差异代谢物条目有1347个条目来自人类,3127个条目来自大鼠,1105个条目来自小鼠,96个条目来自非人类灵长类动物。病人包括抑郁患者、老年人抑郁症与中风后抑郁等,抑郁动物模型包括慢性温和应激抑郁模型(Chronic mild stress, CMS模型)、社会挫败模型(Social defeat stress, SDS模型)、慢性束缚应激模型(Chronic restraint stress, CRS模型)、习得性无助模型(learned helplessness, LH模型)、脂多糖模型(lipopolysaccharide, LPS模型)等。

18. 数据库名称:iUUCD

网址:http://iuucd.biocuckoo.org/index.php

是否需要注册:否

所属分类:信息数据库

功能:iUUCD(泛素和类泛素结合数据库)包含从148个蛋白质组数据集中收集的136512种潜在蛋白质。iUUCD已整理收集E1(泛素激活酶),E2(泛素结合酶),E3(泛素连接酶),DUB(去泛素酶),UBD(包含泛素结合域的蛋白质)和ULD(包含泛素样域)蛋白质)和泛素样修饰的相关数据信息。iUUCD整理了来自68种动物,39种植物和41种真菌的74个科的E1,E2,E3,DUB,UBD和ULD信息。此外,iUUCD还为数据库中所有蛋白质提供注释信息,包括肿瘤中的突变,单核苷酸多态性,mRNA表达,DNA和RNA元件,蛋白质-蛋白质相互作用,蛋白质结构,疾病相关信息,翻译后修饰,DNA甲基化,蛋白质表达,蛋白质功能信息等。

19. 数据库名称:ConsensusPathDB

网址:http://cpdb.molgen.mpg.de/

是否需要注册:否

所属分类:蛋白质数据库

功能:ConsensusPathDB数据库是一个分子功能互作数据库,整合了蛋白互作信息,遗传互作信息,代谢组,基因调控,药物靶点互作信息等。ConsensusPathDB当前版本为23,包括来自30个数据库的信息。利用网页界面,用户可以搜索物理词条,包括蛋白,通路,代谢等等,或者利用名字或ID编号检索通路。选择的互作可以在交互界面进行可视化。此外,ConsensusPathDB数据库允许用户以BioPAX格式或是以图片格式下载模型。

20. 数据库名称:SuperTarget

网址:http://insilico.charite.de/supertarget/index.php

是否需要注册:否

所属分类:药物靶点数据库

功能:SuperTarget是一个收集有关药物-靶点关系的信息的数据库。SuperTarget整合了DrugBank, BindingDB and SuperCyp。它主要由三种不同类型的实体,包含药物、蛋白质和副作用三部分。除此之外,还可以获得关于pathways和ontologie的信息。如细胞色素p450等。

21.数据库名称:CTD(比较毒物遗传数据库)

网址:http://ctdbase.org/

是否需要注册:否

所属分类:疾病相关数据库

功能:CTD是一个强大的,公开的数据库,旨在促进对环境暴露如何影响人类健康的理解。它提供了有关化学-基因/蛋白质相互作用、化学-疾病和基因-疾病关系的人工管理信息。这些数据与功能和通路数据相结合,有助于发展关于环境影响疾病的机制的假设。还有其他正在进行的项目,包括人工处理暴露数据和化学-表型关系,以帮助识别环境暴露导致的疾病前生物标志物。

22. 数据库名称:BioGPS

网址:http://biogps.org/#goto=welcome

是否需要注册:否

所属分类:信息数据库

功能:BioGPS是一个简便快捷查询基因信息的数据库,用户只需要在Search框输入基因名称,就可以进行查询。展示包括有基因简介、探针名、在不同正常组织中的表达量(除了常见的大器官组织,还有各种免疫细胞,例如CD4+/CD8+/NK细胞/单核细胞),还有染色体定位、基因功能GO、转录本信息、编码蛋白信息,还可以找到wiki,KEGG,Pathway等相关信息。该数据库涵盖多物种,包括人、小鼠、兔子、斑马鱼等。

23. 数据库名称:EBI scSeq

网址:https://www.ebi.ac.uk/gxa/sc/home

是否需要注册:否

所属分类:疾病数据库

功能:EMBL-EBI是欧洲分子生物学实验室(EMBL)的一部分,该实验室是由27个成员国,2个潜在成员国和2个准成员国资助的国际性,创新性和跨学科研究组织。该网站通过一系列服务和工具向科学界免费提供全球公共生物数据,进行基础研究并提供生物信息学专业培训。EMBL-EBI的数据涵盖基因组学,蛋白质,表达,小分子,蛋白质结构,系统,本体和文献。该网站还可以帮助我们了解遗传学如何影响人类,植物和动物的健康,以及多种疾病的预防。

24. 数据库名称:MIMIC 数据库

网址:https://about.citiprogram.org/en/homepage/

是否需要注册:是

所属分类:重症医学数据库

功能:MIMIC 是一个重症医学数据库,全称是Medical Information Mart for Intensive Care。2003年,在NIH的资助下,来自贝斯以色列女执事医疗中心(Beth Israel Deaconess Medical Center)、麻省理工(MIT)、牛津大学和麻省总医院(MGH)的急诊科医生、重症科医生、计算机科学专家等共同建立的一个数据库MIMIC III 数据库为普通医生,特别是重症医学科医生开展临床研究提供了极大的便利,因为该数据不仅资料详细,而且包括随访资料。其随访终点包括:住院期间死亡、ICU内死亡和出院后的全因死亡。对影响重症病人预后的因素进行探讨具有极为重要的价值,因为疾病预后在很大程度上可以影响治疗措施的制定。

25. 数据库名称:BioLINCC

网址:https://biolincc.nhlbi.nih.gov/

是否需要注册:否

所属分类:疾病数据库

功能:包含面向全部用户的公共信息和面向注册用户的个人空间。BioLINCC提供了NHLBI临床注册研究和流行病学研究的大量信息,既包含研究总结、参考文献和研究方案,也包含相关研究的深度信息,包括相关研究的延伸信息、BioLINCC模板以及利用该研究数据发表的文献集合。用户如申请相关数据,应成为注册用户。BioLINCC网站导航栏包括生物标本和数据资源(Biospecimen andData resources),使用手册和表格(Proceduresand Forms),新建或提交数据库(Build/submitNew Collection)。

26. 数据库名称:PTMD

网址:http://ptmd.biocuckoo.org/

是否需要注册:否

所属分类:信息数据库

功能:PTMD由华中科技大学薛宇教授实验室建立,该数据库从文献中搜集了不同PTM(翻译后修饰)类型和不同疾病之间关系的研究证据。目前,PTMD搜集了749种蛋白质中1950种与疾病相关的PTM事件,涉及24种PTM类型和275种疾病。在该数据库中,PTM疾病关联分为6类,包括U/D(PTM水平的上调/下调),P/A(PTM存在/不存在)和C/N(通过突变创建/破坏PTM位点)。用户可以通过直接在搜索栏,或者在通过Browse功能查找相关信息。

27. 数据库名称:Lncrnadisease

网址:http://www.cuilab.cn/lncrnadisease

是否需要注册:否

所属分类:疾病数据库

功能:Lncrnadisease是一个有关lncRNA与疾病的数据库,主要收入了已研究与166种疾病相关的1564个lncRNA数据。标准化了疾病名字和lncRNA功能异常类型,并为每一个条目提供了详细的描述。同时也可对新的lncRNA进行与疾病关联预测,支持上传、浏览、搜索和数据下载。

本文首发于“挑圈联靠”微信公众号

转载请注明:解螺旋·临床医生科研成长平台

点击数:0