SEdb:一个全面的人类超级增强子数据库

提到超级增强子,我首先想到的是增强子这个概念,我们先来看下增强子的概念,增强子为基因组上的一段DNA序列,可与转录因子配合调控基因的表达。我们知道人体所有细胞基因组相同,但是细胞的形态和功能各不相同,这很大程度上是由增强子决定的。

那么超级增强子“超级”在哪里呢?具体来说,超级增强子较普通增强子表现出更高的转录因子密度,并且经常与控制体细胞中细胞状态和分化的关键谱系特异性的基因相关,它促进基因表达的能力更强,主要负责调控决定细胞身份的基因的表达。大部分超级增强子在细胞内处于抑制状态,一般只有少量决定细胞身份的超级增强子被打开,一旦细胞内超级增强子打开错误,或靶向的基因错误,就导致肿瘤的发生。很多关键致癌基因都是超级增强子驱动的。肿瘤发生过程中,肿瘤细胞还会在致癌基因处构建超级增强子,用于驱动致癌基因的表达。相比单个基因,肿瘤细胞更依赖超级增强子。这意味着超级增强子或许是不错的抗肿瘤靶点,表明了超级增强子在生物学和医学研究中具有重要的作用和广泛的应用。

因此我们迫切需要全面有效地收集和处理这些数据。尽管科学家们已经开发了几个超级增强子数据库,例如dbSUPER和SEA,但是目前现有的这两个数据库仅提供了关于超增强子的基本信息,例如其基因组位置,细胞或组织类型和相关基因。那么今天给大家介绍的这个数据库提供了有关超级增强子的详细遗传和表观遗传注释信息,有助于阐明超级增强子相关功能并发现潜在的生物学效应——- SEdb: a comprehensive human super-enhancer database

网址:http://www.licpathway.net/sedb/

在使用上,我们可以通过“数据来源”,“生物样本类型”,“组织类型”和“生物样本名称”

进行浏览。比如我们选择组织类型中lung进行浏览:

结果显示肺组织中所有样本的超级增强子还包括基本信息,比如样本ID号,数据来源,样本类型以及样本名字等。

在搜索界面,数据库提供了三种查询方法,包括基于组织类别,基于基因和基于样本的查询

组织查询:以查询lung为例

 

 

 

超级增强子区域中的常见SNP的数量和超级增强子内的常见SNP的细节

我们可以看到这里面除了关于超级增强子的一般信息之外,SEdb还列出了更详细的注释信息,包括常见的SNP,eQTL,风险SNP,TFBS,CRISPR / Cas9靶位点,DHS和增强子。

 

通过五种不同的鉴定策略提供可能与超级增强子相关的基因:

超级增强子元件的详细信息和分析:

与此超级增强子重叠的样本中标识的其他超级增强子的链接,相当于区域富集分析

基因查询以搜索数据库自带的“FLJ35776”基因为例

 

样本查询:以数据库自带的“K562”样本为例

该数据库提供了在线分析工具:Gene-SE AnalysisSNP-SE AnalysisOverlap Analysis

Gene-SE Analysis:

SNP-SE Analysis :

Overlap Analysis:

此外,该数据库提供了数据可视化的工具Genome-Browser ,可以查看超级增强子的临近信息:

接下来就是数据下载了,SEdb为每个样本提供超级增强子和超级增强子元件的下载,我们可以选择bed格式或者是csv的格式进行下载,还支持所有超级增强子的打包下载。

比如我们下载超级增强子的打包bed 文件,下载后的结果:

下面就是数据库的统计页面了,在“统计”页面中,我们可以直观地看到SEdb的统计信息,包括数字显示和图形显示。此外,还提供了DHS和增强子的样本信息。

 

最后是数据库的提交页面,我们可以通过提交原始数据的GEO / SRA系列号将自己的H3K27ac数据共享到SEdb中。

好啦,这个数据库就介绍到这里啦,希望对大家有帮助呦!

工具介绍

Joint Genomics Institute:联合基因组研究中心数据库

2019-12-27 16:11:31

工具介绍

UK Biobank数据申请的基本流程

2019-12-27 16:15:17

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索