文献分享:TARGET数据库

TARGET数据库

前言背景知识群体的全面表征儿童AML的体细胞突变儿童AML的染色体结构改变儿童AML的甲基化改变儿童AML的miRNA改变后记

前言

关于TARGET数据库,我一直没有找到相关的介绍,只是在极少数的博客上看到了有说这个数据库是针对儿童白血病的,其内容和TCGA有些类似,也是有各种组学的数据——转录组、miRNA、WGS、WES及甲基化等。虽然知道数据存放在GDC及XENA里都有,但是因为对数据库的来源及背景不是很清楚,所以一直没有去使用这个数据库。

为了解决这个窘境,我找到了介绍这个数据库的文章

文献资料:

  • 文章名:The molecular landscape of pediatric acute myeloid leukemia reveals recurrent structural alterations and age-specific mutational interactions

  • 下载地址:https://www.nature.com/articles/nm.4439

怪不得还没有过多的介绍,可能是因为这个文章也才是2017年10月才接受,12月才online吧,也就是才2年时间。

背景知识

尽管只有20%的儿科急性白血病是AML,但是AML正在超越作为儿童白血病死亡主要原因的ALL,部分原因是目前的预后分组模式的不准确。除了有明确FLT3-ITD突变的患者外,一般不使用靶向药物。这一切都是因为我们对于儿童AML生物学的不了解。

许多成人白血病中存在的复现性突变在儿童白血病中较为少见。至今没有一个较为完整的儿童白血病特征,所以这篇文章就完成了这样一工作。

Therapeutically Applicable Research to Generate Effective Treatments (TARGET) ,这是一个合作的COG+NCI项目,旨在全面描述一大群有良好注释的儿科 AML 的突变、转录和表观遗传特征。通过对不同年龄组的 AML 分子特征的比较,找出在婴儿、儿童、青少年和成人AML间突变基因、结构变异和 DNA 甲基化模式的显著差异,用于指导临床用药治疗。

TCGA里的数据很多,但是我只关注血液相关的肿瘤,其中就只能用LAML和DLBC。本来想用LAML去做DEG分析,但是,最难的问题就是没有正常对照样本???那比较什么呢???这就限制了我使用TCGA的进展。但是,后来又发现还有个叫TARGET的数据库,主要针对的是“儿童”白血病,而且数据集里有正常对照的样本,这就好了。于是就用TARGET这个数据库来做分析吧!

但是,一切的分析都要有背景知识作为前提,这样你才知道你要做DEG想得到什么样子的结果。所以,这周让我们读一读关于儿童白血病的文献,了解下背景知识吧!

群体的全面表征

  1. 一共有1023个儿童参与了 COG 研究,被纳入TARGET这个项目中。其中有993人的临床信息可以获得,具体 的临床信息条目见supplemental table 1.下面的图展示的都是这993个临床样本的信息summary。

  2. TARGET AML样本的年龄及相关临床信息总结如下图:

  • 年龄分布:8天-29岁。中位年龄:10岁。

  • 年龄分组——Infants<3 ;children:3–14;AYA:15–39岁

  1. 这些样本临床发现的结构异常详情:

只有5个突变(FLT3,NPM1,WT1,CEBPA和KIT)还有5个结构变异(RUNX1,CBFB,KMT2A,trisomy 8,loss of  ChrY)在超过5%的个体中可以找到。

注意:这里的结果都是临床检验得到的结果,并非测序得到的结果。

  1. 关于作者用WGS进行检测以及对结果进行验证的pipeline:

对197个患者的肿瘤样本和他们在缓解时的样本(作为germline)进行比较,通过WGS找出Indels、SNVs、Junctions以及CNVs改变。验证方法如下:

  • 对于WGS找到的Indels:用TCS测序在其中153个样本中验证,76%的结果用2种方法都可以找到。

  • 对于WGS找到的SNVs:用TCS测序在其中153个样本中验证,72%的结果用2种方法都可以找到。

  • 对于WGS找到的Junctions:综合临床核型分析及mRNA测序结果进行验证,89%的结果用3种方法都可以找到。

  • 对于WGS找到的CNVs:用SNP6 array在其中96个样本中验证,75%的CNV deletion or loss结果和85%的CNV gain or amplification结果用2种方法都可以找到。

对于找到并验证过的结果,在另外501个样本中也可以得到验证。

  1. 对于在684个样本中,经过多平台验证后的体细胞突变结果展示如下图:

图例说明:

  • chromCNV:chromosome-arm- or band-level copy variant

  • focalCNV:gene-level copy variant

小结论:

  • 基本上有1/4的样本是核型正常的

  • 几乎所有样本都有>1个的复现性基因突变

  1. 对于412个样本进行miRNA、mRNA和DNA甲基化分析。

  2. 从TCGA数据中去除了M3(n=20)或者BCR-ABL1融合基因(n=3)后,177个成人(>40 岁)AML的TCGA数据也用于分析。

儿童AML的体细胞突变

  1. 儿童AML有最低的突变比率,平均在CDS区每1MB碱基内有<1体细胞突变。

  2. 儿童的突变谱和成人的突变谱相差较大:

  • RAS,KIT,FLT3的突变更多见于儿童白血病患者

  1. 突变负荷随着年龄的增长而逐渐增大,但是老年人中似乎有更少的复现性细胞学改变,更多的是核型正常的个体:

  1. 相比于老年人更多是点突变或indel,在年轻人群中,更多见的则是结构变异

  1. 携带有CBFA2T3-GLIS2,KMT2A或NUP98融合基因的个体一般其携带体细胞突变的数目更少,但是生存情况会更差

  1. 携带CBF基因重排的个体倾向于携带更多的突变,且他们的预后稍好

  2. 不同年龄阶段的AML患者所携带的基因突变相差较大:

  • 年轻人多有NRAS,WT1,KRAS,CBL,GATA2,SETD2,PTPN11。

  • 老年人多有DNMT3A,IDH1/2,RUNX1,TP53,NPM1。

  1. 这里以WT1基因为例说明TCGA和TARGET里成人和儿童在WT1基因上突变发生的模式差异

  1. RAS相关基因(KRAS,NRAS,PTPN11,NF1)在儿童白血病中十分常见,并且常常和KMT2A融合基因共同出现。

  2. WT1突变更可能是年轻患者的克隆起源:

  1. 在过去大家指出FLT3的突变对于标准治疗反应较差,现在发现如果存在一些基因的共突变,则情况更差:

  • 生存情况由好到差排序:FLT3-ITD+NPM1  > 无FLT3-ITD  > 单独FLT3-ITD  > FLT3-ITD + WT1|NUP98-NSD1

  1. 这里,我们发现在儿童白血病患者中,找不到携带有DNMT3A突变的患者,要知道DNMT3A可是老年CHIP患者的头号突变基因!!5-甲基胞嘧啶的自发脱氨基作用和衰老密切相关,DNMT3A的Arg882位点上有双CpG位点,这种位点上容易发生C→T的脱氨基作用DNMT3A也可以直接与TP53相互作用,引起TP53的改变。而DNMT3A、TP53,甚至是IDH1/2这种在健康老人常见的CHIP突变基因,在儿童中基本上找不到

儿童AML的染色体结构改变

  1. 儿童白血病和成人白血病的染色体改变上也存在很大差异:

  1. 有2个基因,存在有染色体片段的缺失:

  • MBNL1:一个剪接调节因子,位于chr2

  • ZEB2:一个正常造血及白血病造血关键调节因子,位于chr3

这两个基因在位置上来说不在同一个染色体上,但是却常常发生共缺失现象。而且这些共缺失的出现常常伴有KMT2A-MLLT3融合基因的出现

同样,有MBNL1-ZEB2共缺失的个体,常常会有更大可能带有更多复现性突变。

  1. 还有15个新发现的染色体缺失发生在ELF1基因上(MEIS1基因的转录调节因子),当发生缺失后,ELF1基因的mRNA水平发生很大的改变,同时有63个基因的表达量发生相应改变:

  1. 过去报道了儿童白血病里的NUP98-NSD1融合基因,这次发现在儿童AML中,与成人相比,有不成比例过多的融合基因的存在

这些融合基因的关系如下图所示:

  1. GATA2突变常见于正常核型的AML,GATA2和CSF3R的突变一般还与CEBPA的突变共同出现。GATA2和CEBPA是在造血过程中非常重要的2个调节因子。他们可以与RUNX1相互作用,在造血和白血病发生过程中发挥重要作用。

可以发现:似乎携带有GATA2突变对患者色生存是有益处的,而CEBPA的突变则会带来不好的结果。而且不携带GATA2的危害性更强

儿童AML的甲基化改变

  1. 可以看到在成人(TCGA)和儿童(TARGET)数据中,对于表观修饰相关基因的影响比例是不同的:

  1. 于是作者联合mRNA数据及甲基化数据,确定了一些复现性基因沉默是由于启动子区的超甲基化引起的。而且,许多患者体内的许多基因都存在启动子的异常超甲基化状态,这些患者多是富集在儿童患者中,且存在有WT1基因突变

  1. Wnt–β-catenin信号通路的异常在白血病发生过程中起到重要作用,Wnt–β-catenin信号通路中的一些基因,如:DKK1,SMAD1,SMAD5,SFRP4,SFRP5,AXIN2,WIF1,FZD3,HES1和TLE1在大多数白血病患者中处于异常甲基化状态或者发生了缺失

  2. 一些抑制NK细胞激活配体的基因,如ULBP1,ULBP2和ULBP3的甲基化沉默在儿科白血病中非常常见,也许可能可以作为儿科白血病的治疗靶点

  3. 存在有KMT2A重排的患者,chr19上的ZNF系列基因(锌指蛋白)的甲基化程度较高,这些基因常常被沉默。

儿童AML的miRNA改变

  1. 对152个儿科患者进行miRNA的测序,无监督聚类结果显示人群可以被分成4个cluster:

  • 带有NPM突变的儿童患者有更高的miR-10a的表达水平。

  • miRs let-7a-3p,let-7b-5p,30a-3p,133a-3p,212-3p,29c-5p,155-5p,3614-5p表达越高,对生存越差。

  • miRs 4662-5p和26a-2-3p表达越高,对生存越好。

  1. 儿童和成人白血病的miRNA水平差异分析:

miR-330在儿童白血病中表达最高,过去被报道在白血病中有促进肿瘤生长的作用

  1. 许多与年龄相关的miRNA,在与其表达成负相关的可能靶基因上有结合位点,说明可能是这些miRNA发挥了调控作用。

  2. let-7b可能通过抑制EIF2S3的表达在儿科患者体内发挥作用,因为儿科病人一般EIF2S3表达量较低。

同时,高表达的let-7b可能预示着较快的复发

后记

可以看到,TARGET项目里关于儿童AML的数据类型还是很多的,基本上TCGA里有的这里也都有,那么在探索公共数据库的时候,我们可以考虑将TARGET数据纳入研究中。

文献解读

文献分享:青年白血病综述

2020-8-14 23:53:20

文献解读

文献综述:lncRNA经典研究思路

2020-8-14 23:57:36

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索