文献解读:肿瘤EMT纯生信分析

上皮-间质转化(EMT)是上皮细胞转化为间质细胞的过程,受到诱导因子、转录因子家族和一系列信号通路基因调控,参与肿瘤的侵袭和进展,增加肿瘤对临床干预的耐受因此,基于EMT相关基因来做肿瘤的分析多么有有意义啊!今天小编要和大文献解读的是今年2月发表在Frontiers in Oncology上的一篇研究胶质瘤EMT的文章。

Genomics and Prognosis Analysis of Epithelial-Mesenchymal Transition in Glioma
胶质瘤中上皮间质转化的基因组与预后分析
 
一. 数据和主要方法
1) 数据的收集
章收集了来自CGGA508个样本的临床病理学信息,以及来自TCGA613个样本的临床病理学信息。
2) EMT相关基因的选择
为了识别EMT相关基因,作者首先从已发表的文献中整理了22EMT相关的诱导因子、转录因子和信号通路基因。同时作者系统地比较了具有不同临床病理特征的胶质瘤中EMT相关转录特征和信号通路基因的表达,包括LGG和GBM中的IDH状态,LGG中的1p19q状态等。接着利用ONCOMINE平台和人类蛋白图谱(The Human Protein Atlas)数据库进行EMT相关基因的翻译水平的验证。
3) 生物信息学分析
为了探索胶质瘤EMT相关基因的功能,作者使用RConsensusClusterPlus 对胶质瘤的表达进行研究,分成不同的簇。
4) EMT基因的注释及差异分析
对不同组中差异表达的基因进行GOKEGG富集分析。应用GSEA研究不同亚型胶质瘤的相关功能。
5) 建立Lasso回归模型和生存分析
作者使用单因素Cox回归分析对22EMT相关基因进行筛选确定了14个与生存高度相关的基因,并使用LASSO Cox回归算法开发可能的预后风险评分模型。
 
二. 主要结果展示
1) EMT相关基因表达模式与病理特征的关系
由于已有研究表明EMT与胶质瘤恶性程度密切相关,所以在文章的第一部分作者系统地研究了胶质瘤WHO分级、IDH状态、1p/19q共缺失状态等病理特征与EMT的关系。从热图1A G可以看出,大多数EMT诱导因子、转录因子和信号通路基因的表达与WHO水平显著相关。接下来,作者研究了不同级别胶质瘤的EMT相关蛋白中IDH1p19q的状态,结果发现,在CGGA数据集中,METSNAI1等基因在带有wildtype-IDHLGG和带有mutan – IDHLGG之间有显著差异(1H)同时在图1I的GBM中作者也发现了类似的模式。作者也研究了不同1p19q状态下的差异表达基因(图1J)。IDH突LGG中,SNAI1PDGFB等基因的表达与1p/19q共缺失状态相关(1K)。接下来为了确定EMT相关基因在胶质瘤患者中的临床意义,作者选择SNAI1SNAI2等基因,利用Oncomine数据库进行数据挖掘和分析,评估蛋白表达情况(2A F)此外,作者也从人类蛋白图谱数据库The Human Protein Atlas中检索到免疫组化(IHC)数据集,展示了EMT相关蛋白的水平(图3A-D)。

图1 EMT相关基因在不同临床病理特征胶质瘤中的表达
 

2 SNAI1SNAI2BIRC5CXCR4mRNA水平的Oncomine数据挖掘分析

 图3 人蛋白图谱数据库验证显著的EMT相关基因
 
2) EMT相关基因的一致性聚类将胶质瘤分为两个具有不同病理特征和临床结局的类
在这一部分作者利用EMT相关基因表达的相似性,如图4A-C所示,将CGGA数据集中的508例胶质瘤样本分为EM1EM2两个亚组。进一步比较了两个亚组的临床病理特征。EM1亚组在诊断时主要表现为低龄化和低等级(4E)。而EM2亚组包括诊断时年龄较大并且分级较高。此外,EM2亚组的总生存(OS)EM1亚组短(4D)。这些结果表明,这两个簇与恶性胶质瘤密切相关。

 图4 EM1/2亚群中胶质瘤的临床病理特征与OS的区别
 
3) 一致性聚类得到的分类与胶质瘤的恶性程度高度相关
在文章的这一部分作者为了更清楚地了解这22EMT相关基因之间的相互作用,分析了它们之间的相关性。结果表明,同一信号通路的诱导因子、转录因子、信号通路基因具有显著的相关性(5A)。采用主成分分析(PCA)比较EM1EM2亚组的转录谱,结果表明EM2EM1之间存在显著差异(5B)。随后,识别出两个亚组间差异表达显著的基因,利用GOKEGG对其功能进行注释。结果表明,差异表达基因富集结果如图5C、D所示。接着GSEA被用来确定恶性肿瘤的关键特征。结果展示上皮间质转化等功能与恶性肿瘤相关(5E)。这些结果说明,这两类肿瘤与胶质瘤细胞的恶性程度密切相关。

 图5 EM1/2亚群中EMT相关基因的相互作用与功能注释
 
4) EMT相关基因的预后价值以及构建风险评分
接着作者为了更好地研究EMT相关基因在胶质瘤中的预后作用,使用单因素Cox回归分析来评估CGGA数据集中22个基因的表达。结果显示,22个基因中有14个与OS显著相关(6A)。接着CGGA数据集作为训练集,应用LASSO Cox回归算法表明这14个基因与OS高度相关(6AC)然后,根据最小标准选择七个基因来构建风险特征,并使用LASSO算法得到的系数来确定CGGA数据集中每个样本的风险得分。根据风险评分中位数将患者分为两组,观察到两组患者的OS有显著差异(6B)。接下来,使用TCGA 数据集作为验证数据集来计算风险评分观察到两组间的OS有显著差异(6C)ROC曲线表明风险评分可以准确预测患者的生存(6D,E)接下来,应用风险评分的热图显示,在CGGA数据集中,高风险和低风险患者中7个基因高表达(6F)

6 EMT相关基因的风险特征
 
5) 风险评分具有良好的预后性能并与样本的临床病理密切相关
在这一部分作者对每个临床病理特征进行风险评分分析,发现两组在WHO分类、1p / 19q 共缺失状态、年龄等方面存在显著差异(7AF)作者还发现与年龄等相比,风险评分具有更高的预测准确性(7G,J)。对CGGA数据集进行的多变量Cox回归和单变量分析显示,风险评分、年龄和WHO分级均与OS相关(7K)。在验证数据集(TCGA数据集)中也得到了类似的结果(7L)。这些结果表明,EMT相关基因的风险评分是神经胶质瘤患者的独立预后预测指标。接下来,作者分析了风险模型在不同WHO分级中的预后潜力。在WHO IIIII级胶质瘤及GBM中,低风险评分亚组与高风险评分亚组的OS存在差异(7MO),说明在不同分级的胶质瘤中,风险评分也具有良好的预后价值。

图7 RM1/2亚组间风险评分及临床病理特征的比较及不同级别胶质瘤OS的差异
 
到这里文章的主要内容就介绍完了,文章对胶质瘤中EMT相关基因涉及到的功能,预后意义等做了详细研究,使用了一致性聚类、LASSO Cox回归、单因素分析等生物信息方法,做预后的小伙伴可以借鉴研究涉及到的分析方法以及流程。
文献解读

基于数据挖掘初探预防新型冠状病毒肺炎中医方药

2020-3-3 14:28:17

文献解读

文献解读:TMB与肿瘤预后分析

2020-3-4 15:27:44

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索