文献解读:纯生信基因家族预测模型思路

今天跟大家分享的是2020年1月发表在Cancer Cell International(IF:3.439)杂志上的一篇文章Overexpression of kinesin superfamily members as prognostic biomarkers of breast cancer.在文章中作者使用来自多个数据集的数据进行了全面的生物信息学分析,来探索KIFs的预后价值以及潜在功能通路以及调控机制。

标题:Overexpression of kinesin superfamily members as prognostic biomarkers of breast cancer

过表达的肌动蛋白超家族分子作为乳腺癌预后生物标志物

一.研究背景

长期以来,驱动蛋白超家族(KIFs)对乳腺癌的发生发展具有重大影响,但是预后价值比较差。作者的研究旨在证明驱动蛋白超家族成员作为乳腺癌的预后生物标志物和治疗靶标的价值。

二.分析流程

 

三.结果解读

1.乳腺癌中的KIFs表达谱

图1a:热图展示了TCGA-BRCA数据中KIFs所有成员的表达情况和临床特征。

  • 聚类分析发现,大多数KIFs在肿瘤组织中过表达。

图1b:TCGA-BRCA和匹配的GTEx-breast正常样本中20个KIFs的表达情况。

  • KIF17,KIF26A,KIF7,KIFC3在TCGA-BRCA中的表达低于对应正常样本。
  • 其余16个在TCGA-BRCA中的表达显著高于对应正常样本。

图1.驱动蛋白超家族在乳腺癌中的表达谱
 

2.与生存相关的KIFs的高表达预示预后较差

作者将来自GEOMETABRIC的数据相结合,使用3951名患者的大型队列探讨KIFs在乳腺癌中的预后价值。

图2a:20个失调KIFS的生存分析。

  • 11个高表达的KIFs(KIF10,KIF11,KIF14,KIF15,KIF18A,KIF18B,KIF20A,KIF23,KIF2C,KIF4A,KIFC1)组别的OS(总生存期)、RFS(无复发生存期)、DMFS(无远处生存期)差。

图2b:使用TCGA-BRCA数据集对OS和RFS进行的KIF17和KIF4A生存分析作验证。

  • TCGA-BRCA中高表达的KIF17(红线)具有更好的OS,与GEO和METABRIC的数据结果一致;
  • TCGA-BRCA中高表达的KIF4A(黑线)的OS较差,也与GEO和METABRIC的数据结果相近。

图2.乳腺癌中20种KIFs的生存分析
 

3.构建基于6个KIFs的 risk score

图3a:根据Cvfit图,当选取KIF数为6个时,lambda值最小。

  • 表明基于6个KIFs构建的风险评分模型在准确性和简便性方面均最佳。

作者筛取了KIF10,KIF15,KIF18A,KIF18B,KIF20A,KIF4A来构建风险评分模型。

图3b:OS相关的11个KIFs的LASSO回归。

  • 依据LASSO回归和Cvfit图,作者最后筛选KIF10,KIF15,KIF18A,KIF18B,KIF20A,KIF4A来构建risk score模型。
  • 基于6-KIFs的risk scoe算法如下:Rs = 0.30Exp(KIF10) − 0.21Exp(KIF15) − 0.21Exp(KIF18A) − 0.12Exp(KIF18B) +0.02Exp(KIF20A) +0.26Exp(KIF4A)

    其中,Exp(X):基因X的表达水平

图3c:6个KIFs对应的LASSO indexes 。

图3d:通过KM生存分析对基于6-KIFs的风险评分进行验证。

  • 在TCGA-BRCA和来自GEO和METABRIC数据中,较高的风险评分的OS差。

图3e:基于患者的基本信息、病理信息、临床信息和基于6-KIFs的risk score构建的Nomogram图。

图3f:使用校准图进行验证,来评估模型的准确性。

  • 显示在5年和8年生存预测中均具有较好的准确性。

图3.OS相关的KIFs的LASSO回归和构造的列线图
 

4.乳腺癌患者KIFs的mRNA和蛋白表达上调

作者用自己的30对乳腺癌患者和正常样本队列数据来验证上述基于6-KIFs构建risk socre模型。

图4a:与正常样本相比,6个KIFs在肿瘤样本中均过表达。

图4b:TCGA-BRCA和GTE-x正常两组乳腺组织的免疫组化分析显示,乳腺癌样本中6个KIFs的蛋白水平显着上调。

图4.qRT-PCR与免疫组化
 

5.乳腺癌中MSX1为KIFs的转录因子

为了探索6个KIFs的上游调控机制,对推测的转录调控因子进行了生物信息学富集。

图5a:6个KIFs和转录因子(NKX6.1,IRF7,PBX1,PAX2,RFX1,MSX1)的相关性分析。

  • 6个转录因子都与6个KIFs呈负相关。PAX2,RFX1和MSX1显示出更显著的相关性。

图5b:与配对的GTE-x正常样品相比,TCGA-BRCA中MSX1显著下调。

图5c:利用GEO和METABRIC数据,作生存分析。

  • MSX1低表达组(黑线)的OS和RFS较差。

图5.6个KIFs转录因子的富集
 

6.GO和KEGG富集分析

图6a:upset图展示6个KIFs的共表达基因。6个KIFs交集的229个共表达基因,用于KEGG富集分析。

图6b:KEGG富集分析显示主要富集的通路为:“细胞周期”,“卵母细胞减数分裂”等。

图6c-d:6个KIFs的GO分析。

  • 分析发现这6个KIFs主要富集在“核分裂”,“DNA复制”,“染色体分离”,“有丝分裂核分裂”,“作用于DNA的催化活性”等。

图6.6个KIFs的GO和KEGG富集分析
 

 

小结

作者使用来自多个数据集的数据进行了全面的生物信息学分析,来探索KIFs的预后价值以及潜在功能通路、调控机制。

首先,作者在乳腺癌和正常组织之间共鉴定出20种差异表达的KIFs,其中4种下调,16种过表达。而通过KM分析显示11种KIFs的过表达时,OS较差。然后,通过LASSO回归生成的基于6-KIFs的risk score进行了进一步的分析,并构建了Nomogram图,验证了模型的预测效果。此外,通过qRT-PCR和免疫组化方法验证了所筛选的6种KIFs的表达谱。而且揭示了MSX1可能是潜在转录因子,该因子负调节乳腺癌中KIFs的表达。还进行了GO和KEGG分析,以探讨KIFs在乳腺癌中的潜在功能通路。
作者的这项研究一定程度上证明了KIFs成员乳腺癌的预后生物标志物和治疗靶标的价值。不过,发现的20种显著差异表达的KIFs,仅有KIF4A被进一步确定为与OS相关。此外,MSX1调控KIFs表达的机制也几乎无涉及,这也需要进一步的研究。
文献解读

文献解读:单基因新套路发高分期刊思路

2020-6-19 21:31:58

文献解读

文献解读:联合多数据集分析文章思路

2020-6-20 23:09:17

声明 本网部分文章源于互联网,转载出于传递更多信息和学习之目的,并不意味着赞同其观点。
如转载稿涉及版权等问题,请立即联系管理员,我们会予以修改、删除相关文章,请留言反馈
When your legal rights are being violated, please send an email to: sci666net@qq.com
0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索