文献解读:生信分析与Meta分析如何组合使用

生信分析Meta分析一样都是基于数据分析来得出一定的结论,不知小伙伴们看多了生信分析的文章之后有没有觉得meta分析就隐藏其中?如果在生信分析的过程中用上Meta分析的方法,会不会对我们的数据质量有所提高?今天介绍两篇文章让大家见识一下生信分析和Meta分析是如何组合使用的。

 

Clinical Value and Prospective Pathway Signaling of MicroRNA-375 in Lung Adenocarcinoma: A Study Based on the Cancer Genome Atlas (TCGA), Gene Expression Omnibus (GEO) and Bioinformatics Analysis (Med Sci Monit, IF=1.585)

 

作者的研究方向是肺癌,大量研究表明。。。(此处省略一万字),所以选择miR-395作为研究对象。首先利用TCGA的临床信息验证miR-395与临床特征的相关性,除了组织来源不同(癌和癌旁)以外,其它都没有相关性,说明miR-395在肺癌组织中特异性的异常表达。接下来作者又利用文献筛选的方法,筛得7个GEO的数据集进行进一步的验证。
看到这两张图你是不是完全相信了这是一篇meta分析?!
然而画风陡然一变就成了生信分析:
接下来作者利用miRNA的靶基因预测工具预测了miR-395的靶基因,并对这些靶基因进行GO和KEGG分析,探究miR-395的生物学功能,然后做了以上这副图中的PPI(Protein-protein interaction)网络(String上直接导出的图~),最后做了一个靶基因与miR-395的表达相关性验证,全文终。

 

Down-regulation of miR-146a-5p and its potential targets in hepatocellular carcinoma validated by a TCGA- and GEO-based study(FEBS OPEN BIO,IF=2.143)

 

作者之前研究过miR-146a-5p,发现miR-146a-5p的下调与肝癌的恶化密切相关,为进一步探究其中的机制,作者决定生信和meta并用,搞一波事情。作者从2705个数据集中利用Meta分析的流程筛选出9个与当前研究相关的能用的数据集,然而9个数据集只有3个数据集显示miR-146a-5p具有显著差异。。。只有两个ROC曲线表明其具有显著的识别值。
老铁,这样不行啊,还是得请TCGA数据库出场,于是作者又利用TCGA数据库做了一遍以上工作,结果表明这个miRNA确实还是可以的。

接下来又回到生信的部分,预测靶基因进行功能分析。
童鞋们,这套路你们看懂了没?有人可能会觉得这有点水。确实, 这属于比较简单的生信+Meta分析的套路,但是俗话说的好“万丈高楼平地起”,CNS级的数据挖掘分析文章并不是一下子就能学会怎么做的。

 

以上两篇文章中Meta的方法筛选芯片数据的部分大家可能比较陌生,这里本宫给大家简单介绍一下流程,具体的大家可以参看Key Issues in Conducting a Meta-Analysis of Gene Expression Microarray Datasets (Plos Medicine,IF=11.862)

 

文中将芯片数据的meta分析分为7个步骤:
1、筛选合适的芯片研究
2、从研究中提取数据
3、准备数据集
4、对数据集进行注释
5、解决基因和探针之间多对多的关系
6、合并study-specific estimates
7、分析、展示数据
作者十分贴心地提供了芯片数据meta分析的数据来源
最给力的是,文章还进行了一个实例分析,这里就不赘述了,大家赶紧把文章下下来看一看吧!

文献解读

【文献解读】利用METABRIC和TCGA挖掘CNA负荷对乳腺癌的预后影响

2019-10-11 21:40:41

文献解读

文献解读:通过TCGA的数据和生物信息学分析快速灌水发低分期刊

2019-10-15 19:54:16

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索