手把手教你用R语言下载TCGA数据库:RTCGA

各位朋友,大家好,今天我们继续在TCGA R包的海洋里遨游,作为TCGA下载专业户,我们继续分享tcga好用的工具包,今天的主角是RTCGA。RTCGA这个包工作流程如下:

该包实际上一系列根据数据类型分离的包,相当于要先下载这些离线数据R包之后再直接从离线数据包里面获取TCGA的所有数据。具体网址:

https://rtcga.github.io/RTCGA/index.html

下面开启你的R界面,学习该包:

1. 首先安装,因为我们是需要下载RNAseq数据,所以我们还需要安装RTCGA.mRNA包,同样借助BiocManager安装,前提也是你要安装好BiocManager,命令如下:

 

2. 加载该包:

OK,可以看到没有任何问题,这也表明,我们安装并成功加载该工具包。

3. 查看所包含的数据,用info()命令:

 

结果如下:

 

4.这里以肺癌为例,提取芯片的表达数据,用expressionTCGA函数进行提取:

 

结果如下:

 

5. 对感兴趣基因提取相应的表达量。

 

结果如下:

 

6. 这里同样以肺癌为例,提取RNAseq的表达数据,用expressionTCGA函数进行提取:

 

结果如下:

 

7. 对感兴趣基因提取相应的RNAseq表达量,注意提取感兴趣的基因需要输入格式为:Gene Symbol|Entrz ID

结果如下:

获得了这个矩阵,就表示你的数据下载成功了!

OK,今天的教程主要是带大家体验TCGA基于R语言的第六种数据下载方式,下期我们继续推出TCGA的第七种编程方式下载,今天的数据下载先讲到这,下期再见。

生物信息学

数据挖掘算Original类文章还是Review类文章?

2019-5-7 12:32:06

生物信息学

R语言系列第五期(番外篇):R语言与线性模型相关问题

2019-5-9 14:01:15

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索