如何通過GDCLegacyArchive下載TCGA原始數(shù)據(jù)

本篇內(nèi)容主要講解“如何通過GDC Legacy Archive下載TCGA原始數(shù)據(jù)”,感興趣的朋友不妨來(lái)看看。本文介紹的方法操作簡(jiǎn)單快捷,實(shí)用性強(qiáng)。下面就讓小編來(lái)帶大家學(xué)習(xí)“如何通過GDC Legacy Archive下載TCGA原始數(shù)據(jù)”吧!

創(chuàng)新互聯(lián)專注為客戶提供全方位的互聯(lián)網(wǎng)綜合服務(wù),包含不限于做網(wǎng)站、網(wǎng)站設(shè)計(jì)、中原網(wǎng)絡(luò)推廣、小程序制作、中原網(wǎng)絡(luò)營(yíng)銷、中原企業(yè)策劃、中原品牌公關(guān)、搜索引擎seo、人物專訪、企業(yè)宣傳片、企業(yè)代運(yùn)營(yíng)等,從售前售中售后,我們都將竭誠(chéng)為您服務(wù),您的肯定,是我們最大的嘉獎(jiǎng);創(chuàng)新互聯(lián)為所有大學(xué)生創(chuàng)業(yè)者提供中原建站搭建服務(wù),24小時(shí)服務(wù)熱線:18980820575,官方網(wǎng)址:muchs.cn

在2016年之前,TCGA項(xiàng)目的相關(guān)結(jié)果文件存放在CGhub和TCGA Data Coordinating Center簡(jiǎn)稱DCC提供的TCGA Data Portal中,當(dāng)時(shí)的結(jié)果是以hg19或者h(yuǎn)g18為參考得到的。

在DCC中,將數(shù)據(jù)劃分為了3個(gè)等級(jí)。level 1代筆原始的,未經(jīng)處理的數(shù)據(jù)的,比如芯片下機(jī)數(shù)據(jù);level2 代表處理的中間結(jié)果,比如測(cè)序深度對(duì)應(yīng)的wig文件;level 3 代表處理完成后的最終結(jié)果,比如基因的定量結(jié)果。

2016年之后,CGhub和DCC相繼關(guān)閉,所有的數(shù)據(jù)統(tǒng)一遷移到現(xiàn)在用的GDC數(shù)據(jù)庫(kù),而且通過GDC的pipeline將原有的結(jié)果轉(zhuǎn)換為hg38參考基因組版本。目前在GDC中檢索到的結(jié)果都是經(jīng)過了GDC pipeline處理過后的,從這里也可以看出,遷移到hg38是一個(gè)大的趨勢(shì)。

當(dāng)然目前使用hg19的還是挺多的,如果你需要基于hg19版本的TCGA數(shù)據(jù),在GDC中也可以找到。其實(shí)GDC中的數(shù)據(jù)可以分為以下兩個(gè)部分

  1. GDC harmonized data

  2. GDC legacy archive

在R包TCGAbiolinks中,介紹了二者的區(qū)別,如下圖所示

如何通過GDC Legacy Archive下載TCGA原始數(shù)據(jù)

第一部分就是默認(rèn)使用的基于hg38版本的數(shù)據(jù),第二部分則是對(duì)原始的TCGA結(jié)果的一個(gè)存儲(chǔ),通過GDC首頁(yè)的GDC APPs, 可以找到CDC Legacy Archive的入口,鏈接如下

https://portal.gdc.cancer.gov/legacy-archive

如何通過GDC Legacy Archive下載TCGA原始數(shù)據(jù)

在左側(cè)的面板可以根據(jù)相關(guān)屬性對(duì)Cases和Files進(jìn)行篩選,Cases相關(guān)的屬性如下

如何通過GDC Legacy Archive下載TCGA原始數(shù)據(jù)

Files相關(guān)的屬性如下

如何通過GDC Legacy Archive下載TCGA原始數(shù)據(jù)

數(shù)據(jù)的下載方式和前面文章中介紹的相同,這里不贅述,從文件名稱可以看到對(duì)應(yīng)的level, 不同level的文件示意如下

1. level1

通過Data TypeRaw intensitites進(jìn)行篩選,得到芯片的原始數(shù)據(jù), 示意如下

如何通過GDC Legacy Archive下載TCGA原始數(shù)據(jù)

2.  level2

通過Data TypeCoverage WIG進(jìn)行篩選,得到比對(duì)的測(cè)序深度數(shù)據(jù), 示意如下

如何通過GDC Legacy Archive下載TCGA原始數(shù)據(jù)

3. level3

通過Data TypemiRNA gene quantification進(jìn)行篩選,得到miRNA表達(dá)定量數(shù)據(jù), 示意如下

如何通過GDC Legacy Archive下載TCGA原始數(shù)據(jù)

通過GDC Legacy Archive, 可以找到基于hg19的數(shù)據(jù)結(jié)果文件,但是由于相關(guān)的網(wǎng)站已經(jīng)關(guān)閉,無(wú)法確認(rèn)該數(shù)據(jù)分析的pipieline等細(xì)節(jié)信息,所以需要謹(jǐn)慎使用。

到此,相信大家對(duì)“如何通過GDC Legacy Archive下載TCGA原始數(shù)據(jù)”有了更深的了解,不妨來(lái)實(shí)際操作一番吧!這里是創(chuàng)新互聯(lián)網(wǎng)站,更多相關(guān)內(nèi)容可以進(jìn)入相關(guān)頻道進(jìn)行查詢,關(guān)注我們,繼續(xù)學(xué)習(xí)!

分享名稱:如何通過GDCLegacyArchive下載TCGA原始數(shù)據(jù)
本文網(wǎng)址:http://muchs.cn/article0/gddgio.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站營(yíng)銷、建站公司用戶體驗(yàn)小程序開發(fā)、網(wǎng)站內(nèi)鏈、外貿(mào)網(wǎng)站建設(shè)

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)

h5響應(yīng)式網(wǎng)站建設(shè)