narrow,broad,gappedpeak三種格式之間的區(qū)別與聯(lián)系

本篇內(nèi)容主要講解“narrow,broad, gapped peak三種格式之間的區(qū)別與聯(lián)系”,感興趣的朋友不妨來(lái)看看。本文介紹的方法操作簡(jiǎn)單快捷,實(shí)用性強(qiáng)。下面就讓小編來(lái)帶大家學(xué)習(xí)“narrow,broad, gapped peak三種格式之間的區(qū)別與聯(lián)系”吧!

創(chuàng)新互聯(lián)公司-專(zhuān)業(yè)網(wǎng)站定制、快速模板網(wǎng)站建設(shè)、高性價(jià)比潮安網(wǎng)站開(kāi)發(fā)、企業(yè)建站全套包干低至880元,成熟完善的模板庫(kù),直接使用。一站式潮安網(wǎng)站制作公司更省心,省錢(qián),快速模板網(wǎng)站建設(shè)找我們,業(yè)務(wù)覆蓋潮安地區(qū)。費(fèi)用合理售后完善,10余年實(shí)體公司更值得信賴。

在進(jìn)行peak calling分析時(shí),經(jīng)常會(huì)接觸到以下3種peak格式

  1. narrow peaks format

  2. broad peaks fotmat

  3. gapped peaks format

peak被定義為基因組上一段reads富集的區(qū)域,核心信息是在染色體上的起始和終止位置,除此之外,還有軟件對(duì)于該peak區(qū)域的打分,比如常見(jiàn)的pvalue, qvalue, fold_enrichment等值。

和基因組比對(duì)信息用BAM格式來(lái)存儲(chǔ)類(lèi)似,為了標(biāo)準(zhǔn)化不同peak calling軟件的輸出,特意制定了以上3種數(shù)據(jù)格式。這三種格式本質(zhì)上都是bed文件,只不過(guò)列數(shù)不太類(lèi)似。

1. Narrow Peaks Format

該格式又稱之為point-source peaks format, macs2默認(rèn)輸出就是這種格式,是一種BED6+4的格式,列數(shù)為10列,示意如下

narrow,broad, gapped peak三種格式之間的區(qū)別與聯(lián)系

前四列分別代表chrom, chromStart, chromEnd, name, 用于描述peak區(qū)間和名稱,注意bed格式中起始位置從0開(kāi)始計(jì)數(shù)。

第五列代表score,在macs2的輸出結(jié)果中為int(-10*log10qvalue),第六列代表strand, 在macs2的輸出結(jié)果中為.,第七列代表signalvalue, 通常使用fold_enrichment的值,第八列代表pvalue, 在macs2的輸出結(jié)果中為-log10(pvalue),第九列代表qvalue, 在macs2的輸出結(jié)果中為-log10(qvalue),第十列代表peak, 在macs2的輸出結(jié)果中為peak的中心,即summit距離peak起始位置的距離。

2. Broad Peaks Format

這種格式就是在narrow peaks format的基礎(chǔ)上丟掉了最后一列的信息,為BED6+3的格式, 列數(shù)為9列。

3. Gapped Peaks Format

前兩種格式都是由于描述連續(xù)的peak區(qū)間,適用于DNA水平上的富集區(qū)域信息的存儲(chǔ),比如chip_seq, ATAC_seq鑒定到的peak區(qū)間,而gapped peaks format用于描述非連續(xù)的peak區(qū)間,這里的非連續(xù)通常指的是在peak的區(qū)間內(nèi)會(huì)包含多個(gè)exon區(qū)域,適用于RNA水平上的富集區(qū)域信息的存儲(chǔ),比如m6A_seq鑒定到的peak區(qū)間。

該格式在BED12的基礎(chǔ)上進(jìn)行延伸,演變?yōu)锽ED12+3的格式,列數(shù)為15列,每列的含義示意如下

narrow,broad, gapped peak三種格式之間的區(qū)別與聯(lián)系

前6列的含義和上述兩種peak格式完全相同,后3列的含義和broad peak完全相同,為了專(zhuān)區(qū)表示peak區(qū)間內(nèi)包含的exon信息,借鑒轉(zhuǎn)錄本的BED12格式,引入了以下6列

  1. thickStart

  2. thickEnd

  3. itemRgb

  4. blockCount

  5. blockSizes

  6. blockStarts

thickStartthickEnd有點(diǎn)類(lèi)似轉(zhuǎn)錄本中CDS的起始和終止位置,在存儲(chǔ)peak信息時(shí),通常的做法是將這兩列的值和chromStartchromEnd的值設(shè)置成相同的,itemRgb是一個(gè)RGB顏色值,比如255,0,0, 如果沒(méi)有對(duì)應(yīng)的顏色信息,則用0來(lái)表示。

blockCount代表該peak區(qū)間包含的exon的個(gè)數(shù),blockSizes代表每個(gè)exon區(qū)間的長(zhǎng)度,多個(gè)exon用逗號(hào)連接,blockStarts代表每個(gè)exon區(qū)間在基因組上的起始位置,多個(gè)exon用逗號(hào)連接。

關(guān)于這三種格式的相關(guān)介紹請(qǐng)參考以下鏈接

https://genome.ucsc.edu/FAQ/FAQformat.html#format13

到此,相信大家對(duì)“narrow,broad, gapped peak三種格式之間的區(qū)別與聯(lián)系”有了更深的了解,不妨來(lái)實(shí)際操作一番吧!這里是創(chuàng)新互聯(lián)網(wǎng)站,更多相關(guān)內(nèi)容可以進(jìn)入相關(guān)頻道進(jìn)行查詢,關(guān)注我們,繼續(xù)學(xué)習(xí)!

文章題目:narrow,broad,gappedpeak三種格式之間的區(qū)別與聯(lián)系
轉(zhuǎn)載源于:http://muchs.cn/article2/pgdsic.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供、Google、品牌網(wǎng)站設(shè)計(jì)關(guān)鍵詞優(yōu)化、網(wǎng)站內(nèi)鏈云服務(wù)器

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)

外貿(mào)網(wǎng)站建設(shè)