如何理解基因組數(shù)據(jù)分析軟件SpeedSeq

本篇文章為大家展示了如何理解基因組數(shù)據(jù)分析軟件SpeedSeq,內(nèi)容簡明扼要并且容易理解,絕對能使你眼前一亮,通過這篇文章的詳細介紹希望你能有所收獲。

公司主營業(yè)務(wù):成都網(wǎng)站制作、網(wǎng)站設(shè)計、外貿(mào)網(wǎng)站建設(shè)、移動網(wǎng)站開發(fā)等業(yè)務(wù)。幫助企業(yè)客戶真正實現(xiàn)互聯(lián)網(wǎng)宣傳,提高企業(yè)的競爭能力。創(chuàng)新互聯(lián)公司是一支青春激揚、勤奮敬業(yè)、活力青春激揚、勤奮敬業(yè)、活力澎湃、和諧高效的團隊。公司秉承以“開放、自由、嚴謹、自律”為核心的企業(yè)文化,感謝他們對我們的高要求,感謝他們從不同領(lǐng)域給我們帶來的挑戰(zhàn),讓我們激情的團隊有機會用頭腦與智慧不斷的給客戶帶來驚喜。創(chuàng)新互聯(lián)公司推出西青免費做網(wǎng)站回饋大家。

SpeedSeq是一款開源的基因組數(shù)據(jù)變異分析軟件,主要功能如下

  1. alignments, 序列比對

  2. variant detection, 變異檢測

  3. functional annotation, 突變位點的功能注釋

該軟件最大的特點就是快速,對于50X的人類全基因組數(shù)據(jù), 原始的fastq到vcf文件只需要13小時左右,對應(yīng)的文章發(fā)表在nature methods上,鏈接如下

http://ucgd.genetics.utah.edu/wp-content/uploads/2015/08/nmeth.3505.pdf

該軟件是一個完整的pipeline, 集成了多款軟件,可以用于檢測以下多種基因組變異

  1. germline and somatic mutations, 通過freebayes軟件來檢測突變微位點

  2. structural variants,通過lumpy-sv軟件來檢測結(jié)構(gòu)變異

其流程圖示意如下

如何理解基因組數(shù)據(jù)分析軟件SpeedSeq

源代碼保存在github上,鏈接如下

https://github.com/hall-lab/speedseq

該軟件按照功能,拆分成了以下5個子模塊

1. align

該模塊將雙端測序的fastq數(shù)據(jù)比對到參考基因組上,然后進行markduplicate, sort, index等步驟, 和GATK流程中的數(shù)據(jù)預處理步驟一致,用法如下

speedseq align \
-R  "@RG\tID:sample1\tSM:sample1\tLB:sample1" \
-t 10 \
-o sample1 \
hg19.fa \
sample1_R1.fastq.gz \
sample1_R2.fastq.gz

使用bwa軟件比對參考基因組,然后使用samblaster進行markduplicate, sambamba軟件進行bam文件的sort。

2. var

該模塊用于檢測生殖變異,輸入為align模塊產(chǎn)生的bam文件,用法如下

speedseq var \
-t 10 \
hg19.fa \
sample1.bam

使用freebayes軟件來檢測生殖變異,輸出文件為VCF文件。

3. somatic

該模塊用于檢測體細胞突變,輸入為align模塊產(chǎn)生的bam文件,用法如下

speedseq somatic \
-t 10 \
-o tumor \
hg19.fa \
normal.bam\
tumor.bam

使用freebayes軟件來檢測體細胞突變,需要配對的腫瘤和正常樣本,輸出文件為VCF文件。

4. sv

該模塊用于檢測結(jié)構(gòu)變異,用法如下

speedseq sv \
-o sample \
-B sample.bam \
-D sample.discordants.bam \
-S sample.splitters.bam \
-R hg19.fa \
-o sample \
-t 10

使用lumpy-sv軟件來檢測結(jié)構(gòu)變異,輸出文件為VCF文件。

5.  realign

該模塊從bam文件中提取雙端的fastq序列,再進行和align模塊相同的處理,用法如下

speedseq realign \
-t 10 \
-o sample \
hg19.fa \
sample.ba

要求bam文件必須包含read group信息,輸出文件和align模塊相同。對于全基因組數(shù)據(jù)的分析,使用speedseq可以大大加快處理速度。

上述內(nèi)容就是如何理解基因組數(shù)據(jù)分析軟件SpeedSeq,你們學到知識或技能了嗎?如果還想學到更多技能或者豐富自己的知識儲備,歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道。

新聞標題:如何理解基因組數(shù)據(jù)分析軟件SpeedSeq
本文地址:http://muchs.cn/article36/johpsg.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供定制網(wǎng)站、域名注冊、App開發(fā)、網(wǎng)站制作、網(wǎng)站導航、關(guān)鍵詞優(yōu)化

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)

微信小程序開發(fā)