Trimmomatic怎么使用

這篇文章主要講解了“Trimmomatic怎么使用”,文中的講解內(nèi)容簡(jiǎn)單清晰,易于學(xué)習(xí)與理解,下面請(qǐng)大家跟著小編的思路慢慢深入,一起來(lái)研究和學(xué)習(xí)“Trimmomatic怎么使用”吧!

讓客戶滿意是我們工作的目標(biāo),不斷超越客戶的期望值來(lái)自于我們對(duì)這個(gè)行業(yè)的熱愛(ài)。我們立志把好的技術(shù)通過(guò)有效、簡(jiǎn)單的方式提供給客戶,將通過(guò)不懈努力成為客戶在信息化領(lǐng)域值得信任、有價(jià)值的長(zhǎng)期合作伙伴,公司提供的服務(wù)項(xiàng)目有:域名注冊(cè)、網(wǎng)絡(luò)空間、營(yíng)銷軟件、網(wǎng)站建設(shè)、昭陽(yáng)網(wǎng)站維護(hù)、網(wǎng)站推廣。

二代測(cè)序數(shù)據(jù)的指控一般包含以下步驟:

  1. 切除尾端堿基質(zhì)量小于指定值(一般為20)的堿基??梢院?jiǎn)單的單堿基修剪,也即從末端開始進(jìn)行刪除,直到讀取堿基質(zhì)量高于20;也可以進(jìn)行滑窗修剪,也即從末端開始以指定堿基數(shù)目的滑窗開始修剪,直到滑窗內(nèi)堿基平均質(zhì)量高于20。

  2. 去除末端修剪后長(zhǎng)度小于指定值的reads。不同項(xiàng)目指定值不同,一般宏基因組去掉小于50bp的reads(50bp已不夠產(chǎn)生k-mer),而擴(kuò)增子測(cè)序則根據(jù)raw reads長(zhǎng)度和PCR插入片段的長(zhǎng)度來(lái)確定,例如V4區(qū)大概260bp,那么可以去掉雙末端reads之和小于280bp的(否則不足以拼接)。

  3. 其他一些要求,例如去除含有N(也即無(wú)法讀取位點(diǎn))過(guò)多的reads、去除完全重復(fù)的reads等。

通常質(zhì)控需要我們自己寫腳本來(lái)完成。Trimmomatic是一個(gè)便捷好用的Illumina測(cè)序數(shù)據(jù)質(zhì)控工具,可以幫我們省掉很多代碼任務(wù),自發(fā)表以來(lái)引用量已過(guò)萬(wàn),安裝可以使用conda:
conda install -c trimmomatic
Trimmomatic基本使用方法及默認(rèn)參數(shù)如下:  
java -jar trimmomatic-0.30.jar PE -threads 20 -phred33 R1.fq R2.fq clean.R1.fq unpaired.R1.fq clean.R2.fq unpaired.R2.fq ILLUMINACLIP:TruSeq3-PE.fa:2:30:10 LEADING:3 TRAILING:3 SLIDINGWINDOW:4:15 MINLEN:36參數(shù)解釋如下:PE/SE    設(shè)定對(duì)Paired-End或Single-End的reads進(jìn)行處理,其輸入和輸出參數(shù)稍有不一樣。-threads    設(shè)置多線程運(yùn)行數(shù),也即核數(shù)-phred33  設(shè)置堿基的質(zhì)量格式,可選pred64ILLUMINACLIP:TruSeq3-PE.fa:2:30:10    切除adapter序列。參數(shù)后面分別接adapter序列的fasta文件:允許的最大mismatch數(shù):palindrome模式下匹配堿基數(shù)閾值:simple模式下的匹配堿基數(shù)閾值。LEADING:3  切除首端堿基質(zhì)量小于3的堿基TRAILING:3  切除尾端堿基質(zhì)量小于3的堿基SLIDINGWINDOW:4:15  滑窗修剪,一個(gè)Windows的size是4個(gè)堿基,其平均堿基質(zhì)量小于15,則切除。MINLEN:50    最小的reads長(zhǎng)度CROP:<length>    保留reads到指定的長(zhǎng)度HEADCROP:<length>  在reads的首端切除指定的長(zhǎng)度TOPHRED33      將堿基質(zhì)量轉(zhuǎn)換為pred33格式TOPHRED64      將堿基質(zhì)量轉(zhuǎn)換為pred64格式
下面通過(guò)一些實(shí)例為大家介紹該軟件的使用方法:  
切除尾端堿基質(zhì)量小于20的堿基(也即從末端開始進(jìn)行刪除,直到讀取堿基質(zhì)量高于20),并去掉剪切后長(zhǎng)度小于150的小序列片段:java -jar trimmomatic-0.30.jar PE -threads 20 -phred33 R1.fq R2.fq clean.R1.fq unpaired.R1.fq clean.R2.fq unpaired.R2.fq TRAILING:20 MINLEN:150使用末端滑窗修剪,同時(shí)去掉質(zhì)控后長(zhǎng)度過(guò)短(小于50bp)的小片段,如下所示:java -jar trimmomatic-0.33.jar PE -threads 20 -phred33 rm_dup_N_trim_1.fq rm_dup_N_trim_2.fq clean_1.fq unp_clean_1.fq clean_2.fq unp_clean_2.fq SLIDINGWINDOW:4:20 MINLEN:50
質(zhì)控后,我們由raw reads獲得clean reads,也可以再次使用FastQC進(jìn)行質(zhì)量可視化來(lái)查看質(zhì)控效果:

Trimmomatic怎么使用

Trimmomatic怎么使用

感謝各位的閱讀,以上就是“Trimmomatic怎么使用”的內(nèi)容了,經(jīng)過(guò)本文的學(xué)習(xí)后,相信大家對(duì)Trimmomatic怎么使用這一問(wèn)題有了更深刻的體會(huì),具體使用情況還需要大家實(shí)踐驗(yàn)證。這里是創(chuàng)新互聯(lián),小編將為大家推送更多相關(guān)知識(shí)點(diǎn)的文章,歡迎關(guān)注!

文章標(biāo)題:Trimmomatic怎么使用
網(wǎng)址分享:http://muchs.cn/article16/picogg.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站導(dǎo)航、定制開發(fā)網(wǎng)站制作、品牌網(wǎng)站建設(shè)全網(wǎng)營(yíng)銷推廣、響應(yīng)式網(wǎng)站

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)

成都網(wǎng)站建設(shè)