測序質(zhì)量linux命令的簡單介紹

RNA-Seq數(shù)據(jù)分析——原始數(shù)據(jù)質(zhì)量控制(QC)

1、獲得轉(zhuǎn)錄組數(shù)據(jù)(.fastq文件)后的第一步就是對原始數(shù)據(jù)的質(zhì)量控制。質(zhì)量控制的目的是全面查看原始數(shù)據(jù)的質(zhì)量,內(nèi)容包括堿基質(zhì)量評估、GC含量檢驗、N堿基數(shù)量評估、TCGA堿基分布、k-mer數(shù)量檢驗等。

成都創(chuàng)新互聯(lián)公司是一家以網(wǎng)絡(luò)技術(shù)公司,為中小企業(yè)提供網(wǎng)站維護(hù)、成都做網(wǎng)站、網(wǎng)站建設(shè)、網(wǎng)站備案、服務(wù)器租用、國際域名空間、軟件開發(fā)、微信小程序開發(fā)等企業(yè)互聯(lián)網(wǎng)相關(guān)業(yè)務(wù),是一家有著豐富的互聯(lián)網(wǎng)運(yùn)營推廣經(jīng)驗的科技公司,有著多年的網(wǎng)站建站經(jīng)驗,致力于幫助中小企業(yè)在互聯(lián)網(wǎng)讓打出自已的品牌和口碑,讓企業(yè)在互聯(lián)網(wǎng)上打開一個面向全國乃至全球的業(yè)務(wù)窗口:建站電話聯(lián)系:18980820575

2、我們現(xiàn)在擁有評估數(shù)據(jù)所需的質(zhì)量指標(biāo),同時還需要將其他信息添加到QC指標(biāo)的元數(shù)據(jù)中,例如 cell ID、 條件信息 和其它各種指標(biāo)。

3、multiqc可以整合其它軟件的報告的軟件,能將fastqc生成的多個報告整合成一個報告的軟件,這樣能方便的查看所有測序數(shù)據(jù)的質(zhì)量。安裝:運(yùn)行:multiqc可以自動檢測到文件中可以整合在一起的文件,運(yùn)行也很簡單。

4、根據(jù)fastqc的報告,如果是RNA數(shù)據(jù)尾巴較多的情況,最好再去一次PolyA尾巴,少就不用了。Trim Galore 合并了FastQC和Cutadapt到一個程序中。它的優(yōu)勢在于它可以根據(jù)FastQC分析的個體質(zhì)量對每個reads進(jìn)行修剪。

linux中Trimmomatic安裝與使用

常見的trim軟件有Trimmomatic、Skewer、fastp等。fastp是一款比較新的軟件,使用時可以用--adapter_sequence/--adapter_sequence_r2參數(shù)傳入接頭序列,也可以不填這兩個參數(shù),軟件會自動識別接頭并進(jìn)行剪切。

右擊相應(yīng)的iso文件,從其右鍵菜單中選擇“解壓到”項,對iso格式文件進(jìn)行解壓。

二代測序的數(shù)據(jù)的分析——質(zhì)量控制

1、質(zhì)量控制的測序質(zhì)量檢測是通過FastQC軟件實現(xiàn)。fastqc可以不設(shè)置任何參數(shù)運(yùn)行,這樣會直接在當(dāng)前目錄下生成一個質(zhì)量報告的壓縮文件和文件夾,報告是網(wǎng)頁格式。也可以設(shè)置輸出目錄和是否解壓縮(--noextract),默認(rèn)設(shè)置會解壓縮。

2、因為實驗過程丌可知,物種特性難量化,數(shù)據(jù)通過qc,可以做到量化展示數(shù)據(jù),從數(shù)據(jù)分析相關(guān)信 息,同時為后續(xù)Kmer分析做準(zhǔn)備,獲取一個準(zhǔn)確的基因組預(yù)估情況。

3、為保證分析結(jié)果的可靠性,對測序數(shù)據(jù)進(jìn)行質(zhì)量控制統(tǒng)計分析意義重大。尤其在臨床二代測序檢測領(lǐng)域,分析結(jié)果的可靠性與否關(guān)乎醫(yī)生的診斷和病人的安危。

4、Fastqc每次對一個樣本進(jìn)行質(zhì)量控制并生成評估報告,當(dāng)樣本數(shù)量過多時,查看報告顯然極不方便。Multiqc能將fastqc生成的多個報告整合成一個報告(HTML和PDF格式),方便的查看所有測序數(shù)據(jù)的質(zhì)量。

5、FastQC是一款基于Java的軟件,須在linux環(huán)境下使用命令行運(yùn)行,它可以快速多線程地對測序數(shù)據(jù)進(jìn)行質(zhì)量評估(Quality Control),其guan 網(wǎng)地址為: Babraham Bioinformatics 。FastQC可以使用conda進(jìn)行安裝。

RSeQC使用

③ SAM 文件處理 使用 samtools 對 SAM 文件排序并轉(zhuǎn)化為 BAM 文件。samtools是一個用于操作sam和bam文件的工具合集,包含有許多命令。④比對結(jié)果可視化 比對結(jié)果使用 IGV 、Genome Maps 和Sacant 等可視化查看。

第一階段是基礎(chǔ)知識學(xué)習(xí),找一本覆蓋面廣但是又不是很難啃的教材先對生物信息所涉及各個方面有所了解,比如人衛(wèi)版李霞主編那本《生物信息學(xué)》。第二階段是一個逐步深入的過程,這個過程中要學(xué)會工具的使用。

ATAC-seq專題---生信分析流程

ATAC-seq信息分析流程主要分為以下幾個部分:數(shù)據(jù)質(zhì)控、序列比對、峰檢測、motif分析、峰注釋、富集分析,下面將對各部分內(nèi)容進(jìn)行展開講解。 下機(jī)數(shù)據(jù)經(jīng)過過濾去除接頭含量過高或低質(zhì)量的reads,得到clean reads用于后續(xù)分析。

ChIP-Seq原理是:首先通過染色質(zhì)免疫共沉淀技術(shù)(ChIP) 特異性地富集目的蛋白結(jié)合的DNA片段 ,并對其進(jìn)行純化與文庫構(gòu)建;然后對富集得到的DNA片段進(jìn)行高通量測序。ATAC-seq是 全基因組范圍 內(nèi),找出所有的OCR。

[4]所以ATAC-seq利用這個特點(diǎn),將測序所用adaptor加在Tn5轉(zhuǎn)座酶上,這樣Tn5轉(zhuǎn)座酶就可以將adaptor添加到開放染色質(zhì)區(qū)域的DNA兩端,這樣就可以對這部分序列進(jìn)行測序了。

當(dāng)前名稱:測序質(zhì)量linux命令的簡單介紹
本文地址:http://muchs.cn/article25/dgdgpji.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供定制網(wǎng)站、外貿(mào)建站定制開發(fā)、微信小程序品牌網(wǎng)站建設(shè)

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)

成都定制網(wǎng)站建設(shè)