snpEff工具有什么用

這篇文章給大家分享的是有關(guān)snpEff工具有什么用的內(nèi)容。小編覺得挺實用的,因此分享給大家做個參考,一起跟隨小編過來看看吧。

十多年的昭平網(wǎng)站建設(shè)經(jīng)驗,針對設(shè)計、前端、開發(fā)、售后、文案、推廣等六對一服務(wù),響應(yīng)快,48小時及時工作處理。成都營銷網(wǎng)站建設(shè)的優(yōu)勢是能夠根據(jù)用戶設(shè)備顯示端的尺寸不同,自動調(diào)整昭平建站的顯示方式,使網(wǎng)站能夠適用不同顯示終端,在瀏覽器中調(diào)整網(wǎng)站的寬度,無論在任何一種瀏覽器上瀏覽網(wǎng)站,都能展現(xiàn)優(yōu)雅布局與設(shè)計,從而大程度地提升瀏覽體驗。創(chuàng)新互聯(lián)建站從事“昭平網(wǎng)站設(shè)計”,“昭平網(wǎng)站推廣”以來,每個客戶項目都認(rèn)真落實執(zhí)行。

1. 查詢所有可用的數(shù)據(jù)庫列表

命令如下

java -jar snpEff.jar databases > snpEff.databases.list.txt

目前共有42791個數(shù)據(jù)庫,snpEff.databases.list.txt文件內(nèi)容如下

snpEff工具有什么用

給出了物種可用的數(shù)據(jù)庫和對應(yīng)的下載鏈接。

2. 下載數(shù)據(jù)庫

human為例,首先查看有哪些數(shù)據(jù)庫

grep -i “Homo_sapiens” snpEff.databases.list.txt | cut -f1

GRCh47.75                                                   
GRCh48.86                                                   
hg19                                                        
hg19kg                                                      
hg38                                                        
hg38kg                                                      
testHg19ChrM

GRCh48.86數(shù)據(jù)庫為例,下載的命令如下

java -jar snpEff.jar download GRCh48.86

下載成功之后,在軟件安裝目錄的data文件夾下,會有一個以數(shù)據(jù)庫名字命名的文件夾,里面就是下載好的所有文件

GRCh48.86/
├── cytoBand.txt.gz
├── interactions.bin
├── motif.bin
├── nextProt.bin
├── pwms.bin
├── sequence.X.bin
├── sequence.Y.bin
└── snpEffectPredictor.bin
3. 進行注釋

命令如下:

java -jar snpEff.jar  GRCh48.86 examples/test.chr22.vcf > test.chr22.ann.vcf

GRCh48.86代表數(shù)據(jù)庫的名字,test.chr22.vcf為輸入文件,輸入文件格式為VCF, 內(nèi)容如下

snpEff工具有什么用

輸出文件test.chr22.ann.vcf內(nèi)容如下

snpEff工具有什么用

可以看到,就是在輸入文件的INFO列新增了一個字段信息,字段的名字叫做ANN, 關(guān)于ANN中各個部分的詳細(xì)信息可以參考VCF頭部的注釋部分。默認(rèn)情況下會給出以下幾種信息,以第一個突變位點為例進行說明

1. Allele

突變之后的堿基,第一個突變位點由T堿基突變成了C堿基,對應(yīng)Allel的值為C

2.Annotation

sequence ontology定義的突變類型,第一個突變位點的downstream_gene_variant在SO系統(tǒng)中的定位如下

snpEff工具有什么用

如果變異位點屬于多個類型時,多個類型之間用&符號連接,比如

intron_variant&nc_transcript_variant

3. Annotation_Impact

對變異位點有害程度的簡單評估,取值有HIGH, MODERATE, LOW, MODIFIER 4種,含義如下

snpEff工具有什么用

4. Gene_Name

基因名稱

5. Gene_ID

基因ID

6. Feature_Type

想要分析的特征類型,transcript, motif, miRNA 等

7. Feature_ID

根據(jù)Feature Type指定的特征,給出對應(yīng)的ID

8. Transcript_BioType

轉(zhuǎn)錄本類型, 通常采用Ensembl數(shù)據(jù)庫的轉(zhuǎn)錄本類型

9. Rank

只有當(dāng)變異位點位于基因區(qū)域時才有值,會給出變異位點所處的exon/intron的編號和該基因的exon/intron的總數(shù),比如一個突變位點位于基因的第3個exon上,該基因一共有12個exon, 對應(yīng)的Rank的值為3/12
當(dāng)變異位點位于基因區(qū)域以外時,該字段的值為空

10. HGVS.c

采用HGVS標(biāo)準(zhǔn)命名的基因水平的變異情況

11. HGVS.p

采用HGVS標(biāo)準(zhǔn)命名的蛋白質(zhì)水平的變異情況,只有當(dāng)突變位點位于編碼區(qū)是才會有值

12. cdnA.pos/cDNA.length

突變位點在cDNA上的位置/cDNA的總長度

13. CDS.pos/CDS.length

突變位點在CDS上的位置/CDS的總長度

14. AA.pos/AA.length

突變位點在氨基酸序列上的位置/氨基酸序列的總長度

15. Distance

變異位點與最近的特征的距離,當(dāng)變異位點位于基因間區(qū)時,會給出與最近的基因之間的距離;當(dāng)變異位點位于exon區(qū)域時,會給出與最近的內(nèi)含子邊界的距離,不同的情況,距離的定義不同。

16. ERRORS/WARNINGS/INFO

對注釋結(jié)果的可靠程度進行評估,各種取值代表的含義如下圖

snpEff工具有什么用

感謝各位的閱讀!關(guān)于“snpEff工具有什么用”這篇文章就分享到這里了,希望以上內(nèi)容可以對大家有一定的幫助,讓大家可以學(xué)到更多知識,如果覺得文章不錯,可以把它分享出去讓更多的人看到吧!

網(wǎng)站標(biāo)題:snpEff工具有什么用
當(dāng)前鏈接:http://muchs.cn/article28/ippcjp.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供微信公眾號App設(shè)計、網(wǎng)站營銷、外貿(mào)網(wǎng)站建設(shè)微信小程序、響應(yīng)式網(wǎng)站

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)

成都seo排名網(wǎng)站優(yōu)化