ANNOVAR是一款什么軟件

這篇文章將為大家詳細講解有關(guān)ANNOVAR是一款什么軟件,小編覺得挺實用的,因此分享給大家做個參考,希望大家閱讀完這篇文章后可以有所收獲。

創(chuàng)新互聯(lián)是一家專注于做網(wǎng)站、網(wǎng)站建設(shè)與策劃設(shè)計,西安網(wǎng)站建設(shè)哪家好?創(chuàng)新互聯(lián)做網(wǎng)站,專注于網(wǎng)站建設(shè)10余年,網(wǎng)設(shè)計領(lǐng)域的專業(yè)建站公司;建站業(yè)務(wù)涵蓋:西安等地區(qū)。西安做網(wǎng)站價格咨詢:13518219792

ANNOVAR 是一款變異位點注釋軟件,提供了多方位的注釋功能,支持多個物種,是最受歡迎的注釋軟件之一。

支持的物種包括以下6種:

  1. huamn

  2. mouse

  3. worm

  4. fly

  5. yeast

  6. others

ANNOVAR 對于學術(shù)和非盈利機構(gòu)而言是免費下載的,只需要注冊個賬號就可以了。下載之后,解壓縮即可。解壓縮之后的文件列表如下

├── annotate_variation.pl
├── coding_change.pl
├── convert2annovar.pl
├── example
├── humandb
├── retrieve_seq_from_fasta.pl
├── table_annovar.pl
└── variants_reduction.pl

ANNOVAR是用perl語言編寫的,由一系列的perl腳本構(gòu)成。其中annotate_variation.pl是最核心的腳本。

安裝好之后,第一步就是下載相關(guān)的數(shù)據(jù)庫,命令如下

annotate_variation.pl -downdb -buildver hg19 -webfrom annovar refGene humandb/

-downdb表明該命令的用途是下載數(shù)據(jù)庫,-buildver指定基因組版本,默認為hg18, -webform指定下載的鏈接,默認是ucsc, refGene代表的是下載的數(shù)據(jù)庫的名字,humandb表示數(shù)據(jù)庫存儲的路徑。

對于指定版本的參考基因組而言,可以通過如下命令查看其所有的數(shù)據(jù)庫

annotate_variation.pl -downdb -buildver hg19 -webfrom annovar avdblist hg19_list/

用法和第一個示例相同,只不過數(shù)據(jù)庫的名字指定為avdblist, 下載成功后會有
一個對應(yīng)的avdblist.txt,部分內(nèi)容如下

hg19_abraom.txt.gz      20180312        23198051
hg19_abraom.txt.idx.gz  20180312        9837067
hg19_AFR.sites.2012_04.txt.gz   20140106        277370590
hg19_AFR.sites.2012_04.txt.idx.gz       20140106        22362560
hg19_ALL.sites.2010_11.txt.gz   20140106        179456415
hg19_ALL.sites.2010_11.txt.idx.gz       20140106        21944132
hg19_ALL.sites.2011_05.txt.gz   20140106        232127231

每一行代表一個數(shù)據(jù)庫文件。

參考基因組相關(guān)數(shù)據(jù)庫準備好之后,就可以進行注釋了。

第一步就是準備輸入文件,輸入文件有兩種格式

1. input

ANNOVAR自定義的格式,用空格或者制表符分隔,最少需要5列,分別代表染色體,起始位置,終止位置,參考基因組的堿基,變異之后的堿基,其他的列作為額外補充信息,示例如下

1 948921 948921 T C comments: rs15842, a SNP in 5' UTR of ISG15
1 13211293 13211294 TC - comments: rs59770105, a 2-bp deletion
1 11403596 11403596 - AT comments: rs35561142, a 2-bp insertion
2. VCF

VCF格式在之前的文章中介紹過了,這里不再贅述。VCF是突變分析的一種標準格式,大多數(shù)軟件都支持這種格式的輸出。

ANNOVAR可以識別的格式就這兩種,當你有其他格式的snp calling結(jié)果時,可以使用convert2annovar.pl進行格式轉(zhuǎn)換。比如將VCF和pileup格式的文件轉(zhuǎn)換為annovar的輸入格式

convert2annovar.pl -format pileup variant.pileup -outfile variant.query
convert2annovar.pl -format vcf4 variantfile -outfile variant.avinput

ANNOVAR軟件的功能可以分成以下4大類

1. gene-based annotation

分析變異位點對蛋白質(zhì)的影響,支持多種基因集,包括RefSeq, UCSC, ENSEMBL, GENCODE 等。

2. region-based annotation

分析變異位點是否位于基因組上的特殊區(qū)域,比如轉(zhuǎn)錄因子結(jié)合區(qū)域,組蛋白修飾區(qū)等。

3. Filter-based annotation

分析變異位點是否位于指定的數(shù)據(jù)庫中,比如dbSNP, 1000G,ESP 6500等數(shù)據(jù)庫,計算SIFT,PolyPhen, LRT, MutationTaster, MutationAssessor, FATHMM, MetaSVM, MetaLR等指標。

4. other functionalities

從基因組上根據(jù)坐標提取序列等小功能。

在實際分析中,主要使用annovar的注釋功能??梢钥吹?,annovar提供了3大類型的注釋。

關(guān)于“ANNOVAR是一款什么軟件”這篇文章就分享到這里了,希望以上內(nèi)容可以對大家有一定的幫助,使各位可以學到更多知識,如果覺得文章不錯,請把它分享出去讓更多的人看到。

分享文章:ANNOVAR是一款什么軟件
標題來源:http://muchs.cn/article48/gecoep.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供移動網(wǎng)站建設(shè)虛擬主機、網(wǎng)站改版、建站公司、網(wǎng)站導航、營銷型網(wǎng)站建設(shè)

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)

外貿(mào)網(wǎng)站建設(shè)