Posts VEP REST服务简单介绍
Post
Cancel

VEP REST服务简单介绍

一个很小的需求,比如手里有基因的location信息,1:3342113-3342291,想知道这段区域有哪些基因,转录本或者其他信息该怎么做? 当然可以打开网页去各大数据库搜索,或者调用注释软件,但是去网页搜索效率低,像我这种电脑卡的人每多开一个网页就是多一份负担,而调用注释软件又显得太大才小用了,操作也比较麻烦,想得到个性化信息也非常不好操作。 好了,这里介绍来自vep的一个REST服务vep REST,里面提供了非常多的api,应该涵盖了基本上能想到的操作。 这里以简单根据位置查找基因来举例,它属于overlap的一个功能overlap,下方提供了各大脚本语言(perl,python,ruby,R)的代码形式,以及最简单的wget,curl的命令形式。 我们用curl形式试试 ` curl ‘https://grch37.rest.ensembl.org/overlap/region/human/1:3342113-3342291?feature=gene’ -H ‘Content-type:text/x-gff3’` 结果:

##gff-version 3
##sequence-region   1 3342113 3342291
1	ensembl_havana	gene	2985732	3355185	.	+	.	ID=gene:ENSG00000142611;Name=PRDM16;assembly_name=GRCh37;biotype=protein_coding;description=PR domain containing 16 [Source:HGNC Symbol%3BAcc:14000];gene_id=ENSG00000142611;logic_name=ensembl_havana_gene;version=12`

很方便把?很清楚的看到这个基因的gene信息,id,name,hgnc的全都注释出了,如果想看转录本信息,只需要加上feature=transcript;,想看其他信息,同理加上feature=other; 把命令改一下

curl 'https://grch37.rest.ensembl.org/overlap/region/human/$1:$2-$3?feature=gene' -H 'Content-type:text/x-gff3' 存为vep_gene.sh,运行时只要加上 chr start endi,sh vep_gene.sh 1 3342113 334229就成了一个快速查找基因位置信息的小程序了。很方便对吧! 但是这个API都是需要依赖于网络的,只要是依赖网络的,尤其是国外的服务,那么它的缺点大家就你懂的。所以如果能够本地化就好了,可惜的是暂时没有看到vep提供本地化的程序和方法,但是vep有REST项目的github地址github REST。如果你能把这个项目搞定改成本地化那就完事了,不过这个事情想想就行了,适合比较成熟的公司去二次开发。 REST的服务有很多,我想肯定有符合大家需求的东西,所以有需求的话没事就去看看吧,还是能提供很大的方便的。

OLDER POSTS NEWER POSTS

Comments powered by Disqus.

Contents

Search Results