一、DeepVariant简介
DeepVariant是google在2017年底发布的一款运用深度神经网络对二代测序结果进行突变检测的软件。
DeepVariant依赖于Nucleus库,是由Python and C++编码的,基于tensorflow深度学习框架编写,用于读写一般的基因组文件格式,如SAM and VCF 。
这是一篇Google AI发表的blog:DeepVariant: Highly Accurate Genomes With Deep Neural Networks
网上有很多对这片blog的翻译,我找了一篇比较重现的:谷歌开源DeepVariant,之前的经典检测基因变异法将被颠覆
DeepVariant GIT地址:https://github.com/google/deepvariant
Nucleus GIT地址:https://github.com/google/nucleus
二、DeepVariant优点
GIT上列出了六个优点:
1.高准确度
2.高适用性
3.简单上手
4.花费少
5.速度快: 64-core CPU-only machine, DeepVariant completes a 50x WGS in 5 hours and an exome in 16 minutes
6.可选参数多
在后面,我会测试一下这款软件是不是真的具备这些优点~
三、DeepVariant运行地址
DeepVariant 0.8.0是最新版本
官方推出了三种可运行版本:
1.docker https://github.com/google/deepvariant/blob/r0.8/docs/deepvariant-quick-start.md
2.开源版本 但是只能在Ubuntu 14 and 16,如果在其他UNIX系统上运行,需要修改脚本 https://github.com/google/deepvariant/blob/r0.8/docs/deepvariant-build-test.md
3.google云平台 gs://deepvariant/
我采用的是docker版本 下载运行也方便。
四、关于这个文集
接下来
1.会先简单学习一下docker
2.然后下载deepvariant的镜像,对test_data进行分析(官方提供的bam/bed/fasta等)
3.然后用deepvariant和GATK共同分析一个真实数据,测试一下二者结果的差异
4.最后再学习一下deepvariant的原理
这个文集主要是为了学习DeepVariant,我也是初学,互相交流~
网友评论