开始我是用 bedtools coverage 统计。但是 bedtools coverage 用起来有些麻烦,你要先根据你的基因组和区域去制作 bed 文件,还需要将 BAM 文件转换到 bed 文件。后来找到了 mosdepth 这个软件非常简单好用。
推荐使用 conda 安装。软件命令格式是。
Usage: mosdepth [options] <prefix> <BAM-or-CRAM>
生成的结果文件中 {prefix}.per-base.bed.gz
是每个碱基的深度统计,像这样:
GQ994935.1 0 22611 0
GQ994935.1 22611 22776 1
GQ994935.1 22776 28626 0
GQ994935.1 28626 28630 1
GQ994935.1 28630 28635 3
GQ994935.1 28635 28641 4
GQ994935.1 28641 28729 5
GQ994935.1 28729 28780 6
GQ994935.1 28780 28787 5
如果用 bedtools coverage 结果文件是这样:
GQ994935.1 0 250 1 1
GQ994935.1 0 250 2 1
GQ994935.1 0 250 3 1
GQ994935.1 0 250 4 1
GQ994935.1 0 250 5 1
GQ994935.1 0 250 6 1
GQ994935.1 0 250 7 1
GQ994935.1 0 250 8 1
GQ994935.1 0 250 9 1
GQ994935.1 0 250 10 1
GQ994935.1 0 250 11 1
GQ994935.1 0 250 12 1
GQ994935.1 0 250 13 1
GQ994935.1 0 250 14 1
4列表示以下信息
- 落在区间内(至少1碱基overlap)的总reads数目
- 区间内非0覆盖度碱基数
- 区间长度
- 非0覆盖度比例
网友评论