美文网首页
fastq处理笔记

fastq处理笔记

作者: Forest_Lee | 来源:发表于2019-04-05 21:39 被阅读0次
less -S SRR1039510_1.fastq #单行查看SRR1039510_1.fastq文件
less -S SRR1039510_1.fastq|paste - - -|cut -f 1|wc #统计文件中一共有多少条序列信息
less -S SRR1039510_1.fastq|grep ^@ |wc #统计文件中一共有多少条序列信息
less -S SRR1039510_1.fastq|grep ^@|awk '{print}' #输出所有的SRR1039510_1.fastq文件中的标识符(即以@开头的那一行)
less -S SRR1039510_1.fastq|grep ^@ -A 1 #输出所有的SRR1039510_1.fastq文件中的标识符和序列信息(第一、二行)
awk  '/^@/{getline; print}' SRR1039510_1.fastq #输出所有的SRR1039510_1.fastq文件中的序列信息(第二行)
less -S SRR1039510_1.fastq|grep ^+ #输出第三行
sed -n '4~4p' SRR1039510_1.fastq #输出质量值信息(即每个序列的第四行)
less SRR1039510_1.fastq|paste - - - - |cut -f 2|grep -i -o [ATCGN]|wc #统计文件中SRR1039510_1.fastq文件里面的序列的碱基总数
less SRR1039510_1.fastq|paste - - - -|cut -f 2 |awk '{sum+=length($0)} END {print sum}' #同上
less -S SRR1039510_1.fastq|paste - - - - |cut -f 2|grep -o ^[ATCGN]|sort|uniq -c # 统计reads_1.fq 中所有序列的第一位碱基的ATCGN分布情况(ATCGN分别个数)(uniq)
less -S SRR1039510_1.fasta|awk '{if($0~/^>/)print $0;else print substr($0,6,length($0)-10)}'|less -S #删除SRR1039510_1.fasta文件每条序列的前后五个碱基
less -S reads_1.fq|paste - - - -|cut -f1,2|tr "\t" "\n"|tr "@" ">" >read_1.fa # 将reads_1.fq 转为reads_1.fa文件(即将fastq转化为fasta)(tr)

参考来源:生信技能树

友情链接:

课程分享
生信技能树全球公益巡讲
https://mp.weixin.qq.com/s/E9ykuIbc-2Ja9HOY0bn_6g
B站公益74小时生信工程师教学视频合辑
https://mp.weixin.qq.com/s/IyFK7l_WBAiUgqQi8O7Hxw
招学徒:
https://mp.weixin.qq.com/s/KgbilzXnFjbKKunuw7NVfw

欢迎关注公众号:青岛生信菜鸟团

相关文章

  • fastq处理笔记

    参考来源:生信技能树 友情链接: 课程分享生信技能树全球公益巡讲(https://mp.weixin.qq.com...

  • RNA-seq数据处理前后的比较

    处理前的fastq原数据,trim-galore处理后的fq.gz(fastq)数据 (若处理数据则需要在rna小...

  • fastq 文件处理

    2021/03/22 这是一个小任务 读取某个目录下的文件 结果是一个列表,包括此目录下所有的文件的全称 及 文件...

  • fastq-dump、fasterq-dump和parallel

    最近新发现一个工具——parallel-fastq-dump,能多线程运行fastq-dump处理SRA文件,而且...

  • Hi-C分析练习(从cool文件到可视化热图)

    在上一篇笔记里,介绍了如何从fastq文件得到.cool文件(.mcool)(Hi-C分析练习(从fastq文件到...

  • scATAC-seq 分析资料

    cellranger ATAC处理fastq data #1 https://www.jianshu.com/p/...

  • 提取链接脚本

    需要提取双端测序链接1.fastq和2.fastq awk处理列 sed行 d为delete,1d表示删除第一...

  • RNA-Seq数据分析—fastp v0.23.1

    用于执行FASTQ数据 的质量控制,支持单端和双端短读数据,作为一体化的 FASTQ预处理器,fastp提供了 诸...

  • Biopython

    2021/03/03 Biopython 常用代码 在python中处理.gz文件 / 生物方面,如 fastq...

  • 测序与质控

    一、测序数据处理 1、bcl2fastq: converting the per-cycle base calls...

网友评论

      本文标题:fastq处理笔记

      本文链接:https://www.haomeiwen.com/subject/nynkiqtx.html