美文网首页
喜大普奔,性能提速一倍,结果稳定重现!你的fastp该升级了!

喜大普奔,性能提速一倍,结果稳定重现!你的fastp该升级了!

作者: 生信修炼小站 | 来源:发表于2021-10-20 13:06 被阅读0次

2021.10.08 号 fastp 重磅更新了,让我们来了解体验一下吧!

Fastp的创建与发展

NGS 测序FASTQ文件的质量控制和预处理是为下游分析提供干净数据的关键。传统上,每个操作都使用不同的工具,如质量控制、接头修剪和质量过滤等,或多次读取和加载数据都会导致分析繁琐及效率低下。

为解决该问题,来自深圳海普洛斯公司的陈实富博士带领其团队开发了一个超快的fastq预处理开源软件fastp。它可以实现对数据的一次性处理,包括过滤低质量,过滤adapter,截取reads,split分割大文件,生成报告等。这个工具是用c++开发的,并且支持多线程。这导致fastp比其它FASTQ预处理工具(如Trimmomatic或Cutadapt)快2-5倍。最终其研究结果于2018发表在Bioiformatics(IF=6.937)杂志上, 至今其引用次数高达2000+。

Fastp 最新升级版本

自2018年第一版本发布以来,fastp 软件陆陆续续的不断的更新优化,目前已经更新37个版本。2021.10.08 陈博士重磅发布新版本fastp v0.23.0,该版本在性能上有了很大的改进。首先,线程和I/O模块已经被完全重写,以生成可重复的输出,并极大地提高性能。其次,引入了新的库libisal和libdeflate来取代运行缓慢的zlib。尽管这可能会给编译带来一些困难,但这些都值得改进性能。在这些改变下fastp v0.23.0 产生了重大的变化:

    1. 在很多情况下fastp v0.23.0可以比以前的版本提速1倍以上速度, 特别是当压缩级别设置为6或更高时,性能增益非常明显。

    2. 线程的随机性已经解决,所有结果都可以稳定重现,同一次命令重复运行,结果也不会有任何不同。

Fastp 安装测试

让我们下载安装测试一下新版本fastp v0.23.0与旧版本fastp的区别。当我们将压缩率都设置为6时候,新版本fastpv0.23.0 平均运行时间约31s,且重复三次运行后生成的质控后的文件大小一致,md5值不变。相对新版本,旧版本fastp v0.20.0 平均运行时间约为85s,重复三次运行之后产生的质控文件大小不一致,md5值存在差异。

现在,赶紧去升级你的fastp(https://github.com/OpenGene/fastp)软件吧!

相关文章

  • 喜大普奔,性能提速一倍,结果稳定重现!你的fastp该升级了!

    2021.10.08 号 fastp 重磅更新了,让我们来了解体验一下吧! Fastp的创建与发展 NGS 测序F...

  • 据说,可以发文了……

    喜大普奔,据说可以更新了

  • 研究生的第一步

    喜大普奔,我的文章发表了

  • Swift5 ABI稳定

    喜大普奔,swift5 ABI终于稳定了,通过Xcode 10.2基于iOS12.2 && Swift5构建的工程...

  • 喜大普奔

    我要开始写作了!

  • 喜大普奔

    在我决定放弃体育测试的时候,我竟然轻轻松松的起来了,仰卧起坐!!!!活了20多年,从来没起来过,今天起来了,初步1...

  • 喜大普奔

    昨天收到挺多朋友的支持和鼓励,我真是大受鼓舞,以后一定卖力敲字,奉上更多有意思的内容。 昨天“万恶的谣言”搞得有点...

  • 喜大普奔

    我脱单了 哈哈哈哈(ಡωಡ)hiahiahia

  • 喜大普奔

    课间,学生问:“老师,我们期中考试是网考吗?” 开什么玩笑,学期居然就要过半了? 教学第七周! 速度啊! 倒! 起...

  • 喜大普奔

    今天按道理来讲应该是开心的一天:1.通知正常入职,我不用再晃荡了;2.好友转岗成功,去了自己想去的岗位。但是实际上...

网友评论

      本文标题:喜大普奔,性能提速一倍,结果稳定重现!你的fastp该升级了!

      本文链接:https://www.haomeiwen.com/subject/rpxaoltx.html