美文网首页GWAS
重测序获取基因编辑植物T-DNA插入位点

重测序获取基因编辑植物T-DNA插入位点

作者: CallumZhao | 来源:发表于2020-12-06 18:36 被阅读0次

早在本科学习比较基因组学期间就有意做一些知识分享,毕竟目前学得的七成生信知识是源自最早做知识分享的前辈们。计划一直夭折,一方面是自觉实力有限,怕误人子弟,一方面是有点空闲时间就想偷个懒。个人是希望做到干湿结合全面发展的,如果不想两边都学个半吊子,那必然得付出双倍努力了。我目前主要做俩物种,异源多倍体油菜和同源多倍体马铃薯,方向涉及多组学分析、细胞遗传和基因编辑。


回归正题,基因编辑过的作物会有载体序列插入到植物基因组中,确定T-DNA插入位点有重要用处,原理可以看一下这篇文章Illumina Sequencing Technology as a Method of Identifying T-DNA Insertion Loci in Activation-Tagged Arabidopsis thaliana Plants。下面介绍我是如何完成这项工作的,有些内容比如软件安装和参数设置,网上已经有太多教程,这里就不啰嗦啦。

1、提取DNA二代测序,PE150,深度10X以上(太低可能检测不到)。

2、过滤reads得到cleandata。

3、创建样本名文件samplename.txt,一个名字一行。

4、运行脚本

#!/bin/bash

#载体序列作为参考基因组,建索引

bwa index TDNA.fa

samtools faidx TDNA.fa

#读入样本,写个循环

cat samplename.txt | while read line

do

read1="${line}_1.clean.fq.gz"

read2="${line}_2.clean.fq.gz"

#bwa比对并samtools排序转成bam文件

bwa mem -t 12 -R "@RG\tID:$line\tSM:$line\tLB:$line\tPL:ILLUMINA" TDNA.fa $read1 $read2 | samtools sort -@ 12 -o $line.sorted.bam

#samtools建索引,提取比对上的信息,保存sam格式

samtools index -@ 12 $line.sorted.bam

samtools view $line.sorted.bam TDNA > $line.TDNA.sam

#提取比对上的reads的ID,根据ID从原始测序数据中提取这些reads

cut -f1 $line.TDNA.sam |sort|uniq > $line.TDNA.ID

seqtk subseq $read1 $line.TDNA.ID > ${line}_1.TDNA.fq

seqtk subseq $read2 $line.TDNA.ID > ${line}_2.TDNA.fq

#spades组装到contig水平,contigs.fasta即为最终结果

spades.py --careful -1 ${line}_1.TDNA.fq -2 ${line}_2.TDNA.fq -o ${line}spades

done

5、将contigs与载体序列blastn(图1),比对不上的序列再和植物基因组blastn(图2),即可找到插入位点。

图1 图2

精力有限,难免出错,转载请注明出处。有任何疑问,欢迎交流讨论。

相关文章

  • 重测序获取基因编辑植物T-DNA插入位点

    早在本科学习比较基因组学期间就有意做一些知识分享,毕竟目前学得的七成生信知识是源自最早做知识分享的前辈们。计划一直...

  • 新年新知识,来看看分子育种的FAQ吧

    基因是控制植物性状的关键因子,重测序技术是将基因和性状关联的有效方法,通过构建目标物种基因组,利用重测序方法分析性...

  • 每日文献:2018-02-27

    如何使用高通量测序检测T-DNA插入 之前拿到了一批混池测序的数据,师兄除了让我帮他找一个突变位点,还让我顺便检查...

  • 肿瘤生信分析工具

    人全基因组重测序(WGS)是对已有参考基因组的物种进行个体或群体的基因组测序,检测单核苷酸多态性位点(SNV)、插...

  • 植物突变方式

    1. T-DNA insertion T-DNA是土壤农杆菌的天然质粒Ti质粒上一段能够自发转移,插入植物染色体D...

  • 拟南芥突变体信息查询

    拟南芥T-DNA插入突变体拿到之后,我们需要先确定其插入位点相关信息。插入locus有时候未必是单一的,可能会插入...

  • 分析流程

    基因组重测序数据目的:需要检测基因组中的变异,找到并定位这些突变位点 条件:参考基因组、重测序数据、 分析流程: ...

  • What's mutant?

    前人研究表明,突变体产生与鉴定是揭示基因功能的有效手段,也就是在植物体内插入一段已知序列的DNA(例如T-DNA)...

  • 测序基础介绍-NGS方法小结

    1 测序方法分类 2 基因组测序 2.1 全基因组测序 大型全基因组测序对人类、植物或动物基因组等大型基因组(>5...

  • 群体遗传学习笔记-测序技术学习

    重测序技术简介 全基因组重测序(Resequencing)是对已知参考基因组序列的物种进行不同个体间的基因组测序,...

网友评论

    本文标题:重测序获取基因编辑植物T-DNA插入位点

    本文链接:https://www.haomeiwen.com/subject/aeuvwktx.html