美文网首页生信生信下游TBtools攻略
基因在染色体上位置可视化

基因在染色体上位置可视化

作者: 邵扬_Barnett | 来源:发表于2020-10-15 11:01 被阅读0次

感谢CJ大神的反复修改,这个功能越变越好了!
本文旨在复现CJ大神推文内容,具体请参考“省心炸鸡”,手动狗头(https://www.jianshu.com/p/b9034ce82ec2

首先需要获取的是染色体位置,我的办法是在GFF3文件里取得。



复制出来的文件都在同一个单元格里,这个时候只需要使用分列功能就能把信息分开。




保存为txt文件
Chr Length
1A 594102056
1B 689851870
1D 495453186
2A 780798557
2B 801256715
2D 651852609
3A 750843639
3B 830829764
3D 615552423
4A 744588157
4B 673617499
4D 509857067
5A 709773743
5B 713149757
5D 566080677
6A 618079260
6B 720988478
6D 473592718
7A 736706236
7B 750620385
7D 638686055

之后需要准备基因位置文件,首先用tbtools提取所有基因的ID和位置。这里使用GFF3 gene position parse。正经的IOS(input,output,start)流程没什么可说的。



之后再input之前获得的文件。在set condition text填入需要提取的gene ID。模式选择包含(contain),过滤模式选择提取(extract)。



需要注意的是,提取出来的文件行列不能直接使用,需要设置table行列。

第一列gene或者transcript ID,第二列chromosome,第三列起始位置,第四列结束为止,第五列图形分组(从0开始排起,目前只试过四种最多几种不清楚)。需要注意的是,该功能里merge会把不同颜色的基因堆叠在一起,而如果ID来自不同的图形分组(第五列信息)则不会。
填入对应信息即可


默认全部分成一组的话,你就能得到



显然没什么意义,分成三组,再加入颜色信息。



说个题外话,关于颜色的批量填充,在excel里按照组分类可以写个if套娃,例如下面这样
=if(c1=0,"253,180,98",if(c1=1,"228,26,28","31,120,180"))

也可以写个index,然后用match去返回需要的颜色标签(R,G,B)

=INDEX({"253,180,98","228,26,28","31,120,180"},MATCH(C1,{0,1,2},0))

同理,你可以用类似方法给自己的基因批量分类。
最后的最后,一定要换形状,否则merge的时候信息会出错。


错误的merge
正确的merge.png

哦对了 基因密度信息请参考这里:https://www.jianshu.com/p/801807865864
最后,祝大家磕盐顺利

相关文章

  • 基因在染色体上位置可视化

    感谢CJ大神的反复修改,这个功能越变越好了!本文旨在复现CJ大神推文内容,具体请参考“省心炸鸡”,手动狗头(htt...

  • circos 可视化手册-ideogram 篇

    circos 主要用于展示染色体上的相关数据,根据在染色上的位置进行不同方式的可视化。 首先我们需要一个染色体的位...

  • 基因家族分析(8)染色体核型图绘制

    mapchart 是一款 windows 系统软件,可以用来绘制基因在染色体上的位置信息。本节将生成 mapcha...

  • 遗传图谱基础原理

    遗传图谱:genetic map,又称遗传连锁图谱,是指根据基因在染色体上的重组值(交换值),将染色体上的各个基因...

  • 怎样找到祖先?

    怎么通过基因来推测你的祖先呢? 我们都知道,人的基因在染色体上。人有23对染色体,其中22对是常染色体,1对性染色...

  • 【名词解释】synteny / collinearity / i

    synteny collinearity 用来描述基因组的共线性 synteny 共线性:同源基因在相应染色体上...

  • 学习RIdeogram笔记

    运行RStudio,设置工作路径 查询工作路径 设置工作路径 包安装路径 染色体基因位置图 调整染色体颜色

  • 生物数据格式 - pileup

    格式 pileup格式描述了染色体上每个位置的碱基信息, 可以用来 SNP/indel calling, 也可以直...

  • bedtools 批量提取snp前后1000bp片段

    准备条件1 知晓snp位置,位于第 x 条染色体上 12345678 bp2 生成 .txt 文件,文件格式如下...

  • 你别皱眉,你最珍贵

    我们知道,人是由来自父亲的23个染色体和来自母亲的23个染色体偶然结合而成。每一个染色体有几百万个基因,任何一个基...

网友评论

    本文标题:基因在染色体上位置可视化

    本文链接:https://www.haomeiwen.com/subject/pdzipktx.html