写在前面
我受够了!整天有人问,TBtools怎么画这个图

但是我其实只想回一句:
你画这个图干什么?有什么意义?你想说谈什么生物学故事?
承认吧,你什么都不知道,什么都没搞清楚,就只是单纯地想画这个图。你被误导了,你以为一些培训机构的鬼话,告诉你做个基因家族就约等于发文章,但是你却没看到他们是否自己有发表相关论文的经验。你更没有搞明白,你当初选择走科研这条路,根本就不想象现在一样,为了生存,灌着水。其实,哪一个人不想为科研进步,做出一丝丝贡献。你的选择没有错,做基因家族分析方面的工作,也很正确。但是你是否能够摸着良心,说出我T真的不仅仅是灌水?
当前,大量物种基因组序列得到测定,但是几乎没有一个物种能够保证自己每个基因的基因结构注释都是正确,尤其是在基因家族上。简单的基因结构会出现问题,串联重复更是会出现问题!
我自认为,任何人做相关方面工作的朋友,应是注意到这点。你要分析一个物种的某个基因家族,第一步也是最有实质贡献的一步,应该是矫正基因结构注释*【具体可以翻看《生信札记》公众号推文】。
OK,题外话到此为止。我们进入主题。要画这个图,过分简单。
主要分为几个步骤:
- 物种内的共线性分析【请翻公众号之前的推文】
- 已经鉴定好的基因家族成员的基因ID【你随便做下基因家族分析就有了】
- 物种的染色体序列【这个你肯定有】
文件如下

基础
我们将会使用TBtools很久很久以前就更新的一个功能Amazing Super Circos。

按照上述工具,我们需要准备一些文件,第一个文件是染色体长度文件,使用Fasta Stat

设置好输入文件,补齐输出文件名字,点击Start

于是,你很快可以得到一个xls文件

提取染色体的长度信息,保存为文本文件,ChrLen.txt

这个时候,如果你点击Show My Circos Plot

于是,恭喜你,已经完成最简单的Circos图绘制
补充
相比于目标的图片,我们还需要一些连线,首先是把所有基因组内的共线性画进去
首先,我们将共线性分析结果,转换成GenePairTable

设置好输入文件,点击Start即可

随后,我们还要用另外一个工具,转换这个信息为LinkedRegion文件

我发现之前我漏了一个输入文件【但是这个文件你一定是有的】

好,把上述两个文件放进去TBtools

于是,你完成了第一个LinkedRegion文件,先看看Circos的效果


你只需要调整一个参数,然后又距离目标靠近了一步

加强
我们需要的是展示WRKY基因家族内部参与的复制事件,所以与WRKY ID相关的连接线应该被高亮出来。或者我们直接补充一些高亮的线进去就可以了
我们直接使用TBtools的文本区块提取工具【不是用表格提取工具的原因是...我们是要在整行搜索】

设置输入输出

随后点击Start即可得到结果文件,这个结果文件,使用刚才类似的操作,获得WRKY家族内部的LinkedRegion文件

随后,我们使用Excel打开原来的LinkedRegion文件,使用Excel也打开WRKY的LinkedRegion文件,在最后增加一列颜色的RGB代码之后,添加到原来的LinkedRegion文件的上方

保存原来的LinkedRegion文件【这样,就合并了两者】,随后,重现点击查看Circos图

调整线条粗细就可以了....

还差一些信息...
是的,相比于我们的目标,似乎还差一些文本标签... 好的,那就补充。
这会,我们要用TBtools的表格提取功能

选择要筛选的列

然后,输入我们WRKY的ID列表

得到的文件,那么就放到TBtools里面

点击Start之后,你就得到

细调
OK,你画这个图,根本用不到Amazing Super Circos的精髓,但是没关系。这里只是说要画这个图


OMG!!!几乎是一模一样....
写在最后
是的,我这里用的是甜橙的数据,你根本就不明白,这些事情很简单,只是你不会。你甚至不知道TBtools的图片是可以交互的。
网友评论