感觉tbtools,CJ大神最新开发的几个有料小插件确实大大简化了RNA-seq定量的流程。通过go分析发现过氧化物酶基因被广泛上调。通过亚定位分析发现大量过氧化物酶定位在细胞外。于是想看看相应的工作有没有人做过。

很好,已经有人做过了。结果可以直接拿来看看。

等等,这个ID不太对!
于是去Triticeae Multi-omics Center(http://202.194.139.32/)搜索了一圈这个ID什么名堂。

找到了,是14年发布的IWGSC_MIPSv2.2……崩溃。这是9012年的文章么

ID只能一个一个转换,转换不过去的只能靠blast找一找了。多数都能找到最后打包成一个表格。最后匹配上的有226个(包括一些LC结果)。然后去Crop-pal去找找。
网页很简单,
https://crop-pal.org/factsheet/ 加上 transcript ID (如:TraesCS1B01G214800.1)加上 .html就能打开了
例如:
https://crop-pal.org/factsheet/TraesCS1B01G214800.1.html
转换后拿自己的结果去搜索。居然找不到?
回头去看文章,人家标题明确说了:
Genome-wide and evolutionary analysis of the class III peroxidase gene family in wheat and Aegilops tauschii reveals that some members are involved in stress responses
好吧,原来还有好多类的……看来想了解这些只能自己动手了……
去NCBI找了个peroxidase
https://www.ncbi.nlm.nih.gov/protein/CAA37713.1
拿去ensembl做blastN和blastP

blastP还好找到203个。
但是blastP……3715个!将gene ID拖到excel里去除重复结果,通过uniprot保存鉴定为peroxidase的结果得到638个ID……

噩梦还没结束……再在uniprot搜索peroxidase,物种设定为小麦
peroxidase AND organism:"Triticum aestivum (Wheat) [4565]"
搜索获得966个……彻底崩溃……哈酒去了,梦里啥都有……希望有生之年能给这些基因做个分类吧……
2020年8月21日
参考前人的文章基因家族分析——TBtools
大致设计实验思路如下:

其中uniprot,blast,hmm检索结果经过合并删除相同ID等操作最终剩下640个ID……
总算减少了不少……但看hmm的结果,右下角是0,这意味着hmm的结果完美被uniprot+balst的结果包含。考虑一下还是用697个结果做做看了。

接下来是Batch Smart和Batch CDD (iD: QM3-qcdsearch-275F3D9222D882A9)
通过保守区域筛选又筛掉了一部分。

还剩下608个……之前别人看群里问的问题获得一些新的想法,考虑做进化树进一步缩小范围……

或者说其实peroxidase家族基因在功能上区别并不大。GO分析发现这些序列在ABD染色体的位置上相似性很高。所以重点不是谁表达了,而是谁调控他们表达了?
2020年8月26日
进化树结果出来了

看着还行,个别gene距离太远了。说明分类不好,还需要优化
把我需要的基因名名字改长看看位置

也不太集中在某个区域或者某个枝干上……只能再优化看看了

To be continued ...
网友评论