一、概述

之前发布了绘制RSCU柱形图的R语言脚本,对于没有使用R语言的学习者比较麻烦,因此我开发了一个工具集,让大家在网页上,不需要下载任何软件,零代码完成绘制。

二、视频教学

20.零代码绘制RSCU柱形图(单序列 多基因 多物种通用)http://www.bilibili.com/video/BV1kYJL6eEnF

三、工具网址及效果预览

3.1 BioDataTools网页版

BioDataTools网页版http://biodatatools.top/

3.2 效果预览

网页流程包含满足于单序列、多基因、多物种以及对基因多物种的绘制工具。颜色等参数都可以在网页上进行调整。

单序列:

 

多基因:

 

多物种:

 

四、流程演示

4.1 准备工作

首先你需要准备好RSCU的结果表格。那么问题来了,如何才能获取RSCU的结果表格呢?

4.1.1 蛋白编码基因序列获取

首先你要有你想要分析的序列,如果你只有需要研究物种的Genbank格式的注释文件。

可以找到网页中的GenBank 特征序列提取工具

 

将你的单物种的gb文件上传上去,选择提取CDS序列:

 

然后就得到每个蛋白编码基因的序列了:

 

如果是对多物种进行绘图,你需要重复该操作。

4.1.2 计算RSCU值

找到RSCU计算工具

 

将刚才得到的CDS序列粘贴上去:

 

按照你的物种来源选择密码子表:

 

如果是单序列RSCU柱形图选择合并所有序列,如果是多基因按照各个序列分别计算。随后点击开始计算,即可得到结果。

 

如果是多物种序列,你可以选择计算多次合并后的结果,导出CSV文件进行合并(随后会讲到)。

如果是单序列。多物种只需要复制结果就可以了。

4.2 单序列

使用合并的结果

 

打开RSCU柱形图绘制

 

粘贴上步骤得到的结果(可以是逗号分隔的,也可以是制表符分隔的):

 

导入后绘图模式选择单序列模式,检查其他内容对不对

 

选择是否分组(后边会提到分不分有何区别),生成表格

 

设置参数绘制图表:

 

由于参数在网页上展示的效果与实际的不同,所以需要下载出来SVG文件才能看实际的效果

 

4.3 多基因

与单基因的类似,只需要在RSCU计算工具那里选择分别计算结果:

 

导入数据之后就会看到基因名称列了:

 

选择多基因/物种模式,检查一些其他列名对应情况,生成图表:

 

随后会在这里看到想要绘制的基因,以及绘制时候的顺序:

 

你可以自行调整,筛选出需要绘图的基因,以及从左到右的顺序:

比如全部画出来就是:

 

筛选出个别基因的效果:

 

 

4.4 多物种

还是回到RSCU计算工具那里,我们可以每个物种按照单序列的形式计算一次,然后导出CSV文件。

然后将两个表格合并起来,在基因名称那里可以区分不同物种的名称。

 

然后绘图与多基因的操作差不多,详细可以看视频讲解。

五、常见问题

5.1 是否分组

 

 

如果勾选分组,氨基酸会按照密码子前两位进行分组,比如左侧是分组的情况,右侧是不分组的情况。是否分组只会改变图片的呈现方式,并不会影响RSCU的计算结果,很多论文会使用分组让图片更加美观。

5.2 显示不全

比如选择第五套密码子表,如果不进行分组Ser氨基酸对应有8个密码子,显示会有问题。

 

你可以通过增加底部留白来让下边的东西显示出来:

 

其次你也可以自行在SVG编辑软件上,比如Adobe Illustrator调整画布。你也可以调整其他参数使得画面协调。

Logo

一站式 AI 云服务平台

更多推荐