21.零代码绘制基因重排图(基因排布图)
一、概述
之前我分享过使用python编写的基因排布图的绘制脚本,对于没有编程基础的同学使用起来不太便捷。因此我编写了一个网页工具可以进行基因重排图的绘制。
二、视频教程
21.零代码绘制基因重排图(基因排布图)
https://www.bilibili.com/video/BV1PYJK6CEtx
三、准备工作
3.1 网站链接
大家可以在BioDataTools 网页版找到基因排列可视化(基因重排图):基因排列可视化(基因重排图) - BioDataTools 网页版

3.2 绘图效果
绘图效果与python脚本绘制出来的是一样的:

你也可以与进化树结合生成类似于下面的图片(本工具没提供结合的方法):

四、流程演示
4.1 第一步:导入基因排列文件
如果不知道导入格式可以点击加载示例:

技巧:如果使用EXCEL打开表格“-”开头的基因被识别为函数出现乱码,可以先使用记事本打开,替换“-”为“ -”,也就是将“-”前边添加空格,就可以正常打开了,基因名称中的空格脚本会自动处理!
需要根据具体的基因排布整理一个制表符分隔的文本文件(可以在EXCEL表格中编辑并复制到文本文件中)。整理方法可以参考教学视频,注意需要将相同的基因作为起始。以下是示例文件:
#Epicaridea
Gyge ovalis cox1 L2 cox2 K D atp8 atp6 cox3 G R nad3 A -nad1 -L1 N rrnS -W :I :E :S1 !-CR -cob -T nad5 F -H -nad4 -nad4L -P nad6 S2 rrnL -V -Q M nad2 -C -Y
Bopyroides hippolytes cox1 L2 cox2 :K D atp8 atp6 cox3 G R nad3 A -nad1 -L1 N rrnS :-W :I -S1 -E !CR -cob -T nad5 F -H -nad4 -nad4L -P nad6 S2 -rrnL -V -Q M nad2 -C -Y
Argeia pugettensis cox1 L2 cox2 D atp8 atp6 cox3 G R nad3 A -nad1 -L1 N rrnS W :I -S1 -E !CR -cob -T nad5 nad4 :-nad4L :-P :nad6 H -F -nad5 T cob S2 rrnL -V -Q M nad2 -K -C -Y
#
#Cymothoida
Cymothoa indica cox1 cox2 K D atp8 atp6 cox3 R G nad3 A V N rrnS !CR -nad1 -L1 :-I :-E -L2 -S1 -W -cob -T nad5 F -H -nad4 -nad4L -P nad6 S2 -rrnL -Q M nad2 -C -Y
Ichthyoxenos japonensis cox1 cox2 K D atp8 atp6 cox3 R G nad3 A V N rrnS !CR -nad1 L1 :-I -E -L2 S1 -W -cob -T nad5 F H -nad4 -nad4L -P nad6 S2 -rrnL -Q M nad2 -C -Y
Asotana magnifica cox1 cox2 K D atp8 atp6 cox3 R G nad3 A V -nad1 N rrnS !CR -L1 :-I :-E -L2 -S1 -W -cob -T nad5 F H -nad4 -nad4L -P nad6 S2 -rrnL -Q M nad2 :-C -Y
Tachaea chinensis cox1 cox2 K D atp8 atp6 cox3 R G nad3 A V -nad1 N rrnS -I !CR -E -L1 -W :S1 -L2 -cob -T nad5 F H -nad4 -nad4L -P nad6 S2 -rrnL -Q M nad2 -C -Y
#Oniscidea
Ligia oceanica cox1 L2 cox2 K D atp8 atp6 cox3 :R G nad3 A -nad1 -L1 N rrnS -W -V I !-CR E S1 -cob -T nad5 F -H -nad4 -nad4L -P nad6 S2 -rrnL -Q M nad2 C -Y
Mongoloniscus sinensis cox1 L2 cox2 K D atp8 atp6 cox3 R nad3 :A V -nad1 :-L1 N rrnS I W G T :E !-CR S1 -cob nad5 F -H -nad4 -nad4L -P nad6 S2 -rrnL -Q M nad2 -C -Y
#Sphaeromatidea
Sphaeroma terebrans cox1 L1 cox2 K D atp8 atp6 cox3 R :G nad3 :A -nad1 N rrnS -I W V -Q !CR E S1 -cob -T nad5 F -H -nad4 -nad4L -P nad6 L1 S2 -rrnL M nad2 -C -Y
#
#Limnoriidea
Limnoria quadripunctata cox1 cox2 K cox3 V A -E !CR -R -rrnL -W -M -atp6 -atp8 -D -nad3 -T -nad6 P nad4L nad4 H -F -nad5 cob -S1 N -E -V G -nad1 -L2 I -L1 rrnS S2 -Q nad2 -Y -C
#
#Phreatoicidea
Eophreatoicus karrkkanj -cox1 Y C -nad2 -M cox2 D atp8 atp6 cox3 G nad3 A R -nad1 N rrnS K E !-CR -I -W S1 cob T nad5 F -H -nad4 -nad4L -P nad6 S2 -rrnL -V -Q L2 L1
其中:
# 符号开头的行为注释行,在图片中显示为加粗的正体描述文字
- 符号为前缀(基因名前都是前缀不一定是开头)的基因或者区域,比如-cox1表示编码于负链的基因或者区域

: 符号为前缀(基因名前都是前缀不一定是开头)的基因或者区域,比如:K表示缺失的基因或者区域

! 符号为前缀(基因名前都是前缀不一定是开头)的基因或者区域,比如!CR表示控制区或者非编码区

上述符号可以结合使用,比如编码于负链的基因可能是缺失的,控制区可能是编码于负链的。
此外,如果想要在排布图的某些位置增加额外的空白区域,可以使用单独的#符号作为标记。
上述标记都可以缺少,比如可以没有注释信息、可以没有编码于负链的基因、可以没有缺失基因也可以没有控制区标记。比如下面对排布文件也是可以使用的:
Gyge ovalis cox1 L2 cox2 K D atp8 atp6 cox3 G R nad3 A -nad1 -L1 N rrnS
Bopyroides hippolytes cox1 L2 cox2 :K D atp8 atp6 cox3 G R nad3 A -nad1 -L1 N rrnS
Argeia pugettensis cox1 L2 cox2 D atp8 atp6 cox3 G R nad3 A -nad1 -L1 N rrnS
Cymothoa indica cox1 cox2 K D atp8 atp6 cox3 R G nad3 A V N rrnS !CR -nad1
Ichthyoxenos japonensis cox1 cox2 K D atp8 atp6 cox3 R G nad3 A V N rrnS !CR -nad1
Asotana magnifica cox1 cox2 K D atp8 atp6 cox3 R G nad3 A V -nad1 N rrnS !CR
Tachaea chinensis cox1 cox2 K D atp8 atp6 cox3 R G nad3 A V -nad1 N rrnS -I
Ligia oceanica cox1 L2 cox2 K D atp8 atp6 cox3 :R G nad3 A -nad1 -L1 N rrnS
Mongoloniscus sinensis cox1 L2 cox2 K D atp8 atp6 cox3 R nad3 V -nad1 N rrnS
Sphaeroma terebrans cox1 L1 cox2 K D atp8 atp6 cox3 R nad3 :A -nad1 N rrnS -I
Limnoria quadripunctata cox1 cox2 K cox3 V A -E !CR -R -rrnL -W -M -atp6 -atp8 -D -nad3
Eophreatoicus karrkkanj -cox1 Y C -nad2 -M cox2 D atp8 atp6 cox3 G nad3 A R -nad1 N
4.2 第二步:设置呈现类型
根据基因自身特点,预设了四种样式:

各个样式的颜色可以修改,分别适用于不同的基因呈现:单字母tRNA适用于形如:A、K等单字母tRNA编码基因;带编号tRNA适用于形如:S1、L2等带数字的tRNA基因;长蛋白/rRNA适用于大多数斜体基因名称 ;短蛋白适合如atp8的序列相对于其他基因短得多的基因。
如果想要更加细分基因,比如区分nad基因和atp基因的颜色等,可以手动添加多个自定义类型,可以旋转使用宽/窄矩形,基因名称正体/斜体,以及是否需要旋转和颜色。

4.3 第三步:为基因分配类型
经过第二步的设置,网页会根据基因名称的特点分配到预设的类型中(需要注意的是网页不会把任何基因假定为短基因和自定义类型,因此如果有必要的话需要手动修改部分基因的类型。)。

第三步设置完成后无需任何操作。
4.4 第四步:绘图参数
设定绘图参数后点击生成基因排序。

我设定的默认值感觉良好,如果基因紧凑或者有其他需要可以自行设置参数。
4.5 第五步:SVG 预览与导出
点击导出SVG即可得到结果。

需要注意的是,生成的SVG图片可能太小,或者显示不全,可以自行在Adobe Illustrator编辑SVG。
更多推荐




所有评论(0)