一、概述

之前我分享过使用python编写的基因排布图的绘制脚本,对于没有编程基础的同学使用起来不太便捷。因此我编写了一个网页工具可以进行基因重排图的绘制。

二、视频教程

21.零代码绘制基因重排图(基因排布图)https://www.bilibili.com/video/BV1PYJK6CEtx

三、准备工作

3.1 网站链接

大家可以在BioDataTools 网页版找到基因排列可视化(基因重排图):基因排列可视化(基因重排图) - BioDataTools 网页版

3.2 绘图效果

绘图效果与python脚本绘制出来的是一样的:

你也可以与进化树结合生成类似于下面的图片(本工具没提供结合的方法):

四、流程演示

4.1 第一步:导入基因排列文件

如果不知道导入格式可以点击加载示例:

技巧:如果使用EXCEL打开表格“-”开头的基因被识别为函数出现乱码,可以先使用记事本打开,替换“-”为“ -”,也就是将“-”前边添加空格,就可以正常打开了,基因名称中的空格脚本会自动处理!

需要根据具体的基因排布整理一个制表符分隔的文本文件(可以在EXCEL表格中编辑并复制到文本文件中)。整理方法可以参考教学视频,注意需要将相同的基因作为起始。以下是示例文件:

#Epicaridea																																										
Gyge ovalis	cox1	L2	cox2	K	D	atp8	atp6	cox3	G	R	nad3	A	-nad1	-L1	N	rrnS	-W	:I	:E	:S1	!-CR	-cob	-T	nad5	F	-H	-nad4	-nad4L	-P	nad6	S2	rrnL	-V	-Q	M	nad2	-C	-Y				
Bopyroides hippolytes	cox1	L2	cox2	:K	D	atp8	atp6	cox3	G	R	nad3	A	-nad1	-L1	N	rrnS	:-W	:I	-S1	-E	!CR	-cob	-T	nad5	F	-H	-nad4	-nad4L	-P	nad6	S2	-rrnL	-V	-Q	M	nad2	-C	-Y				
Argeia pugettensis	cox1	L2	cox2		D	atp8	atp6	cox3	G	R	nad3	A	-nad1	-L1	N	rrnS	W	:I	-S1	-E	!CR	-cob	-T	nad5	nad4	:-nad4L	:-P	:nad6	H	-F	-nad5	T	cob	S2	rrnL	-V	-Q	M	nad2	-K	-C	-Y
#																																										
#Cymothoida																																										
Cymothoa indica	cox1	cox2	K	D	atp8	atp6	cox3	R	G	nad3	A	V	N	rrnS	!CR	-nad1	-L1	:-I	:-E	-L2	-S1	-W	-cob	-T	nad5	F	-H	-nad4	-nad4L	-P	nad6	S2	-rrnL	-Q	M	nad2	-C	-Y				
Ichthyoxenos japonensis	cox1	cox2	K	D	atp8	atp6	cox3	R	G	nad3	A	V	N	rrnS	!CR	-nad1	L1	:-I	-E	-L2	S1	-W	-cob	-T	nad5	F	H	-nad4	-nad4L	-P	nad6	S2	-rrnL	-Q	M	nad2	-C	-Y				
Asotana magnifica	cox1	cox2	K	D	atp8	atp6	cox3	R	G	nad3	A	V	-nad1	N	rrnS	!CR	-L1	:-I	:-E	-L2	-S1	-W	-cob	-T	nad5	F	H	-nad4	-nad4L	-P	nad6	S2	-rrnL	-Q	M	nad2	:-C	-Y				
Tachaea chinensis	cox1	cox2	K	D	atp8	atp6	cox3	R	G	nad3	A	V	-nad1	N	rrnS	-I	!CR	-E	-L1	-W	:S1	-L2	-cob	-T	nad5	F	H	-nad4	-nad4L	-P	nad6	S2	-rrnL	-Q	M	nad2	-C	-Y				
#Oniscidea																																										
Ligia oceanica	cox1	L2	cox2	K	D	atp8	atp6	cox3	:R	G	nad3	A	-nad1	-L1	N	rrnS	-W	-V	I	!-CR	E	S1	-cob	-T	nad5	F	-H	-nad4	-nad4L	-P	nad6	S2	-rrnL	-Q	M	nad2	C	-Y				
Mongoloniscus sinensis	cox1	L2	cox2	K	D	atp8	atp6	cox3	R	nad3	:A	V	-nad1	:-L1	N	rrnS	I	W	G	T	:E	!-CR	S1	-cob	nad5	F	-H	-nad4	-nad4L	-P	nad6	S2	-rrnL	-Q	M	nad2	-C	-Y				
#Sphaeromatidea																																										
Sphaeroma terebrans	cox1	L1	cox2	K	D	atp8	atp6	cox3	R	:G	nad3	:A	-nad1	N	rrnS	-I	W	V	-Q	!CR	E	S1	-cob	-T	nad5	F	-H	-nad4	-nad4L	-P	nad6	L1	S2	-rrnL	M	nad2	-C	-Y				
#																																										
#Limnoriidea																																										
Limnoria quadripunctata	cox1	cox2	K	cox3	V	A	-E	!CR	-R	-rrnL	-W	-M	-atp6	-atp8	-D	-nad3	-T	-nad6	P	nad4L	nad4	H	-F	-nad5	cob	-S1	N	-E	-V	G	-nad1	-L2	I	-L1	rrnS	S2	-Q	nad2	-Y	-C		
#																																										
#Phreatoicidea																																										
Eophreatoicus karrkkanj	-cox1	Y	C	-nad2	-M	cox2	D	atp8	atp6	cox3	G	nad3	A	R	-nad1	N	rrnS	K	E	!-CR	-I	-W	S1	cob	T	nad5	F	-H	-nad4	-nad4L	-P	nad6	S2	-rrnL	-V	-Q	L2	L1

其中:

# 符号开头的行为注释行,在图片中显示为加粗的正体描述文字

- 符号为前缀(基因名前都是前缀不一定是开头)的基因或者区域,比如-cox1表示编码于负链的基因或者区域

: 符号为前缀(基因名前都是前缀不一定是开头)的基因或者区域,比如:K表示缺失的基因或者区域

! 符号为前缀(基因名前都是前缀不一定是开头)的基因或者区域,比如!CR表示控制区或者非编码区

上述符号可以结合使用,比如编码于负链的基因可能是缺失的,控制区可能是编码于负链的。

此外,如果想要在排布图的某些位置增加额外的空白区域,可以使用单独的#符号作为标记。

上述标记都可以缺少,比如可以没有注释信息、可以没有编码于负链的基因、可以没有缺失基因也可以没有控制区标记。比如下面对排布文件也是可以使用的:

Gyge ovalis	cox1	L2	cox2	K	D	atp8	atp6	cox3	G	R	nad3	A	  -nad1	  -L1	N	rrnS
Bopyroides hippolytes	cox1	L2	cox2	:K	D	atp8	atp6	cox3	G	R	nad3	A	  -nad1	  -L1	N	rrnS
Argeia pugettensis	cox1	L2	cox2		D	atp8	atp6	cox3	G	R	nad3	A	  -nad1	  -L1	N	rrnS
Cymothoa indica	cox1	cox2	K	D	atp8	atp6	cox3	R	G	nad3	A	V	N	rrnS	!CR	  -nad1
Ichthyoxenos japonensis	cox1	cox2	K	D	atp8	atp6	cox3	R	G	nad3	A	V	N	rrnS	!CR	  -nad1
Asotana magnifica	cox1	cox2	K	D	atp8	atp6	cox3	R	G	nad3	A	V	  -nad1	N	rrnS	!CR
Tachaea chinensis	cox1	cox2	K	D	atp8	atp6	cox3	R	G	nad3	A	V	  -nad1	N	rrnS	  -I
Ligia oceanica	cox1	L2	cox2	K	D	atp8	atp6	cox3	:R	G	nad3	A	  -nad1	  -L1	N	rrnS
Mongoloniscus sinensis	cox1	L2	cox2	K	D	atp8	atp6	cox3	R	nad3	V	  -nad1	N	rrnS		
Sphaeroma terebrans	cox1	L1	cox2	K	D	atp8	atp6	cox3	R	nad3	:A	  -nad1	N	rrnS	  -I	
Limnoria quadripunctata	cox1	cox2	K	cox3	V	A	  -E	!CR	  -R	  -rrnL	  -W	  -M	  -atp6	  -atp8	  -D	  -nad3
Eophreatoicus karrkkanj	  -cox1	Y	C	  -nad2	  -M	cox2	D	atp8	atp6	cox3	G	nad3	A	R	  -nad1	N

4.2 第二步:设置呈现类型

根据基因自身特点,预设了四种样式:

各个样式的颜色可以修改,分别适用于不同的基因呈现:单字母tRNA适用于形如:A、K等单字母tRNA编码基因;带编号tRNA适用于形如:S1、L2等带数字的tRNA基因;长蛋白/rRNA适用于大多数斜体基因名称 ;短蛋白适合如atp8的序列相对于其他基因短得多的基因。

如果想要更加细分基因,比如区分nad基因和atp基因的颜色等,可以手动添加多个自定义类型,可以旋转使用宽/窄矩形,基因名称正体/斜体,以及是否需要旋转和颜色。

4.3 第三步:为基因分配类型

经过第二步的设置,网页会根据基因名称的特点分配到预设的类型中(需要注意的是网页不会把任何基因假定为短基因和自定义类型,因此如果有必要的话需要手动修改部分基因的类型。)。

第三步设置完成后无需任何操作。

4.4 第四步:绘图参数

设定绘图参数后点击生成基因排序。

我设定的默认值感觉良好,如果基因紧凑或者有其他需要可以自行设置参数。

4.5 第五步:SVG 预览与导出

点击导出SVG即可得到结果。

需要注意的是,生成的SVG图片可能太小,或者显示不全,可以自行在Adobe Illustrator编辑SVG。

Logo

一站式 AI 云服务平台

更多推荐