零代码,如何绘制物种Beta多样性主坐标分析PCoA? |云平台
爱基百客云平台推出PCoA分析工具,帮助用户快速实现Beta多样性可视化。该工具支持多种距离算法(如Bray-Curtis、Jaccard等),适用于处理非正态分布的多维数据。用户只需上传基因表达矩阵和分组文件,选择距离计算方法,即可自动生成三种可视化结果(点图、置信区间图和样本名图)。平台提供38款零代码分析工具,操作简单,支持PDF/PNG格式输出,满足微生物组学、转录组等研究的降维分析需求。
在处理群落生态学、微生物组学或复杂的多维数据时,如何直观地展示样本间的Beta多样性与差异,是我们分析中的关键一步。主坐标分析(PCoA)正是为此而生。
作为一种经典的无约束降维方法,它打破了传统PCA对欧氏距离的限制,允许我们使用任意距离度量矩阵,提取出数据中最主要的特征。它能最大程度地保留样本间的原始距离关系,帮助我们快速识别数据的分组或梯度变化。
为了让大家把更多的时间留给数据解读,而不是消耗在繁琐的绘图调试上,今天向大家介绍一款高效、便捷的PCoA可视化小工具。
首先,打开爱基百客官网:http://www.igenebook.com;点击菜单栏最右侧“云平台”按钮。

弹出云平台界面(下图),输入账号、密码和验证码方可登录;进入云平台,可以轻松实现多种组学数据的分析和可视化,实现真正的“零代码、无门槛、操作简单”!

登陆后,如下图,我们进入到小工具专栏。当前云平台有38款小工具供用户使用,包括基础绘图、高级绘图、差异检验、聚类分析和序列处理等子模块,本着用户至上的理念,平台小工具将会持续更新维护,积极接受用户的反馈和意见。

1.1 PCoA分析介绍
PCoA(Principal Coordinates Analysis,主坐标分析) 是一种经典的降维和可视化方法,常用于生态学、微生物组学、转录组等领域的β多样性分析。在数据不符合正态分布时,少数高表达基因会完全主导PCA坐标轴,导致样本聚类扭曲。看着PC1、PC2 解释率很高,但是实际只是数值分布畸形带来的假趋势,这时候可以考虑PCoA分析。通过计算所有样本两两之间的距离矩阵,PCoA分析摆脱了PCA对数据正态分布、欧式距离以及协方差矩阵的强依赖。选用Bray-Curtis、Jaccard、altGower等多种距离算法,可适配转录组基因表达数据稀疏、高偏态且存在大量零值的特点,将样本间差异关系映射至二维坐标系中,实现样本表达格局的可视化分析。
在样本间距离计算方式中,bray(Bray-Curtis)最为常用,基于丰度数据,对丰度差异敏感。Gower适合混合数据类型,Jaccard更关注于样本间物种或基因的有无,altGower在Gower的基础上忽略了样本都为零的情况。
爱基百客云平台网络图之PCoA分析地址:http://182.61.3.169:5000/smalltools/detail?id=2039533580629155842
下面我们进行PCoA分析的实操展示。首先打开我们云平台的小工具页面,点击进入PCoA分析页面。

右侧的工具的介绍对输入数据的格式进行了展示,左侧是数据的输入框,主要需要Gene的Count表达量和样本的分组文件。在选择样本间距离计算方式后,点击提交,任务会在后台运行,结束后可以下载运行结果。

1.2 参数设置
距离计算方式:样本间距离举证的计算方式,默认为bray。
输入表达文件:RNAexp的表达Count矩阵文件。
分组文件:样本分组关系文件,第一列为组名,第二列为样本名,无表头。
输出名:自定义输出文件的名字,默认为out。
输入文件格式在小工具页面有展示,也有示例文件可供下载。
-
Count表达文件示例展示:
表达数据表格之间需用制表符(Tab键)分隔,第一行为表头信息,第一列为GeneID,其余每个样本一列。

分组信息示例展示:

1.3 任务查看
项目运行成功后,点击下载得到运行的结果文件。

结果文件分别是置信区间PCoA图、样本名PCoA图、PCoA点图、PCoA绘图文件以及输入文件。

1.4 结果展示
PCoA的结果包括pdf和png版本的图,有三种展示方式以供选择。
(1)PCoA点图

(2)置信区间PCoA图

(3)样本名PCoA图

更多推荐




所有评论(0)