保姆级教程!零代码实现订单利润自动分流:从MySQL取数到双Excel输出(助睿实验作业1)
本文是一篇实验记录,主要整理我在助睿数智平台中完成订单利润分流数据加工的过程。本次实验的核心内容是使用零代码 ETL 组件完成订单表与产品表的关联,并按照利润字段对订单进行分类,分别输出盈利订单和亏损订单。
一、实验背景
1.1 实验目的
本次实验依托助睿数智(Uniplore)平台完成订单利润分流数据加工任务。通过本次实验,我主要希望掌握以下几个方面的内容:
- 熟悉助睿数智零代码数据集成平台的基本使用方式;
- 掌握新建转换流、添加组件、配置参数和执行流程的操作过程;
- 学会使用表输入、记录集连接、字段选择、过滤记录、Excel 输出等常见 ETL 组件;
- 理解多表连接、字段清理、条件过滤和结果分流的基本处理思路;
- 能够将订单数据按照利润情况拆分为盈利订单和亏损订单,并输出为 Excel 文件。
1.2 实验环境
本次实验在助睿数智平台中完成,实验环境如下:
- 平台全称:助睿数智(Uniplore)一站式数据科学实验平台
- 平台定位:覆盖数据接入、ETL处理、机器学习建模到可视化分析的全链路 Agentic 零代码数据智能平台
- 产品官网:https://www.uniplore.com/
- 实验平台地址:https://lab.guilian.cn/
本次实验使用的数据来源于 MySQL 数据库,主要涉及以下两张表:
- 订单明细表:business_anaylsis.order_detail
- 产品信息表:business_anaylsis.product
1.3 业务场景
在业务分析中,订单相关数据往往需要和产品信息数据结合后,才能进一步分析利润、销售额以及产品表现等指标。本次实验以订单利润分流为例,通过零代码拖拽方式完成以下任务:
- 将订单明细表与产品信息表进行连接;
- 删除连接后产生的重复字段;
- 根据利润字段 profit 判断订单属于盈利还是亏损;
- 将不同类型的订单分别导出为 Excel 文件。
1.4 数据加工流程
本次实验的总体处理流程如下:
读取订单数据和产品数据 → 按产品 ID 进行关联 → 清理重复字段 → 根据利润正负进行分流 → 输出 Excel 文件
整个流程的核心是利用可视化组件完成数据读取、连接、筛选和结果输出。

二、实验步骤
2.1 登录实验平台
首先打开实验平台地址,并使用课程实验账号登录平台。
实验平台地址如下:
- 进入页面后,点击进入右上角头像,随后点击“我的学习”

- 进入以后,点击进入实训平台

- 进入实验平台首页

配置要点:
登录后进入实训平台,后续主要在“数据集成 / ETL”模块中完成实验操作。
2.2 了解数据集成平台基本概念
在正式开始实验之前,我先了解了助睿数据集成平台中的几个基础概念,以便后续区分不同对象的作用。
|
概念 |
说明 |
|
Pipeline(转换) |
面向数据流的数据处理单元,由多个 Transform 组成 |
|
Workflow(作业) |
面向任务的完整流程,由多个 Action 组成 |
|
Transform(步骤) |
转换流中的处理单元,例如表输入、字段选择等 |
|
Action(任务项) |
作业中的执行单元,例如启动、发送邮件等 |
|
Hops(节点连接) |
步骤之间的数据传输连线 |
本次实验主要使用的是 Pipeline(转换流),通过多个 Transform 组件实现订单利润分流。


2.3 团队管理
进入平台后,选择数据集成 / ETL 模块,进入数据集成页面。如果课程采用小组实验方式,可以先在团队管理中创建团队,便于统一管理项目。
- 点击“团队管理”,选择“新增团队”;

- 在弹窗中填写团队名称和团队描述;

- 点击确认后,按需要添加团队成员。
配置要点如下:
- 团队名称:可按课程小组名称填写;
- 团队描述:填写课程实验或小组说明。
2.4 创建实验项目
为了单独管理本次实验内容,我新建了一个项目用于保存转换流和输出结果。
具体操作如下:
- 在数据集成页面中选择所属团队;

- 点击“新建项目”;

- 输入项目名称并确认;

- 在项目列表中查看是否创建成功。
本次实验中的项目既可以放在小组团队下,也可以放在个人空间中,具体根据实验要求决定。
2.5 同步数据源
项目创建完成后,我点击项目右上角“…”按钮,选择打开项目。进入项目后,左侧可以看到资源库、文件库和元数据等菜单。
|
菜单 |
作用 |
|
资源库 |
管理转换流和作业 |
|
文件库 |
保存输入文件和输出文件 |
|
元数据 |
管理数据库、运行配置等信息 |
由于本次实验需要读取数据库中的表,因此要先在元数据中同步公共数据源。
具体操作如下:
- 点击左侧“元数据”;

- 右键根目录下的“关系数据库”;
- 点击“同步数据源”;

- 切换到其他菜单后再切回元数据;
- 检查是否出现“线上公共数据源(Readonly)”。

配置要点:
本实验使用只读公共数据源,后续表输入组件需要选择该数据源。
2.6 新建转换流
本次实验需要创建一个转换流,用于完成订单数据与产品信息数据的关联,并根据利润字段进行分流。
操作步骤如下:
- 切换到资源库;

- 右键根目录,选择“新建转换流”;

- 输入转换流名称“订单利润分流处理”;

- 点击确定进入转换流设计页面;
- 如果页面处于锁定状态,点击锁图标进行解锁。

转换流的整体逻辑如下:
订单明细表 → 左外连接产品信息表 → 删除重复 ID 字段 → 按 profit >= 0 分流 → 分别输出盈利订单和亏损订单
|
组件 |
作用 |
|
表输入 |
读取订单明细表和产品信息表 |
|
记录集连接 |
按产品 ID 关联两张表 |
|
字段选择 |
删除重复字段 |
|
过滤记录 |
按利润条件分流 |
|
Excel 输出 |
输出盈利订单和亏损订单 |
2.7 添加组件
2.7.1 添加表输入组件
本次实验需要读取两张表,因此需要添加两个表输入组件。
相关数据表为:
- business_anaylsis.order_detail
- business_anaylsis.product
操作步骤如下:
- 在组件库中搜索“表输入”;

- 将第一个表输入组件拖拽到画布中;

- 再拖拽一个表输入组件;

- 双击第一个组件,命名为“订单_详细订单”;


- 双击第二个组件,命名为“订单_产品信息”。

配置要点:
两个表输入组件分别对应订单明细表和产品信息表,名称要能够区分数据来源。
2.7.2 添加记录集连接组件
两个表输入组件读取数据后,需要通过记录集连接组件完成关联。
操作步骤如下:
- 在组件库中搜索“记录集连接”;
- 将该组件拖拽到画布中;

- 将两个表输入组件分别连接到记录集连接组件。

如果页面出现“排序需要”的提示,说明记录集连接对输入数据顺序有一定要求,后续配置时需要注意。
2.7.3 添加字段选择组件
两张表连接后,可能会出现重复字段,例如产品 ID 字段。为了避免输出结果中出现多余字段,需要添加字段选择组件进行清理。
操作步骤如下:
- 在组件库中搜索“字段选择”;

- 将字段选择组件拖拽到画布中;
- 右键编辑组件;
- 将组件名称修改为“移除产品ID字段”;

- 将记录集连接组件连接到字段选择组件。

配置要点:
字段选择组件主要用于去除重复 id 字段,使输出结果更清晰。
2.7.4 添加过滤记录组件
本次实验需要根据利润字段 profit 判断订单是盈利还是亏损,因此需要继续添加过滤记录组件。
操作步骤如下:
- 在组件库中搜索“过滤记录”;
- 将过滤记录组件拖拽到画布中;
- 将字段选择组件连接到过滤记录组件;

- 在连接线弹窗中选择主输出步骤。

2.7.5 添加 Excel 输出组件
过滤记录后会形成两个输出分支,因此需要添加两个 Excel 输出组件。
操作步骤如下:
- 在组件库中搜索“Excel 输出”;
- 将两个 Excel 输出组件拖拽到画布中;
- 分别将组件命名为“盈利订单”和“亏损订单”;

- 将过滤记录组件连接到两个 Excel 输出组件;
- 连接“盈利订单”时选择 True 输出;

- 连接“亏损订单”时选择 False 输出。


配置要点:
True 输出表示满足过滤条件的记录,False 输出表示不满足过滤条件的记录。
2.8 配置组件信息
组件添加完成后,还需要对每个组件进行具体配置。
2.8.1 配置表输入组件
首先配置“订单_详细订单”表输入组件。
操作步骤如下:
- 双击“订单_详细订单”组件,进入配置页面;
- 在数据库连接中选择“线上公共数据源(Readonly)”;

- 点击获取 SQL 查询语句;

- 搜索并选择订单明细表;

- 点击确定;

- 系统自动生成 SQL 后点击确认保存。

随后按照相同方式配置“订单_产品信息”组件,选择 business_anaylsis.product 表。

订单明细表:business_anaylsis.order_detail
产品信息表:business_anaylsis.product
配置要点:
表输入组件支持自动生成 SQL,如果默认 SQL 无法满足需求,也可以手动修改。
2.8.2 配置记录集连接组件
接下来配置记录集连接组件。
操作步骤如下:
- 双击记录集连接组件,进入配置页面;
- 在第一个 Transform 中选择“订单_详细订单”;
- 在第二个 Transform 中选择“订单_产品信息”;
- 将连接类型设置为 LEFT OUTER;

- 点击“获得连接字段”;


- 在第一个 Transform 中保留 produc_id;

- 在第二个 Transform 中保留 id;

- 点击确认保存配置。
使用左外连接可以尽量保留订单表中的记录,避免订单数据丢失。
2.8.3 配置字段选择组件
在记录集连接完成后,produc_id 和 id 表示的是同一类信息,因此需要删除其中一个重复字段。
操作步骤如下:
- 双击“移除产品ID字段”组件;
- 点击移除选项;
- 点击获取字段;

- 在字段列表中只保留需要移除的 id 字段;
- 删除其他无关字段行;

- 点击确认保存。

配置要点:
这里主要移除产品表中的重复 id 字段,保留订单表中的 produc_id 及其他业务字段。
2.8.4 配置过滤记录组件
过滤记录组件用于按照利润字段对订单数据进行分流。
操作步骤如下:
- 双击过滤记录组件;

- 选择字段 profit(Number);

- 设置判断条件为 >=;

- 值类型选择 Integer;

- 输入值 0;
- 点击确认保存。

这样配置后,利润大于等于 0 的订单会进入 True 分支,利润小于 0 的订单会进入 False 分支。
2.8.5 配置 Excel 输出组件
最后配置两个 Excel 输出组件。
先配置“盈利订单”组件,操作如下:
- 双击“盈利订单”Excel 输出组件;
- 将文件名设置为“盈利订单”;
- 文件扩展名选择 xlsx [Excel 2007 and above];

- 点击输出字段;
- 在空白区域右键点击获取字段;

- 字段获取完成后点击确认。

再按相同方式配置“亏损订单”组件:
- 双击“亏损订单”组件;
- 将文件名设置为“亏损订单”;
- 扩展名同样选择 xlsx;

- 获取字段并保存。

输出文件名称如下:
- 盈利订单.xlsx
- 亏损订单.xlsx
配置要点:
两个 Excel 输出组件的文件名不能相同,否则执行时可能报错。
2.9 执行转换
组件全部配置完成后,就可以启动转换任务。
操作步骤如下:
- 点击页面中的启动按钮;

- 在弹出的窗口中点击启动;
- 等待转换执行完成;

- 查看页面中的执行状态。

执行前需要检查以下内容:
- 所有组件是否已经正确连接;
- 表输入 SQL 是否配置正确;
- 连接字段是否设置正确;
- 过滤条件是否为 profit >= 0;
- 两个 Excel 输出文件名是否不同。
2.10 查看执行日志
转换执行完成后,可以通过日志检查任务是否成功。
我主要查看以下几个方面:
- 是否出现错误提示;
- 是否存在组件执行失败;
- Excel 输出组件是否已成功接收到数据;
- 输出文件是否已成功生成。


2.11 查看输出结果
当转换执行成功后,我进入左侧“文件库”,右键根目录刷新,即可看到本次实验生成的结果文件。
输出文件包括:
- 盈利订单.xlsx
- 亏损订单.xlsx

随后可以右键下载文件,并打开查看内容。
三、实验结果
本次实验成功生成了两个 Excel 输出文件,分别保存盈利订单和亏损订单数据。
|
输出文件 |
内容 |
说明 |
|
盈利订单.xlsx |
profit >= 0 的订单数据 |
可用于后续分析盈利订单与高利润产品 |
|
亏损订单.xlsx |
profit < 0 的订单数据 |
可用于后续分析亏损订单与异常产品 |
从结果来看,订单明细表和产品信息表已经完成关联,并且通过 profit 字段实现了订单分流。
本次实验主要通过以下方式验证结果:
- 在文件库中确认是否生成两个 Excel 文件;
- 下载后检查字段是否完整;
- 检查“盈利订单.xlsx”中的 profit 是否大于等于 0;
- 检查“亏损订单.xlsx”中的 profit 是否小于 0;
- 检查是否已经删除重复的 id 字段。
通过以上验证,可以说明本次订单利润分流处理流程执行成功。


四、问题与解决
4.1 Excel 输出组件无法获取字段
问题现象:
在配置 Excel 输出组件时,点击“获取字段”后没有正常显示字段信息。
问题原因:
检查后发现,是过滤记录组件到 Excel 输出组件之间的连接类型选错了。盈利订单应连接 True 输出,亏损订单应连接 False 输出。如果连接错误,Excel 输出组件无法正常识别输入字段。
解决方法:
重新创建过滤记录组件到 Excel 输出组件的连接线,并正确设置输出类型:
- 盈利订单:True 输出
- 亏损订单:False 输出
重新连接后,再次点击“获取字段”,即可正常读取字段信息。
4.2 两个 Excel 输出组件文件名相同导致执行报错
问题现象:
两个 Excel 输出组件配置完成后执行转换,系统报错,流程无法正常结束。
问题原因:
两个输出组件都使用了默认文件名,没有区分不同文件,导致平台无法正确写出结果。
解决方法:
将两个 Excel 输出组件的文件名分别修改为:
- 盈利订单
- 亏损订单
并统一选择 xlsx 格式。修改后重新执行,流程可以正常运行。
五、实验总结
通过本次实验,我熟悉了助睿数智零代码 ETL 平台的基本操作流程,包括创建团队、创建项目、同步数据源、新建转换流、添加组件、配置组件、执行流程以及查看输出结果等内容。
在组件使用方面,本次实验主要练习了以下几类组件:
|
组件 |
本次实验中的作用 |
配置要点 |
|
表输入 |
读取数据库表 |
选择数据源并生成 SQL |
|
记录集连接 |
完成多表关联 |
设置连接类型和连接字段 |
|
字段选择 |
清理重复字段 |
删除多余的 id 字段 |
|
过滤记录 |
按条件分流 |
设置 profit >= 0 |
|
Excel 输出 |
导出结果文件 |
配置文件名并获取字段 |
通过这次实验,我进一步理解了 ETL 数据处理的基本流程。和直接编写 SQL 或脚本相比,助睿数智平台通过可视化拖拽方式呈现数据流向,整体上更容易理解,也更方便排查问题。
同时我也发现,虽然零代码平台降低了操作难度,但在实际配置过程中,连接类型、字段设置和输出文件名等细节仍然需要认真检查。例如,过滤记录组件的 True / False 分支如果接错,就会影响后续字段获取;两个输出文件名如果相同,也会导致任务执行失败。
总体来看,本次实验顺利完成了订单利润分流数据加工任务,也让我对数据接入、表连接、字段清理、条件过滤和结果输出这些基础处理流程有了更清楚的认识。
更多推荐



所有评论(0)