助睿零代码 ETL 平台订单利润分流数据加工
熟练地掌握了表输入、记录集连接、字段选择、过滤记录、Excel 输出五大组件的使用方法,理解了多表关联、数据清洗、条件分流的 ETL 核心设计思路。本次实验将创建“订单利润分流处理”的转换流,,根据利润正负将数据分流为盈利订单和亏损订单,实现订单数据与产品信息的关联,分别输出到两个Excel文件中。1、熟练掌握助睿零代码数据集成平台的新建项目、同步数据源、新建转换流、添加组件、配置参数、执行转换、
在数字化经营与商业数据分析场景中,企业每天会产生大量分散、多源的业务数据,这些原始数据往往存在字段冗余、结构不统一、无法直接用于分析等问题。
要实现精准的经营决策、利润分析与亏损溯源,必须先对数据进行标准化的抽取、转换、加载(ETL) 处理,形成可直接使用的高质量数据集。
传统 ETL 依赖代码编写,不易上手。本次实验采用助睿零代码 ETL 平台,以订单利润分流为真实业务场景,通过可视化拖拽方式完成多表关联、字段清洗、数据过滤与结果输出
一、实验背景
1.1 实验目的
1、熟练掌握助睿零代码数据集成平台的新建项目、同步数据源、新建转换流、添加组件、配置参数、执行转换、查看结果等完整操作流程。
2、深入理解并掌握表输入、记录集连接、字段选择、过滤记录、Excel 输出五大核心组件的功能与配置方法。
3、掌握ETL 数据加工的典型思路:多表关联、字段清洗、数据过滤、结果分流、文件输出。
4、能够独立完成企业级订单数据的关联计算与分类存储,为后续经营分析、利润分析提供标准化数据。
1.2 实验环境
1、零代码实验平台:助睿数智(Uniplore)一站式数据科学平台
2、平台访问地址:https://lab.guilian.cn/
3、产品官网:
https://www.uniplore.com/
4、数据库环境:MySQL(只读公共数据源)
5、实验数据表:订单明细表:business_anaylsis.order_detail
产品信息表:business_anaylsis.product
1.3 业务场景
在企业日常经营分析中,需要将订单数据与产品数据关联,计算每笔订单的利润,并按照盈利/ 亏损对订单进行分类存储,便于分别开展高盈利产品分析与亏损订单原因排查。本实验基于真实业务逻辑,使用零代码 ETL 工具完成全流程数据处理。
1.4 数据加工流程
订单明细表→ 左外连接产品信息表 → 移除重复字段 → 按利润≥0 过滤分流 → 分别输出盈利订单、亏损订单到两个 Excel 文件

二、实验步骤
2.1 登录实验平台
打开贵兰在线课程页面,随后点击右上角头像,进入我的学习。

在课程实训区点击大数据实训平台,跳转至实验登录页。

输入账号、密码、验证码

完成登录并进入平台首页

2.2 基本概念了解
是什么:助睿一站式大数据平台中的数据集成平台,通过可视化方式做数据ETL(抽取、转换、加载)
|
概念 |
说明 |
|
Pipeline(转换) |
面向数据流,处理数据的一个功能单元,由多个Transform组成 |
|
Workflow(作业) |
面向任务,完成一件完整的事,由多个Action组成,必须包含开始项 |
|
Transform(步骤) |
转换内的最小单元,如"Excel输入"、"字段选择",每个步骤独立线程运行 |
|
Action(任务项) |
作业的执行单位,如"启动"、"发送邮件" |
|
Hops(节点连接) |
数据传输通道,连接步骤或任务项 |
转换工作流与作业工作流

2.3 团队管理(小组协作)
进入数据集成/ ETL模块,打开团队管理。

组长点击新增团队

填写团队名称、团队描述,完成创建

点击添加成员,进入团队详情

输入组员手机号,勾选并确认添加。

2.4 创建实验项目
在数据集成页面选择所属团队(个人/ 小组)。

点击新建项目

输入项目名称(如:助睿ETL 入门实验),点击确定

确认创建后,在项目列表中可查看新建项目。

2.5 同步实验数据源
点击项目右上角“…”→ 打开项目,进入项目编辑空间。

|
菜单名称 |
核心用途 |
主要功能 |
本次实验使用情况 |
|
资源库 |
工作流统一管理 |
新建 / 删除 / 修改 / 查看转换流与作业流信息;工作空间导入导出;任务调度管理 |
主要使用:新建转换流、编辑转换流、保存流程 |
|
文件库 |
实验文件存储与管理 |
存放流程所需文件;保存转换执行后生成的输出文件;支持文件下载 / 删除 |
主要使用:查看并下载盈利订单、亏损订单 Excel 文件 |
|
元数据 |
数据集成配置定义 |
定义运行配置、数据库连接、Flink 集群、密钥等底层环境配置 |
辅助使用:同步数据库数据源 |

在项目内切换到元数据面板

右键关系数据库→ 同步数据源,获取平台公共实验数据。

切换到文件库再返回元数据,确认出现线上公共数据源(Readonly)。

2.6 新建转换流
本次实验将创建“订单利润分流处理”的转换流,,根据利润正负将数据分流为盈利订单和亏损订单,实现订单数据与产品信息的关联,分别输出到两个Excel文件中。
整体逻辑:订单明细表→ 左外连接产品信息表 → 移除重复ID字段 → 按利润≥0分流 → 盈利订单/亏损订单分别输出
各组件作用:
1、表输入(订单 / 产品):读取数据库中的订单表与产品表原始数据
2、记录集连接:按照产品 ID 将两张表进行左外连接,实现多表数据合并
3、字段选择:移除两表连接后重复的产品 ID 字段,完成数据清洗
4、过滤记录:根据利润字段正负,将数据分为盈利与亏损两类进行分流
5、Excel 输出:将分流后的结果分别导出为盈利订单、亏损订单 Excel 文件
切换到资源库,右键根目录→ 新建转换流。

输入转换流名称:订单利润分流处理,点击确定。

进入转换流画布,点击锁图标解锁编辑权限。

2.7 添加并连接组件
按业务逻辑依次添加并连接以下组件:表输入

分别命名为订单_详细订单、订单_产品信息。


记录集连接:用于两表关联,连接两个表输入组件。

在建立连接线时,会出现“排序需要”的提示。这是由于记录集连接组件是按接收数据的顺序进行记录关联的,如果接收的数据是无序的,可能会造成记录连接结果出错。

创建两个表输入组件到记录集连接组件的连接线,如下图:

字段选择:命名为“移除产品ID_1”字段,用于去重。


创建记录集连接组件到字段选择组件的连接线,如下图:

过滤记录:按利润条件将数据分为两路。

创建字段选择组件到过滤记录组件的连接线,如下图:

在选择连接线的弹窗中点击“主输出步骤”。由于在进行字段选择操作时,可能有记录不满足要求,导致记录被标记为错误。主输出步骤表示满足要求的记录通过该连接线传输数据。


添加Excel 输出(2 个)

分别命名为盈利订单、亏损订单。


连接规则:
过滤记录→ 盈利订单(True 输出)

过滤记录→ 亏损订单(False 输出)

2.8组件详细配置
2.8.1 表输入组件配置
数据库连接选择:线上公共数据源(Readonly)。
点击获取SQL 查询语句,分别选择订单数据(business_anaylsis.
order_detail)和产品信息数据(business_anaylsis.product)


确认自动生成SQL,保留全部字段,完成订单与产品数据读取。


2.8.2 记录集连接配置
按照配置信息配置,删除多余字段,只保留关联键,确保连接准确。
配置信息:
第一个 Transform:订单_详细订单
第二个 Transform:订单_产品信息
连接类型:LEFT OUTER(左外连接)
连接字段:订单表product_id ↔ 产品表id

2.8.3 字段选择配置
切换到移除模式,点击获取字段。


只保留重复字段id,删除其余所有字段。

确认配置,完成重复字段清理。

2.8.4 过滤记录配置
设置匹配输出:盈利订单;不匹配输出:亏损订单。

字段选择profit(Number),运算符>=,值为0。

确保配置正确,然后点击确认

2.8.5 Excel 输出配置
文件名分别设为:盈利订单、亏损订单。

文件格式:xlsx(Excel 2007 及以上)(亏损订单同理)。

点击输出字段→ 获取字段,自动加载全部字段(亏损订单同理)。

确认字段无误,保存配置(亏损订单同理)。


2.9 执行转换与查看日志
点击画布上方启动按钮,选择local运行配置。

等待转换执行完成,查看日志面板与步骤度量。


确认所有组件状态为已完成,无报错、无拒绝数据。

2.10 查看与下载结果文件
切换到文件库,右键刷新目录。

查看生成的盈利订单.xlsx和亏损订单.xlsx。

右键文件,选择下载到本地查看数据内容。

三、实验结果
本次实验成功完成订单数据ETL 全流程处理,输出结果如下:
|
输出文件 |
数据筛选规则 |
数据量 |
用途说明 |
|
盈利订单.xlsx |
profit ≥ 0 |
7977 条 |
用于高利润订单分析、爆款产品挖掘 |
|
亏损订单.xlsx |
profit < 0 |
2023 条 |
用于亏损原因排查、定价策略优化 |
实验完全实现业务目标:多表关联、字段清洗、条件分流、文件输出,数据处理流程正确,输出结果规范可用。
四、实验遇到的问题及解决方法
问题1:Excel 输出组件无法获取字段
现象:配置Excel 输出时点击 “获取字段” 无响应,字段列表为空。
原因:过滤记录到Excel 输出的连接线类型错误,未选择 True/False 输出。
解决方法:删除原有连接线,重新连接并分别选择True 输出(盈利)、False 输出(亏损),再次获取字段成功。
问题2:记录集连接提示“排序需要”
现象:连接表输入与记录集连接时弹出警告。
原因:组件要求输入数据有序,避免关联错误。
解决方法:保持默认配置,平台自动处理排序,不影响结果。
五 、实验总结
通过本次助睿零代码ETL 平台实验,我掌握了从平台登录、项目创建、数据源同步,到转换流设计、组件配置、执行调试、结果导出的全过程操作。熟练地掌握了表输入、记录集连接、字段选择、过滤记录、Excel 输出五大组件的使用方法,理解了多表关联、数据清洗、条件分流的 ETL 核心设计思路。
对比传统代码式数据处理,零代码ETL 工具更直观、高效、易维护,非常适合数据分析初学者快速上手。本次实验为后续更复杂的数据集成、数据治理、机器学习建模打下了坚实基础,也提升了我运用工具解决实际商业数据分析问题的能力。
更多推荐


所有评论(0)