【零基础】助睿平台实操:助睿实验作业1-订单利润分流数据加工
这是一份完全适合零基础小白的零代码数据加工入门实验指南。实验基于助睿数智(Uniplore)一站式数据科学平台,核心目标是将 MySQL 数据库中的订单明细表与产品信息表进行关联,计算订单利润后按 “盈利 / 亏损” 将数据分流,最终分别导出为两个 Excel 文件。实验步骤清晰易懂,从平台登录、团队与项目创建、数据源同步,到转换流搭建、核心组件配置(表输入、记录集连接、字段选择、过滤记录、Exc
一、实验环境
1.1实验目的
本次实验旨在熟悉助睿零代码数据集成平台(ETL平台)的核心功能和操作方法,具体包括:
掌握新建转换、添加组件、执行转换等基本操作流程
熟悉表输入、记录集连接、字段选择、过滤记录、Excel输出等常用组件的配置方法
理解多表关联、数据过滤与分流处理的ETL设计思路
通过本次实验,学生能够独立使用助睿平台完成常见的数据加工任务,为后续更复杂的数据处理场景打下基础。
1.2实验环境
零代码在线实验平台:本次实验使用助睿数智(Uniplore)作为一站式数据科学平台。该平台覆盖从数据接入、ETL处理、机器学习建模到可视化展示的全链路零代码功能,适用于数据分析教学与企业数据加工场景。产品官网为https://www.uniplore.com/,本次实验的访问地址为https://lab.guilian.cn/。
数据库:MySQL(含订单数据和产品信息表)
数据准备:订单表(business_anaylsis.order_detail)、产品表(business_anaylsis.product)
1.3业务场景
在企业经营分析中,经常需要将多张表关联起来计算利润,并按利润正负对订单进行分类存储。本实验以订单利润分流为例,通过零代码拖拽方式完成这一数据处理任务。
1.4数据加工流程
订单明细表与产品信息表进行左外连接,移除重复字段,按利润是否大于等于零进行分流,最后分别输出盈利订单和亏损订单到两个Excel文件。

二、实验步骤
2.1基本概念了解
助睿一站式大数据平台中的数据集成平台,通过可视化方式做数据ETL(抽取、转换、加载)。
|
概念 |
说明 |
|
Pipeline(转换) |
面向数据流,处理数据的一个功能单元,由多个Transform组成 |
|
Workflow(作业) |
面向任务,完成一件完整的事,由多个Action组成,必须包含开始项 |
|
Transform(步骤) |
转换内的最小单元,如"Excel输入"、"字段选择",每个步骤独立线程运行 |
|
Action(任务项) |
作业的执行单位,如"启动"、"发送邮件" |
|
Hops(节点连接) |
数据传输通道,连接步骤或任务项 |

2.2登录实验平台
1.点击“实训平台”,进入实验平台。

2.加载后进入如下界面,点击“数据集成”,进入数据集成页面。

2.3团队管理
在该环节,组长可以创建团队,方便对小组作业进行管理;操作步骤如下。
1.点击“团队管理”,再点击“新增团队”。

2.输入团队名称和团队信息,然后点击“确认”。
建议团队名称为“周一(五)班【组长名】组”,团队描述为【组员名称】。

3.团队创建成功后,点击团队右上角“…”,再点击“添加成员”。

4.输入队员手机号,点击“查询”,勾选队员,点击“添加”即可把队员加入团队中。

2.4创建实验项目
实验平台提供了默认项目,可以使用默认项目进行实验;这里演示创建课程专属项目作为。
1.点击“我的项目”,打开所属团队下拉框选择团队,点击“新建项目”。

2.输入项目名称:“助睿ETL入门实验”,再点击“确定”。

2.5数据资源获取
项目创建成功后,接下来需要同步数据源。
1.点击右上角“…”,再点击“打开项目”进入项目页面。

项目页面核心模块说明表
|
模块名称 |
核心功能说明 |
|
资源库 |
用于对工作流的全生命周期管理,支持工作流的新建、删除、修改、信息查看; 同时支持工作空间的导出与导入、工作流调度管理等相关操作 |
|
文件库 |
用于存储工作流运行所需的依赖文件,以及工作流执行过程中产生的结果文件 |
|
元数据管理 |
作为数据集成的核心基础能力,可为工作流配置运行环境、数据库连接、flink集群等核心运行参数 |
补充说明:本次实验主要使用到资源库和文件库两个模块。
2.点击“元数据”,右键点击“关系数据库”,点击“同步数据源”。

3.提示“同步成功”,点击“文件库”然后点击“元数据”切回界面,关系数据库目录下出现“线上公共数据源(Readonly)”,表示数据源获取成功。

2.6新建转换流
本次实验将创建“订单利润分流处理”转换流,实现订单数据与产品信息的关联,根据利润正负将数据分流为盈利订单和亏损订单,输出到两个Excel文件。
整体逻辑如图:

各组件作用见下表:
|
组件 |
作用 |
|
表输入(订单/产品) |
读取原始数据 |
|
记录集连接 |
按产品ID关联两表 |
|
字段选择 |
移除重复的ID字段 |
|
过滤记录 |
根据利润正负分流 |
|
Excel输出 |
分别输出盈利/亏损订单 |
新建转换流的具体步骤如下:
1.点击“资源库”,右键根目录,再点击“新建转换流”。

2.输入转换流名字:“订单利润分流处理”,点击“确定”,即可完成转换流创建。

3.创建转换流成功后,点击“订单利润分流处理”进入转换流设计页面,再点击锁🔒标志进行解锁(每次打开转换流设计页面都需要重新解锁)。

解锁后有提示,锁标志有变化,见下图。

2.7添加组件
完成转换任务的创建后,就可以根据预设的数据处理逻辑,向转换任务中添加对应的功能操作组件,逐步搭建完整的ETL数据处理流程。
本次实验将以订单明细数据(对应数据库表:business_anaylsis.order_detail)和产品基础信息数据(对应数据库表:business_anaylsis.product)作为原始数据源,以实现“按利润正负拆分,分别生成盈利订单、亏损订单两份独立数据集”为核心目标,演示完整转换任务的构建过程。
2.7.1添加表输入组件
本次实验将两类数据进行合并计算,所以需要添加2个表输入组件,用于读取2个不同表的数据。由于组件库的组件数量较多,可以通过关键字搜索快速获取。
1.点击“组件库”,搜输框输入“表输入”组件,搜索,按住鼠标左键将“表输入”组件拖入画布。

2.再拖拽一个“表输入”组件进入画布。

3.右键点击第一个“表输入”组件,点击“编辑组件”。

4.更改名称为“订单_详细订单”,点击“确定”。

5.和上述同样的步骤,继续修改另一个组件名称为“订单_产品订单”,点击“确定”。

2.7.2添加记录集连接组件
表输入组件用于读取数据,读取数据之后需要使用记录集连接组件关联表输入组件的数据。
1.在搜索框中搜索“记录集连接”,把记录集连接组件拖拽入画布中。

2.创建两个表输入组件到记录集连接的连接线,鼠标左键按住起始点拖拽到终点完成连线。

2.7.3添加字段选择组件
两个表的数据连接后,会出现重复的字段“产品id”,字段选择组件可以移除多余字段。
1.在搜索框中搜索“字段选择”,把字段选择组件拖入画布中。

2.将字段选择组件名称改为“移除产品ID_1字段”。


3.创建记录集连接组件到字段选择组件的连接线。

2.7.4添加过滤记录组件
过滤记录组件可以根据记录中的某个字段的值进行分流,本次实验中用于根据订单的利润情况对订单进行分流。
1.在搜索框输入“过滤记录”,将过滤记录组件拖拽至画布中。

2.创建字段选择组件到过滤记录组件之间的连接线,跳出提示窗口后,点击“主输出步骤”完成连接。


2.7.5添加excel输出组件
数据流经“过滤记录”组件时,会按预设条件被拆分为两条独立的记录流。根据业务场景的不同,这两条记录流可定向输出至多种存储位置,包括文件、数据库表等。结合本次实验目标,我们选择将拆分后的记录流导出为Excel文件。
1.在搜索框搜索“excel输出”,拖拽两个表输出组件进入画布中。

2.将两个表输出组件分别命名为“盈利订单”、“亏损订单”。

3.创建过滤记录组件到两个表输出组件的连接线,分别选择“True输出”和“False输出”。


经过之前的步骤,得到一个完整的转换任务流程,见下图。

2.8配置组件信息
2.8.1表输入组件配置
1.双击“订单_详细订单”表输入组件,下拉框选择“线上公共数据源(Readonly)”。

2.点击“获取SQL查询语句”,自动生成SQL查询语句。

3.点击依次打开目录:“线上公共数据源(Readonly)”à“表”。

4.搜索“business_anaylsis.order_detail”,下滑找到并点击它,再点击“确定”

5.在系统提示弹窗中点击“确定”。

6.观察左侧,系统填充了完整的SQL查询语句,再点击“确认”。
补充:当自动生成的SQL语句无法满足业务需求时,可以自行修改。

7.另一个订单_产品信息表输入组件也参考上述配置过程。

2.8.2记录集连接组件配置
1.双击记录集连接组件,在下拉列表中选择需要连接的数据来源。
第一个Transform选择订单_详细订单;
第二个Transform选择订单_产品信息;
连接类型选择LEFTOUTER。

2.点击第一个Transform中的“获取连接字段”按钮,获取表输入组件在订单_详细订单的查询到的字段。


3.点击第二个Transform中的“获取连接字段”按钮。

4.选择连接字段。
第一个Transform字段中除了produc_id外的其他字段,右键点击“删除选中的行”;
第二个Transform字段中除了id外的其他字段,右键点击“删除选中的行”。


5.删除完后,点击“确定”。

2.8.3字段选择组件配置
记录集连接后,字段product_id与字段id内容相同,只需要保留一个,这里选择保留product_id,配置字段选择组件移除id字段。
1.双击“移除产品ID_1字段”字段选择组件,点击“移除”功能选项,右键点击空白处,点击“获取字段”。

2.右键选中除“id”以外的字段,点击“删除选中的行”。

3.点击“确认”。
表示删除“id”字段。

2.8.4过滤记录组件配置
本实验业务需求需要将盈利订单和亏损订单分开存储,在过滤记录组件中使用字段利润来区分。
1.双击“过滤记录”组件,在弹窗中的下拉列表中选择将结果发送给不同的后续处理步骤。

2.选择字段利润(profit)来作为判断字段,选中“profit(Number)”后点击“确定”。

3.=0作为判断条件,点击“判断条件框”,在函数中选择“>=”,点击“确定”。

4.点击value,值类型选择“Integer”,值输入“0”点击“确定”。


5.过滤条件已配置完成,点击“确定”。

2.8.5Excel输出组件配置
这一步的目的:将结果写入到对应的Excel表中。
1.双击“盈利订单”excel表输出组件打开弹窗,修改文件名为“盈利订单”,下拉选择文件拓展名为“xlsx[Excel2007andabove]”。

2.点击“输出字段”,右键点击空白处,再点击“获取字段”。

3.字段获取成功后,点击“确认”。

4.“亏损订单”的excel组件的配置步骤和上述三步相同。


2.9执行转换任务
组件配置完成后,点击启动按钮执行任务转换。
1.点击快捷工具栏的“启动”标签。

2.在弹窗中点击“启动”。

3.执行成功。


2.10查看执行日志

2.11查看输出结果文件
右键点击选择刷新根目录;打开目录查看文件;右键点击文件可以选择下载。



三、实验结果
|
输出文件 |
内容 |
说明 |
|
盈利订单.xlsx |
profit≥0的订单 |
可进一步分析高利润产品 |
|
亏损订单.xlsx |
profit<0的订单 |
可用于亏损原因追踪 |
实验成功实现了订单数据的关联与分流处理,为后续的盈利分析提供了规范的数据基础。


四、核心组件说明
|
组件 |
作用 |
本实验配置要点 |
|
表输入 |
读取数据库表 |
配置数据源和SQL,自动获取字段 |
|
记录集连接 |
多表关联 |
选择连接类型和连接字段 |
|
字段选择 |
字段筛选与重命名 |
移除重复的id字段 |
|
过滤记录 |
按条件分流 |
设置profit≥0 |
|
Excel输出 |
导出结果 |
配置文件名和输出字段 |
五、问题与解决
问题1:Excel输出组件生成的文件为空
解决方法:
确认过滤记录组件的profit≥0条件配置正确,检查连接线类型,确保分别选择“True输出”和“False输出”,而非默认的“主输出步骤”。
六、实验总结
本次实验通过助睿零代码ETL平台,完成了订单与产品数据的关联、去重及按利润分流的全流程处理。掌握了表输入、记录集连接、过滤记录等核心组件的配置方法,理解了“抽取、转换、加载”的ETL设计逻辑。零代码拖拽式操作大幅降低了数据加工门槛,为后续复杂的企业级数据处理任务积累了实践经验。
更多推荐



所有评论(0)