一、实验背景

1.1实验目的

本次实验主要用于熟悉助睿零代码数据集成 ETL 平台的核心能力与实操流程。实验将学习新建数据转换任务、拖拽配置组件、运行调度转换流程等基础操作;同时熟练掌握表输入、记录集关联、字段筛选、数据过滤、Excel 文件输出等常用组件的参数配置方式。

通过实操加深对多表关联匹配、数据条件筛选、业务数据分流等 ETL 数据加工设计思想的理解。完成实验后,可具备独立运用该平台完成常规数据清洗、整合与导出任务的能力,为后续开展复杂大数据处理与数据集成项目奠定实操基础。

1.2实验环境

1.2.1实验平台

助睿数字(Uniplore)一站式数据科学实验平台

平台链接:https://lab.guilan.cn/

本次实验使用助睿数智(Uniplore)是AI驱动的一站式数据科学平台。该平台覆盖从数据接入、ETL处理、机器学习建模到可视化展示的全链路零代码功能,适用于数据分析教学与企业数据加工场景。产品官网https://www.uniplore.com/

1.2.2数据库:MySQL(含订单数据和产品信息表)

1.2.3数据准备:订单表(business_anaylsis.order_detail)、产品表(business_anaylsis.product)

1.3业务场景

在企业经营数据分析场景中,经常需要关联多张业务数据表开展利润核算,并依据利润盈亏情况对订单进行分类归档。本实验以订单利润分流分析为应用案例,依托零代码可视化拖拽模式,完整实现该数据整合与分类处理流程。

1.4数据加工流程

通过读取订单明细表与产品表,以产品 ID 为键进行左外连接整合数据,去除重复字段后按利润是否大于等于 0 进行分流,最终分别输出盈利与亏损订单数据。

image

二、实验步骤

2.1打开实验平台

使用https://lab.guilan.cn/进入实验平台

2.2创建实验项目

进入实验平台后,选择数据集成/ETL,进入数据集成页面

屏幕截图 2026-05-12 102820

因为本次实验是个人实验,选择创建的项目所属团队为“个人团队”

屏幕截图 2026-05-12 103425

点击屏幕左上角的“新建项目”

输入项目名称为“助睿ETL入门实验”,点击“确定”

点击“确定”后可以在数据集成页面看到新创建的项目

2.3同步数据源

点击该项目右上角“…”,再点击“打开项目”

在项目页面,可以看到左侧有3个菜单:资源库、文件、元数据

资源库:用于对工作流的管理,包括新建、删除、修改、查看工作流的信息;导出导入工作空间;调度管理等操作。

文件库:用于保存工作流中需要用到的文件和工作流产生的文件。

元数据:是数据集成的重要基石,可以为工作流定义“运行配置”、“数据库”、“flink集群”等配置。

本次实验主要用到资源库和文件库

首先点击“元数据”,鼠标右键根目录“关系数据库”,选择“同步数据源”

可以看见数据同步成功

切换“文件库”菜单再切换回到元数据,可以看到数据库“线上公共数据源(Readonly)”

2.4新建转换流

本次实验将创建“订单利润分流处理”转换流,实现订单数据与产品信息的关联,并根据利润正负将数据分流为盈利订单和亏损订单,分别输出到两个Excel文件。

整体逻辑:订单明细表 → 左外连接产品信息表 → 移除重复ID字段 → 按利润≥0分流 → 盈利订单/亏损订单输出

各组件作用:

组件

作用

表输入(订单/产品)

读取原始数据

记录集连接

按产品ID关联两表

字段选择

移除重复的ID字段

过滤记录

根据利润正负分流

Excel输出

分别输出盈利/亏损订单

新建转换流具体操作如下:

点击“资源库”,鼠标右键根目录,点击“新建转换流”

输入转换流名字“订单利润分流处理”,点击“确定”

进入转换流设计页面,该页面每次打开都是锁定状态,点击页面上的锁图标进行解锁

可以看到该页面已经解锁

2.5添加组件

在建立转换任务后,可添加相应操作组件到转换任务中。

下面以订单数据(business_anaylsis.order_detail)和产品信息数据(business_anaylsis.product)生成盈利订单数据和亏损订单数据为例来构建转换任务,按如下顺序向转换中添加组件:

2.5.1添加表输入组件

本次实验需要将两类数据进行合并计算,所以需要添加2个表输入组件,读取2个不同表的数据。

首先点击“组件库”,由于组件库的组件数量较多,可以通过关键字搜索快速获取

在搜索输入框中输入“表输入”,即可查询到“表输入”组件

将“表输入”组件拖拽至画布中

再次拖拽“表输入”组件拖拽至画布中

鼠标右键“表输入”组件,点击“编辑组件”

修改步骤名称中“为订单_详细订单”,点击“确认”

修改第二个“表输入”组件的步骤名称为“订单_产品信息”,点击“确认”

2.5.2添加记录集连接组件

使用“表输入”组件读取数据后,需要通过“记录集连接”组件将表输入组件的数据进行关联。

在搜索输入框中输入“记录集连接”,将记录集连接组件拖拽至画布中

创建两个“表输入”组件到“记录集连接”组件的连接线(把鼠标悬停在“表输入”组件,出现黑色十字架按下鼠标左键拖拽到“记录集连接”组件),如下图:

在建立连接线时,会出现“排序需要”的提示。这是由于记录集连接组件是按接收数据的顺序进行记录关联的,如果接收的数据是无序的,可能会造成记录连接结果出错。

2.5.3添加字段选择组件

两个表数据进行连接后,会出现重复的字段“产品ID”。我们可以通过“字段选择”组件移除这个多余字段。

在搜索输入框中输入“字段选择”,将字段选择组件拖拽至画布中

鼠标右键“字段选择”组件,点击“编辑组件”,将步骤名称修改为“移除产品ID_1字段”,然后点击“确认”

创建“记录集连接”组件到“字段选择”组件的连接线,如下图:

2.5.4添加过滤记录组件

本次实验是根据订单的利润情况对订单进行分流。使用“过滤记录”组件可以根据记录中某个字段的值进行记录分流。

在搜索输入框中输入“过滤记录”,将“过滤记录”组件拖拽至画布中

创建“字段选择”组件到“过滤记录”组件的连接线,会弹出系统提示,点击“主输出步骤”。由于在进行字段选择操作时,可能有记录不满足要求,导致记录被标记为错误。主输出步骤表示满足要求的记录通过该连接线传输数据。

2.5.5添加 excel 输出组件

记录经过“过滤记录”组件后会被分成2个记录流。我们可以根据业务需求将2个记录流输出到指定位置(文件、数据库表)。在本次实验中,我选择将记录输出到 Excel 文件中。

在搜索输入框中输入“excel 输出”,将2个表输出组件拖拽至画布中

鼠标右键两个表输出组件,将步骤名称分别改为“盈利订单”和“亏损订单”

创建“过滤记录”组件到两个excel 输出组件的连接线,在选择连接线类型的弹窗中分别选择“True输出”和“False输出”

“True输出”表示满足过滤条件的记录输出,对应盈利订单表。

“False输出”表示不满足过滤条件的记录输出,对应亏损订单表。

至此,一个完整的转换任务流程构建完毕,如下图所示:

2.6配置组件信息

组件添加完成后需要对其进行相应配置。

2.6.1表输入组件配置

双击“订单_详细订单”表输入组件,弹出组件配置页面。在数据库连接下拉框中选择已同步的“线上公共数据源(Readonly)”,接着点击“获取SQL查询语句”,自动生成SQL查询语句。如下图所示:

点开“线上公共数据源(Readonly)”-“表”目录

下滑列表找到“business_anaylsis.order_detail”并点击它,再点击“确定”

在系统提示弹窗中点击“确认”

系统自动填写了完整的SQL查询语句,点击“确认”。当自动生成的SQL语句无法满足业务需求时,也可以通过在文本框输入自定义SQL语句。“表输入”组件的其他配置参数保持默认即可

订单_产品信息”表选择“business_anaylsis.product”,再点击“确定”

2.6.2记录集连接组件配置

双击“记录集连接”组件,在下拉列表中选择需要连接的数据来源

第一个Transform选择订单_详细订单,第二个Transform选择订单_产品信息,连接类型选择LEFT OUTER

分别点击两个个Transform的连接字段中的“获得连接字段”按钮,即可获取表输入组件在两个表里的查询到的字段

第一个Transform字段中除了 produc_id 外的其他字段,右键点击“删除选中的行”,可以按住键盘上的“CTRL”键,鼠标左键单击选择多个字段,一次性删除

第二个Transform字段中除了id 外的其他字段,右键点击“删除选中的行”

删除完后,点击“确认”,若删除错误,可重新获取连接字段再进行删除

2.6.3字段选择组件配置

通过记录集连接后,字段 produc_id 与字段 id 内容相同,只需要保留一个,因此,需要使用“移除产品ID_1字段”字段选择组件的移除选项移除字段 id,具体操作如下:

双击“移除产品ID_1字段”字段选择组件,选择“移除”菜单,并鼠标右键页面,点击“获取字段”

在获取的字段中选中除“id”字段以外的字段,右键点击“删除选中的行”

除字段“id”以外的所有字段已被删除,点击“确认”

2.6.4过滤记录组件配置

根据业务需求需要将盈利订单亏损订单分开存储,两个订单可以使用字段利润来区分
双击“过滤记录”组件,在弹窗中的下拉列表中选择将结果发送给不同的后续处理步骤,然后点击框选的<field>方框,如下图:

选中“profit(Number)”后点击“确定”

点击“=”

选择“>=”,点击“确定”

点击“value”

值类型选择“Integer”

值输入“0”点击“确定”

至此,过滤条件已配置完成,点击“确认”

2.6.5 Excel 输出组件配置

将接收到的结果写入到Excel表中,双击“盈利订单”excel表输出组件,在配置弹窗中,文件名修改为“盈利订单”,选择文件拓展名“xlsx [Excel 2007 and above]”

在配置弹窗中点击“输出字段”,在空白表格处鼠标右键点击“获取字段”

字段获取后,点击“确认”

“亏损订单”的excel组件也进行同样的设置

2.7执行转换

组件配置完成后,可执行转换任务,点击启动按钮

在弹出的窗口中点击“启动”

执行成功,可以看到每个组件右上角都有个“√”

2.8查看执行日志

任务执行过程中,会将相关操作记录到日志中,任务执行完毕后,可查看执行结果及日志,如下图所示

2.9查看结果

点击“文件库”,右键根目录刷新,可以看到转换任务的输出结果:盈利订单和亏损订单,可以右键下载查看

三、实验结果

输出文件

内容

说明

盈利订单.xlsx

profit ≥ 0 的订单

可进一步分析高利润产品

亏损订单.xlsx

profit < 0 的订单

可用于亏损原因追踪

实验成功实现了订单数据的关联与分流处理,为后续的盈利分析提供了规范的数据基础。

四、问题与解决

4.1问题:新建转换流后处于锁定状态,无法拖拽和编辑组件解决:点击页面锁定图标解锁转换流设计画布,解锁后才可进行组件添加、连线与配置操作。

4.2问题:记录集连接组件连线时提示排序需要,关联后数据匹配错乱解决:保证两张表输入数据有序,按业务主键规范排序后再建立连接,选用左外连接方式保留全部订单记录。

4.3问题:两表关联后出现重复产品 ID 字段,影响后续数据处理解决:添加字段选择组件,通过移除功能删除冗余同名字段,只保留唯一关联标识字段。

4.4问题:过滤记录条件配置错误,盈利与亏损订单分流结果颠倒解决:重新设置判断字段为利润 profit,配置判断条件为大于等于 0,True 输出对应盈利订单、False 输出对应亏损订单。

4.5问题:同步数据源后找不到业务数据表解决:在元数据与文件库之间来回切换刷新,确认线上公共数据源加载成功,再选择对应业务数据表进行读取。

五、实验总结

本次实验依托助睿零代码 ETL 平台,完成了订单与产品两张业务数据表的抽取、关联整合、字段清洗、条件分流及 Excel 结果导出全流程数据加工操作。实验熟练掌握了平台新建转换流、组件拖拽连线、参数配置、任务执行与结果查看的完整流程,理解了表输入、记录集连接、字段选择、过滤记录、Excel 输出等常用 ETL 组件的功能与配置要点。

同时深入掌握了多表左外关联、重复字段处理、按业务指标条件数据分流的核心设计思路,能够通过零代码可视化方式完成企业经营场景下的利润核算与订单分类加工任务。通过本次实验,熟悉了 ETL 数据集成的基本原理与实操方法,提升了零代码数据处理的动手能力,也为后续复杂多表关联、数据清洗分流及企业经营数据分析类实训项目积累了实操经验。

Logo

一站式 AI 云服务平台

更多推荐