基于零代码平台的订单利润分流数据加工
我保留了订单明细表里的product_id,把产品信息表带来的那个去掉就好了。任务跑完之后,我打开输出的Excel文件,发现表格里有两列产品ID,一列叫product_id,另一列叫id。做左外连接的时候,订单明细表里本来就有产品ID字段,产品信息表里也有产品ID字段,两张表合并之后,两个同名的字段都被保留了下来。我没有做字段清洗,就直接往下走了。这次实验我按照流程走了一遍:拉出订单明细表和产品信
基于零代码平台的订单利润分流数据加工
一.实验背景
1.1实验目的
本次实验主要目标是要求我们掌握助睿平台的零代码ETL数据处理能力,完成“订单利润分流数据加工”任务。具体学习内容如下:
掌握新建转化、添加组件、执行转化等基本操作流程
熟悉常用组件的创建与配置(字段选择、条件过滤等)
学会将加工后的数据输出为数据集或文件
1.2 实验环境
平台:助睿数智(Uniplore),网址 https://lab.guilian.cn
数据:平台自带的线上公共数据源,里面有订单表,字段包括快递名称、省份等。
方式:零代码,全部在平台界面上拖拽配置。
1.3 处理流程
创建项目并同步数据
新建转换流,命名为“订单利润分流处理”
配置组件信息
执行转换
查看执行日志
查看结果
二.实验步骤
2.1 创建项目并同步数据
登录平台后新建项目,名字叫“助睿ETL入门实验”

然后获取我们本次的实验数据集

成功同步数据库—线上公共数据源(Readonly),结果如下图所示

2.2 新建转换流
命名为“订单利润分流处理”

在选择连接线的弹窗中点击“主输出步骤”,表示满足要求的记录通过该连接线传输数据

最终,一个完整的转换任务流程构建完成

2.3 配置组建信息
2.3.1 表输入组建配置
订单_详细订单表选择 “business_anaylsis.order_detail”

生成完整的SQL语句

订单_产品信息表选择 “business_anaylsis.product”

生成SQL语句

2.3.2 记录集连接组件配置
双击记录集连接组件,在下拉列表中选择需要连接的数据来源,最终结果如下图所示

第一个Transform字段保留product_id,第二个Transform字段保留id

2.3.3 字段选择组件配置
因为字段produce_id与字段id内容相同,所以需移除id字段

2.3.4 过滤记录组件配置
点击value配置成如下图所示的内容

最终,过滤条件配置结果如下图所示

2.3.5 Excel输出组件配置
盈利订单


亏损订单

2.4 执行转换
组件配置完成后,点击启动按钮

2.5 查看执行日志


2.6 查看结果

三.实验结果
执行成功后我们可以在项目文件列表里看到两个Excel文件,点击下载,即可在电脑的下载里面查看这两个文件。
我分别打开看了:

盈利订单.xlsx:所有行的 profit 列都 ≥ 0。

亏损订单.xlsx:所有行的 profit 列都 < 0。

实验成功实现了订单数据的关联与分流处理,为后续的盈利分析提供了规范的数据基础。
四.问题与解决
问题1:连接之后Excel里多出来一列重复的产品ID
问题现象:我把订单明细表和产品信息表做左外连接之后,就直接连到过滤记录组件开始分流了。任务跑完之后,我打开输出的Excel文件,发现表格里有两列产品ID,一列叫product_id,另一列叫id。两个字段其实是一样的东西,数据冗余了,看着很乱。
问题原因:做左外连接的时候,订单明细表里本来就有产品ID字段,产品信息表里也有产品ID字段,两张表合并之后,两个同名的字段都被保留了下来。我没有做字段清洗,就直接往下走了。
解决方法:严格按照流程来,在“记录集连接”后面加一个“字段选择”组件,把多余的某个产品ID字段去掉。我保留了订单明细表里的product_id,把产品信息表带来的那个去掉就好了。数据源表名不一样,但字段含义是一样的,平时默认全都要,不做移除就冗余了。
五.实验总结
这次实验我按照流程走了一遍:拉出订单明细表和产品信息表,做左外连接,去掉多余的ID字段,按利润是否大于等于0分成盈利和亏损两路,最后输出两个Excel文件。
通过实际操作,我记住了以下几点:
1.画布打开默认是锁定状态,右上角或者工具栏有小锁图标,先点解锁再动手拖组件。
2.连接了两张表之后,同名字段通常会同时保留,需要手动去重。
3.过滤记录的分流条件要注意写对比较运算符和阈值,边界数据(比如利润正好等于0)别漏掉。
更多推荐



所有评论(0)