一、实验背景

1.1实验目的

         本次实验旨在熟悉助睿零代码数据集成平台(ETL平台)的核心功能和操作方法,具体包括:

  1. 掌握新建转换、添加组件、执行转换等基本操作流程
  2. 熟悉表输入、记录集连接、字段选择、过滤记录、Excel输出等常用组件的配置方法
  3. 理解多表关联、数据过滤与分流处理的ETL设计思路

        通过本次实验,学习独立使用助睿平台完成常见的数据加工任务的方法,为后续更复杂的数据处理场景打下基础。

1.2实验环境

  1. 零代码在线实验平台:本次实验使用助睿数智(Uniplore)作为一站式数据科学平台。该平台覆盖从数据接入、ETL处理、机器学习建模到可视化展示的全链路零代码功能,适用于数据分析教学与企业数据加工场景。产品官网为 https://www.uniplore.com/,本次实验的访问地址为 https://lab.guilian.cn/。
  2. 数据库: MySQL(含订单数据和产品信息表)
  3. 数据准备:订单表(business anavlsis.order detail). 产品表(business anavylsis.product)

1.3业务场景

        在企业经营分析中,经常需要将多张表关联起来计算利润,并按利润正负对订单进行分类存储。本实验以订单利润分流为例,通过零代码拖拽方式完成这一数据处理任务。

1.4数据加工流程

        

二、实验步骤

2.1新建项目

        打开实训平台,新建一个项目,根据实验日期命名,方便后续查看。

2.2同步数据源

        右键关系数据库,同步数据源,成功则显示如下界面

2.3创建转换流

        本次实验将创建"订单利润分流处理"转换流,实现订单数据与产品信息的关联,并根据利润正负将数据分流为盈利订单和亏损订单,分别输出到两个Excel文件。
        实际操作步骤如下:

        点击资源库,右键资源库下文件图标,选择“新建转换流”。

2.4添加组件

        在建立转换任务后,可添加相应操作组件到转换任务中。
        下面以订单数据(business_anaylsis.order_detail)和产品信息数据(business_anaylsis.product)生成盈利订单数据和亏损订单数据为例来构建转换任务,按如下顺序向转换中添加组件:

2.4.1添加表输入组件

        本次实验需要将两类数据进行合并计算,所以需要添加2个表输入组件,读取2个不同表的数据。
        点击"组件库”,由于组件库的组件数量较多,可以通过关键字搜索快速获取。在搜索输入框中输入"表输入”,即可查询到"表输入"组件

        将表输入组件拖拽到右侧编辑器中并将其名称修改如下

2.4.2添加记录集连接、字段选择、过滤记录、excel组件

        操作步骤同上一步,通过将鼠标放置再组件右下角可将组件设置箭头连接至其他组件。最终效果如下图

2.5设置表输入组件

        右键组件并选择编辑组件

        数据库连接选择刚才同步的线上数据库,并点击获取SQL语句,在语句目录中找到"business_anaylsis.order_detail"并点击它,再点击"确定”。最终效果如下图。

        

2.6设置记录集连接组件

        编辑组件,并将各项修改至如下图所示

2.7设置字段选择组件

        编辑组件,将各项设置为如下图所示,注意先右键空白区获取字段。

2.8设置过滤记录组件

        编辑过滤记录组件,将各项修改为如图所示,注意0的值的类型应为Integer。

2.9设置excel组件

        设置excel两个组件如图

注意两表都应先在输出字段选项中获取字段,最终效果如图。

2.10执行转换并输出文件

        点击如图按钮即可执行转换,等待一段时间后即可生成输出文件。

Logo

一站式 AI 云服务平台

更多推荐