助睿数智:零代码校园考勤可视化分析
返回平台首页,点击左侧助睿BI,进入数据可视化分析平台;点击左侧数据源,新建MySQL数据源,填写与AI平台一致的数据库连接信息,测试连接成功并保存;进入数据集模块,点击新建数据集并命名为“聚类簇编号数据集”创建完成后在右上角弹出的提示中点击“好的,我知道了”,并在右上角选定已创建的MySQL数据源,选中聚类结果表并添加至画布;批量修改所有字段中文备注名称,方便后期图表制作,修改完成后保存并发布数
一、实验背景
1. 实验目的
- 依托助睿数智一体化平台,掌握AI 聚类建模、ETL 数据规整、BI 可视化分析全链路零代码实操流程。
- 运用 K-Means 算法对学生考勤多维数据完成智能分群,划分出不同考勤行为群体,重点聚焦纪律高危型学生开展用户画像分析。
- 熟练完成数据表结构调整、字段映射、标签回填等数据处理操作,实现算法结果回流至业务数据表。
- 借助助睿 BI 制作多维度统计图表与综合分析仪表盘,挖掘高危学生性别、年级、校区、班级分布规律,为校园考勤精细化管理、学生行为精准干预提供数据依据。
- 打通原始数据 — 智能建模 — 数据加工 — 可视化分析 — 业务应用完整数据闭环,建立业务驱动型数据分析思维。
2. 实验环境
- 实训平台:助睿数智 Uniplore 在线实验平台
- 核心工具:AI Studio 机器学习平台、UDI-Studio ETL 数据加工平台、助睿 BI 数据可视化平台
- 数据环境:MySQL 团队实训数据库,存储学生考勤相关业务数据表
- 核心数据源:
student_attendance_stats学生考勤主题标签表 - 设备环境:联网电脑,具备平台登录、数据库访问、流程编辑与结果导出权限
- 开发模式:全程拖拽式零代码开发,无需编写专业程序代码
3. 业务场景
校园日常积累海量学生迟到、早退、请假、校服违规等考勤原始数据,原始数据杂乱无章,无群体划分标签,无法直接区分自律优秀、轻微波动、纪律高危三类学生群体。单纯人工统计效率低、主观性强,难以精准定位违纪高发人群、年级、校区与班级。通过平台完成智能聚类分群→ETL 标签更新→BI 多维画像分析,自动划分学生考勤群体,精准挖掘纪律高危学生行为特征与分布规律,输出可视化分析成果与校园考勤管理优化方案,辅助学校落实分层德育管理与考勤纪律整治工作。
4. 数据加工整体流程
原始考勤业务数据表接入→筛选建模有效数值字段→AI Studio 执行 K-Means 聚类分群→生成聚类簇结果表→ETL 执行 SQL 新增业务标签字段→完成聚类编号与考勤群体名称值映射→跨表回填考勤分层标签→规整标准化业务主表→助睿 BI 搭建数据集→制作多维度统计分析图表→整合搭建综合分析仪表盘→解读群体特征→输出校园考勤管理应用建议
二、实验步骤
考勤主题扩展标签构建
步骤一:进入AI Studio平台,搭建K-Means聚类建模工作流
登录助睿数智实验平台,点击左侧菜单栏人工智能,进入AI Studio智能建模空间;

点击页面左上角"+"号,选择新建工作流,自定义工作流名称,进入可视化拖拽建模画布;

左侧组件搜索数据库加载组件,拖拽至空白画布区域;

双击数据库加载组件,填写团队私有MySQL数据库连接参数,点击测试并完成数据库连接;

在数据表选择栏中选中前置数据表 student_attendance_stats;

进行字段筛选配置:仅保留student_id、class_id、late_count、early_leave_count、leave_count、uniform_violate_count,其余所有基础信息字段统一勾选跳过(skip),并为数值型考勤次数设置numeric类型,学生ID、班级ID设置分类类型;

配置完成点击确定,右键数据库加载组件,选择运行该控件,运行成功后右键查看输出结果,确认字段筛选无误;



在组件库搜索K-Means聚类组件,拖拽至画布,用连线将数据库加载组件输出端连接至K-Means输入端;

双击打开K-Means配置面板,固定聚类簇数量设置为3簇,其余算法参数保持平台默认配置,无需修改;

右键运行K-Means聚类组件,运行结束查看输出结果,确认每条学生数据均生成唯一聚类簇编号C1/C2/C3;

拖拽数据入库组件,连接K-Means聚类输出结果;

双击数据入库组件,配置相同团队数据库信息,点击获取表信息选择新建数据表,表名命名为student_cluster,确认入库字段;


整体运行整条工作流,等待全部组件运行成功,完成聚类结果持久化存入数据库。运行成功后每个组件右上角会显示“√”

步骤二:进入助睿BI平台,完成聚类结果可视化与群体画像定义
返回平台首页,点击左侧助睿BI,进入数据可视化分析平台;

点击左侧数据源,新建MySQL数据源,填写与AI平台一致的数据库连接信息,测试连接成功并保存;



进入数据集模块,点击新建数据集并命名为“聚类簇编号数据集”


创建完成后在右上角弹出的提示中点击“好的,我知道了”,并在右上角选定已创建的MySQL数据源,选中student_cluster聚类结果表并添加至画布;


批量修改所有字段中文备注名称,方便后期图表制作,修改完成后保存并发布数据集;


进入工作表模块,新建专属分组命名为“聚类簇对应的考勤画像群体分类分析”


右键刚刚创建额分组,在分组内新建空白工作表并命名为“迟到与早退次数的聚类簇分析”


同样,点击跳过提示后,在右上角选中刚刚发布完成的聚类簇编号数据集。


图表类型选择探索器散点图

将字段“late_count(迟到次数)”拖拽到X轴,“early_leave_count(早退次数)”拖拽到Y轴

点击图形设置按钮,打开设置面板在颜色区域添加聚类簇编号Cluster

点击信息区域的“+”,在下拉框中选择“student_id(学生ID)”,并点击“确认”

将“student_id(学生ID)”设置为“维度”

系统默认限额为 2000 条数据,需要将限额设置为 100%,避免数据过多不显示全部。

为了区分更明显,我们可以设置聚类簇编号的颜色,切换对比强烈的主题配色,设置完成点击空白处生效。


同样地,按相同步骤完成迟到 & 请假、迟到 & 校服违规、早退 & 请假、早退 & 校服违规、请假 & 校服违规五张分析图表的创建;












进入仪表盘模块,新建综合聚类分析仪表盘命名为“聚类簇分析”



在“基础组件”中添加标题文本组件,组件内容为“聚类簇分析”,字体居中、加粗


在组件右下角可以拖动调整组件的大小,调整后可以点击右上角的图钉按钮固定


点击上方工作表组件将所有制作完成的考勤聚类分析工作表统一拖拽至仪表盘内


调整布局、大小与排版,保存并发布仪表盘;


步骤三:进入助睿ETL平台,为考勤主表新增扩展标签字段
切换至数据集成(ETL) 平台,打开前期实验创建的项目空间,新建转换流并命名为“增加考勤主题扩展标签字段”;


在组件库拖拽执行SQL脚本组件至画布;

双击组件,绑定团队私有数据库连接,在脚本编辑框内输入数据表新增字段语句:
ALTER TABLE student_attendance_stats
ADD COLUMN cluster VARCHAR(10) NULL DEFAULT NULL COMMENT '聚类簇编号',
ADD COLUMN attendance_group VARCHAR(30) NULL DEFAULT NULL COMMENT '考勤群体分类';

确认SQL语句无误,运行该组件,执行数据表结构修改,为主表新增两个扩展标签字段;


步骤四:ETL搭建数据流转流程,实现标签映射与批量更新
在当前ETL转换流内,拖拽表输入组件,绑定团队数据库,读取student_cluster聚类结果整张数据表;


拖拽字段选择组件,连线表输入组件,进入配置页面;

右键空白部分获取字段后,移除所有多余字段,仅保留student_id学生编号与Cluster聚类编号两个核心字段,同时统一调整字段数据类型,保证与主表字段类型一致;


点击元数据界面获取数据,确认两个字段设置如下:


拖拽值映射组件,连接字段选择输出端;

右键插入字段,配置映射关系


拖拽更新组件,连接值映射组件输出数据流;

双击更新组件,选择目标数据表为student_attendance_stats学生考勤主表;

用来查询的关键字表格空白处获取字段,保留 student_id、class_id,表示更新时查询到数据表与流里的字段1相同时,执行更新操作


更新字段表格空白处获取字段,删除 student_id。注意,我们在增加扩展字段时,聚类簇编号的字段为cluster,所以在表字段的 Cluster 字段中需要双击后点击下拉框选择正确的表字段

确认所有匹配、更新规则无误,完整运行整条ETL数据转换流程。

步骤五:数据结果校验,完成整体实验
在ETL平台右键点击“团队私有数据”加载数据库元数据,进入student_attendance_stats数据表进行数据探查,确认数据匹配无误、标签分类准确,完成本次考勤主题扩展标签构建全部实验流程。;


考勤画像可视化分析
1.点击页面左侧数据集功能模块,点击页面左上角+号选择新建数据集;在弹出窗口内填写数据集名称为学生考勤主题数据集,选择对应所属分组,填写实验相关备注,填写完毕点击确认;



2.关闭页面自动弹出的提示弹窗,在数据源选择栏选中已配置好的实验数据库,选定数据库后页面展示库内所有数据表,找到student_attendance_stats学生考勤数据表,长按鼠标将数据表拖拽至数据集编辑画布中。



3.确认画布内数据表字段完整无误后,点击画布右上角保存按钮,在弹出保存选项框中点击保存并发布,完成数据集发布操作,只有发布成功的数据集才可在后续工作表中正常调用使用。

点击左侧菜单栏工作表进入工作表制作模块

点击左上角+号选择新建分组,将分组名称命名为学生考勤画像分析,完善分组信息后确认创建,后续所有分析工作表统一存放至该分组内。


4.制作整体概况指标卡
4.1 右键点击刚建好的学生考勤画像分析分组,选择新建工作表,填写工作表名称为纪律高危型人数,选定所属分组,填写备注信息后点击确认;

关闭页面提示弹窗,在数据集下拉选项中选中刚刚发布的学生考勤主题数据集。

4.2 在页面左侧基础图表组件中选择指标卡,将字段student_id(学生ID)拖拽至指标卡数值填写区域;点击该字段聚合设置,将统计方式修改为去重计数。


4.3 打开图形设置面板,点击过滤器添加按钮,添加attendance_group(考勤群体分类)筛选字段,进入筛选编辑页面,勾选筛选内容为纪律高危型,确定筛选条件完成人数统计。


4.4 进入样式设置界面,统一调整指标卡边距、标题字体大小、字体颜色、文字展示位置,调整数值字体大小、颜色、加粗状态,全部样式调试完成后点击保存,选择保存并发布工作表。



4.5 再次在分组内新建工作表,命名为纪律高危型男生人数,沿用上述指标卡全部制作流程,在原有考勤群体筛选条件基础上,新增gender(性别)筛选字段,筛选内容设置为男,调整相同样式后保存并发布。




4.6 新建工作表命名为纪律高危型女生人数,筛选考勤群体为纪律高危型,性别筛选条件设置为女,完成样式设置后保存发布。


4.7 新建工作表命名为纪律高危型未知性别人数,筛选考勤群体为纪律高危型,性别筛选条件设置为未知,调整样式后完成保存发布。


5.制作性别特征分析可视化图表
5.1 新建纪律高危型学生男女占比工作表,选定学生考勤主题数据集,图表类型选择饼图;


将student_id字段拖拽至数值栏,gender性别字段拖拽至分类栏,student_id统计方式设置为去重计数。

5.2 进入图形设置,添加gender性别过滤器,筛选规则设置为排除未知性别;


再添加attendance_group考勤群体过滤器,筛选仅包含纪律高危型学生。


5.3 进入图表样式设置,开启饼图百分比标签显示,调整饼图内环大小、扇形圆角半径,统一设置图表主题配色,参数调整完毕后保存并发布工作表。



5.4 新建工作表制作全校男女生人数占比饼图,制作流程与上述一致,仅设置排除未知性别数据,取消考勤群体筛选条件,统计全校全体学生性别占比,统一样式后保存发布。




6.制作年级特征分析图表,新建工作表选用柱状图组件


将 grade 年级字段拖拽到 X 轴,student_id 拖拽到 Y 轴并设置为去重计数。


打开图形设置,添加 attendance_group 过滤器,筛选仅包含纪律高危型


统一图表主题配色,取消图表边框颜色,完成样式优化并保存发布


- 纪律高危型学生校区类型 + 年级交叉特征分析
7.1新建工作表,选择柱状图,沿用年级分析基础字段配置


7.2将 campus_type 校区类型字段拖拽至分组位置,生成校区 + 年级交叉堆叠柱状图

7.3统一图表整体样式与配色,核对各校区各年级高危学生数据

确认无误后保存并发布工作表,分析新老校区高危学生分布规律。

- 不同校区类型各年级学生人数
8.1新建工作表,制作校区年级堆叠柱状图

不添加任何考勤群体筛选条件,统计全校所有学生在不同校区、不同年级的总人数

保存发布图表,用于对照排除学生基数带来的数据分析误差。

- 纪律高危型学生班级特征分析
新建工作表,图表类型选择水平条图

将 class_name 班级名称拖拽至 Y 轴,student_id 拖拽至 X 轴并设置去重计数

添加过滤器筛选考勤群体为纪律高危型


将统计数值设置为降序排序,让高危人数多的班级优先展示

调整图表整体主题样式,美化展示效果

保存并发布工作表,定位违纪行为集中的班级。

- 搭建综合仪表盘
点击左边菜单栏中的 “仪表盘”,点击左上角 “+” 选择新建仪表盘


输入仪表盘名称与备注信息,点击确认创建空白仪表盘

在右侧组件栏选择基础组件,拖拽文本组件放置到画布上方

在文本组件内输入仪表盘总标题,设置字体大小、颜色、加粗、居中格式,拖动调整文本组件大小


切换组件列表至工作表分类,将之前所有制作发布完成的指标卡、各类分析图表依次拖拽至仪表盘画布当中


自由拖动调整所有图表的摆放位置、组件长宽尺寸,规划整体布局,可点击上方按钮进行预览


再次拖拽新增文本组件,输入数据分析内容、特征总结、管理建议等文字,关闭文本超出隐藏开关实现文字自动换行

点击预览按钮,全屏查看完整仪表盘展示效果

整体排版全部完成后,点击页面发布按钮,保存并正式发布仪表盘

点击分享功能,可设置分享权限,生成公开访问链接,完成仪表盘分享操作,他人可通过链接直接查看分析成果。

三、实验结果
1. 结果文件清单
- 基础数据表:
student_attendance_stats(完善后带考勤群体标签的考勤画像主表) - 聚类中间数据表:
student_cluster(K-Means 智能建模分群结果数据表) - BI 可视化成果:6 张考勤指标聚类分析工作表、1 份纪律高危型学生群体综合分析仪表盘
- ETL 流程文件:数据表新增字段转换流程、考勤群体标签批量更新转换流程
- 实验配置文件:数据库连接配置文档、K-Means 算法参数配置、平台字段映射关系配置文档
2. 数据内容与用途说明
- 完善后考勤主表:整合学生基础信息、日常考勤统计次数、聚类簇编号、考勤分层群体中文标签,是校园学生考勤用户画像核心数据源,直接支撑日常学生纪律管理、班级考勤统计、年级德育分析等业务。
- 聚类结果中间表:存储全体学生唯一聚类划分标识,是实现 AI 智能分群、拓展多维度学生行为标签的过渡核心数据。
- BI 可视化图表成果:以图表形式直观展示三类考勤学生群体分布差异,重点呈现纪律高危学生人群分布特点,为学校德育管理、纪律整治、家校沟通提供直观可视化决策依据。
- ETL 流程工程文件:具备可重复复用特性,后期新增学生考勤业务数据后,直接运行已搭建流程,即可自动完成聚类分群与考勤标签批量生成更新,大幅提升数据处理效率。
四、核心组件说明
1. 各组件功能作用
- 数据库加载(AI Studio):打通实训数据库与机器学习建模平台通道,快速读取业务数据表,完成智能建模数据源接入。
- K-Means 聚类组件:平台零代码机器学习核心组件,依托考勤多维数值特征自动完成学生样本分层分群,实现考勤行为智能化群体划分。
- 数据入库组件:将 AI 算法训练生成的聚类分析结果写入数据库,实现智能分析结果持久化存储。
- 数据源连接组件(BI):建立可视化平台与业务数据库稳定连接,为多维数据分析提供底层数据支撑。
- 数据集组件:统一规整数据表字段格式、规范字段命名,过滤无效信息,为 BI 图表制作提供标准化可用数据。
- 探索器散点图组件:实现多维度考勤数据交叉展示,直观区分三大聚类学生群体的行为特征差异。
- 执行 SQL 脚本组件(ETL):快速执行数据库语句,便捷完成数据表新增字段、修改表结构等基础运维操作。
- 表输入组件:读取数据库内指定业务数据表,作为数据清洗、数据转换、数据更新的基础数据源。
- 字段选择组件:过滤数据流内冗余无用字段,精简数据传输内容,降低平台运算压力,保障多表数据精准匹配。
- 值映射组件:完成聚类数字编码与中文考勤群体名称快速转换,提升业务数据可读性,贴合校园管理业务用语。
- 数据更新组件:依托
student_id唯一学生主键,实现跨数据表字段数据同步回填,完成学生考勤画像标签批量补充完善。
2. 实验内配置重点
- AI 建模阶段仅使用迟到、早退、请假、校服违规四类数值字段训练模型,禁止录入姓名、性别、年级等文本分类字段,避免算法分群出现偏差。
- K-Means 聚类数量固定设置为 3 类,严格匹配校园自律模范、轻微波动、纪律高危三类学生考勤群体划分标准。
- BI 可视化图表关闭数据抽样模式,放开全量学生数据展示权限,防止样本缺失造成群体特征判断错误。
- ETL 执行新增字段 SQL 语句时,严格核对字段名、数据类型、字段长度与中文注释,避免出现数据表结构冲突、字段重复问题。
- 值映射对应关系必须与 BI 业务定义的三类考勤群体完全一致,严禁出现编号与群体名称错乱匹配。
- 跨表数据更新统一使用
student_id学生 ID 作为唯一关联匹配键,禁止使用班级名称、学生姓名等易重复字段。
五、实验问题与解决方案
1. 实验遇到故障问题
- AI Studio 平台数据库加载失败,出现连接超时、访问权限不足提示;
- K-Means 聚类组件运行异常报错,无法正常输出学生分群聚类结果;
- 助睿 BI 数据源连接正常,但无法读取新建完成的聚类结果数据表;
- ETL 平台执行新增字段 SQL 语句运行失败,数据表字段添加不成功;
- ETL 数据更新流程运行显示成功,但考勤主表内新增群体标签字段全部为空;
- BI 各类分析图表仅展示少量学生数据,无法查看全校全体学生考勤聚类分布情况。
2. 对应排查解决办法
- 仔细核对数据库 IP 地址、访问端口、登录账号、登录密码、数据库名称全部参数,确认团队实训数据库已开放外网访问权限,切换稳定网络环境后重新建立连接。
- 重新检查数据库加载字段配置,剔除所有文本型、日期型非数值建模字段,修正异常字段数据格式,重新启动聚类流程运行。
- 在助睿 BI 数据源管理页面手动刷新数据库数据表列表,重新加载数据表元数据,新建数据集重新绑定目标数据表即可识别。
- 逐条检查 SQL 语句标点符号、中英文格式、字段命名规范,确认目标数据表不存在同名字段,修正语法错误后重新执行脚本。
- 分步排查流程故障:检查字段选择环节是否遗漏学生 ID 主键、核对值映射规则是否正常生效、确认数据更新组件匹配主键设置统一,重新调试整条数据流转流程。
- 进入 BI 图表高级设置界面,取消数据条数限制,将数据展示模式调整为 100% 全量展示,关闭系统默认抽样展示功能。
六、实验总结
1. 实验掌握内容
- 熟练掌握助睿 AI Studio 零代码 K-Means 聚类完整操作流程,充分理解依托连续数值特征实现用户分层建模的核心逻辑。
- 全面掌握助睿 BI 数据源配置、数据集创建、多维度统计图表制作、综合分析仪表盘搭建整套可视化实操技能。
- 精通 UDI-Studio ETL 平台 SQL 表结构修改、数据抽取过滤、字段值映射、跨表批量数据更新等核心数据处理能力。
- 完整掌握智能聚类建模 — 数据清洗规整 — 可视化分析解读 — 业务标签回流落地标准化学生用户画像搭建全流程。
- 能够独立结合校园考勤真实业务场景,完成学生行为数据智能分群、人群特征定义、校园管理应用方案设计与落地实操。
2. 平台操作体会
助睿数智一体化大数据实训平台全程采用可视化拖拽式操作模式,摒弃复杂编程代码,极大降低大数据应用与人工智能算法落地的入门学习难度。AI Studio、UDI-ETL、助睿 BI 三大功能模块分工明确、业务流程衔接紧密,AI 模块侧重数据智能挖掘、ETL 模块侧重数据规整与业务落地、BI 模块侧重数据分析与成果展示,整体架构高度贴合企业真实数据分析工作流程。平台操作界面简洁清晰,实验步骤由浅入深、逻辑循序渐进,十分适合大数据技术、数据分析相关专业学生夯实一线实操基本功。
3. 实验学习收获
本次实验打通了从原始校园业务数据出发,经过智能算法深度分析,再到可视化结果解读,最终完成业务标签落地应用的完整数据业务闭环,跳出单一的数据查询与基础统计学习层面。实操中不仅熟练掌握了平台核心组件的使用方法,更学会站在校园德育管理、班级考勤管理的实际业务视角解读机器学习聚类分析结果,真正实现技术实操与行业业务深度融合。同时在流程调试、报错排查、数据逻辑梳理的过程中,有效提升了数据流程排错能力与整体业务思维能力,为后续开展多维度学生用户画像构建、教育行业大数据深度分析等综合实训项目,打下扎实的实操基础与数据思维基础。
更多推荐


所有评论(0)