考勤主题扩展标签构建& 考勤画像可视化分析
本次实验通过零代码 K-Means 聚类完成学生考勤行为分群,成功构建考勤主题扩展标签。实现了从数据建模、可视化解读到标签回写的全流程操作,输出可直接用于校园管理的学生考勤画像。验证了助睿数智平台在教育场景数据挖掘、用户画像构建中的实用性与便捷性。考勤画像可视化分析完成纪律高危型学生全维度可视化分析,清晰揭示群体分布规律与行为特征。依托助睿 BI 实现指标卡、饼图、柱状图、水平条图、综合仪表盘全场
学生用户画像 - 考勤主题扩展标签构建& 考勤画像可视化分析 实验报告 考勤主题扩展标签构建
话题标签:# 助睿数智 #学生用户画像 #K-Means 聚类 #考勤数据标签
一、实验基本信息
-
实验名称:学生用户画像 - 考勤主题扩展标签构建
-
实验平台:助睿数智(Uniplore)在线实验平台
-
实验时间:2026年5月18日
-
实验参考文档:助睿实验指导 - 学生用户画像 - 考勤主题扩展标签构建
二、实验目的
-
基于学生考勤主题标签表student_attendance_stats,使用K-Means 聚类算法完成学生考勤行为自动分群。
-
以迟到、早退、请假、校服违规次数为核心指标,识别不同考勤行为群体,生成可解释的学生考勤画像。
-
将聚类结果转化为业务标签,回写至原始考勤表,完成考勤主题扩展标签构建,为校园精细化管理提供数据支撑。
三、实验环境
-
平台工具:助睿数智在线实验平台(AI Studio 人工智能平台、助睿 ETL 数据集成平台、助睿 BI 可视化平台)
-
数据库:MySQL
-
前置数据:学生考勤主题标签表student_attendance_stats
-
核心功能:零代码机器学习建模、数据 ETL 处理、数据可视化分析、数据入库更新
四、实验数据
4.1 数据来源
实验使用上一实验输出的学生考勤主题标签表,包含学生基础信息与考勤次数统计数据。
4.2 核心字段
4.3 建模思路
-
特征选择:仅保留迟到、早退、请假、校服违规4 个独立考勤指标,避免冗余。
-
算法适配:指标为非负连续数值,直接适配 K-Means 算法,无需额外数据转换。
-
辅助字段:学生性别、年级、住校状态等仅用于后续画像解释,不参与建模。
五、实验原理
-
K-Means 聚类算法:无监督机器学习算法,将数据划分为 K 个簇,使簇内数据相似度高、簇间相似度低,本次固定 K=3。
-
零代码建模流程:数据加载→特征筛选→模型训练→结果输出→可视化解读→标签回写。
-
标签扩展逻辑:将机器聚类编号(C1/C2/C3)映射为业务标签,新增字段并更新至原始考勤表。
六、实验步骤
6.1 AI Studio 平台完成 K-Means 聚类建模
-
新建工作流:进入 AI Studio,创建考勤聚类分析工作流。
-
数据导入:拖拽「数据库加载」控件,连接 MySQL 数据库,加载student_attendance_stats表,仅保留建模核心字段。
-
聚类配置:拖拽「K-Means」组件,设置簇数量为3,其余参数默认,运行模型生成聚类结果。
-
结果保存:拖拽「数据入库」组件,将聚类结果保存至新表student_cluster。
6.2 助睿 BI 平台完成聚类群体分类解读
-
连接数据源:在 BI 平台新建 MySQL 连接,关联student_cluster数据表。
-
构建数据集:创建聚类分析数据集,配置字段中文备注并发布。
-
制作可视化工作表:通过散点图两两分析 4 个考勤指标,区分 C1/C2/C3 簇的行为特征。
-
群体命名:结合分布特征,将簇映射为自律模范型、轻微波动型、纪律高危型。
6.3 数据集成平台完成扩展标签回写
-
新增字段:通过 SQL 脚本为student_attendance_stats新增cluster(聚类编号)、attendance_group(考勤群体)字段。
-- 为学生考勤统计表添加聚类结果字段
ALTER TABLE student_attendance_stats
ADD COLUMN cluster VARCHAR(10) NULL DEFAULT NULL COMMENT '聚类簇编号',
ADD COLUMN attendance_group VARCHAR(30) NULL DEFAULT NULL COMMENT '考勤群体分类';
-
数据获取:读取student_cluster表,筛选student_id和Cluster字段。
表输入:
-
值映射:将 C1/C2/C3 映射为对应业务标签。
字段选择:
-
数据更新:通过「更新」组件,将聚类标签回写至原始考勤表,完成扩展标签构建。
更新:
七、实验结果
-
聚类分群结果
-
表格
聚类簇编号
群体名称
核心行为特征
C1
自律模范型
全维度异常次数极低,出勤稳定
C2
轻微波动型
迟到早退少,偶发校服违规 / 请假
C3
纪律高危型
多维度违纪叠加,高频异常行为
-
数据表更新结果:student_attendance_stats表成功新增cluster和attendance_group字段,所有学生均完成标签匹配。
-
可视化结果:通过 BI 仪表盘清晰呈现三类群体的考勤行为分布差异。
八、实验分析
-
聚类有效性:4 个核心指标业务独立,聚类结果可解释性强,符合校园考勤管理实际场景。
-
群体特征价值:精准区分不同纪律表现学生,为分层管理、重点干预提供数据依据。
-
标签扩展意义:将机器聚类结果转化为业务可读标签,实现数据到管理决策的落地。
九、实验总结
-
本次实验通过零代码 K-Means 聚类完成学生考勤行为分群,成功构建考勤主题扩展标签。
-
实现了从数据建模、可视化解读到标签回写的全流程操作,输出可直接用于校园管理的学生考勤画像。
-
验证了助睿数智平台在教育场景数据挖掘、用户画像构建中的实用性与便捷性。
考勤画像可视化分析
十、实验目的(第二部分:学生考勤画像可视化分析)
-
基于已完成 K-Means 聚类并标注考勤群体的学生考勤主题标签表,聚焦纪律高危型群体开展专项行为特征分析。
-
通过助睿 BI 可视化平台完成多维度图表制作,明确高危群体在性别、年级、校区、班级的分布规律。
-
挖掘考勤违纪核心特征与高发场景,为校园精准干预、重点整治、精细化考勤管理提供直观数据支撑与决策依据。
十一、实验环境
-
平台工具:助睿数智(Uniplore)在线实验平台、助睿 BI 数据可视化探索平台
-
数据库:MySQL
-
核心数据源:已完成标签扩展的学生考勤主题标签表student_attendance_stats
-
核心功能:数据集构建、指标卡制作、多类型图表可视化、综合仪表盘搭建与分享
十二、实验数据
12.1 数据来源
沿用第一部分实验已完成聚类标签回写的student_attendance_stats数据表,包含学生基础信息、考勤统计数据、聚类簇编号与考勤群体分类全维度数据。
12.2 核心分析字段
十三、实验步骤
13.1 进入助睿 BI 平台
点击实验平台左侧菜单「助睿 BI」
进入可视化探索平台,复用第一部分实验已配置的 MySQL 数据库连接,无需重复新建数据源。
13.2 构建学生考勤主题数据集
-
点击左侧「数据集」→「+」→「新建数据集」,命名为学生考勤主题数据集,所属分组选择根目录。
-
数据源选择已创建的「商业数据分析实验」,关联student_attendance_stats数据表。
-
确认字段中文备注完整,点击「保存并发布」,生成可用于可视化分析的正式数据集。
13.3 新建分析分组与工作表
-
点击「工作表」→「新建分组」,命名为学生考勤画像分析,统一管理可视化图表。
-
在分组内按需新建工作表,用于制作指标卡、饼图、柱状图、水平条图等可视化内容。
13.4 核心可视化图表制作
13.4.1 整体概况指标卡
-
新建工作表,图表类型选择「指标卡」。
-
拖拽student_id至值区域,聚合方式设置为去重计数。
-
过滤器添加attendance_group,筛选「纪律高危型」,按需添加性别筛选条件。
-
分别制作纪律高危型总人数、男生人数、女生人数、未知性别人数指标卡,并完成样式优化。
13.4.2 性别特征分析饼图
-
新建工作表,图表类型选择「饼图」。
-
分类拖拽gender,值拖拽student_id(去重计数)。
-
过滤器排除性别「未知」,并筛选纪律高危型群体,制作高危群体性别占比饼图。
-
同方法制作全校学生性别占比饼图,用于基数对比校验。
13.4.3 年级与校区交叉特征分析
-
新建工作表,图表类型选择「柱状图」,X 轴grade、Y 轴student_id(去重计数),筛选高危群体,生成年级分布柱状图。
-
拖拽campus_type至分组区域,生成校区 + 年级堆叠柱状图,展示新老校区高危人数差异。
-
制作全校各年级校区人数柱状图,排除学生基数干扰,验证分布真实性。
13.4.4 班级特征水平条图
-
新建工作表,图表类型选择「水平条图」,Y 轴class_name、X 轴student_id(去重计数)。
-
筛选纪律高危型群体,按人数降序排序,定位高危学生集中的重点班级。
13.5 搭建综合可视化仪表盘
-
点击「仪表盘」→「新建仪表盘」,命名为纪律高危型学生用户画像分析。
-
拖拽文本组件设置标题,将所有工作表图表按逻辑布局至画布。
-
添加分析结论文本组件,完善仪表盘内容,点击「保存并发布」。
-
支持预览、分享仪表盘,实现可视化结果快速传递与查看。
来自undefined分享的资源
访问地址:http://47.109.153.89/#/share/dashboard/2058462493633810432
十四、实验结果
14.1 纪律高危型整体规模
-
纪律高危型学生总人数:195 人
-
男生:13 人,女生:11 人,性别未知:171 人
14.2 性别分布特征
-
全校性别占比:男生 53.03%,女生 46.97%
-
高危群体性别占比:男生 54.17%,女生 45.83%
-
男生在高危群体中占比高于全校基数,为违纪高发群体。
14.3 年级与校区分布特征
-
年级特征:高三年级高危人数最多,高一、高二年级相对较少。
-
校区特征:老校区为高危核心区域,高三老校区高危人数达 261 人;新校区高危人数极少,高三无高危学生。
14.4 班级分布特征
纪律高危型学生呈高度班级聚集性,高三 09 班高危人数最多(19 人),其次为高三 05 班、高三 19 班。
14.5 可视化成果
完成纪律高危型学生综合仪表盘搭建,直观展示人数、性别、年级、校区、班级全维度特征,可直接用于校园管理决策。
十五、实验分析
-
性别差异:男生规则意识、时间观念相对薄弱,考勤违纪风险显著高于女生,需针对性开展纪律与时间管理教育。
-
年级规律:高年级学业压力大、自主管理空间更广,对考勤纪律重视度下降,高三为考勤管控核心年级。
-
校区差异:老校区在通勤条件、管理模式、学风氛围上存在短板,高危人数远高于新校区,需优化老校区管控措施。
-
班级聚集:高危学生集中于少数管理薄弱、班风涣散的班级,与班级管理强度、同伴效应直接相关,需重点整顿薄弱班级。
十六、实验总结
-
完成纪律高危型学生全维度可视化分析,清晰揭示群体分布规律与行为特征。
-
依托助睿 BI 实现指标卡、饼图、柱状图、水平条图、综合仪表盘全场景可视化,数据展示直观、易懂、可落地。
-
构建从聚类标签到可视化分析的完整闭环,输出的结果可直接用于校园考勤精细化管理、精准干预与重点整治。
-
验证了助睿 BI 平台在教育场景数据可视化、用户画像深度分析中的实用性与便捷性。
更多推荐



所有评论(0)