浏览器市场与用户画像分析-数据加工(2)+市场分析数据大屏制作
原始数据清洗→多维度聚合 ETL→指标体系搭建→可视化大屏落地,理解提前聚合明细数据、避免大屏实时查海量原始数据的工程意义;熟练使用 Uniplore 零代码 ETL:分组聚合、值映射、JS 条件判断、表关联、单位换算等常用数据处理逻辑;掌握数据大屏设计规范:遵循「总览 - 细分 - 细节」叙事逻辑、不同指标匹配合适图表类型;理解 Max 蓝图编辑器数据源、触发器、数据分发的运行逻辑。
实验五 浏览器市场与用户画像分析 - 数据加工 + 大屏可视化制作实验报告
课程名称:商业数据分析
实验日期:2026/6/1
一、实验目的
本次实验分为数据 ETL 加工、大屏静态布局搭建、蓝图数据接入三个子实验,整体实现从原始行为数据→聚合统计数据表→可视化数据大屏全流程落地,具体目标:
(1)数据加工(实验 5-1)
-
基于原始用户行为日志,生成daily_browser_detail用户 - 日 - 浏览器 - 小时明细中间表;
-
按照业务分析需求,批量构建 8 张统计汇总数据表,覆盖浏览器市场、用户使用行为、用户画像全维度指标;
-
通过 Uniplore ETL 零代码组件完成分组、计算、字段映射、条件分层、表关联等数据加工,区分轻 / 中重度用户、工作日 / 周末使用、多浏览器使用等细分指标;
-
关联用户人口属性表demographic.csv,完成用户多维度画像统计(性别、年龄、学历、职业、地域等)。
(2)大屏静态布局(实验 5-2)
-
结合业务分析逻辑完成大屏版面规划,遵循「总指标→细分市场→用户行为→时段 & 竞品分析」从上至下的展示逻辑;
-
使用助睿 Max 大屏组件完成页面美化:背景图、顶部标题 Banner、导航切换按钮、各图表分区背景与标题;
-
根据数据类型匹配对应图表:指标翻牌器、柱状图、饼图、折线图、分组柱状图、堆叠柱状图等。
(3)大屏数据接入(实验 5-3)
-
掌握 Max 蓝图编辑器核心概念:数据源、SQL 请求、触发器、并行数据处理、组件数据绑定;
-
创建团队私有 MySQL 数据源,编写各表查询 SQL,将加工后的统计数据动态绑定至大屏各个图表;
-
调试图表样式与数据映射关系,最终预览、发布大屏并生成在线访问链接。
二、实验环境
-
实验平台:助睿在线实验平台、Uniplore 一站式数据科学平台、助睿 Max 可视化大屏;
-
数据存储:团队私有 MySQL 数据库;
-
原始数据:1000 位用户数据,800 万 + 浏览器行为记录(约 825MB)、用户人口属性文件demographic.csv;
-
工具:Uniplore ETL 集成组件、Max 大屏编辑器、蓝图低代码编辑器。
三、实验数据源说明
表格
四、实验操作步骤
模块一:浏览器数据加工(实验 5-1)
步骤 1:创建并生成基础明细表 daily_browser_detail
-
新建转换流,执行建表 SQL,在团队私有库创建daily_browser_detail数据表;
-
复制上一实验「日志清洗抽取」转换流,修改排序字段为user_id、usage_date、process_name、hour,避免分组重复;
-
添加值映射组件,将系统进程名(iexplore.exe/chrome.exe 等)映射为中文浏览器名称(IE/Google/360 极速等);
-
配置表输出组件,勾选裁剪表,完成字段映射,运行转换流落地明细数据。
步骤 2:批量创建全部目标汇总数据表
新建转换流,通过批量 DROP+CREATE SQL 一次性创建browser_overview、browser_weekly_active、browser_frequency_stats、browser_multi_usage、browser_weekday_weekend、user_profile_stats6 张结果表,执行 SQL 脚本完成建表。
步骤 3:逐个开发统计 ETL 转换流
-
周活跃统计表 browser_weekly_active
-
表输入读取明细→字段格式化日期→值映射将日期转为周区间→排序→分组(浏览器 + 周,user_id 去重计数)→表输出入库。
-
按用户 + 浏览器汇总总秒数→增加常量 3600→计算器换算小时→JS 脚本划分轻度 / 中度 / 重度→再次分组统计各层级用户数。
-
多浏览器使用分布 browser_multi_usage
-
按用户分组统计浏览器种类→JS 转为 1 种 / 2 种 / 3 种及以上→分组统计各类人数。
-
工作日 & 周末对比 browser_weekday_weekend
-
JS 根据日期获取星期,区分工作日 (1-5)/ 周末 (0、6)→分组聚合人均秒、总秒→换算总小时后入库。
-
全局指标表 browser_overview
-
单 SQL 一次性计算 4 项全局指标→行转列(字段转行)→值映射字段中文名→写入键值格式指标表。
-
用户画像 user_profile_stats
-
① CSV 输入导入 demographic.csv,常量 2012,计算器2012-出生年份计算年龄;JS 划分 <18/18-25/26-35/>35 年龄段;
-
② 表输入读取明细数据,两份数据分别按 user_id/USERID 排序后,LEFT 外连接;
-
③ 多字段分组(浏览器 + 性别 + 年龄 + 学历 + 职业 + 收入 + 省份 + 城乡),去重统计用户数,落地画像表。
步骤 4:数据探查校验
在数据探查页面打开各汇总表,核对字段与统计结果是否符合业务逻辑。
模块二:市场分析大屏静态布局制作(实验 5-2)
步骤 1:新建大屏与全局样式配置
-
Max 大屏→新建空白大屏,命名「市场分析」;
-
页面设置粘贴全局背景图片链接;添加单张图片组件配置顶部 banner 标题图;
-
制作导航按钮:导航背景图 + 通用标题文字,分别设置「市场分析(选中)」「用户画像(未选中)」两个导航组件,成组置顶。
步骤 2:分区搭建全图表板块(共 9 个区块)
每个区块统一格式:区域背景图→小标题背景图→标题文字→图表组件,逐个布局:
-
数据概览区(顶部指标卡):长标题背景,4 组图标 + 数据翻牌器组件,分别对应总使用时长、人均时长、活跃占比、重度占比;
-
左上:浏览器用户数(基础柱状图);
-
左中:浏览器使用时长(多维度饼图),自定义 6 类浏览器配色;
-
左下:人均使用时长(基础柱状图);
-
右上:周活跃趋势(折线图);
-
右中:使用频率分布(堆叠柱状图);
-
右下:浏览器使用数量(基础饼图);
-
中左:工作日 vs 周末对比(分组柱状图);
-
中右:24 小时时段活跃(区域折线图)。
步骤 3:组件分组管理
将同区块组件右键成组,优化图层结构,保存大屏静态页面。
模块三:大屏蓝图数据接入(实验 5-3)
步骤 1:配置数据库数据源
我的数据→新建数据源,选择 MySQL,填写团队私有库连接信息,测试连接并保存。
步骤 2:组件导出蓝图
画布右键所有图表、指标组件,全部导出至蓝图编辑器,进入蓝图编辑页面。
步骤 3:全局初始化 + 分模块配置 SQL 与数据映射
-
拖入全局节点(页面初始化触发),作为所有 SQL 请求的触发源;
-
市场三大图表(用户数 / 时长饼 / 人均柱):单 SQL 查询 browser_coverage,并行数据处理拆分 3 套字段映射,分别绑定 3 个图表;
-
4 项指标翻牌:查询 browser_overview,并行拆分 4 个分支,分别匹配 4 个指标卡 value 字段;
-
剩余图表逐个配置:工作日周末、24h 活跃、周活跃、使用频率、多浏览器饼图分别新建 SQL 请求,书写对应表查询语句,数据处理后绑定对应图表组件。
步骤 4:预览调试与发布
-
逐个保存蓝图配置,大屏预览,修正图例、配色、字段映射错误;
-
确认数据展示无误后点击发布,复制大屏在线分享链接。
五、实验结果
-
数据加工成果:成功创建daily_browser_detail明细表 + 6 张业务汇总统计表,数据表字段、统计口径与业务需求一致,可支撑大屏全指标展示;
-
可视化成果:完成浏览器市场分析大屏静态排版 + 全量数据动态接入,9 个图表均可自动从 MySQL 拉取聚合数据,实现指标卡、柱状 / 饼 / 折线图动态渲染;
-
最终产出:大屏在线访问链接:http://47.109.66.142:30887/#/dataScreen/release?shareId=6c8835415fd44ee88317766691976922,打开链接可在线查看可视化成果。
六、实验问题及解决方案
表格
七、实验总结
1. 知识收获
-
掌握商业数据分析全链路:原始数据清洗→多维度聚合 ETL→指标体系搭建→可视化大屏落地,理解提前聚合明细数据、避免大屏实时查海量原始数据的工程意义;
-
熟练使用 Uniplore 零代码 ETL:分组聚合、值映射、JS 条件判断、表关联、单位换算等常用数据处理逻辑;
-
掌握数据大屏设计规范:遵循「总览 - 细分 - 细节」叙事逻辑、不同指标匹配合适图表类型;理解 Max 蓝图编辑器数据源、触发器、数据分发的运行逻辑。
2. 业务认知
通过数据落地可以量化浏览器市场格局:直观看出各浏览器用户体量、用户粘性差异,区分重度 / 轻度用户占比,对比工作日与娱乐时段使用习惯,基于用户画像精准定位产品核心受众,为产品运营、竞品分析提供数据支撑。
3. 不足与改进
-
本次未实现用户画像子大屏开发,后续可复用 user_profile_stats 表,搭建第二张画像大屏,按省份地图、年龄分层、收入分段做地域 & 人口可视化;
-
蓝图仅做页面初始化加载,可增加浏览器筛选下拉组件,通过变量传参实现单浏览器数据筛选交互。
更多推荐




所有评论(0)