很多人一提到“千万级供应链数据分析”,第一反应就是复杂。采购、入库、出库、供应商等多张表,不仅要先完成清洗和规范,还要处理字段对齐、跨表关联、口径统一、指标计算等一系列问题,最后才能得到库存周转、采购统计这类真正有业务价值的结果。按传统做法,这类任务往往离不开数据库、SQL 和技术人员配合,流程重、周期长,业务团队很难快速推进。

但今天我要介绍的是另一种更轻量的 AI 工作流方式:

可以直接在本地电脑上完成数据清洗、关联分析、统计汇总以及结果输出。整个过程零代码、零 SQL,无需搭建数据库,也不需要任何编程基础。数据全程保留在本地,安全可控,业务人员只需要把分析目标描述清楚,就可以。

如下配置好的工作流图:

image

报表可视化结果:

image

接下来,我们就用一个典型业务场景,来完整演示这个过程:供应链库存与采购分析

一、案例需求分析

 在供应链分析场景里,业务真正关心的,通常不是原始数据本身,而是最后能产出哪些可直接使用的结果表。因此,这个案例先从结果导向出发,先明确最终要生成哪些统计结果,再回到数据来源和清洗过程。

1、最终输出哪些结果表

完成数据清洗、字段规范和多表关联后,这个案例最终会输出 4 个统计结果表:

  • 仓库质检统计表:用来统计各仓库的入库总量和质检合格率,帮助业务了解不同仓库的收货与质检情况。
  • 供应商统计表:用来统计各供应商的采购金额、供货物料数等核心指标,方便评估供应商贡献和供货表现。
  • 物料进销存汇总表:用来汇总各物料的总入库量、总出库量、库存结余、平均月出库量、库存周转天数等指标,帮助业务全面掌握物料库存状态。
  • 库存周转 Top50 表:用来筛选库存周转最慢的 Top50 物料,并结合供应商信息查看对应情况,帮助业务快速识别库存积压和周转风险。

生成结果统计的文件,如下图:

 同时,还会生成对应的 HTML 报表视图,方便直接查看分析结果。如图:

image

2、业务数据涉及哪些源表

这次案例围绕供应链库存与采购分析展开,一共涉及 4 张核心业务表。

  • 采购订单表 :主要记录采购单号、供应商ID、物料编码、采购数量、采购单价、采购金额、下单日期、预计到货日期,用来承接采购业务数据,是后续采购分析和供应商分析的重要基础表。
  • 入库记录表 :主要记录入库单号、采购单号、物料编码、入库数量、入库日期、仓库编号、质检结果,用来反映采购物料的实际到货、入库和质检情况。
  • 出库记录表 :主要记录出库单号、物料编码、出库数量、出库日期、领用部门、用途,用来反映物料实际出库和使用情况,是库存分析的重要来源。
  • 供应商信息表 :主要记录供应商ID、供应商名称、供应商等级、所在省份、合作起始日期、联系人、联系电话,用来补充供应商维度信息,支撑供应商表现分析和库存周转结果展示。

4张表的数据量在千万级,如下图示:

image

3、这次主要做了哪些清洗

清洗主要集中在采购订单表、入库记录表和出库记录表这 3 张业务表上,重点是统一日期格式、清理数值字段、规范物料编码和业务口径,为后续采购、库存和供应商分析打好基础。具体动作如下:

清洗采购订单表

  • “下单日期”“预计到货日期”统一为 yyyy-MM-dd 格式
  • “采购单价”“采购金额”去除 ¥ 和千分位逗号
  •  “物料编码”去除前后空格,统一为大写
  • “采购数量”提取数字

清洗入库记录表

- “入库日期”统一为 yyyy-MM-dd 格式
- “入库数量”去除单位后缀
- “质检结果”归一化处理:“合格”“OK”“PASS”统一为“合格”,“不合格”“NG”统一为“不合格”
- “物料编码”统一为大写,去除前后空格
- 只保留“质检结果”为“合格”的记录

清洗出库记录表

- “出库日期”统一为 yyyy-MM-dd 格式
- “出库数量”提取数字
- “物料编码”统一为大写
- “领用部门”去除前后空格,并做归一化处理


经过这一步清洗后,采购、入库、出库三张核心业务表的数据格式和字段口径会先统一下来,后续才能继续完成采购入库关联、物料进销存汇总以及各类统计结果表输出。

二、提示词整理

在工作流配置之前,需要先把这次业务处理逻辑整理成一份提示词。

这一步的作用,就是先明确 清洗哪些表 、 怎么关联 、 输出哪些报表 。整理好之后,这份提示词就可以作为工作流配置输入,指导后续执行。

这里也需要说明一点: 提示词不一定非要写成固定模板 。只要表达得 清晰 、 明确 、 简洁 ,让人一眼能看懂要做什么、按什么顺序做、最后输出什么结果,就可以了。

本次案例整理出的提示词如下:

第一步 - 清洗采购订单表:
  - "下单日期""预计到货日期"统一为 yyyy-MM-dd 格式
  - "采购单价""采购金额"去除¥和千分位逗号
  - "物料编码"去除前后空格,统一为大写
  - "采购数量"去除"个""件""箱"等单位后缀

第二步 - 清洗入库记录表:
  - "入库日期"统一为 yyyy-MM-dd 格式
  - "入库数量"去除单位后缀
  - "质检结果"归一化:"合格""OK""PASS"统一为"合格","不合格""NG"统一为"不合格"
  - "物料编码"统一为大写,去除前后空格
  - 只保留"质检结果"为"合格"的行

第三步 - 清洗出库记录表:
  - "出库日期"统一为 yyyy-MM-dd 格式
  - "出库数量"去除单位后缀
  - "物料编码"统一为大写
  - "领用部门"去除前后空格,归一化

第四步 - 生成采购入库关联表:
  - 采购订单表 关联 入库记录表(按"采购单号"匹配)
  - 新增"实际到货周期" = 入库日期 - 下单日期(天数)
  - 新增"到货率" = 入库数量 / 采购数量

第五步 - 生成采购入库汇总表:
  - 采购入库关联表 按"供应商ID"+"物料编码"汇总:总采购量、总入库量、采购总额、平均到货周期、平均到货率、平均采购单价

第六步 - 生成出库汇总表:
  - 出库记录表 按"物料编码"汇总:总出库量、出库次数、平均月出库量

第七步 - 生成物料进销存关联表:
  - 采购入库汇总表 与 出库汇总表 按"物料编码"全量合并(保留"供应商ID",两侧数据都保留)

第八步 - 生成物料进销存汇总表:
  - 基于"物料进销存关联表"新增"库存结余" = 总入库量 - 总出库量,新增"库存周转天数" = 库存结余 / 平均月出库量 * 30(平均月出库量为0时记为空)

第九步 - 生成供应商统计表:
  - 基于"采购入库汇总表" 关联 "供应商信息表"(按"供应商ID"匹配),按"供应商名称"分组,统计:采购总额、平均到货周期、平均到货率、物料种类数
  - 输出"供应商统计表"

第十步 - 生成物料库存统计表:
  - 基于"物料进销存汇总表"按"物料编码"分组,统计:采购总额、总出库量、库存结余、平均月出库量、库存周转天数
  - 输出"物料库存统计表"

第十一步 - 生成库存周转Top50表:
  - 基于"物料进销存汇总表"(沿用上一步保留下来的"供应商ID")关联"供应商信息表"(按"供应商ID"匹配),按"库存周转天数"降序排列,取周转最慢的Top50
  - 输出"库存周转Top50表"(含物料编码、供应商ID、供应商名称、库存结余、平均月出库量、库存周转天数)

第十二步 - 生成仓库质检统计表:
  - 基于"入库记录表"(清洗后)
  - 按"仓库编号"分组,统计:入库总量、质检合格率
  - 输出"仓库质检统计表"

三、落地实现:工作流配置

 工作流是由多个智能体节点组成的,这个案例我们涉及到下面几个智能体:

  • 文件助手: 获取磁盘的文件或目录。
  • 内容清洗器: 专门用来做数据清洗的,只要输入清洗描述就可以对文件数据进行任意整理。
  • 数据入库:将文件数据转成本地数据库,用于后面作SQL统计。
  • 表统计: 对本地数据库表进行SQL统计,不需要写sql,只需要统计的描述就可以了。
  • 报表导出: 对数据库表进行导出,支持导出csv,xlsx,HTML(可视化显示) 。

根据这几个智能体还有上面描述的提示词,我们就可以完成工作流的配置了。

1. 清洗数据表

清洗数据流程总共分为三步:

  1. 配置文件助手 : 获取待清洗的源文件。
  2. 配置内容清洗器: 描述清洗内容。
  3. 数据入库: 将文件数据搞成表放到本地数据库(后面好进行sql统计)。

打开DT-Bot工作流, 配置一个 “文件助手”智能体节点,描述原始数据文件位置,文件助手配置如图:

DT-Bot工作流,解决方案获取可以看文章末尾名片。

image

根据提示词描述,获取到了”采购订单表“原始表格,然后就会输出该文件,然后我们接下一个智能体“内容清洗器”,如图: 

image

直接将清洗的提示词写进来就可以了,清洗之后,我们需要将表格文件的数据放到数据库里面,后面好进行SQL统计,所以还要接入一个“数据入库”,不需要输入任何提示词,如下图:

image

第一步就完成了,同理,所有的源表清洗都是这个套路。

2. 表统计

接下来我们需要进行表统计,直接用“表统计”智能体就好了, 也是直接输入提示词描述,工作流内部会生成相关sql进行统计(全程不用你操心),下面是我配置完成的图:

image

导出报表

表统计后,只生成了结果表到数据库里面,还需要从数据库里面下载出来,这是要用“报表导出”智能体,可以指定哪些表,下载类型,如下图:

image

 配置完成后,我们发布工作流执行就可以了。下图是统计结果文件:

image

image

HTML 可视化大盘:

image

image

四、结尾语

千万级数据清洗与统计分析并不一定意味着很高的技术门槛。只要先把业务链路梳理清楚,把分析目标描述清楚,再结合 AI 工作流逐步执行,就能够把采购、入库、出库、供应商这些原始业务数据,整理成可清洗、可关联、可统计、可输出的分析结果和报表。

对于这类场景来说,真正重要的并不是写了多少 SQL、搭了多少技术环境,而是能不能把业务问题讲清楚,把分析流程跑顺,把最终结果稳定输出出来。供应链库存与采购分析只是一个典型开始,后面还可以继续扩展到人力、销售、财务、制造等更多行业和业务场景,用同样的方式完成千万级数据清洗、统计分析和报表输出。

Logo

一站式 AI 云服务平台

更多推荐