整体概述:

  • 第一步:降维----特征值
  • 第二步:k-means聚类

 

基于图论的聚类方式:

  • 拉普拉斯矩阵特征向量进行聚类

 

连点成线构成图:

 

 

图的度矩阵-图的邻接矩阵=拉普拉斯矩阵:

 

 

归一化拉普拉斯矩阵:

 

生成该拉普拉斯矩阵最小的k个特征值+特征向量:

 

特征向量kmeans聚类:

 

 

谱聚类的优点与缺点:

  • 优点:
    • 稀疏处理:
      • 只要数据之间的相似度矩阵
      • 对于处理稀疏数据的聚类很有效
    • 高维处理:
      • 使用降维
      • 处理高维数据聚类时间复杂度比传统聚类算法好
      • 在高维数据上表示尤为明显
  • 缺点:
    • k值:
      • k值只能靠猜测
    • 最终效果可能不同:
      • 聚类效果依赖于相似矩阵
      • 不同相似矩阵得到最终聚类效果不同
Logo

一站式 AI 云服务平台

更多推荐