美文网首页
聚类算法(一)——简介

聚类算法(一)——简介

作者: 不是Blues的布鲁斯 | 来源:发表于2019-08-21 19:30 被阅读0次

描述

聚类就是将数据集划分为由若干相似对象组成的多个组或簇的过程,使得同一组中对象的相似度最大化,不同组中对象间的相似度最小化。

分类

  • 基于划分的方法
  • 基于层次的方法
  • 基于密度的方法
  • 基于图的方法

评价方法

聚类性能度量亦称有效性指标,分为:外部指标,聚类完成后将聚类结果与某个参考模型进行比较;内部指标,直接考察聚类结果而不利用任何参考模型。

外部指标

  • 混淆矩阵

Precision,Recall,F-measure

  • 兰德指数RI
RI

内部指标

  • Dunn指数(DI)


    Dunn

计算两个簇的簇间最短距离除以任意簇中的最大距离,DI越大说明聚类效果越好。同样对环状分布的数据效果不好,且对离散点的聚类测评很高。

  • SSE

一个簇的误差平方和即簇内各点到质心欧式距离的平方和,此方法对离散点的聚类测评很高


SSE

Python 聚类项目

设计一个Python聚类小项目,项目包括以下四个模块,模块阐述如图所示,该项目可调用多种聚类算法,并比较结果


项目架构

Ref:

机器学习之聚类概述及评价指标

相关文章

  • 大数据--聚类算法

    本篇结构 简介 聚类算法的分类 K-Means聚类算法 DBSCAN聚类算法 本篇介绍了聚类算法的种类,重点关注K...

  • 聚类算法之K均值算法(k-means)的Python实现

    聚类算法之K均值算法(k-means) 算法简介 K-means算法是硬聚类算法,是典型的基于原型的目标函数聚类方...

  • kmeans算法

    kmeans算法 简介kmeans算法 kmeans算法又称k平均或k均值算法,一种已知聚类类别数的聚类算法。 它...

  • 机器学习 - DBSCAN聚类算法

    1. DBSCAN简介 密度聚类 (亦称基于密度的聚类算法,density-based clustering)算法...

  • 机器学习之K-Means算法

    一、聚类算法的简介   聚类算法是一种典型的无监督学习算法,主要用于将相似的样本自动归到一个类别中。聚类算法与分类...

  • c语言实现K均值算法

    1.算法简介    k均值聚类算法(k-means clustering algorithm)是一种迭代求解的聚类...

  • 聚类算法(一)——简介

    描述 聚类就是将数据集划分为由若干相似对象组成的多个组或簇的过程,使得同一组中对象的相似度最大化,不同组中对象间的...

  • 数据算法之kmeans聚类

    一、聚类算法 聚类属于无监督学习,是数据挖掘十大经典算法之一 。 二、k-means聚类算法简介 1、k-mean...

  • Kmeans聚类算法简介(有点枯燥)

    1. Kmeans聚类算法简介 由于具有出色的速度和良好的可扩展性,Kmeans聚类算法算得上是最著名的聚类方法。...

  • Kmeans聚类算法简介

    1. Kmeans聚类算法简介 由于具有出色的速度和良好的可扩展性,Kmeans聚类算法算得上是最著名的聚类方法。...

网友评论

      本文标题:聚类算法(一)——简介

      本文链接:https://www.haomeiwen.com/subject/ksptextx.html