放牧代码和思想
专注自然语言处理、机器学习算法

4.2 聚类算法概述

目录

如同SQL和数组排序那样,聚类是广义上的排序。通过排序对象,聚类算法找到对象的邻居,同时保留对象的多维性。聚类算法的目的是识别分组,同时能拓展到多维空间。

聚类算法有三种分类方式:

4.2.1 基于分组结构的聚类算法分类

类似于WordPress的分类目录。根据目录形成的方向可分为两种:分裂层次聚类算法——通过将对象分为几个大组,然后对每个大组分出几个小组,如此循环;凝聚型层次聚类算法则是自底而上,反过来进行分组。

4.2.2 基于数据类型和结构的聚类算法分类

类似于股票价格分为三日平均和一周平均等。

4.2.3 根据数据规模的聚类算法分类

分为高纬度和大量数据等。

这一节泛泛而谈,下一节才有干货。

知识共享许可协议 知识共享署名-非商业性使用-相同方式共享码农场 » 4.2 聚类算法概述

分享到:更多 ()

评论 欢迎留言

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址

我的开源项目

HanLP自然语言处理包基于DoubleArrayTrie的Aho Corasick自动机