如同SQL和数组排序那样,聚类是广义上的排序。通过排序对象,聚类算法找到对象的邻居,同时保留对象的多维性。聚类算法的目的是识别分组,同时能拓展到多维空间。
聚类算法有三种分类方式:
4.2.1 基于分组结构的聚类算法分类
类似于WordPress的分类目录。根据目录形成的方向可分为两种:分裂层次聚类算法——通过将对象分为几个大组,然后对每个大组分出几个小组,如此循环;凝聚型层次聚类算法则是自底而上,反过来进行分组。
4.2.2 基于数据类型和结构的聚类算法分类
类似于股票价格分为三日平均和一周平均等。
4.2.3 根据数据规模的聚类算法分类
分为高纬度和大量数据等。
这一节泛泛而谈,下一节才有干货。