放牧代码和思想
专注自然语言处理、机器学习算法
    This thing called love. Know I would've. Thrown it all away. Wouldn't hesitate.

算法

第18页
4.5 健壮的链接型聚类(ROCK)

4.5 健壮的链接型聚类(ROCK)

阅读(5648)评论(1)

原书译为“鲁棒的链接型聚类”,这个“鲁棒”真的太绅(henn)士(tai)了。我查了下,“鲁棒”来源于英文“Robust”,意为“强健的,稳固的,耐用的,粗野的,浓的”等。“Robustness”的一般含义是“强度,  ...

4.4 k-means 算法

4.4 k-means 算法

阅读(5732)评论(0)

前面的三种基于链接的算法都是“合并”,k-means算法是一种“分割”算法,据说是实际应用最广泛的聚类算法。 4.4.1 初识k-means算法 主程序: package com.hankcs; import iweb2...

4.3 基于链接的算法

4.3 基于链接的算法

阅读(4074)评论(0)

继续使用4.1中的数据,聚类算法使用的数据结构是树。 4.3.1 树状图:基本的聚类数据结构 定义集合[d,k,{…}],d代表每个聚类中元素间相似度的最小值(距离的最大值),k代表聚类的数量,{…}是每个聚类集合的...

4.2 聚类算法概述

4.2 聚类算法概述

阅读(3983)评论(0)

如同SQL和数组排序那样,聚类是广义上的排序。通过排序对象,聚类算法找到对象的邻居,同时保留对象的多维性。聚类算法的目的是识别分组,同时能拓展到多维空间。 聚类算法有三种分类方式: 4.2.1 基于分组结构的聚类算法分类 类似于WordPr...

4.1 聚类的需求

4.1 聚类的需求

阅读(7644)评论(0)

       聚类指的是分组时,将类似的事物放在一起。应用于发布有针对性的广告,显示相关文章和在网站中构建社交网络等方面。 4.1.1 网站中的用户组:案例研究  &nb...

3.4 像Netflix.com那样推荐电影

3.4 像Netflix.com那样推荐电影

阅读(4835)评论(0)

3.4.1 电影数据集的介绍及推荐器 3.4.2 数据标准化与相关系数          这是世界上最大的在线电影租赁商,技术核心是一个推荐系统 3.4.1 电影数据集的...

3.3 推荐朋友、文章与新闻报道

3.3 推荐朋友、文章与新闻报道

阅读(4000)评论(0)

3.3.1 简介 3.3.2 发现朋友 三角效应 3.3.3 DiggDelphi的内部工作机制          这一节的目标是实现一个类似豆瓣的网站,目的在于鉴别出具...

3.2 推荐引擎是怎么工作的

3.2 推荐引擎是怎么工作的

阅读(4680)评论(1)

3.2.1 基于相似用户的推荐 计算用户相似度 3.2.2 基于相似条目的推荐 3.2.3 基于内容的推荐 样例设置 基于内容的相似度的要点 三类基于内容的推荐引擎        ...

3.1 一个在线音乐商店:基本概念

3.1 一个在线音乐商店:基本概念

阅读(3821)评论(0)

3.1.1 距离与相似度的概念 3.1.2 走进相似度的计算 3.1.3 什么才是最好的相似度计算公式?          通过用户对某些音乐的评分来预测对其他音乐的评分...

我的作品

HanLP自然语言处理包《自然语言处理入门》