放牧代码和思想
专注自然语言处理、机器学习算法
    恕不接待索要源码语料者、索求技术方案者、以及不Google的懒人。

标签:《Machine Learning in Action》

提升方法
机器学习

提升方法

hankcs阅读(606)评论(1)

本文是《统计学习方法》第8章提升方法的笔记,整合了《机器学习实战》中的提升树Python代码,并添加了注解和PR值计算代码。《方法》重理论,但不易理解,《实战》重实践,但缺乏理论基础,特别是AdaBoost算法的解释、提升树与加法模型的关系...

支持向量机
机器学习

支持向量机

hankcs阅读(1197)评论(3)

本文是《统计学习方法》第七章《支持向量机》的笔记,附带了少量注解和背景知识的补充;后半部分将《机器学习实战》支持向量机的Python代码加以整理注释,与公式放到一起形成对照,辅助理解。私以为,没有泛函分析基础的人是无法深刻理解支持向量机的,...

决策树
机器学习

决策树

hankcs阅读(3942)评论(3)

   “何以别离久,何以少团栾。” 本文对应《统计学习方法》 第5章,用Python实现了决策树的ID3生成算法和C4.5生成算法,并用matplotlib可视化出来。 决策树模型与学习 决策树模型 分类决策树模型是一种...

高性能Java科学与技术运算库Colt
Java

高性能Java科学与技术运算库Colt

hankcs阅读(3660)评论(1)

在学习《Machine Learning in Action》和《NLTK Natural Language Processing with Python》的过程中,我真切地感受到Numpy库的便捷与强大,线性代数的数据结构与运算封装得浅显...

我的开源项目

HanLP自然语言处理包基于DoubleArrayTrie的Aho Corasick自动机