放牧代码和思想
专注自然语言处理、机器学习算法
    恕不接待索要源码语料者、索求技术方案者、以及不Google的懒人。

机器学习

第4页
k近邻法

k近邻法

hankcs阅读(2600)评论(10)

“一切只贴公式不写代码的博客都是在耍流氓”——图灵·佳德méiyǒu shuōguò。本文对应《统计学习方法》第3章,用数十行代码实现KNN的kd树构建与搜索算法,并用matplotlib可视化了动画观赏。 k近邻算法 给定一个训练数据集,...

感知机

感知机

hankcs阅读(3449)评论(6)

《统计学习方法》系列笔记的第一篇,对应原著第二章。大量引用原著讲解,加入了自己的理解。对书中算法采用Python实现,并用Matplotlib可视化了动画出来,应该算是很硬派了。一套干货下来,很是辛苦,要是能坚持下去就好。 概念 感知机是二...

机器学习入门书单

机器学习入门书单

hankcs阅读(7192)评论(22)

继NLP之后,我又开了ML这个大坑。这是因为NLP涉及到太多的ML模型,仅仅拿过来用的话,我实现的HanLP已经快到个人极限了。而模型背后的原理、如何优化、如何并行化等问题,都需要寻根求源才能解决。 所以我找了个书单自学,电子书为主,顺便分...

使用Matplotlib和Imagemagick实现算法可视化与GIF导出

使用Matplotlib和Imagemagick实现算法可视化与GIF导出

hankcs阅读(2786)评论(6)

ML可视化学习  最近在学习一些基础的ML算法,比起枯燥的公式,我更喜欢写Python实现,再通过Matplotlib这个强大的作图库可视化出来。比如最简单的感知机梯度下降算法,给定数据集,用不同的颜色和形状,可以很方便地画出来:...

我的开源项目

HanLP自然语言处理包基于DoubleArrayTrie的Aho Corasick自动机