放牧代码和思想
专注自然语言处理、机器学习算法

2014年01月的文章

人人网全部好友相册一键批量下载工具
Python

人人网全部好友相册一键批量下载工具

hankcs阅读(5925)评论(5)

方便地下载你所有人人网好友的全部相册照片,并且按照姓名/相册名的结构归类。无论你有多少个好友,无论你的好友有多少个相册,它都可以一键帮你把所有照片下载到硬盘里。也许你希望制作毕业相册,也许你希望保留一份回忆,甚至只是不怀好意地保存大家的黑历...

PyCharm Python开发环境搭建
Python

PyCharm Python开发环境搭建

hankcs阅读(17309)评论(1)

PyCharm是JetBrains系列产品的一员,也是现在最好用的IDE。PyCharm维持了JetBrains一贯高度智能的作风,简要枚举如下: 独特的本地VCS系统 强大的重构功能 基于上下文的智能代码提示和纠错 可以与IDEA、Php...

《智能Web算法》2.4 根据用户点击改进搜索结果
Java

《智能Web算法》2.4 根据用户点击改进搜索结果

hankcs阅读(2575)评论(2)

搜索引擎通过分析每个用户的每次搜索与用户的每次点击,从中学习到哪个结果才是用户最需要的,最终可以针对每个用户改进搜索结果。这是机器学习一个实例。 在《智能Web算法》的2.4章,给出了简单的实现,利用用户点击数据来训练搜索引擎,得出每个结果...

我的开源项目

HanLP自然语言处理包基于DoubleArrayTrie的Aho Corasick自动机