放牧代码和思想
专注自然语言处理、机器学习算法

2015年03月的文章

HanLP自然语言处理包开源
自然语言处理

HanLP自然语言处理包开源

hankcs阅读(26034)

支持中文分词(N-最短路分词、CRF分词、索引分词、用户自定义词典、词性标注),命名实体识别(中国人名、音译人名、日本人名、地名、实体机构名识别),关键词提取,自动摘要,短语提取,拼音转换,简繁转换,文本推荐,依存句法分析(MaxEnt依存...

使用rst2pdf拓展sphinx生成PDF
Python

使用rst2pdf拓展sphinx生成PDF

hankcs阅读(2563)评论(4)

当初项目文档是用sphinx写的,一套rst下来make html得到一整个漂亮的在线文档。现在想要将文档导出为离线的handbook pdf,于是找到了rst2pdf这个项目,作为sphinx的拓展,然后加上少量配置即可输出中文PDF。 ...

我的开源项目

HanLP自然语言处理包基于DoubleArrayTrie的Aho Corasick自动机