放牧代码和思想
专注自然语言处理、机器学习算法

2015年03月的文章

HanLP自然语言处理包开源
自然语言处理

HanLP自然语言处理包开源

hankcs阅读(31567)

中文分词≠自然语言处理! 中文分词只是第一步;HanLP从中文分词开始,覆盖词性标注、命名实体识别、句法分析、文本分类等常用任务,提供了丰富的API。 不同于一些简陋的分词类库,HanLP精心优化了内部数据结构和IO接口,做到了毫秒级的冷启...

使用rst2pdf拓展sphinx生成PDF
Python

使用rst2pdf拓展sphinx生成PDF

hankcs阅读(3608)评论(4)

当初项目文档是用sphinx写的,一套rst下来make html得到一整个漂亮的在线文档。现在想要将文档导出为离线的handbook pdf,于是找到了rst2pdf这个项目,作为sphinx的拓展,然后加上少量配置即可输出中文PDF。 ...

我的开源项目

HanLP自然语言处理包基于DoubleArrayTrie的Aho Corasick自动机