放牧代码和思想
专注自然语言处理、机器学习算法

标签:《Natural Language Processing with Python》

NLTK中文语料库sinica_treebank
Python

NLTK中文语料库sinica_treebank

hankcs阅读(6737)评论(3)

NLTK包含Sinica (中央研究院)提供的繁体中文语料库,其在Python环境下的显示有些讲究。 NLTK sinica_treebank 显示中文 在IDLE中如果直接查看的话会显示十六进制码: >>> f...

我的开源项目

HanLP自然语言处理包基于DoubleArrayTrie的Aho Corasick自动机