放牧代码和思想
专注自然语言处理、机器学习算法

2017年08月的文章

深度学习中文分词调研
中文分词

深度学习中文分词调研

hankcs阅读(706)评论(13)

随着深度学习的普及,有越来越多的研究应用新模型到中文分词上,让人直呼“手快有,手慢无”。不过这些神经网络方法的真实水平如何?具体数值多少?以Sighan05中的PKU数据集为例,真像一些论文所言,一个LSTM-CRF就有96.5%吗?或者像...

我的开源项目

HanLP自然语言处理包基于DoubleArrayTrie的Aho Corasick自动机