放牧代码和思想
专注自然语言处理、机器学习算法
    正处于一个非常忙的阶段,抱歉不会经常回应任何联络

2018年02月的文章

Wu Manber多模式匹配算法
算法

Wu Manber多模式匹配算法

hankcs阅读(340)评论(2)

AC自动机中,转移的最小单位是一个字符。也就是说,匹配后只能移动一个字符,复杂度是线性的$O(n)$。然而线性并非最快,Boyer-Moore算法在匹配后可以跳过多个字符,比线性还快。据说在实践中,利用Boyer-Moore优化的AC自动机...

我的开源项目

HanLP自然语言处理包基于DoubleArrayTrie的Aho Corasick自动机