放牧代码和思想
专注自然语言处理、机器学习算法
    时间有限,只有GitHub上的issue能及时处理,大约每周末一次。另外,不要叫我楼主,谢谢。

2014年03月的文章

最小生成树算法初步
C++

最小生成树算法初步

hankcs阅读(2233)评论(2)

最小生成树Prim算法 与Dijkstra算法类似,任意挑一个顶点,添加最短边,直至所有顶点都在树中,此时就得到一颗最小生成树了。 证明: 令V为顶点集合,已求得顶点集合为X,V上的最小生成树为T。 假设连接X和V\X的最短边为e,现在需要...

图的最短路算法初步
算法

图的最短路算法初步

hankcs阅读(2014)评论(0)

对图的几种初级算法做个总结,温故知新。 最短路问题 Bellman-Ford和Dijkstra的递推公式都是d[i] = min{d[j] + cost[i to j]}。 单源最短路之Bellman-Ford算法 适用于无原点s可达负圈的...

百度云储存批量下载脚本
BAE

百度云储存批量下载脚本

hankcs阅读(3711)评论(4)

前些时间在BAE上搭了一个应用,数据写入了百度云储存BCS里。现在想将BCS里的数据搬走,但是官方并没有提供一个一键下载的功能。只好自己写了一个,运行良好。 此脚本在本地PHP环境下运行,需要开启CURL拓展。代码里的krumo是一个调试输...

TextRank算法提取关键词的Java实现
自然语言处理

TextRank算法提取关键词的Java实现

hankcs阅读(16413)评论(27)

谈起自动摘要算法,常见的并且最易实现的当属TF-IDF,但是感觉TF-IDF效果一般,不如TextRank好。 TextRank是在Google的PageRank算法启发下,针对文本里的句子设计的权重算法,目标是自动摘要。它利用投票的原理,...

多说自动摘要与防剽窃代码
PHP

多说自动摘要与防剽窃代码

hankcs阅读(3248)评论(3)

多说还算是WordPress上一款不错的社交网络评论框插件,不过它有“剽窃”博主文章的嫌疑。在wp-content/plugins/duoshuo/WordPress.php中有如下“剽窃”代码: 红色方框内的代码直接将整个post的con...

维特比算法在分词中的应用
自然语言处理

维特比算法在分词中的应用

hankcs阅读(4301)评论(7)

很久之前写的东西,有不少谬误。维特比算法应该特指定义在栅格网络上的动态规划算法,其在分词中的应用请参考维特比算法。 在维特比算法通俗理解中,记录了我对维特比算法的粗浅理解,这里结合Ansj中文分词的源码,记录一下维特比算法在分词中的应用。 ...

维特比算法通俗理解
算法

维特比算法通俗理解

hankcs阅读(9330)评论(4)

维特比算法说白了就是动态规划实现最短路径,只要知道“动态规划可以降低复杂度”这一点就能轻松理解维特比算法 维特比算法是一个特殊但应用最广的动态规划算法,利用动态规划,可以解决任何一个图中的最短路径问题。而维特比算法是针对一个特殊的图——篱笆...

我的开源项目

HanLP自然语言处理包基于DoubleArrayTrie的Aho Corasick自动机