放牧代码和思想
专注自然语言处理、机器学习算法
    This thing called love. Know I would've. Thrown it all away. Wouldn't hesitate.

2014年03月的文章

最小生成树算法初步
C++

最小生成树算法初步

阅读(5773)评论(2)

最小生成树Prim算法 与Dijkstra算法类似,任意挑一个顶点,添加最短边,直至所有顶点都在树中,此时就得到一颗最小生成树了。 证明: 令V为顶点集合,已求得顶点集合为X,V上的最小生成树为T。 假设连接X和V\X的最短边为e,现在需要...

图的最短路算法初步
算法

图的最短路算法初步

阅读(5209)评论(1)

对图的几种初级算法做个总结,温故知新。 最短路问题 Bellman-Ford和Dijkstra的递推公式都是d[i] = min{d[j] + cost[i to j]}。 单源最短路之Bellman-Ford算法 适用于无原点s可达负圈的...

百度云储存批量下载脚本
BAE

百度云储存批量下载脚本

阅读(7573)评论(4)

前些时间在BAE上搭了一个应用,数据写入了百度云储存BCS里。现在想将BCS里的数据搬走,但是官方并没有提供一个一键下载的功能。只好自己写了一个,运行良好。 此脚本在本地PHP环境下运行,需要开启CURL拓展。代码里的krumo是一个调试输...

TextRank算法提取关键词的Java实现
自然语言处理

TextRank算法提取关键词的Java实现

阅读(31696)评论(39)

谈起自动摘要算法,常见的并且最易实现的当属TF-IDF,但是感觉TF-IDF效果一般,不如TextRank好。 TextRank是在Google的PageRank算法启发下,针对文本里的句子设计的权重算法,目标是自动摘要。它利用投票的原理,...

多说自动摘要与防剽窃代码
PHP

多说自动摘要与防剽窃代码

阅读(7098)评论(3)

多说还算是WordPress上一款不错的社交网络评论框插件,不过它有“剽窃”博主文章的嫌疑。在wp-content/plugins/duoshuo/WordPress.php中有如下“剽窃”代码: 红色方框内的代码直接将整个post的con...

维特比算法在分词中的应用
自然语言处理

维特比算法在分词中的应用

阅读(11007)评论(8)

很久之前写的东西,有不少谬误。维特比算法应该特指定义在栅格网络上的动态规划算法,其在分词中的应用请参考维特比算法。 在维特比算法通俗理解中,记录了我对维特比算法的粗浅理解,这里结合Ansj中文分词的源码,记录一下维特比算法在分词中的应用。 ...

维特比算法通俗理解
算法

维特比算法通俗理解

阅读(17025)评论(5)

维特比算法说白了就是动态规划实现最短路径,只要知道“动态规划可以降低复杂度”这一点就能轻松理解维特比算法 维特比算法是一个特殊但应用最广的动态规划算法,利用动态规划,可以解决任何一个图中的最短路径问题。而维特比算法是针对一个特殊的图——篱笆...

我的作品

HanLP自然语言处理包《自然语言处理入门》