放牧代码和思想
专注自然语言处理、机器学习算法
    愛しさ 優しさ すべて投げ出してもいい

编程开发

第20页
字符串编辑距离的几种实现

字符串编辑距离的几种实现

阅读(7753)评论(1)

春暖花开,踏青时节,我看完了形式语言与自动机这一章这一章提到字符串编辑距离,于是动手实现了几个。编辑距离主要用于拼写纠错,貌似Google 2013的校招笔试题里就有这个。 常见的编辑距离定义 通过插入删除或替换使得一个字符串变为另一个字符...

POJ 3259 Wormholes 题解 《挑战程序设计竞赛》

POJ 3259 Wormholes 题解 《挑战程序设计竞赛》

阅读(6343)评论(3)

POJ 3259 Wormholes 虫洞:农夫约翰有F个农场,每个农场有N块地,其间有M条路,W条时光隧道(时间倒流)。问是否可能回到过去? 2.5 它们其实都是“图” 最短路 依然很水很基础的 Bellman-Ford 判定负...

最小生成树算法初步

最小生成树算法初步

阅读(6275)评论(2)

最小生成树Prim算法 与Dijkstra算法类似,任意挑一个顶点,添加最短边,直至所有顶点都在树中,此时就得到一颗最小生成树了。 证明: 令V为顶点集合,已求得顶点集合为X,V上的最小生成树为T。 假设连接X和V\X的最短边为e,现在需要...

图的最短路算法初步

图的最短路算法初步

阅读(5636)评论(1)

对图的几种初级算法做个总结,温故知新。 最短路问题 Bellman-Ford和Dijkstra的递推公式都是d[i] = min{d[j] + cost[i to j]}。 单源最短路之Bellman-Ford算法 适用于无原点s可达负圈的...

百度云储存批量下载脚本

百度云储存批量下载脚本

阅读(7853)评论(4)

前些时间在BAE上搭了一个应用,数据写入了百度云储存BCS里。现在想将BCS里的数据搬走,但是官方并没有提供一个一键下载的功能。只好自己写了一个,运行良好。 此脚本在本地PHP环境下运行,需要开启CURL拓展。代码里的krumo是一个调试输...

多说自动摘要与防剽窃代码

多说自动摘要与防剽窃代码

阅读(7578)评论(3)

多说还算是WordPress上一款不错的社交网络评论框插件,不过它有“剽窃”博主文章的嫌疑。在wp-content/plugins/duoshuo/WordPress.php中有如下“剽窃”代码: 红色方框内的代码直接将整个post的con...

维特比算法通俗理解

维特比算法通俗理解

阅读(17780)评论(5)

维特比算法说白了就是动态规划实现最短路径,只要知道“动态规划可以降低复杂度”这一点就能轻松理解维特比算法 维特比算法是一个特殊但应用最广的动态规划算法,利用动态规划,可以解决任何一个图中的最短路径问题。而维特比算法是针对一个特殊的图——篱笆...

双数组Trie树(DoubleArrayTrie)Java实现

双数组Trie树(DoubleArrayTrie)Java实现

阅读(39308)评论(65)

双数组Trie树(DoubleArrayTrie)是一种空间复杂度低的Trie树,应用于字符区间大的语言(如中文、日文等)分词领域。 双数组Trie (Double-Array Trie)结构由日本人JUN-ICHI AOE于1989年提出...

我的作品

HanLP自然语言处理包《自然语言处理入门》