放牧代码和思想
专注自然语言处理、机器学习算法
    愛しさ 優しさ 全て投げ出している

2014年04月的文章

第4页
Python卸载模块
Python

Python卸载模块

阅读(5992)评论(0)

easy_install 卸载 通过easy_install 安装的模块可以直接通过  easy_install -m PackageName 卸载,然后删除\Python27\Lib\site-packages目录下的...

第3章 形式语言与自动机
自然语言处理

第3章 形式语言与自动机

阅读(8486)评论(0)

3.1 基本概念 3.1.1 图 无向图、有向图、连通图和回路。 3.1.2 树 森林:无回路无向图。 树:无回路连通无向图。 根树:有根节点的树。 3.1.3 字符串 Σ:是字符表。 字符串:由Σ中字符相连而成的有限序列被称之为Σ 上的字...

字符串编辑距离的几种实现
Java

字符串编辑距离的几种实现

阅读(5973)评论(1)

春暖花开,踏青时节,我看完了形式语言与自动机这一章这一章提到字符串编辑距离,于是动手实现了几个。编辑距离主要用于拼写纠错,貌似Google 2013的校招笔试题里就有这个。 常见的编辑距离定义 通过插入删除或替换使得一个字符串变为另一个字符...

自然语言处理入门
自然语言处理

自然语言处理入门

阅读(14242)评论(26)

看过很多书,也走过很多弯路,干脆自己写了本《自然语言处理入门》,应该算是入门的最短路径。 最近买了一系列自然语言处理的书,块头大,内容深奥。如果单纯地看一遍的话,估计如同流水无痕。不如也发扬烂笔头(烂键盘)的优良传统,将重点简明扼要地记下来...

POJ 3259 Wormholes 题解 《挑战程序设计竞赛》
C++

POJ 3259 Wormholes 题解 《挑战程序设计竞赛》

阅读(4833)评论(3)

POJ 3259 Wormholes 虫洞:农夫约翰有F个农场,每个农场有N块地,其间有M条路,W条时光隧道(时间倒流)。问是否可能回到过去? 2.5 它们其实都是“图” 最短路 依然很水很基础的 Bellman-Ford 判定负...

来自Google AdSense的愚人节玩笑
其他类别

来自Google AdSense的愚人节玩笑

阅读(3537)评论(0)

经室友捉弄,我才记起今天是4月的第一天,所谓的エープリルフール。月初嘛,于是打开Google AdSense看看上个月的报表,国家和地区那一栏竟然是一颗从没见过的星球! 收入最高的行星和卫星竟然是欧罗巴,此外还有月球和火星…… 既然有来自欧...

我的作品

HanLP自然语言处理包《自然语言处理入门》