放牧代码和思想
专注自然语言处理、机器学习算法
    This thing called love. Know I would've. Thrown it all away. Wouldn't hesitate.

Java

第5页
《智能Web算法》2.1 用Lucene构建搜索引擎

《智能Web算法》2.1 用Lucene构建搜索引擎

阅读(6564)评论(2)

这是《智能Web算法》的笔记,备忘备查。 Lucene是一个成功的开源IR(信息获取)库,可以快速地分析、索引和搜索文档(网页和电子文档)。 Lucene现在最新版本已经有4.6了,由于《智能Web算法》的配书代码用的是2.3.0,所以我依...

《智能Web算法》环境配置和BeanShell使用

《智能Web算法》环境配置和BeanShell使用

阅读(4743)评论(1)

从Google code下载最新的配书代码,建议解压到C盘,不然路径很麻烦。 编译前确保Java安装并配置好环境变量,apache ant的环境变量可加可不加,但是一定要下载一个。把下面的傻瓜批处理复制,新建一个run.bat,粘贴进去,最...

判断字符串是否含有日文

判断字符串是否含有日文

阅读(8797)评论(2)

日文字符的Unicode编码范围是: U+3040–U+309F: Hiragana U+30A0–U+30FF: Katakana U+4E00–U+9FBF: Kanji 所以我们只需要对每一个字符判断其是否位于这三个区间即可。另外,如...

Intellij Idea Jad 反编译class

Intellij Idea Jad 反编译class

阅读(16900)评论(0)

Jad其实是一个优秀的反汇编工具,在命令行下使用。Jad并不局限于IDEA,在eclipse下也有插件。这里记录一下Jad IDEA下的配置。 插件的安装很简单,请参考http://wangqiaowqo.iteye.com/blog/40...

我的作品

HanLP自然语言处理包《自然语言处理入门》