放牧代码和思想
专注自然语言处理、机器学习算法
    This thing called love. Know I would've. Thrown it all away. Wouldn't hesitate.

hankcs的文章

第28页
《日语综合教程》第七册 第三課 ナイン
第七册

《日语综合教程》第七册 第三課 ナイン

阅读(153759)评论(8)

上外 《日语综合教程》 翻译注解。点击生词后的数字可以跳转到解释,再次点击返回(BackSpace键也可)。最后一页有课文翻译。 第3課 ナイン 本文 井上ひさし  放送局(ほうそうきょく)[1] での仕事(し...

WordPress中文分词与智能搜索
PHP

WordPress中文分词与智能搜索

阅读(7701)评论(2)

问题 WordPress的搜索功能非常简陋,如果用户搜索“日语综合教程+第六册”,WordPress会机械地构造一个wp_posts.post_title LIKE '%日语综合教程+第六册%'的SQL查询送到数据库里,结果...

让Intellij IDEA显示Servlet文档
Java

让Intellij IDEA显示Servlet文档

阅读(8519)评论(0)

问题 使用Intellij IDEA + Tomcat的时候,发现默认的Servlet相关类是不显示文档的: 原因 这是因为Tomcat的发行包里不含source jar或doc jar。 解决方法 下载Tomcat的源码包 下载地址是ht...

Intellij IDEA 配置 JRebel 自动热部署
Java

Intellij IDEA 配置 JRebel 自动热部署

阅读(17026)评论(8)

目标 在Java Web开发中,更新了Java文件后,一般要手动进行Compile->Redeploy(或重启)这两个步骤,浪费不少生命。虽然最新的Intellij IDEA13已经支持热部署,不过依然需要按键。而对于效率至上者,必须...

SAE自动登陆
Javascript

SAE自动登陆

阅读(3222)评论(1)

问题 SAE没有记住密码选项,也许是处于安全考虑,但是很不方便。我写了一段js脚本实现了一键登陆。 原理 在登陆页面出现后,加载一段js,直接给输入框赋值,然后找到表单并且提交。 代码 javascript:document.getElem...

Java读取文件加速
Java

Java读取文件加速

阅读(7552)评论(2)

在执行IO时,Java的InputStream被广泛使用,比如DataInputStream.readInt等等。事实上,这些高度封装的接口奇慢无比。我有一个项目启动时需要读取90MB左右的词典文件,用DataInputStream耗时3秒...

基于互信息和左右信息熵的短语提取识别
自然语言处理

基于互信息和左右信息熵的短语提取识别

阅读(20582)评论(29)

在中文语言处理领域,一项重要的任务就是提取中文短语,也即固定多字词表达串的识别。短语提取经常用于搜索引擎的自动推荐,新词识别等领域。本文主要实现了从陌生文本中自动发现固定短语,并给出原理和步骤。 开源项目 本文代码已集成到HanLP中开源:...

闪之轨迹2通关,毕业撒花!
游戏

闪之轨迹2通关,毕业撒花!

阅读(10499)评论(1)

从零之轨迹开始,轨迹的主题就开始向现实靠拢,金融诈骗、政治手腕、军事侵略、内战谋反……十周年后,轨迹早已告别男女主人公卿卿我我拯救世界的童话,而是影射现实,描述人世间的黑暗,并用这深渊般的黑暗衬托人性中的光辉点。閃之軌跡II OP命名「閃光...

我的作品

HanLP自然语言处理包《自然语言处理入门》