放牧代码和思想
专注自然语言处理、机器学习算法
    愛しさ 優しさ すべて投げ出してもいい

2014年10月的文章

第2页
SAE自动登陆
Javascript

SAE自动登陆

阅读(2965)评论(1)

问题 SAE没有记住密码选项,也许是处于安全考虑,但是很不方便。我写了一段js脚本实现了一键登陆。 原理 在登陆页面出现后,加载一段js,直接给输入框赋值,然后找到表单并且提交。 代码 javascript:document.getElem...

Java读取文件加速
Java

Java读取文件加速

阅读(7236)评论(2)

在执行IO时,Java的InputStream被广泛使用,比如DataInputStream.readInt等等。事实上,这些高度封装的接口奇慢无比。我有一个项目启动时需要读取90MB左右的词典文件,用DataInputStream耗时3秒...

基于互信息和左右信息熵的短语提取识别
自然语言处理

基于互信息和左右信息熵的短语提取识别

阅读(19369)评论(29)

在中文语言处理领域,一项重要的任务就是提取中文短语,也即固定多字词表达串的识别。短语提取经常用于搜索引擎的自动推荐,新词识别等领域。本文主要实现了从陌生文本中自动发现固定短语,并给出原理和步骤。 开源项目 本文代码已集成到HanLP中开源:...

闪之轨迹2通关,毕业撒花!
游戏

闪之轨迹2通关,毕业撒花!

阅读(10142)评论(1)

从零之轨迹开始,轨迹的主题就开始向现实靠拢,金融诈骗、政治手腕、军事侵略、内战谋反……十周年后,轨迹早已告别男女主人公卿卿我我拯救世界的童话,而是影射现实,描述人世间的黑暗,并用这深渊般的黑暗衬托人性中的光辉点。閃之軌跡II OP命名「閃光...

我的作品

HanLP自然语言处理包《自然语言处理入门》