码农场

放牧代码和思想
专注自然语言处理、机器学习算法
    This thing called love. Know I would've. Thrown it all away. Wouldn't hesitate.

最新发布 第28页

SAE自动登陆
Javascript

SAE自动登陆

阅读(3218)评论(1)

问题 SAE没有记住密码选项,也许是处于安全考虑,但是很不方便。我写了一段js脚本实现了一键登陆。 原理 在登陆页面出现后,加载一段js,直接给输入框赋值,然后找到表单并且提交。 代码 javascript:document.getElem...

Java读取文件加速
Java

Java读取文件加速

阅读(7546)评论(2)

在执行IO时,Java的InputStream被广泛使用,比如DataInputStream.readInt等等。事实上,这些高度封装的接口奇慢无比。我有一个项目启动时需要读取90MB左右的词典文件,用DataInputStream耗时3秒...

基于互信息和左右信息熵的短语提取识别
自然语言处理

基于互信息和左右信息熵的短语提取识别

阅读(20574)评论(29)

在中文语言处理领域,一项重要的任务就是提取中文短语,也即固定多字词表达串的识别。短语提取经常用于搜索引擎的自动推荐,新词识别等领域。本文主要实现了从陌生文本中自动发现固定短语,并给出原理和步骤。 开源项目 本文代码已集成到HanLP中开源:...

闪之轨迹2通关,毕业撒花!
游戏

闪之轨迹2通关,毕业撒花!

阅读(10499)评论(1)

从零之轨迹开始,轨迹的主题就开始向现实靠拢,金融诈骗、政治手腕、军事侵略、内战谋反……十周年后,轨迹早已告别男女主人公卿卿我我拯救世界的童话,而是影射现实,描述人世间的黑暗,并用这深渊般的黑暗衬托人性中的光辉点。閃之軌跡II OP命名「閃光...

试验UDP打洞穿透NAT
网络

试验UDP打洞穿透NAT

阅读(20530)评论(6)

目标 路由穿透,实现广域网P2P通讯。 4种典型NAT类型 按照NAT设备在进行地址映射时行为的不同,NAT可以分为以下四种:  Full Cone  Restricted Cone  Port Restric...

POJ 1795 DNA Laboratory 题解 《挑战程序设计竞赛》
算法

POJ 1795 DNA Laboratory 题解 《挑战程序设计竞赛》

阅读(5236)评论(0)

POJ 1795 DNA Laboratory DNA拼接:弗兰肯斯坦从尸体里提取了一堆DNA碎片,想拼成字典序最小的整体,于是他找了几个实习生,你就是其中一个。 3.4熟练掌握动态规划 状态压缩DP 首先,如果一个字串包含在另一个母串中,...

求解两个数组中最相近的数
算法

求解两个数组中最相近的数

阅读(4927)评论(5)

在工程中遇到这么一个问题,有两个升序集合A和B,a是A中的元素,b是B中的元素,希望求解a与b之差绝对值(abs(a-b))的最小值。 二分 朴素算法复杂度是O(n*n),二分算法O(n*logn),又因为两个集合都是升序的,所以可以优化到...

我的作品

HanLP自然语言处理包《自然语言处理入门》