放牧代码和思想
专注自然语言处理、机器学习算法
    愛しさ 優しさ すべて投げ出してもいい

2014年05月的文章

第2页
Win64下RadASM运行16位DOS程序
汇编逆向

Win64下RadASM运行16位DOS程序

阅读(7474)评论(4)

最近捡起8086汇编,用RadASM编译连接构建之后无法运行,提示“不支持的16位应用程序”。这才想起时过境迁,Win64已经废弃了对16位程序的支持,甚至连debug都废除了。作为老牌RadASM用户,我自然不甘心在虚拟机写汇编,于是摸索...

词图的生成
中文分词

词图的生成

阅读(16324)评论(19)

当分词系统有一份词典的时候,就可以生成词图了。所谓词图,指的是句子中所有词可能构成的图。如果一个词A的下一个词可能是B的话,那么A和B之间具有一条路径E(A,B)。一个词可能有多个后续,同时也可能有多个前驱,它们构成的图我称作词图。 词图的...

POJ 3185 The Water Bowls 题解 《挑战程序设计竞赛》
算法

POJ 3185 The Water Bowls 题解 《挑战程序设计竞赛》

阅读(3991)评论(0)

POJ 3185 The Water Bowls 翻盖有奖:将一列碗翻成口朝上,一把下去可能同时反转3个或2个(首尾),求最小翻转次数。 3.2常用技巧精选(一) 反转 似乎穷举也能过,不过太蠢了。反转法只需枚举2次,分别是从第一个开始翻和...

POJ 2100 Graveyard Design 题解 《挑战程序设计竞赛》
算法

POJ 2100 Graveyard Design 题解 《挑战程序设计竞赛》

阅读(4399)评论(0)

POJ 2100 Graveyard Design 盗墓:将一个整数分解为连续数平方之和,有多少种分法? 3.2常用技巧精选(一) 尺取法 本身简单,IO蛋疼。今天心情特好,也就不计较了。输出格式要先统计有多少个答案,所以饶了些弯弯,那种算...

POJ 2566 Bound Found 题解 《挑战程序设计竞赛》
算法

POJ 2566 Bound Found 题解 《挑战程序设计竞赛》

阅读(5456)评论(1)

POJ 2566 Bound Found 上下界:从数列中找出连续序列,使得和的绝对值与目标数之差最小。 3.2常用技巧精选(一) 尺取法 因为前缀和不单调,所以需要先排个序。之后就是尺取法了:首尾分别逐步向前挪动,挪动过程中记录答案。找了...

几个开源分词系统所使用标注集的来源
语料库

几个开源分词系统所使用标注集的来源

阅读(12809)评论(5)

HanLP开源分词系统 支持中文分词(N-最短路分词、CRF分词、索引分词、用户自定义词典、词性标注),命名实体识别(中国人名、音译人名、日本人名、地名、实体机构名识别),关键词提取,自动摘要,短语提取,拼音转换,简繁转换,文本推荐,依存句...

我的作品

HanLP自然语言处理包《自然语言处理入门》