码农场

放牧代码和思想
专注自然语言处理、机器学习算法
    愛しさ 優しさ すべて投げ出してもいい

最新发布 第34页

词图的生成
中文分词

词图的生成

阅读(17788)评论(19)

当分词系统有一份词典的时候,就可以生成词图了。所谓词图,指的是句子中所有词可能构成的图。如果一个词A的下一个词可能是B的话,那么A和B之间具有一条路径E(A,B)。一个词可能有多个后续,同时也可能有多个前驱,它们构成的图我称作词图。 词图的...

POJ 3185 The Water Bowls 题解 《挑战程序设计竞赛》
算法

POJ 3185 The Water Bowls 题解 《挑战程序设计竞赛》

阅读(4271)评论(0)

POJ 3185 The Water Bowls 翻盖有奖:将一列碗翻成口朝上,一把下去可能同时反转3个或2个(首尾),求最小翻转次数。 3.2常用技巧精选(一) 反转 似乎穷举也能过,不过太蠢了。反转法只需枚举2次,分别是从第一个开始翻和...

POJ 2100 Graveyard Design 题解 《挑战程序设计竞赛》
算法

POJ 2100 Graveyard Design 题解 《挑战程序设计竞赛》

阅读(4610)评论(0)

POJ 2100 Graveyard Design 盗墓:将一个整数分解为连续数平方之和,有多少种分法? 3.2常用技巧精选(一) 尺取法 本身简单,IO蛋疼。今天心情特好,也就不计较了。输出格式要先统计有多少个答案,所以饶了些弯弯,那种算...

POJ 2566 Bound Found 题解 《挑战程序设计竞赛》
算法

POJ 2566 Bound Found 题解 《挑战程序设计竞赛》

阅读(6004)评论(1)

POJ 2566 Bound Found 上下界:从数列中找出连续序列,使得和的绝对值与目标数之差最小。 3.2常用技巧精选(一) 尺取法 因为前缀和不单调,所以需要先排个序。之后就是尺取法了:首尾分别逐步向前挪动,挪动过程中记录答案。找了...

几个开源分词系统所使用标注集的来源
语料库

几个开源分词系统所使用标注集的来源

阅读(13314)评论(5)

HanLP开源分词系统 支持中文分词(N-最短路分词、CRF分词、索引分词、用户自定义词典、词性标注),命名实体识别(中国人名、音译人名、日本人名、地名、实体机构名识别),关键词提取,自动摘要,短语提取,拼音转换,简繁转换,文本推荐,依存句...

POJ 3484 Showstopper 题解 《挑战程序设计竞赛》
C++

POJ 3484 Showstopper 题解 《挑战程序设计竞赛》

阅读(6189)评论(0)

POJ 3484 Showstopper 句柄:N个等差数列,初项X_i,末项Y_i,公差Z_i,求出现奇数次的数? 3.1不光是查找值!“二分搜索” 其他 这题的难点在于……IO,数据集之间可能有多个空行,而且也没指定数据的上限,全靠瞎猜...

我的作品

HanLP自然语言处理包《自然语言处理入门》