放牧代码和思想
专注自然语言处理、机器学习算法
    愛しさ 優しさ すべて投げ出してもいい

hankcs的文章

第33页
Win64下集成RadASM+nasm编写操作系统
操作系统

Win64下集成RadASM+nasm编写操作系统

阅读(8024)评论(3)

这个标题有点唬人,我只是在看《自己动手写操作系统》的第二版《ORANGE’S:一个操作系统的实现》。作者喜欢命令行,我喜欢IDE。我尝试在RadASM下实现了第一个例子的编译与载入,觉得还不错。 RadASM默认只支持用Nasm开发win3...

ICTCLAS中的HMM人名识别
中文分词

ICTCLAS中的HMM人名识别

阅读(12411)评论(1)

本文主要从代码的角度分析标注过程中的细节,理论谁都能说,但没几人能做出一个实用高效的系统。在得出粗分结果之后,需要对其进行人名、翻译人名、地名识别,然后重新KSP得出最终结果,在ICTCLAS中,这些标注都是通过HMM模型实现的。 人名识别...

HMM与分词、词性标注、命名实体识别
自然语言处理

HMM与分词、词性标注、命名实体识别

阅读(28913)评论(12)

HMM(隐马尔可夫模型)是用来描述隐含未知参数的统计模型,举一个经典的例子:一个东京的朋友每天根据天气{下雨,天晴}决定当天的活动{公园散步,购物,清理房间}中的一种,我每天只能在twitter上看到她发的推“啊,我前天公园散步、昨天购物、...

Java Collection在遍历中删除、合并元素
Java

Java Collection在遍历中删除、合并元素

阅读(7197)评论(1)

我的分词结果链表需要合并连续的数字和日期,所以需要熟悉一下Java Collection在遍历的过程中同时删除、合并元素的小trick。自己试验了一下,活用listIterator的previous()和next()方法就可以达到目的。 遍...

AOJ 0531 Paint Color 题解 《挑战程序设计竞赛》
算法

AOJ 0531 Paint Color 题解 《挑战程序设计竞赛》

阅读(6023)评论(3)

AOJ 0531 Paint Color 涂色:(日文题目,自己翻译成了中文)为了宣传信息竞赛,要在长方形的三合板上喷油漆来制作招牌。三合板上不需要涂色的部分预先贴好了护板。被护板隔开的区域要涂上不同的颜色,比如上图就应该涂上5种颜色。 请...

我的作品

HanLP自然语言处理包《自然语言处理入门》