放牧代码和思想
专注自然语言处理、机器学习算法
    愛しさ 優しさ すべて投げ出してもいい

hankcs的文章

第25页
CRF分词的纯Java实现
中文分词

CRF分词的纯Java实现

阅读(19309)评论(20)

与基于隐马尔可夫模型的最短路径分词、N-最短路径分词相比,基于条件随机场(CRF)的分词对未登录词有更好的支持。本文(HanLP)使用纯Java实现CRF模型的读取与维特比后向解码,内部特征函数采用 双数组Trie树(Double...

CRF++模型格式说明
自然语言处理

CRF++模型格式说明

阅读(26745)评论(52)

通过追加-t, –textmodel参数可以输出文本格式的CRF模型文件,通过该模型文本,可以加深对条件随机场的理解或为其他应用所利用。本文旨在介绍CRF++的文本模型格式,具体读取与解码将集成到HanLP中一并开源。 训练 语...

《日语综合教程》第七册 第六課 自然と人間
第七册

《日语综合教程》第七册 第六課 自然と人間

阅读(80736)评论(2)

上外 《日语综合教程》 翻译注解。点击生词后的数字可以跳转到解释,再次点击返回(BackSpace键也可)。最后一页有课文翻译,支持键盘左右键(← →)翻页。 第六課 自然と人間 本文 季節 桜(さくら)の花(はな)が咲...

最大熵依存句法分析器的实现
句法分析

最大熵依存句法分析器的实现

阅读(12912)评论(7)

这是一个判决式汉语句法分析器的Java实现,基于最大熵模型和最大生成树模型,实现了中文依存句法的自动分析,分析速度达到 570.7句/秒。 开源项目 本文代码已集成到HanLP中开源:http://www.hankcs.com/n...

POJ 3420 Quad Tiling 题解 《挑战程序设计竞赛》
算法

POJ 3420 Quad Tiling 题解 《挑战程序设计竞赛》

阅读(5618)评论(2)

POJ 3420 Quad Tiling 贴瓷砖:4*N的地板上用2*1的瓷砖铺满,求所有方案数对M求余。 3.4熟练掌握动态规划 矩阵的幂 久违地上了节课,太无聊,只好刷一题。 假设S[n]表示填满n时的方案数,有S[0]=1。定义矩阵 ...

最大熵的Java实现
自然语言处理

最大熵的Java实现

阅读(11294)评论(12)

这是一个最大熵的简明Java实现,提供训练与预测接口。训练采用GIS训练算法,附带示例训练集。本文旨在介绍最大熵的原理、分类和实现,不涉及公式推导或其他训练算法,请放心食用。 最大熵理论 简介 最大熵属于辨识模型,能够满足所有已知的约束, ...

我的作品

HanLP自然语言处理包《自然语言处理入门》