放牧代码和思想
专注自然语言处理、机器学习算法

标签:Michael Collins

Michael Collins NLP公开课任务4 GLM
命名实体识别

Michael Collins NLP公开课任务4 GLM

hankcs阅读(721)评论(2)

最后一次练习,对应课程结尾的对数线性模型框架;于是又拿下一门课。在这次练习中,我们将使用感知机算法训练一个GLM应用到命名实体识别上。对输入实例,GLM使用如下三个组件完成解码: 一个函数生成所有可能的结果 一个全局特征函数 一个参数向量 ...

Michael Collins NLP公开课任务3 机器翻译
自然语言处理

Michael Collins NLP公开课任务3 机器翻译

hankcs阅读(655)评论(0)

说是机器翻译,其实只涉及最最简单的两个模型:IBM1和2以及启发式改进,用来做文本对齐。代码见文末,包括附加题在内全部达到了预期目标。 文本对齐 文本对齐是这么一个问题,将母语翻译为外语时,给定一个长l的母语句子和长度m,估计一个长m的外语...

Michael Collins NLP公开课任务2 PCFG
句法分析

Michael Collins NLP公开课任务2 PCFG

hankcs阅读(860)评论(0)

Micheal Collins在Coursera上的自然语言处理公开课,第二次任务。自然语言中的歧义令人忍俊不禁,只要你或者你的模型脑洞足够大。 语料库来自WSJ,但并不是乔姆斯基范式: 因为乔姆斯基范式中一元rule必须是叶子节点,修正方...

我的开源项目

HanLP自然语言处理包基于DoubleArrayTrie的Aho Corasick自动机