放牧代码和思想
专注自然语言处理、机器学习算法
    博主不用扣扣,公事请博客留言,私事请微博私信。开源项目一律GitHub见,发错地方恕不回复,谢谢。

自然语言处理

深度学习中文分词调研

深度学习中文分词调研

hankcs阅读(707)评论(13)

随着深度学习的普及,有越来越多的研究应用新模型到中文分词上,让人直呼“手快有,手慢无”。不过这些神经网络方法的真实水平如何?具体数值多少?以Sighan05中的PKU数据集为例,真像一些论文所言,一个LSTM-CRF就有96.5%吗?或者像...

CS224n笔记18 挑战深度学习与自然语言处理的极限

CS224n笔记18 挑战深度学习与自然语言处理的极限

hankcs阅读(477)评论(0)

最后一课,总结了目前这两个领域中的难题,介绍了一些前沿研究:快16倍的QRNN、自动设计神经网络的NAS等。 深度学习已经漂亮地完成了许多单项任务,但如果我们继续随机初始化模型参数,我们永远也无法得到一个可以完全理解语言的系统。模型就像蒙住...

CS224n研究热点15 Neural Turing Machines

CS224n研究热点15 Neural Turing Machines

hankcs阅读(206)评论(1)

    这次讲座覆盖了来自DeepMind的两篇论文: 第二篇是第一篇的轻微改进,这里只关注抽象思想。 问题  目前的神经网络擅长模式识别和动态决策,但无法使用知识进行深思或推断。比如明明可以胜任电子游戏这么复...

CS224n笔记17 NLP存在的问题与未来的架构

CS224n笔记17 NLP存在的问题与未来的架构

hankcs阅读(513)评论(1)

课程介绍了各种各样的深度学习网络与应用,是时候从更高层次思考自然语言处理存在的问题与展望未来了。虽然BiLSTM与attention几乎统治了NLP,但在篇章级别的理解与推断上还不尽人意。 新时代人们正在“解决”语言  深度学习填...

CS224n研究热点14 自动组合神经网络做问答系统

CS224n研究热点14 自动组合神经网络做问答系统

hankcs阅读(207)评论(0)

这是自我组装推断的QA,可接受多种知识,包括图片和结构化知识库。问答具有复合性,很早就有人引入句法分析判断究竟在问什么,甚至脑洞大开想做自然语言编译器。但他们总是脱离不了手写规则的思维,白白糟蹋了性能卓越的句法分析器。而该模型自动组装多个神...

CS224n笔记16 DMN与问答系统

CS224n笔记16 DMN与问答系统

hankcs阅读(406)评论(1)

最有意思的一课,将所有NLP任务视作QA问题。模仿人类粗读文章和问题,再带着问题反复阅读文章的行为,利用DMN这个通用框架漂亮地解决了从词性标注、情感分析到机器翻译、QA等一系列任务。 是否所有NLP任务都可视作QA? 问答系统举例如下: ...

CS224n研究热点13 学习代码的语义

CS224n研究热点13 学习代码的语义

hankcs阅读(175)评论(0)

在培训码农的时候,教师需要给学生批改代码、写反馈。学生太多时成为机械劳动,这篇论文研究自动编码程序的语义表示。数据集来自斯坦福开发的模拟操控机器人的语言。 表示代码  希望得到代码的简洁表示、运行后会得到什么结果,哪怕它无法编译运...

CS224n笔记15 指代消解

CS224n笔记15 指代消解

hankcs阅读(433)评论(0)

从规则启发式代词回指消解出发,介绍了传统特征工程二分类模型、启发式损失的分类模型,过渡到利用强化学习自动缩放损失的神经网络模型。 什么是指代消解  找出文本中名词短语所指代的真实世界中的事物。比如: 不只是代词能够指代其他事物,所...

CS224n研究热点12 神经网络自动代码摘要

CS224n研究热点12 神经网络自动代码摘要

hankcs阅读(189)评论(0)

任务与数据集  自动生成C#和SQL代码的文档描述,数据集整理自StackOverflow上的提问。 子任务  根据代码生成摘要,或根据问题检索代码。 网络架构  一个LSTM处理已生成的文本token,一个在...

CS224n笔记14 Tree RNN与短语句法分析

CS224n笔记14 Tree RNN与短语句法分析

hankcs阅读(423)评论(2)

介绍了著名的复合性原理,由此启发得到树形RNN,用于表示短语和句子级别的语义。从朴素树形RNN到SU-RNN和MV-RNN,讨论了进化历史和各自优缺点,演示了效果和在图像等领域的拓展应用。 语言模型光谱  最简陋最常用的是词袋模型...

我的开源项目

HanLP自然语言处理包基于DoubleArrayTrie的Aho Corasick自动机