码农场

放牧代码和思想
专注自然语言处理、机器学习算法
    恕不接待索要源码语料者、索求技术方案者、以及不Google的懒人。

最新发布 第4页

CS224n笔记10 NMT与Attention
自然语言处理

CS224n笔记10 NMT与Attention

hankcs阅读(4059)评论(1)

从NMT的历史谈到现代,讲解了attention机制的动机、原理及最新的拓展。通过实例展示谷歌翻译的变化,直言不讳指出其过度炒作。Manning今天还换上了新MBP,挺潮的。 机器翻译 传统衡量机器对语言理解的测试之一 同时涉及到语言分析与...

CS224n Assignment 2
自然语言处理

CS224n Assignment 2

hankcs阅读(6902)评论(15)

先在TensorFlow上实现多项逻辑斯谛回归练练手,然后增加难度实现基于神经网络的转移依存句法分析,试验Xavier初始化、Dropout和Adam优化器。最后推导RNN和语言模型的困惑度、梯度、反向传播和复杂度。 Python代码开源在...

从源码编译安装TensorFlow
机器学习

从源码编译安装TensorFlow

hankcs阅读(5159)评论(4)

普通安装方法是pip官方的包,但这种大街货往往没有针对本地环境做优化。比如调用时会警告说你的机器支持一些可加速运算的指令,但编译时没有启用,让你心痒难耐。 2017-06-26 10:34:11.820609: W&nb...

CS224n笔记9 机器翻译和高级LSTM及GRU
自然语言处理

CS224n笔记9 机器翻译和高级LSTM及GRU

hankcs阅读(3959)评论(2)

简单回顾了传统统计机器翻译中的难题,过渡到利用GRU和LSTM来救场,最后介绍了一些较新的改进工作。 机器翻译 对于情感分析这类还算简单的任务,你可以整理一个情感极性词典、编写一堆规则做出一个勉强能用的系统。但到了机器翻译这个高级应用,就无...

CS224n研究热点7 迈向更好的语言模型
自然语言处理

CS224n研究热点7 迈向更好的语言模型

hankcs阅读(1890)评论(0)

我们已经知道一些手段来改进语言模型,比如: 更好的输入:词→词根→字符 更好的正则化/预处理 这些手段综合起来得到了更好的语言模型 更好的输入 文本的多种颗粒度: 更细的颗粒度相当于减小了词表,让模型更容易做对选择。试验表明的确降低了err...

CS224n笔记8 RNN和语言模型
自然语言处理

CS224n笔记8 RNN和语言模型

hankcs阅读(4793)评论(5)

这次课推导RNN,介绍各种训练技巧和拓展变种。梯度消失的推导很详细,用Python演示很直观,也给出了用裁剪防止梯度爆炸的直观解释。笔记里还补充了用于机器翻译时的5项改进。 语言模型 语言模型就是计算一个单词序列(句子)的概率($P(w_1...

CS224n笔记7 TensorFlow入门
自然语言处理

CS224n笔记7 TensorFlow入门

hankcs阅读(3392)评论(2)

这节课由TA们介绍了TF里的几个基本概念(graph、variable、placeholder、session、fetch、feed),基本流程。然后现场敲代码演示如何在TF上跑线性回归和训练词向量。与优达学城的《深度学习公开课》不同之处在...

CS224n研究热点5 图像对话
自然语言处理

CS224n研究热点5 图像对话

hankcs阅读(1976)评论(1)

术语Visual Dialog,大致这么翻译(通俗理解为斗图)。你可以给聊天机器人发送图片,它能理解图片的意思,你们可以就图片内容展开对话;除了文本之外,让图片也成为交流的一部分;这可以帮助盲人理解周围或社交媒体上的信息。 这是自然语言处理...

我的作品

HanLP自然语言处理包《自然语言处理入门》