码农场

放牧代码和思想
专注自然语言处理、机器学习算法
    恕不接待索要源码语料者、索求技术方案者、以及不Google的懒人。

最新发布

不开心
生活

不开心

阅读(41)评论(2)

18年之后就很少更新了,借口是忙,其实是生命力的流失。生物的本能是追求快乐,我似乎哪里坏掉了。无论是中paper,还是考试合格,带给我的快乐转瞬即逝。我从不社交,从不旅游,从不主动买衣服。体检的时候护士看我挺憔悴,问我抽烟喝酒吸毒频率,我的...

中文抽象意义表示简介
语料库

中文抽象意义表示简介

阅读(257)评论(0)

上周收到LDC的订阅邮件,由布兰迪斯大学和南京师范大学联合标注的中文抽象意义表示语料库2.0(CAMR 2.0)发布了。于是第一时间下单购买,做一期开箱评测。 抽象意义表示(Abstract Meaning Representation,A...

HanLP 2.0 alpha版发布
自然语言处理

HanLP 2.0 alpha版发布

阅读(2446)评论(21)

面向生产环境的多语种自然语言处理工具包,基于 TensorFlow 2.0,目标是普及落地最前沿的NLP技术。HanLP具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。目前,基于深度学习的HanLP 2.0正处于alpha测试阶...

“原子”因果常识图谱
语料库

“原子”因果常识图谱

阅读(2452)评论(0)

AAAI19的论文(Sap et al. (2019))开源了一个包含87万条推理常识的知识图谱ATOMIC。相较于常见的基于本体论分类条目的知识图谱,该知识库专注于“如果…那么…”关系的知识。作者提出了9种类型的因果联系来区分原因-效果、...

梯度下降与海森矩阵
机器学习

梯度下降与海森矩阵

阅读(3706)评论(1)

理一理基础优化理论,解释一下深度学习中的一阶梯度下降遇到的病态曲率(pathological curvature)问题。当海森矩阵condition number很大时,一阶梯度下降收敛很慢,无论是对鞍点还是局部极值点而言都不是个好事。 鞍...

定个小目标,发它一个亿条微博语料
语料库

定个小目标,发它一个亿条微博语料

阅读(3812)评论(14)

2019最新的微博语料,可用于预训练语言模型Weibo-BERT词向量等。由于比较时新,对网络流行语的建模可能很有帮助。每个压缩包都有两千多万条,一共5个。大家下载之后也算是有一个亿身家的人了,激动吧。感兴趣的同学要不要训练个Weibo-B...

依存句法分析在深度学习中的应用
自然语言处理

依存句法分析在深度学习中的应用

阅读(4501)评论(8)

句法分析是一项核心的NLP任务,目标是获取句子的主谓宾等句法结构。下级应用时,给定依存句法树,传统时代利用规则提取句法树的特征;在深度学习时代,如何提取树的向量表示?本文调研了7种常用模型,涵盖Tree RNN、DCNN和GCN等。 Tre...

中文语义依存分析语料库
自然语言处理

中文语义依存分析语料库

阅读(9019)评论(6)

HanLP 2.0语义分析模块已开源!支持中文语义分析和英文语义分析等。 本文介绍语义依存的语言学知识以及BH中文语义依存语料库的标注规范。 给定一个句子,语义依存分析(Semantic Dependency Parsing,SDP)任务试...

我的作品

HanLP自然语言处理包《自然语言处理入门》