码农场-自然语言处理、机器学习算法

HanLP自然语言处理包开源
中文分词≠自然语言处理！中文分词只是第一步；HanLP从中文分词开始，覆盖词性标注、命名实体...
Aho Corasick自动机结合DoubleArrayTrie极速多模式匹配
本文使用Double Array Trie实现了一个性能极高的Aho Corasick自动机，应...

HanLP古汉语处理模型发布

2025-01-13阅读(2921)评论(3)

在陆续支持了简繁中英日俄法德在内的130种语言后，HanLP今日正式发布开源古汉语模型，以支持古汉语文言文自动分词、词形、词性标注和依存句法分析。得益于多任务学习技术，只需一个模型就可以支持这些任务，以及粗分/细分、UPOS/XPOS/PK...

日语教程

手作り幻想

2023-06-02阅读(5656)评论(1)

手作り幻想本文川田順造アフリカから久()しぶりに日本()に帰()って、「手仕事()」や「手作()り」ということに、異常()な関心()が払(われているのに驚()いた。それまでの2()年半()、私)が、基礎的()な生産技術(...

自然语言处理

HanLP招聘

2023-01-06阅读(7910)评论(0)

NLP 工程师工作内容研发业内领先的语言理解与生成、知识图谱与推理、语义索引与搜索的技术体系。包括但不限于如下方向—— 核心NLU技术：分词、词性标注、命名实体识别、句法分析、语义分析；可控NLG技术：文本摘要、文章生成、代码生成、机...

第七册

《日语综合教程》第七册第八課案内者

2022-11-22阅读(6869)评论(0)

第八課案内者假名上标的版本点这儿 (｡･∀･)ﾉﾞ：假名上标本文寺田寅彦電車(でんしゃ)に跳(は)ね飛(と)ばされてけがをしたどこかへ旅行りょこうがしてみたく...

自然语言处理

语法纠错的评测指标

2022-01-30阅读(11126)评论(0)

在进行一项NLP任务前，了解评测指标至关重要。以语法纠错为例，一项评测如何定义、如何对齐黄金与预测数据、是否符合人工评测、是否支持多语种等等都值得关注。本文简要评测几个常用的评测指标，特别关注对中文的支持程度。首先，语法纠错任务经常定义为...

日语教程

简单有效的位置编码

2021-11-27阅读(8619)评论(0)

去年流行了一阵相对位置编码，各种巧夺天工的设计层出不穷，各有各的数学解释。然而谷歌这篇文章指出，相对位置并不优于绝对位置。之所以看上去更优是因为位置信息被加到了每一层注意力矩阵上，增大了矩阵的秩。其实我当时看这些论文的时候就很疑惑，这些论文...

中文分词

#EMNLP21#抗噪自监督中文分词

2021-11-08阅读(10240)评论(2)

很久没有关注中文分词，今年恰好开会听了这篇清华领衔的长论文，分数相当不错。而且还引用了我的第一篇论文，于是简要介绍一下。虽然仰慕已久，但我与论文作者们并无私交。本文仅代表我的个人观点，如果有任何理解或表述错误，都是我的责任，与原作者无关。图...

自然语言处理

#EMNLP21#干细胞假说：神经网络也具备干细胞难成全才

2021-11-07阅读(8595)评论(0)

近来预训练语言模型在许多任务上成果斐然，然而在多任务联合学习上则差强人意。通过剪枝，我们发现所有任务会争夺一些通用的注意力头。据此，我们提出了干细胞假说：预训练会孕育一些天才注意力头，如同干细胞，可以分化为专精一种任务的功能细胞，却难以同时...

自然语言处理

M1加速深度学习：HanLP正式支持苹果芯GPU

2021-11-04阅读(13571)评论(11)

今天我的MBP M1MAX终于寄到了，于是第一时间为HanLP提供M1的原生CPU+GPU支持。MBP用户从此享受到GPU加速的推理与训练，微调个BERT同样丝滑。本文简要介绍原生环境搭建与安装，适用于包括M1系列在内的Apple Sili...

1
2
3
4
...
下一页
共 84 页

码农场

HanLP自然语言处理包开源

Aho Corasick自动机结合DoubleArrayTrie极速多模式匹配

最新发布

HanLP古汉语处理模型发布

手作り幻想

HanLP招聘

《日语综合教程》第七册第八課案内者

语法纠错的评测指标

推荐几本好用的日语词典

简单有效的位置编码

#EMNLP21#抗噪自监督中文分词

#EMNLP21#干细胞假说：神经网络也具备干细胞难成全才

M1加速深度学习：HanLP正式支持苹果芯GPU

我的作品