放牧代码和思想
专注自然语言处理、机器学习算法
    恕不接待索要源码语料者、索求技术方案者、以及不Google的懒人。

关于

算法初心者,海外修业中。

白天生存,晚上生活。

没有任何光鲜的经历,也没有任何过去的回忆。无论是互联网还是现实中,都不会保留任何“过去”的东西。

喜欢有思想深度的事物,讨厌浮躁、拜金与安逸的人。

对外面的世界失去了兴趣,希望一直活在“心境”里。

 

评论 373

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址
  1. #0

    请问hanlp里面的crfpp模型是用什么参数训练出来的? 是http://www.hankcs.com/nlp/the-crf-model-format-description.html里面的模板和参数吗?

    天涯霜雪15小时前回复
  2. #0

    博主您好, 看了你的博客,感觸良多! 想問博主您指的”心境” 是甚麼呢?

    kent1天前回复
  3. #0

    你能编译一个portable-1.3.4版本吗, 现在1.3.3的一个bug导致我不能接入到系统中, 你已经修改了该问题.

    guozhiqiang2周前 (05-12)回复
  4. #0
  5. #0

    博主您好!有没有可以实现的代码?我目前正在苦恼微博用户模型的建立,我数据已经处理好了,求您帮忙

    盼盼2周前 (05-09)回复
  6. #0

    你好博主,请问你的HMM的状态概率是怎么获取的呢?如果直接使用标记的语料库,E和S的转移概率都是0啊

    MUdou3周前 (05-03)回复
  7. #0

    请问博主,关于NLP中的信息抽取领域,目前的研究方向大概是什么,能否指点一下呢

    hzylmf3周前 (05-03)回复
  8. #0

    博主你好!请问写日语的博客文章时如何同时显示日语汉字的假名的?用的哪个wordpress插件么?谢谢!

    GUO4周前 (04-28)回复
  9. #0

    博主,厉害!以收藏网站。

    jackzhoumine1个月前 (04-23)回复
  10. #0

    大概我就那种被讨厌的浮躁的人吧,一直在寻找内心的点。偶然看到的这个网站,心里荡起了一点涟漪,希望是暗涌吧,感谢博主!

    janeslea1个月前 (04-21)回复
  11. #0

    很喜欢你的博客,对我毕业设计有不少帮助

    dowski1个月前 (04-18)回复
  12. #0

    很厉害,最关键的是把我喜欢的两个东西都放在里面了,一个是编程一个是日语,其实大学专业有一个叫做软件工程-日语强化班,这种专业不学英语学日语,并且学软件,然而我只是个普通的软件工程,博主java的api讲的很不错,但是不够详细啊,如果能就原本api基础上举例子就更好了。

    为你敲一个世界1个月前 (04-16)回复
  13. #0

    你是我的偶像!~

    mr_x1个月前 (04-14)回复
  14. #0

    汗颜ing, 你真的超赞,用着你开源的HanLP,看着你的技术帖子,突然发现兴趣才是最好的导师;白天生存,晚上生活,跟你的境界相比,我真是low爆了。向你看齐,好好努力!

    winson1个月前 (04-11)回复
  15. #0

    你好!非常感谢你提供的hanlp!
    我想问一下,NLP分词使用了什么算法?
    谢谢!

    无何有之乡1个月前 (04-10)回复
  16. #0

    迢迢牵牛星,皎皎河汉女。
    纤纤擢素手,札札弄机杼。
    终日不成章,泣涕零如雨。
    河汉清且浅,相去复几许。
    盈盈一水间,脉脉不得语。

    hangxing782个月前 (03-28)回复
  17. #0

    楼主,你的语料是怎么训练的,为啥我在用CRF++训练2000万行大规模语料的时候中途被中断,不管是windows还是linux下。求教

    景诗2个月前 (03-21)回复
  18. #0

    楼主,你的语料是怎么训练的,为啥我在用CRF++训练2000万行大规模语料的时候中途被中断,不管是windows还是linux下。求教

    NLP2个月前 (03-21)回复
  19. #0

    白天生存,晚上生活 很喜欢博主这种价值观

    Peter Hu2个月前 (03-13)回复
  20. #0

    决定把自己从颓废的困境里拉出来

    像疯一样自由!2个月前 (03-12)回复
  21. #0

    博主有开QQ群吗?或者有粉丝开了QQ群?

    hangxing783个月前 (03-07)回复
  22. #0

    请问,如何解决“长春市长春节致辞”被分成“长春市, 长, 春节, 致辞”的问题

    hangxing783个月前 (03-07)回复
  23. #0

    决定把自己从浮躁的懒惰工程师掰回来

    ASH3个月前 (02-24)回复
  24. #0

    请问文章里公式排版用的什么框架,

    2010围巾3个月前 (02-09)回复
  25. #0

    博主您好,请问在 com.hankcs.hanlp.summary.TextRankKeyword第156行 这代码是什么意思?
    m.put(key, m.get(key) + d / size * (score.get(element) == null ? 0 : score.get(element)));

     3个月前 (02-09)回复
  26. #0

    新年快乐~ hankcs~~

    像疯一样自由!4个月前 (01-28)回复
  27. #0

    楼主出去留学了吗?

    王晓可4个月前 (01-23)回复
  28. #0

    如我是老板早高薪挖走你了

    王晓可4个月前 (01-23)回复
  29. #0

    这个个人站点吗?

    小杨4个月前 (01-15)回复
  30. #0

    这个关于漂亮

    像疯一样自由!4个月前 (01-11)回复
  31. #0

    博主这么优秀,注定单身啊

    CHEN5个月前 (12-18)回复
  32. #0

    学霸,这格调的有点高。

    CHEN5个月前 (12-18)回复
  33. #0

    我想想也代码,不过现在没什么时间

    聖赒5个月前 (12-18)回复
  34. #0

    非常非常欣赏hankcs ~>~
    近来疲倦厌烦, 女王大人的文让我找到做码农的动力 ~.~

    像疯一样自由!5个月前 (12-17)回复
  35. #0

    博主喜欢看电子书(“找到电子版就把纸质书扔床底下”),问下博主用什么工具看电子书呢,ipad吗?望回复!

    • 我一般用双显示器,竖起来看书

      hankcs5个月前 (12-18)回复
  36. #0

    您好,我想请教下能不能从分词过程中,做中文的错别字识别?这方面您能给一些思路吗?谢谢!

    老头6个月前 (12-03)回复
  37. #0

    大神的博客intuition,推导和code兼备,是我努力学习的对象。另,背景音乐很好听。

    文行知Cer6个月前 (11-26)回复
  38. #0

    进来膜拜一下~

    SurprisedCat7个月前 (10-17)回复
  39. #0

    您好:这个目录“D:\JavaProjects\HanLP\data\test\cbgm”下面的数据在哪里啊?

    大道至公7个月前 (10-17)回复
  40. #0

    这么好的基础,自己学有点浪费~

    老城百姓7个月前 (10-12)回复
  41. #0

    博主厉害,读语言的还会码,还做NLP,有空可以交流,本人也在学校实验室搞一点NLP

    陈裕通Derrick8个月前 (10-11)回复
  42. #0

    博主,为什么用你的crf序列标注得出来的结果跟用命令行运行得出来的结果会不一样呢?(用的是同一个模型)

    tianyunzqs8个月前 (10-09)回复
  43. #0

    大神 里面没有看到分类聚类的功能 有研究过这块吗

    马林8个月前 (10-08)回复
  44. #0

    博主的博客很简洁和实用,想问一下,这个是用的哪一个wordpress的主题呢?还是自己写的?

    ZhuzhuO_o8个月前 (09-30)回复
  45. #0

    crf en OT
    + null TH
    + null TH
    是 v TH
    由 p TH
    c en TH
    + null TH
    + null TH
    语言 n TH
    编写 v TH
    的 uj TH
    条件 n TH
    随 v TH
    机场 n TH
    工具 n TH

    在 p OT
    系统 n TH
    主体 n TH
    的 uj TH
    java en TH
    程序 n TH
    中 f TH
    使用 v TH

    敢问博主,像上面的crf模型,该如何解析呢?你集成到HanLP中的模型解析及测试方法,没怎么看懂,能帮帮忙么

    tianyunzqs8个月前 (09-28)回复
  46. #0

    hankcs 能否加个QQ?我对你博客上的东西很有兴趣,希望能与您有合作关系。

    吴德乾8个月前 (09-28)回复
    • 感谢关注,我不习惯用QQ和微信,烦请通过邮箱me艾特hankcs点com联系我,谢谢。

      hankcs8个月前 (10-01)回复
  47. #0

    「某女校」什么鬼……

    zmonster8个月前 (09-22)回复
  48. #0

    女校是什么鬼?

    NASa_CJ8个月前 (09-20)回复
  49. #0

    首页下拉时会自动加载,就点击不到底部的开源项目了诶~

    northernw9个月前 (09-03)回复
  50. #0

    你好,您有没有出版过hanlp这方面的书啊?

    大道至公9个月前 (08-26)回复
  51. #0

    博主的博客很漂亮,怎么建的?

    SonpKing9个月前 (08-18)回复
  52. #0

    很不错的博客

    戎码人生9个月前 (08-12)回复
  53. #0

    很强

    ﺭ南风ﺭ10个月前 (08-11)回复
  54. #0

    你好,请问你有基于英文的命名实体识别的代码吗,谢谢!!!

    I believe I can10个月前 (08-10)回复
  55. #0

    像“明天上午九点” 这样的语句分词效果好像很差呢。

    如何把它映射成一个日期呢?

    谢谢~

    Richard Chen10个月前 (08-03)回复
  56. #0

    聴解ストラテジー(上).pdf
    聴解ストラテジー(上)解答.pdf
    聴解ストラテジー(下).pdf
    聴解ストラテジー(下)解答.pdf

    请问还有这个资源咩?

    丫丫10个月前 (07-31)回复
  57. #0

    求问一下为什么我用HanLP里面的CRFModel读取Crf++训练出来的模型,计算出来的结果与crf++自带的crf_test算出来的结果不一样呢?crf_test算出来的结果要好和很多,CRFModel算出来的不准?

    刘力华10个月前 (07-31)回复
  58. #0

    非常感谢极具分享精神的博主!!!代码也写得真溜!

    我目前在基于博主的代码拓展一些功能,比如像添加歌曲名这样的词性。请问做法是不是应该如下:
    1)在Nature里面添加一个新词性为歌曲名(例:nq)
    2)维护一个歌曲名列表;
    3)对CustomDictionary在应用启动时动态加载好这个歌曲名列表同时标注其词性为nq;
    4)最后对相应的语句分词,获得其中的歌曲名。

    Richard Chen10个月前 (07-31)回复
  59. #0

    感谢大神,给您跪了。。。我弄得一个版本控制器核心代码抄袭您的。。。谢谢大神。

    李振平brise12个月前 (06-10)回复
  60. #0

    好厉害,棒棒哒

    四月天12个月前 (06-07)回复
  61. #0

    非常感谢hankcs,你的这个博最近这帮了我很多。

    扬泡泡1年前 (2016-05-21)回复
  62. #0

    博主,svm一节没有贴出calws的代码!

    流x--ing1年前 (2016-05-19)回复
    • 哦哦,我已经找到了。多谢大神的文章!

      流x--ing1年前 (2016-05-20)回复
  63. #0

    最近开始学习HanLP,感觉好强大,但是可以的话,博主能否分享下model的下载地址?运行CRF分词时出错,尝试按git版本model里的readme.txt步骤未找到model下载地址。

    张德斌1年前 (2016-05-17)回复
  64. #0

    博主大人,我看了您rfc5766-turn-server和ice4j广域网通讯的帖子,我是在虚拟机ubuntu中配置运行的,我也没有公网IP,用自己电脑PC的IP来配的,在turnserver.conf中加external-ip=172.16.13.84(PC电脑ip)运行不管,改为172.16.13.84:3478也不行,把external-ip=172.16.13.84改为external-ip=192.168.61.129 (ubuntu中ifconfig的ip)还是不行,还有turnserver.conf中每条语句前的#号表示注释符吗?恳请博主大人明示,谢谢!!

    暖风1年前 (2016-05-12)回复
  65. #0

    你好,博主,我下载data完整版后发现WordNature只有bin二进制文件。博主,能提供一下WordNature的txt文件么?谢谢咯

    小黎1年前 (2016-05-10)回复
  66. #0

    博主大人,能不能讲些生物文本中的命名识别,以及关系抽取啊,多谢

    huangxe1年前 (2016-05-10)回复
    • 您好,请问您也是做生物文本实体识别的吗?能否加QQ交流一下438942304,谢谢

      黑色幽默1年前 (2016-05-12)回复
  67. #0

    楼主是如何根据“基于角色标注的中国人名自动识别研究”这篇论文实现代码的?

    hs1年前 (2016-04-26)回复
  68. #0

    博主是华东师范大学的吗?Orz!!

    oilover1年前 (2016-04-22)回复
    • 上外

      asdf1年前 (2016-04-22)回复
  69. #0

    主谓宾提取工具 MainPartExtractor mvn-repo http://maven.ansj.org 不能用了吗?

    lg.chen1年前 (2016-04-01)回复
  70. #0

    纯粹就是想过来看看

    初雪之音1年前 (2016-03-29)回复
  71. #0

    感谢大神热心分享

    魔人1年前 (2016-03-29)回复
  72. #0

    冒昧请教博主,我希望通过HanLP实现计算两个文章的相似度,大概如何实现较合理?盼回复~

    温承瑭1年前 (2016-03-27)回复
    • 之前用Ansj,现刚发现HanLP,还不熟悉,但觉得HanLP非常不错,盼大神提供实现两篇文章相似度的大概思路,感激不尽~

      温承瑭1年前 (2016-03-27)回复
  73. #0

    大神你好,你的这篇文章中的百度云链接失效了,http://dataunion.org/12565.html
    能否将链接发到我得邮箱804570192@qq.com,万分感谢!

    半面留香1年前 (2016-03-23)回复
  74. #0

    为什么现在东西都无法下载了?

    李健博1年前 (2016-03-21)回复
  75. #0

    hankcs,我想开发一个数学领域自动阅卷系统,敢请你相助吗?微信号18049732112.

    yunbin1年前 (2016-03-16)回复
  76. #0

    佩服佩服

    戚名钰1年前 (2016-03-16)回复
  77. #0

    mafling ,我完全同意你说“为啥你会觉得是学姐? = = 妥妥的男生吧?” ,你够敏锐!为啥大部分人都认为上海外语学院是女校? 只不过男的少而已!

    雅_格1年前 (2016-03-15)回复
  78. #0

    mark!

    雅_格1年前 (2016-03-15)回复
  79. #0

    博主好棒啊!求加友链啊!http://hujiaweibujidao.github.io/ [互粉]

    五道口宅男1年前 (2016-03-15)回复
  80. #0

    你好,网站的图片储存你是怎么处理的

    路人甲乙丙1年前 (2016-03-15)回复
  81. #0

    想学JAVA和C++STL希望博主推荐几本书

    刘亚坤1年前 (2016-03-05)回复
  82. #0

    近乡情更怯,不敢问来人。

    婚纱照哪好1年前 (2016-03-03)回复
  83. #0

    能否来个搜索框?

    Kx1年前 (2016-02-29)回复
  84. #0

    “hankcs对外面的世界失去了兴趣,希望一直活在“心境”里。” 这是什么样的心境呢。

    亚飞ing1年前 (2016-02-24)回复
  85. #0

    站主是妹子么?

    陈洞天1年前 (2016-02-05)回复
  86. #0

    已收藏贵站

    陈洞天1年前 (2016-02-05)回复
  87. #0

    Hi,

    I am trying to use your sample client from GITHUB https://github.com/hankcs/IceNAT.

    I wanted to achieve something like this http://stackoverflow.com/questions/27224008/webrtc-force-peers-to-use-turn-server.

    I am not sure how easily it can be achieved by tweaking ICE4J library, would highly appreciate if you can provide some inputs on this.

    Ady

    Ady1年前 (2016-02-05)回复
  88. #0

    好久没更新了…

    匿名1年前 (2016-02-02)回复
  89. #0

    欢迎回访

    东北松子1年前 (2016-01-28)回复
  90. #0

    一个线段树去除重叠部分的问题。
    如下代码:
    Trie trie = new Trie();
    trie.addKeyword(“she”);
    trie.addKeyword(“he”);
    trie.addKeyword(“hers”);
    trie.addKeyword(“his”);
    trie.addKeyword(“is”);
    System.out.println(trie.parseText(“uisishers”));
    trie.removeOverlaps();
    System.out.println(trie.parseText(“ushers”));
    给出结果:
    [1:2=is, 3:4=is, 5:6=he, 4:6=she, 5:8=hers]
    [2:5=hers]
    这样的输出结果是正确的吗?

    蔓儿朵1年前 (2016-01-25)回复
  91. #0

    膜拜啊,连评论一条不落的看完了[嘻嘻]

    反穿人字拖1年前 (2016-01-19)回复
  92. #0

    被妹子推荐了,还特地跑过来看看[采访]

    1年前 (2016-01-19)回复
  93. #0

    背景音乐是什么,求。。。

    欧几里德的猫1年前 (2016-01-18)回复
  94. #0

    谢谢。

    登山者1年前 (2016-01-16)回复
  95. #0

    能帮我做一些商业数据的清洗优化不?

    xunyu1年前 (2016-01-08)回复
  96. #0

    只是想过来拍一下博主大人的马屁,真的是厉害,佩服!

    游行至1年前 (2015-12-18)回复
  97. #0

    楼主很多干货,认真学习~

    劈马砍柴1年前 (2015-12-17)回复
  98. #0

    学长泥嚎…我是隔壁工程大的~路过看看w

    CDog1年前 (2015-12-15)回复
  99. #0

    不错的网站~

    hrwhisper1年前 (2015-12-14)回复
  100. #0

    佩服博主,一不是计算机专业,二计算机知识面很广,三网站做的很好。
    有联系方式吗,方便加一下QQ或微信,我的是502489185

    梁荣晓1年前 (2015-12-10)回复
  101. #0

    第一个粉丝报道……

    董依良1年前 (2015-12-08)回复
  102. #0

    君は凄い 君を見ると自分がどれほど弱いのか自覚しますた もどもどかんばらないとね

    セイバー君1年前 (2015-12-07)回复
  103. #0

    你好,我再用汉字转换成拼音的功能,在本地测试没事,上传到服务器就包这样的异常,我怀疑是不是中文乱码的问题

    java代码:
    HanLP.convertToPinyinString(“你好”, “”, false);

    异常:
    Exception in thread “main” java.lang.ExceptionInInitializerError
    at com.hankcs.hanlp.HanLP.convertToPinyinString(HanLP.java:341)
    at com.uanhao.es.UpLoadMain.getSaveHealth(UpLoadMain.java:147)
    at com.uanhao.es.UpLoadMain.upHealth(UpLoadMain.java:91)
    at com.uanhao.es.UpLoadMain.main(UpLoadMain.java:67)
    Caused by: java.lang.ArrayIndexOutOfBoundsException: 85062
    at com.hankcs.hanlp.utility.ByteUtil.bytesHighFirstToInt(ByteUtil.java:240)
    at com.hankcs.hanlp.corpus.io.ByteArray.nextInt(ByteArray.java:62)
    at com.hankcs.hanlp.dictionary.py.PinyinDictionary.loadDat(PinyinDictionary.java:98)
    at com.hankcs.hanlp.dictionary.py.PinyinDictionary.load(PinyinDictionary.java:56)
    at com.hankcs.hanlp.dictionary.py.PinyinDictionary.(PinyinDictionary.java:41)

    ITDN2年前 (2015-11-26)回复
    • 找到原因了,远程服务器pinyin.txt.bin文件出错了,删除了就好了

      ITDN2年前 (2015-11-26)回复
  104. #0

    你好,请问你的博客用的是hexo吗?如果是的话,你的主题是哪个啊?能不能放个Github链接?

    pappe2年前 (2015-11-22)回复
    • 你好,自豪地采用WordPress

      hankcs2年前 (2015-11-23)回复
      • 好的,谢谢,没想到WordPress也能搞的挺漂亮,楼主加油!

        pappe2年前 (2015-11-24)回复
  105. #0

    膜拜中, 收藏了博主的网站!

    晓梦2年前 (2015-11-22)回复
  106. #0

    嗯,比我们很多专业的人还要写的好,确实像是John Carmak的感觉。追随自己的爱好倾尽全力,也喜欢这样追求极致的自己,有空会常来看看的。
    PS:配乐很好听,空之轨迹3rd没有玩过,看着不错,小寺可南子在双星物语2的ボクラの未来也很不错,“広がる空は 仆らを待ってる 未来 眩しくて”~

    focusheart2年前 (2015-11-22)回复
    • 感谢支持,3rd是三部曲中剧情最佳的一作,如同碧之轨迹的地位一样。双星物语2没有通关,大概主角家乡被烧毁后就中断了,后来不记得前面的剧情了。

      hankcs2年前 (2015-11-23)回复
  107. #0

    clion安装了minGW之后,就是这样,不知道是什么意思。求博主指导。博主有QQ吗?我也是大学生。
    Error:Configuration MinSizeRel
    The C compiler “D:/MinGW/bin/gcc.exe” is not able to compile a simple test program.
    It fails with the following output:
    Change Dir: C:/Users/璧垫櫒瓒�/.CLion12/system/cmake/generated/212b9a/212b9a/MinSizeRel/CMakeFiles/CMakeTmp
    Run Build Command:”D:/MinGW/bin/mingw32-make.exe” “cmTC_20a94/fast”
    D:/MinGW/bin/mingw32-make.exe -f CMakeFilescmTC_20a94.dirbuild.make CMakeFiles/cmTC_20a94.dir/build
    mingw32-make.exe[1]: Entering directory ‘C:/Users/赵晨越/.CLion12/system/cmake/generated/212b9a/212b9a/MinSizeRel/CMakeFiles/CMakeTmp’
    Building C object CMakeFiles/cmTC_20a94.dir/testCCompiler.c.obj
    D:MinGWbingcc.exe -o CMakeFilescmTC_20a94.dirtestCCompiler.c.obj -c C:Users璧垫櫒瓒奬.CLion12systemcmakegenerated212b9a212b9aMinSizeRelCMakeFilesCMakeTmptestCCompiler.c
    gcc.exe: error: C:Users璧垫櫒瓒奬.CLion12systemcmakegenerated212b9a212b9aMinSizeRelCMakeFilesCMakeTmptestCCompiler.c: No such file or directory
    gcc.exe: fatal error: no input files
    compilation terminated.
    CMakeFilescmTC_20a94.dirbuild.make:64: recipe for target ‘CMakeFiles/cmTC_20a94.dir/testCCompiler.c.obj’ failed
    mingw32-make.exe[1]: *** [CMakeFiles/cmTC_20a94.dir/testCCompiler.c.obj] Error 1
    mingw32-make.exe[1]: Leaving directory ‘C:/Users/赵晨越/.CLion12/system/cmake/generated/212b9a/212b9a/MinSizeRel/CMakeFiles/CMakeTmp’
    Makefile:125: recipe for target ‘cmTC_20a94/fast’ failed
    mingw32-make.exe: *** [cmTC_20a94/fast] Error 2
    CMake will not be able to correctly generate this project.

    虚心请教2年前 (2015-11-22)回复
    • 博客搜索mingw,我上传过懒人包,也使用过64位的,多试试

      hankcs2年前 (2015-11-22)回复
  108. #0

    恩,这样比较合理,毕竟每个使用者的业务逻辑不太一样

    slei2年前 (2015-11-13)回复
  109. #0

    可以实现

    hankcs2年前 (2015-11-13)回复
  110. #0

    我可以把过滤逻辑写成一个接口,用户可以把自己的业务逻辑替换进去

    hankcs2年前 (2015-11-13)回复
  111. #0

    直接封装到方法里面用起来应该比较方便,我现在是拿出来之后又通过词性过滤了一遍

    slei2年前 (2015-11-13)回复
  112. #0

    有应用场景,比如做seo优化的,现在很多文章重复度太高,如果文章内容一样就不容易被搜索引擎收录,如果通过同义词修改标题和内容,对内容有所编辑就容易被收录。

    slei2年前 (2015-11-13)回复
  113. #0

    lucene有的功能,就没有做。有其他应用场景吗

    hankcs2年前 (2015-11-13)回复
  114. #0

    可以,要改一点代码,停用词典按词性过滤就行了

    hankcs2年前 (2015-11-13)回复
  115. #0

    刚刚看到您写了一般有关lucene同义词的文章
    http://www.hankcs.com/program/java/lucene-synonymfilterfactory.html
    请问能再hanlp里面加入替换文章里面同义词的功能吗?这个功能应该有很多人用。

    slei2年前 (2015-11-13)回复
  116. #0

    大神你好,我最近在用“TextRank关键词提取”,发现还是会提取一些不想要的词,比如我提取的一组词:“汤二至,影子,二月,鞣质,那是”,里面“那是”这个词除去加到停用词里面,可以自定义词性吗,比如我只要词性是n,nr的关键词

    slei2年前 (2015-11-13)回复
  117. #0

    你好,我学的时候倒没想那么多,是由需求驱动的,按时间先后写过BiGram、HMM-Viterbi、TextRank、CRF、MaxEnt之类的,也没写出什么新东西。《统计自然语言处理》太偏理论了,我是当成论文目录大全扫一遍的,而且NLP实际上是机器学习的应用,深入模型实现的话可能还是李航老师的《统计学习方法》搭配《机器学习实战》更好。

    hankcs2年前 (2015-11-12)回复
  118. #0

    大神你好,我对NLP很感兴趣,尤其是看了《数学之美》之后,现在在读宗版《统计自然语言处理》,但是迄今都是看到的理论,请问实践写一些关于NLP的东西应该是怎么样个循序渐进的过程呢?哪些地方哪些模型需要我动手写一写加深理解呢?

      2年前 (2015-11-12)回复
  119. #0

    查询turnserver偶然点进来你的关于页面,同为没有计算机学历的计算机爱好者~博主的自学能力相当强悍啊!

    静水流深2年前 (2015-11-10)回复
  120. #0

    找到了,导航里有,太大意了,sorry

    MrUse2年前 (2015-11-10)回复
  121. #0

    你在线啊,你的github地址多少,我在github上搜hankcs没找到呢

    MrUse2年前 (2015-11-10)回复
  122. #0

    你好,并没有

    hankcs2年前 (2015-11-10)回复
  123. #0

    你好,我有学习视频编码的意向,您那里有学习资料?

    MrUse2年前 (2015-11-10)回复
  124. #0

    暂无

    hankcs2年前 (2015-11-09)回复
  125. #0

    我想请问博主有学习视频编解码的意向没有。

    luckystar19922年前 (2015-11-09)回复
  126. #0

    佩服

    张子豪博客2年前 (2015-11-09)回复
  127. #0

    非常钦佩博主的自学经历,我也在努力自学,目前已经接近一年了,向博主学习!

    苹苹橙2年前 (2015-11-09)回复
  128. #0

    顶礼膜拜哇~

    zy2年前 (2015-11-06)回复
  129. #0

    博主求翻译一下 4.7 习题 AOJ 2212 (ง ·̀_·́)ง

    0x3f2年前 (2015-09-29)回复
  130. #0

    Aho-Corasick算法的Java实现与分析这篇文章建议参考http://www.cnblogs.com/xudong-bupt/p/3433506.html重新写吧,你这个太难理解了

    InitialD2年前 (2015-09-28)回复
  131. #0

    非常喜欢作者的这个网站,特别是作者能把日语AOJ的给翻译上来,真是太给力了!

    Philip2年前 (2015-09-26)回复
  132. #0

    博主技术的背后是情怀,请教一下,HanLP是否会加情感分析和信息分类的模块,如果有需要的话,我这情感分析词库博主审阅一下

    天街小雨2年前 (2015-09-16)回复
    • 感谢支持,正在积累文本分类的算法和语料,欢迎赐教。

      hankcs2年前 (2015-09-16)回复
      • 我这暂没有文本分类词库,有中文情感词汇库

        天街小雨2年前 (2015-09-16)回复
        • 其实情感极性分析就是文本分类,情感词汇可以用于特征提取,方便的话欢迎共享给我me艾特hankcs.com

          hankcs2年前 (2015-09-16)回复
          • ok

            天街小雨2年前 (2015-09-16)
          • 已发送

            天街小雨2年前 (2015-09-16)
          • 谢谢,收到

            hankcs2年前 (2015-09-17)
  133. #0

    前来膜拜楼主

    王爵2年前 (2015-09-07)回复
  134. #0

    正在研究HanLP,已跪!
    楼主请收好我的膝盖

    姜玉刚2年前 (2015-09-01)回复
  135. #0

    正在研究HanLP,已跪!
    楼主请收好我的膝盖

    姜玉刚2年前 (2015-09-01)回复
  136. #0

    正在研究HanLP,已跪!
    楼主请收好我的膝盖

    姜玉刚2年前 (2015-09-01)回复
  137. #0

    我正在用hanNLP框架进行商业项目上的开发,不知道是否有机会合作

    xunyu2年前 (2015-08-23)回复
    • 你好,抱歉现在才看到。我现在这个时间点的兴趣是挑战更复杂的模型,而不是将一个模型应用到特定的领域,不知道能否满足你的项目。

      hankcs2年前 (2015-09-11)回复
      • 我现在在做的是简历解析引擎,底层用的hannlp的分词和词性识别,再在上层搭建分类等功能,项目测试网站在p.talentbot.cn。现在收到的数据很多都是有缺失的,不好处理,这个在hannlp里是否可以进行预测,对缺失的时间日期地点等补充,

        xunyu2年前 (2015-09-15)回复
  138. #0

    你这真火啊

    东北人2年前 (2015-08-20)回复
  139. #0

    赞一个,再用你的HanLP分词,不过发现一个问题,句子中出现 “嗷嗷嗷” 的时候会出抛出异常

    落蓝飞雪2年前 (2015-08-14)回复
    • 你好,1.2.4版中没有问题:
      String text = "嗷嗷嗷嗷~正好防晒霜快完啦快接上嗷嗷嗷嗷~人民的好伙伴啊嗷嗷嗷~";
      System.out.println(HanLP.segment(text));
      输出:
      [嗷嗷/o, 嗷嗷/o, ~/nx, 正好/z, 防晒霜/n, 快/a, 完/v, 啦/y, 快/a, 接/v, 上/f, 嗷嗷/o, 嗷嗷/o, ~/nx, 人民/n, 的/uj, 好/a, 伙伴/n, 啊/y, 嗷嗷/o, 嗷/n, ~/nx]

      我记得1.2.2优化过度,可能产生图不连通的问题。

      hankcs2年前 (2015-08-14)回复
  140. #0

    博主,您好,boke123导航(boke123.net)从2015年8月5日起正式更名为boke112导航(boke112.com),欢迎有空前去围观,谢谢。

    博客1122年前 (2015-08-12)回复
  141. #0

    博主学算法这么可爱认真一定是男孩子

    Likecer2年前 (2015-08-10)回复
  142. #0

    不错 学习了!

    最励志网2年前 (2015-08-07)回复
  143. #0

    博主你为啥这么吊?。。。真的好佩服你这种算法大神 。。最近公司要用到分词、增加新词。。偶然搜到这个网站, ~
    谢谢分享~

    兰翔不要停下来2年前 (2015-08-06)回复
  144. #0

    网站不错,能交换各友情链接吗?我的网站是:最励志(http://www.zuilizhi.net)

    最励志网2年前 (2015-08-06)回复
  145. #0

    说实在话,hankcs是真正做技术的人,爱好

    咕咕牛2年前 (2015-07-31)回复
  146. #0

    顶礼膜拜,向你学习

    Demonsxl2年前 (2015-07-24)回复
  147. #0

    喜欢 [爱你]

    小旺财2年前 (2015-07-22)回复
  148. #0

    博主您好,我是江苏省某大学的一名学生。最近在刷POJ。遇到不会的题目经常看您的题解。您是非计算机专业的,算法搞得这么厉害。我也想攻算法,您能否分享一下您是如何从非专业人员到将算法学的如此好呢

    LYK2年前 (2015-07-22)回复
    • 你好,过奖了。我也是看到不会的就到处找资料,还有很长的路要走。

      hankcs2年前 (2015-07-23)回复
    • 因为楼主是怪物

      Kid2年前 (2015-09-10)回复
  149. #0

    博主很厉害啊 无意路过 想起了当年刷poj时的梦想,不该因为孤独就放弃的。

    夜祸2年前 (2015-07-17)回复
  150. #0

    博主好,自称码农,实为高手!赞一个! [good]

    0072年前 (2015-07-13)回复
  151. #0

    楼主,机器学习入门书单的链接可以再分享一下吗?原先的链接用不了了,谢谢楼主

    墨翎2年前 (2015-07-13)回复
  152. #0

    互相学习 有时间回访下 [挤眼]

    松露巧克力2年前 (2015-07-12)回复
  153. #0

    学习一下

    杭州晨力2年前 (2015-07-12)回复
  154. #0

    NB啊,原来是女生 。

    hunk2年前 (2015-07-11)回复
  155. #0

    我觉得您是张华平老师

    wxz2年前 (2015-07-10)回复
    • 你太高估我了,我连张老师的学生都不是

      hankcs2年前 (2015-07-11)回复
      • 好牛气啊, 太厉害了, 膜拜膜拜 以后要做你的粉丝

        wxz2年前 (2015-07-13)回复
  156. #0

    支持

    卡丝面膜2年前 (2015-07-10)回复
  157. #0

    大神,您好,无意间看到您的这篇博客,内心十分激动,我以前读研究生的时候也是学习自然语言处理的,看了您的这篇文章收益匪浅,我也是一名程序员,热爱技术,崇拜您!

    清蔡2年前 (2015-07-06)回复
  158. #0

    你好,我也是一个 程序猿,,,很高兴来到你这,希望 能和你加下友情链接,我的博客:www.liuzk.com

    刘召考2年前 (2015-07-04)回复
  159. #0

    我记得东大博士前期入学考有英语测验,博主日语不落下,英语也要加油哦~

    上帝不玩骰子 ( 付饶 )2年前 (2015-06-24)回复
  160. #0

    我曾经也有过博主类似的梦想,只不过没有坚持下来,最后来是投奔了美帝。
    兄弟加油!

    上帝不玩骰子 ( 付饶 )2年前 (2015-06-24)回复
  161. #0

    厉害

    怎么在网上赚钱2年前 (2015-06-23)回复
  162. #0

    博主好厉害。。。。。膜拜一下

    李阳博客2年前 (2015-06-16)回复
  163. #0

    人民日报分词语料库博主有购买过吗?多少钱?

    xiaowu_01122年前 (2015-06-11)回复
  164. #0

    楼主有email吗,聊一聊

    一方通行2年前 (2015-06-03)回复
    • 右边微信私聊 [嘻嘻]

      hankcs2年前 (2015-06-28)回复
      • 哪有微信。。我怎么没找到。。。

        Hiro2年前 (2015-06-30)回复
        • 打错字了,我想说的是右边微博私信聊,PC上打字快一些,微博客户端也能收到

          hankcs2年前 (2015-06-30)回复
  165. #0

    博主 你太厉害了 我要给你生孩子~~~~~

    MrZONT2年前 (2015-05-31)回复
    • 好吧 其实我想说你这个用的是wordpress么?另外这里面的文章都是用markdown写的么?我也在搭建博客但是效果一直不满意啊~~~~~

      MrZONT2年前 (2015-05-31)回复
      • 你好,是的,用UEditor

        hankcs2年前 (2015-06-28)回复
  166. #0

    楼主,你好耀眼啊!咱们来谈朋友吧

    snow2年前 (2015-05-26)回复
  167. #0

    楼主太厉害了,又一个计算机专业的研究生觉得羞愧

    萌哥87V52年前 (2015-05-26)回复
  168. #0

    hankcs对外面的世界失去了兴趣,希望一直活在“心境”里。 How?

    luox22年前 (2015-05-15)回复
  169. #0

    膜拜,一下神人!!!

    zzq2年前 (2015-05-14)回复
  170. #0

    请问,在初分结果中不会出现nr这样的人名词性标注吧?

    victor.zhang2年前 (2015-05-11)回复
    • 词性标注只会在分词结束后进行

      hankcs2年前 (2015-05-12)回复
  171. #0

    您好,请问人民日报2014分词语料库能分享下吗?谢谢

    victor.zhang2年前 (2015-05-11)回复
    • 你好,我没有版权,不能散布。

      hankcs2年前 (2015-05-11)回复
      • 请问什么渠道获取的 可以goum,

        victor.zhang2年前 (2015-05-11)回复
  172. #0

    我是来膜拜女神的,请表介意我的直白和内容的乏营养化

    闹吧别停下2年前 (2015-05-09)回复
  173. #0

    博主,你好,我AMD的本捣鼓苹果系统很久都没成功,看了你的《支持AMD/Intel OS X Mountain Lion 10.8.3 VMware镜像 下载即用》,终于成功了,非常感谢博主!然后,我看到你帖子里的10.9,手痒就下了,但是运行不了,提示:客户机操作系统已禁用 CPU,请关闭或重置虚拟机 请问怎么破?是不是也需要相应的amd-kernel.cmd,我不懂这个,尝试把里面的OS X Mountain Lion.nvram换成OS X Mavericks.nvram,提示:找不到文件-OS X Mavericks.nvram,能帮忙做一个吗?如果可以,就太好了,再次感谢!

    百里石2年前 (2015-05-08)回复
    • 你好,不好意思我已经很久没做这个了。

      hankcs2年前 (2015-05-08)回复
  174. #0

    我也很喜欢日本,目前喜欢上了语言分析,做做玩玩。

    木叶三郎2年前 (2015-04-18)回复
  175. #0

    感觉博主网站的访问量与内容不成正比,可以做一些简单的seo

    jiachao122年前 (2015-04-10)回复
    • 谢谢建议,顺其自然

      hankcs2年前 (2015-04-10)回复
  176. #0

    看到你的介绍,好惭愧

    jiachao122年前 (2015-04-09)回复
  177. #0

    膜拜博主orz……大一菜鸟一枚路过, 搜挑战程序设计题解发现这里的,,居然只是一个个人博客。

    wt2年前 (2015-04-08)回复
  178. #0

    从我的博客的访问记录点到这里,看了下留言,忍不住惭愧。我一cs的研究生,即将入职的码农,对code的兴趣完全不及楼主的万分之一。。。

    yx2年前 (2015-04-07)回复
  179. #0

    欢迎到靠谱课题组读博或者继续修炼。http://nlpr-web.ia.ac.cn/cip/cqzong.htm

    翻译驴2年前 (2015-04-04)回复
    • 感谢指点,您是宗成庆老师的博士生吗?我正在朝这个方向努力,前路漫漫,请前辈多多关照。

      hankcs2年前 (2015-04-04)回复
      • 好久没注意,不好意思。我是这个组的博士生。

        翻译驴2年前 (2015-06-28)回复
  180. #0

    看完楼主的博客,感觉压力好大啊, 做了十年各种端上的程序, 目前30多岁了,想转行做nlp。
    是不是太晚呢。楼主给个建议吧。

    金大为2年前 (2015-03-26)回复
  181. #0

    博主,好厉害呀!我也是语言学背景的NLPer,求指点啊

    木叶飞飞2年前 (2015-03-22)回复
  182. #0

    博主 开放下HMM词性标注的 训练和预测代码吧,好想学习下

    阿黄想太多2年前 (2015-03-12)回复
    • 老板最近非常忙,开源的事情被延后了

      hankcs2年前 (2015-03-13)回复
  183. #0

    博主,下午好啊,祝元宵节快乐

    懿古今2年前 (2015-03-05)回复
  184. #0

    博主佩服佩服···这才发现是一个个人博客。博主加油加油

    想请教博主对于微博爬虫有研究吗?有类似可以直接上手的工具或者代码指导分享供学习一下的吗?

    jimmytzm2年前 (2015-03-04)回复
    • 谢谢。这个没有接触过

      hankcs2年前 (2015-03-08)回复
  185. #0

    hi,楼主HanLP什么时候能开源呢?我想研究下Hmm训练代码

    阿黄想太多2年前 (2015-02-25)回复
    • hi,老板最近忙,推迟了,具体时间未定。

      hankcs2年前 (2015-02-25)回复
  186. #0

    OMG..今天才知道原来这是个个人博客.. 之前一直以为是一群人在维护

    凤凰院有点天真2年前 (2015-02-23)回复
  187. #0

    博主好厉害!窝瞬间被励志了

    2年前 (2015-02-22)回复
  188. #0

    博主有空的话能写一篇 挑战程序设计竞赛 p68的 多重集组合数 那道例题的说明吗?书上的跳跃幅度太大,今天看了一天还是没明白那个递推式是如何转变的。

    奥特曼2年前 (2015-02-13)回复
  189. #0

    现在被 挑战程序设计竞赛 那本书困扰,无意间发现了这里!博主接触计算机多久了啊?很厉害了啊,现在在日本准大二,都一年过去了,除了c语言的一些语法,感觉没什么进步。现在在啃书

    奥特曼2年前 (2015-02-12)回复
    • 《挑战程序设计竞赛》是本好书,不过难度很大,未必适合做算法入门用。我自学有六七年了,不过大部分时间都花在工作生存等琐事上了。语法、语言都是末节,思想才是本质的。你本科能在国外读工科是非常难得的条件,请好好珍惜吧。如果你在东京的话,说不定十月份可以碰到我。

      hankcs2年前 (2015-02-12)回复
  190. #0

    博主让我等码农汗颜

    ddddcccc2年前 (2015-02-07)回复
  191. #0

    哈哈,女校。

    gladuo2年前 (2015-02-06)回复
  192. #0

    女校男生?…

    Willin Wang2年前 (2015-02-06)回复
  193. #0

    你好 请问HanLP地址有吗?另外双数组tire树还是不太明白,能否再举个详细例子呢

    阿黄想太多2年前 (2015-02-04)回复
    • 你好,HanLP将会开源在https://github.com/hankcs/HanLP/ ,什么时候这个地址有效了,什么时候就正式开源了。至于双数组tire树,我建议你单步一下就明白了。

      hankcs2年前 (2015-02-04)回复
      • hi,年前能否开放出来呢 想乘过年时候好好研究下,尤其是HMM训练的代码

        阿黄想太多2年前 (2015-02-11)回复
  194. #0

    你好女王楼主,我把自己实现的DAT以及基于DAT 的AhoCorasick 极速多模式匹配开源了,相互学习学习。
    代码 https://github.com/langzhaozhi/DAT 这是我第一个开源的代码,后面会基于它来做自己的很多东西。

    明月朗照之2年前 (2015-01-19)回复
    • 太棒了,我看了下,比我封装的好,加油!

      hankcs2年前 (2015-01-19)回复
      • 楼主说笑了,不能和你比啊,我也是看了你的算法介绍实现的。

        明月朗照之2年前 (2015-01-27)回复
  195. #0

    。。。。好厉害!!!找日语资料的时候无意中找到这里来的!!又有了一个让自己不堕落的理由。。。嘤嘤嘤!真的好棒!!

  196. #0

    还是在这里留个言吧,博主写的知识都太深。

    夏日博客2年前 (2015-01-13)回复
  197. #0

    女神!!!那篇关于支持AMD的MAC OS虚拟机文章里的“目前最新的OS X Mavericks(10.9版本)VMware镜像 下载地址:百度网盘”能重新补档吗? [太开心] 我还在寻找虚拟机替换内核的方法,因为想用10.10 能指点一下吗?

    智商日天2年前 (2015-01-04)回复
    • 你好,已经被删了,你可以去他们博客上找找看。

      hankcs2年前 (2015-01-04)回复
      • 博客进不去了……需要翻墙吗?

        智商日天2年前 (2015-01-04)回复
        • 哦,他们似乎出问题了,我在另一个网盘找到了,补档完毕。

          hankcs2年前 (2015-01-04)回复
  198. #0

    发现女极客一妹!

    ROSchina2年前 (2015-01-03)回复
  199. #0

    真是大神,码农女神 [挤眼] 。不知道码农女神对机器人开发有兴趣吗?比如ROS.org

    ROSchina2年前 (2015-01-03)回复
    • 过奖了,还未涉及这个领域

      hankcs2年前 (2015-01-03)回复
  200. #0

    希望看到你的HanLP发布,学习下

    DJ2年前 (2014-12-30)回复
  201. #0

    博主你好,我照着你的下载编译WebRTC一文,下载了WebRTC,但是最后提示:ImportError: No mudule named gyp_chromium,生成不了工程文件,不知博主有何建议。我看了下载的目录中是有chromium目录的,下载的目录体积有6.06G。而且我反复试过不下10次,每次都是完全重新下载的,都是提示这个错误。所以我想问下你有没有遇到过这个问题,或者对这个问题有没有什么建议。

    Qin, Tom2年前 (2014-12-27)回复
    • 不好意思,我也没有遇到过,你可以去他们社区问问

      hankcs2年前 (2014-12-27)回复
  202. #0

    在本女校还有如此厉害的大神!学长你成为我偶像了!某学英语却想当码农的妹子留…不知道学长对非专业入门有没有什么建议?

    Lichen2年前 (2014-12-07)回复
    • 学妹说笑了,野路子而已。如果想晚成大器的话,得从C入门然后C++或Java面向对象,内修数据结构算法设计模式,外修操作系统数据库网络,练成软件架构师、算法工程师、系统工程师等。如果时间有限的话,买本HTML、CSS、JavaScript的书,做一名安静的前端工程师也未尝不可~

      hankcs2年前 (2014-12-07)回复
      • 原来是学姐!!太厉害了我觉得我要弯了orz…多谢指点,我大概知道接下来干点啥。以后有问题应该还会来请教的,请多多指教~另外我也喜欢轨迹哈哈,最初还是因为你做的波波碰才知道你

        Lichen2年前 (2015-01-09)回复
        • 太好了,轨迹迷!不用客气,我给你写了邮件。

          hankcs2年前 (2015-01-09)回复
        • 为啥你会觉得是学姐? = = 妥妥的男生吧?

          mafing2年前 (2015-02-26)回复
  203. #0

    博主,无意间发现你的博客,作为一个计算机专业的研究生我好惭愧,你是怎么做到的,业余兴趣也能做这么棒,赞赞赞

    phenix3年前 (2014-11-24)回复
    • 你太谦虚了,我一是兴趣,二是生存,所以花了很多时间。

      hankcs3年前 (2014-11-24)回复
      • 不谦虚,我刚研一,菜鸟一枚,你的个人网站做的很好,萌生了我搭站的想法,可以分享下你的经验吗?

        Phenix3年前 (2014-11-24)回复
        • 先去阿里云租一个月,完成备案,然后用博客申请微博加蓝V,然后用蓝V申请SAE中级开发者,中级开发者每月送一万免费云豆,然后把博客搬到SAE。空手套白狼……

          hankcs3年前 (2014-11-24)回复
          • [威武]

            Phenix3年前 (2014-11-24)
          • 好吧,还可以这样..我正常申请认证各种不通过;之前一直玩SAE,WP,但是站点一塌糊涂(PHP不能),冒昧问句,这个wp是自己改的么?之前找不到很合适的主题,wp都快舍弃转马克飞象了,看了你的博客,还是想把站点好好整一下呀。

            charch2年前 (2015-01-10)
          • 是找了个主题改了改,我对外观要求不高

            hankcs2年前 (2015-01-10)
          • 我已达成此成就2333

            追随你自己的内心2年前 (2015-02-10)
          • 6666666666666666

            cevin2年前 (2015-03-22)
          • 你是如何发现我的= =

            T.S.E.M.P.U2年前 (2015-04-06)
          • 你猜啊 [馋嘴]

            cevin2年前 (2015-04-06)
  204. #0

    日语+码农 这是标准宅到家六。。

    iterator3年前 (2014-11-20)回复
  205. #0

    没想到搜索Clion竟然搜出大神来!!
    博主才华令人赞叹不已!!!

    foreachlich3年前 (2014-11-06)回复
  206. #0

    博主很有意思,也很努力。谢谢你的分享。

    Tina3年前 (2014-10-29)回复
  207. #0

    真的很有用!非常感谢博主!

    buingbuing3年前 (2014-10-28)回复
  208. #0

    弹幕系统具体怎么实时交互 我能请教一下您么

    3年前 (2014-10-27)回复
  209. #0

    楼主 我像知道弹幕现在还能不能用啊!

    3年前 (2014-10-27)回复
    • 不知道,很久没有测试过。

      hankcs3年前 (2014-10-27)回复
  210. #0

    大神,mark一下此站点。

  211. #0

    楼主我是一名计算机专业的学生,看到你的博文之后才发觉自己有多无知,自己有多浮躁,向你学习

    Charlee3年前 (2014-10-12)回复
  212. #0

    非常感谢博主的日语课程分享,帮我不少。真心感谢!

    家有糖果甜心3年前 (2014-09-14)回复
  213. #0

    已经解决了,是我错了。。

    小虎3年前 (2014-09-12)回复
  214. #0

    给跪了,很想看看你的精读课本,是不是笔记很认真?

    中银唐老鸭3年前 (2014-08-31)回复
    • 惭愧,我几乎不用纸质课本

      hankcs3年前 (2014-09-05)回复
  215. #0

    博客做的很棒,内容也不错!

    maoYe3年前 (2014-08-28)回复
  216. #0

    好顶赞,踩一踩。

    Findxiaoxun3年前 (2014-08-14)回复
  217. #0

    楼主毅力不错呢,看你的进度《挑战程序设计竞赛》现在应该是刚看完第三章在刷背后的习题吧!
    这本书我刚开始五天,我也要把每道题思考敲一遍,向你学习下。

    仕成3年前 (2014-08-10)回复
    • 加油,越到后面越难,也不知什么时候能刷完。

      hankcs3年前 (2014-08-10)回复
  218. #0

    搜题解过来的…
    仰慕,以及自愧不如…

    illuz3年前 (2014-08-06)回复
  219. #0

    http://www.tui56.com 站长论坛
    pr4 103000 95000 2年站 续费10年。
    换连接吗朋友?

    王宝臣3年前 (2014-07-29)回复
    • 您好,感谢抬举,小博客不敢高攀盈利性网站。

      hankcs3年前 (2014-07-29)回复
  220. #0

    真佩服博主的毅力。你学习的坚持连我这个计算机专业的人都自愧不如。一般的人只是学来玩玩,没想到你能这么深入。连c++,java都啃。还深入到了算法等应用数学这些高深的东西。真是了不起。看到我要向博主学习了。能不能分享一下您学习的方法?感激不尽!谢谢!

    毅峥明3年前 (2014-07-27)回复
    • 过奖了,我学得比较杂,但是都不深。我也谈不上什么学习方法啦,编程是爱好,打打算法的基本功,一些NLP的模型要用到数学我就学一点,基本上随兴所至吧

      hankcs3年前 (2014-07-27)回复
  221. #0

    这是你自己的网站呀、吓尿了。。。。

    搞笑到冷酷3年前 (2014-07-26)回复
  222. #0

    博主是男是女? 是男为什么读女校? 是女为什么这么geek?想不通求解释

    Jecvay3年前 (2014-07-25)回复
    • 因为好玩啊,男女并不重要~

      hankcs3年前 (2014-07-27)回复
      • 博主大概是上外的吧

        Jerry3年前 (2014-11-05)回复
      • 为了这个我人肉了 [泪] 我一定是太无聊了。给博主点赞,作为科班IT+NLP出生,完全被博主虐杀

        mafing2年前 (2015-02-26)回复
  223. #0

    博主您好!感叹您的才华!
    今有两个问题请教:
    1 在知乎上看到有讲bae不太稳定,不知博主的使用效果如何?目前日ip多少?wordpress开启了哪些耗资源的插件没有?
    2 据说已经备案的网站,当更换空间时需要重新备案,不知是否这样?
    谢谢!

    generalsir3年前 (2014-07-19)回复
    • 不客气
      1、BAE3.0目前稳定,日IP三四百,普通插件抗得住
      2、不是,我在阿里云备的案,之后换过SAE和BAE

      hankcs3年前 (2014-07-20)回复
  224. #0

    经常来逛逛 定有收获,欢迎回访问 DIY博客园 http://www.diybloghome.com

    DIY博客园3年前 (2014-06-18)回复
  225. #0

    hankcs好厉害!!!

    蠢蛋小丑魚3年前 (2014-05-27)回复
  226. #0

    主题名字是啥?

    bob在路上3年前 (2014-05-25)回复
  227. #0

    很漂亮的博客,请问置顶的两个内容是怎么弄的?用什么插件么?谢谢
    516669923@qq.com

    bob在路上3年前 (2014-05-25)回复
    • 主题自带的,前端我也不熟~

      hankcs3年前 (2014-05-25)回复
  228. #0

    好强==,有种饭碗要被抢的紧迫感……

    。。。。。。3年前 (2014-05-19)回复
  229. #0

    楼主很厉害

    zcedar3年前 (2014-03-05)回复
  230. #0

    已将楼主的链接加入到我的wordpress站,来学习学习,最近刚搭成的站 对于读者墙和最近访客,楼主自己写的吗?? 还有,报告一个bug哦,这个评论框是多说的吧,然后,按表情选择的时候,有一部分被掩盖了,右边的分类目录也是……..小小的发现 楼主用一年时间写了这么多文章??

    国货航不想开电脑3年前 (2014-02-15)回复
    • 这个是多说自带的,我对前端一知半解。底部栏的z-index是最高的,其他小一些,感谢反馈 。嘛,不过有滚动条还可以忍受。我的博客导入了2010年以前的文章,所以现在看起来很多的样子。

      hankcs3年前 (2014-02-15)回复
  231. #0

    无意看到楼主的网站,觉得非常好,请教一下,这是用的 WordPress吗?

    zhangt3年前 (2014-02-15)回复
    • 对,Proudly powered by WordPress

      hankcs3年前 (2014-02-15)回复
      • 哦,感谢回复。最近我也想用WordPress搭建一个站,一方面可以查看自己记录的文章,另一方面也可以分享出来引起大家探讨共同进步。请问一下这些布局(包括导航条,以及左右布局)都是WP可以提供的吗,还是说得自己写呢?不知道楼主方不方便告诉我,这个网站的布局是怎么一步一步在WP平台下搭建起来的?

        zhangt3年前 (2014-02-16)回复
        • 当然可以,布局是通过主题实现的,准确来讲是通过CSS控制外观和位置,Php控制内容的。你可以自己写一个主题或者直接改改别人写的现成的,WP中的确有“菜单”“侧边栏”“小工具”的概念,菜单和侧边栏直接用原生的(位置自己控制),小工具继承WP_Widget,WP提供了很多方便的函数,查查官方文档写改一个主题并非难事。

          hankcs3年前 (2014-02-16)回复
  232. #0

    新年快乐!祝楼主和网站越来越强大!

    徐达可3年前 (2014-01-01)回复
  233. #0

    我想问博主何时开始码农的生活的?

    fat3年前 (2013-12-31)回复
    • 这个嘛,拿工资是在今年十月份。

      hankcs3年前 (2014-01-01)回复
      • 好吧,码农兼职这是在哪找的?

        woody3年前 (2014-03-20)回复
        • 学校一位老师推荐的

          hankcs3年前 (2014-03-20)回复
  234. #0

    あの、こんにちは。

    ここではいろいろ勉強になりまして、本当にありがとうございます。

    ちょっと聞きたいですが、今学んででいるのは日本語なの?

    milkkk3年前 (2013-12-31)回复
    • こんにちは。おっしゃるとおりです。実は日本語プラス経済という専門です。

      hankcs3年前 (2013-12-31)回复
  235. #0

    看了一下博主的一些东西,感觉您真是太牛叉了,c++ java php android 算法都有研究,你的这个网站也做得很好,用了很多网站的API接口,你还写过chrome浏览器插件…..一个语言专业能做到这些真的是大神,我还是计算机专业的,比起来真是相差太远。你可不可以写一遍文章来分享一下您的学习经验啊!

    socialmin3年前 (2013-12-19)回复
    • 我这网站都是花里胡哨的皮毛罢了,别人做了这么一套api,我就伸手拿过来用了,用完了也就结束了。平时多看看书(学),做做小项目(用)就能轻松掌握了,花不了多少时间。
      数学(算法)和架构(操作系统底层)才是真正牛叉的东西,这方面我简直弱爆了,现在正在往这方面走,不知道能走多远呢,可能得花一辈子。
      我太水了,没有经验,就说上面几句个人看法吧。

      hankcs3年前 (2013-12-19)回复
      • 说得对。算法方面我也是很欠缺,目前只看了一本数据结构的书,了解广度搜索,深度搜索,递归是怎么调用和返回的。现在我想提高算法方面的能力,请问有什么好的方法或者你就推荐一本书呗

        socialmin3年前 (2013-12-19)回复
        • 没有什么比亲手写一写进步更快了,特别是刷各大OJ趣味十足啊。看书的话,我推荐Sahni《数据结构算法与应用-C++语言描述》,公式少比较具体。不知道你有没有兴趣刷ACM之类,《挑战编程-程序设计竞赛训练手册》和《挑战程序设计竞赛(第2版)》都很有意思。

          hankcs3年前 (2013-12-19)回复
          • 好的,多谢指教

            socialmin3年前 (2013-12-19)
  236. #0

    电气专业菜鸟,断断续续学习编程中。惭愧,向楼主致敬。

    徐达可3年前 (2013-12-19)回复
    • 我很菜,但是觉得专业并不重要,加油!

      hankcs3年前 (2013-12-19)回复
  237. #0

    赶脚很厉害的样子/..

    千寻4年前 (2013-12-08)回复
  238. #0

    瞬间感觉楼主是大神,现在在自学编程,遇到一些不懂就想换个容易的学,很惭愧,努力学吧,黎明的太阳是最好的!

    采姑娘的小蘑菇4年前 (2013-11-26)回复
    • 我只是个浪人罢了,坚持下去吧少年!

      hankcs4年前 (2013-11-26)回复
  239. #0

    我也是一名语言学习者,不过最近才刚刚开始学习,努力成为码农。

    Whatever_Xyz4年前 (2013-11-26)回复
    • 加油共勉!

      hankcs4年前 (2013-11-26)回复
    • 我在台湾学法语。

      Whatever_Xyz4年前 (2013-11-27)回复
      • 法语好,想必你英语也好,可以看计算机外文经典著作了

        hankcs4年前 (2013-11-28)回复
  240. #0

    来坐个沙发~~

    神情话意4年前 (2013-11-24)回复

我的开源项目

HanLP自然语言处理包基于DoubleArrayTrie的Aho Corasick自动机