放牧代码和思想
专注自然语言处理、机器学习算法
    愛しさ 優しさ すべて投げ出してもいい

机器学习入门书单

NLP之后,我又开了ML这个大坑。这是因为NLP涉及到太多的ML模型,仅仅拿过来用的话,我实现的HanLP已经快到个人极限了。而模型背后的原理、如何优化、如何并行化等问题,都需要寻根求源才能解决。

所以我找了个书单自学,电子书为主,顺便分享出来。

ML书单
│  李航.统计学习方法.pdf
│  机器学习及其应用.pdf
│  All of Statistics - A Concise Course in Statistical Inference - Larry Wasserman - Springer.pdf
│  Machine Learning - Tom Mitchell.pdf
│  PRML.pdf
│  PRML读书会合集打印版.pdf
│  Programming Collective Intelligence.pdf
│  [奥莱理] Machine Learning for Hackers.pdf
│  [机器学习]Tom.Mitchell.pdf
│  《大数据:互联网大规模数据挖掘与分布式处理》迷你书.pdf
│  推荐系统实践.pdf
│  数据挖掘-实用机器学习技术(中文第二版).pdf
│  数据挖掘_概念与技术.pdf
│  机器学习-Mitchell-中文-清晰版.pdf
│  机器学习导论.pdf
│  模式分类第二版中文版Duda.pdf(全).pdf
│  深入搜索引擎--海量信息的压缩、索引和查询.pdf
│  矩阵分析.美国 Roger.A.Horn.扫描版.pdf
│  统计学习基础 数据挖掘、推理与预测.pdf
│  
├─机器学习实战
│      machinelearninginaction.zip
│      机器学习实战 单页.pdf
│      机器学习实战.pdf
│      
└─论文文集
    └─LDA
            LDA-wangyi.pdf
            LDA数学八卦.pdf
            text-est.pdf

下载地址:百度网盘

现在正在看《统计学习方法》,边看便用Python实现。再用Matplotlib可视化,简直太完美了,比如kd树的构建算法:

以前也看过《机器学习实战》,不过感觉偏应用,原理没讲清楚,所以中断了。再往前面看过的《智能Web算法》也是偏应用的,过了一遍之后收获也不大。至于一些兜售“XX学习班”的博客,也就采集网上零落的博文,贴一些公式和理论甚至是戏说的程度。大部分博主都挑自己擅长的讲,挑自己容易找到的抄,这样导致网上公开的都是些千篇一律的浅显东西,只能看着玩,当不得真。至于代码,更不用想了。

感觉要入门,还是得从业界经典入门,那些“实战XXX”的书只能画个葫芦,然后读者只能画个瓢。

不是说网上大部分的机器学习教程都是这样的吗:

所以说还是得从原理开始打基础吧。

上面的书单是我这个外行搜集大家推荐次数比较多的书凑起来的,只是个人书单,不保证质量。这个书单应该会不断补充(话说回来,要是能都看完估计也很了得了),如果路过的各路高人有任何建议的话,恳请留言指点迷津。

使用电子书的形式是因为,个人偏好。即使我买了实体书,一旦找到了电子书,我马上就会把纸质书扔到床底下。如果侵犯了任何人的权益,烦请及时通知。

至于何时填完这些坑,生命不息,奋斗不止吧。

知识共享许可协议 知识共享署名-非商业性使用-相同方式共享码农场 » 机器学习入门书单

评论 41

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址
  1. #26

    您好!文章中的百度网盘链接挂了
    麻烦大神更新一下~!

    Akex2年前 (2022-10-30)回复
  2. #25

    网盘挂了,恳请更新一下,感谢!

    Bonnie5年前 (2020-06-10)回复
  3. #24

    好想知道后面博主看了几本

    million5年前 (2019-10-10)回复
  4. #23

    网盘挂了,烦请hankcs挂一下,谢谢,感恩!

    鱼一6年前 (2019-05-07)回复
  5. #22

    大神,你有实现统计学习方法的算法吗?看本文有kdd实现,有github吗?学习一下~

    fighter7年前 (2018-01-16)回复
  6. #21

    期待博主的不断更新!

    Timer7年前 (2018-01-06)回复
  7. #20

    博主太厉害了!对我们这些刚入门机器学习的人帮助很大,谢谢博主!!!

    mncTQJ7年前 (2017-09-21)回复
  8. #19

    其实个人认为还是可以从上而下学习的,毕竟像我们这些有工作任务再身的普通程序员哪里来的那么多时间从高等数学学起。。。我现在把python的numpy,pandas,matplotlib,scikit-learn库都浅学了一遍,简单的数据我已经能处理了,直接扔进模型里面就行,虽然我不知道里面发生了什么事,这个要以后有时间再回头看数学慢慢学,就像先学开车再学汽车的原理一样,虽然不懂汽车原理不能成为一个赛车手,但是当一名司机,应付日常工作还是可以的,要是有雄心以后慢慢学数学也不迟。

    sherlock7年前 (2017-09-07)回复
    • 其实你可以直接方法的原始实现去理解和熟悉理论。这样子比单纯只用函数比较好一些;

      shr1237年前 (2017-10-23)回复
  9. #18

    真是业界良心啊

    秋秋8年前 (2017-07-12)回复
  10. #17

    博主,机器学习那些理论强一点。小小android程序员,自学一下。

    伊尹8年前 (2017-04-10)回复
  11. #16

    https://zhuanlan.zhihu.com/p/26197266 知乎上有人未注明作者就转载这篇文章,还删除了几位用户的提醒评论。觉得原作者需要知道一下。

    simoncos8年前 (2017-04-07)回复
    • 感谢提醒,确认公众号 @隐剑鬼吊 未经授权剽窃我的博文牟利,并且不注明来源链接,还无耻地删除了读者评论,行为卑劣。我已向 @知乎版权 投诉,请大家不要再关注此垃圾公众号,谢谢!

      hankcs8年前 (2017-04-07)回复
  12. #15

    谢谢博主

    t't8年前 (2017-03-22)回复
  13. #14

    我曹,业界良心啊

    苏光国8年前 (2016-12-23)回复
  14. #13

    感谢博主的分享。博主可不可以分享一下自己学习机器学习相关知识的前修数学知识的经历或参考书目,给初学者指指路呢?目前自己在学习线性代数的阶段,想问除了线代和概率论之外还需要哪些数学知识,博主自己在学习的过程中遇到过哪些坑?Thanks in advance!

    苹苹橙8年前 (2016-11-15)回复
    • 不成熟的一点看法:数学基础的话,一般高等数学和线性代数基础就够了;最好加上博主书单里的矩阵分析,理解一下矩阵。在加上李航的《统计学习方法》。其中不懂的就要自己查了。如果有余力的话,多看看凸优化的书。

      shr1237年前 (2017-10-23)回复
  15. #12

    楼主可以稍微介绍一下这些书单中,哪些更推荐,或者建议一下看书的顺序吗?一打开很茫然啊,谢谢

    刘刘刘刘ying爱sun8年前 (2016-10-18)回复
  16. #11

    百度网盘已挂,还请博主补一下,谢谢

    joln8年前 (2016-08-05)回复
  17. #10

    请问下Kd tree的图使用什么工具画出来的?

    程序员小王9年前 (2016-03-24)回复
  18. #9

    楼主很棒

    bibi9年前 (2016-03-09)回复
  19. #8

    那个猫头鹰的图太生动形象了。

    木兰减字调9年前 (2016-03-07)回复
  20. #7

    谢谢博主,链接很全 :)

    cppup9年前 (2016-02-15)回复
  21. #6

    谢谢博主分享~~~ 已经开始看了 再次感谢!

    misakaikato9年前 (2016-01-13)回复
  22. #5

    tks

    test9年前 (2015-11-12)回复
  23. #4

    网盘的链接不存在了,楼主可以再分享一下吗?谢谢了

    墨翎10年前 (2015-07-13)回复
  24. #3

    感谢楼主分享

    如鱼得水10年前 (2015-05-29)回复
  25. #2

    快来啊,发现一只野生NLP大神!

    white ink10年前 (2015-03-11)回复
  26. #1

    很赞,很不错

    mafing10年前 (2015-02-26)回复

我的作品

HanLP自然语言处理包《自然语言处理入门》