一年之计在于春。春天都不看书的话,你还指望自己哪个季节看?四月不翻书,五月就参与不了同行讨论,六月就看不懂行业新闻,七月老板就该让你去财务结账走人了。论大数据人的自我修养:手不释卷。
给你准备了10本免费机器学习和数据科学电子书,就问你,看不看?!
本书单根据内容深度排序,从基础统计学到基础机器学习,再到内容更深入的专著,从具体的话题讨论,到整个行业的分析。这些书中既有数据科学经典读本,也有最近出版的新书,希望你能从中找到感兴趣的阅读材料。
1.《统计思维:程序员的概率与统计学》ThinkStats: Probability and Statistics for Programmers
作者:Allen B. Downey
《统计思维》是针对Python程序员编写的概率和统计学专著。
《统计思维》一书强调利用简单的技术处理实际数据集(real dataset)、回答一些有趣的问题。书中还介绍了对美国国立卫生研究院的案例分析。作者鼓励读者在实际数据集项目中通过实践来学习。
2. 《黑客的概率编程与贝叶斯方法》Probabilistic Programming & BayesianMethods for Hackers
作者:Cam Davidson-Pilon
从计算理解第一、数学第二的角度介绍了贝叶斯方法和概率编程。
贝叶斯方法是推理的自然方法,本书用很多章节详细解释了数学分析过程。一般介绍贝叶斯推理的文本都会用2到3章介绍概率论,然后再介绍什么是贝叶斯推理。
但是由于贝叶斯模型涉及到的数学内容对一般读者来说太困难,所以很多书在介绍贝叶斯模型的时候只会用到简单的、理想化的案例。这其实是让读者对贝叶斯模型理解的误导。
事实上,这本书就是作者避免了上述情形来写的。
3. 《深入理解机器学习:从原理到算法》Understanding Machine Learning: From Theoryto Algorithms
By Shai Shalev-Shwartz and Shai Ben-David
本书为剑桥大学机器学习教材。机器学习是计算机科学领域发展最快的分支之一,其应用具有深远的意义。
本教科书的目的是有条理地介绍机器学习及为读者提供算法范例。本书介绍了机器学习基础知识,并详细解释了将这些原理转化为实际算法的数学推导理论论述。
除了介绍基础知识之外,本书还涵盖了以前教科书无法解决的一系列中心课题,包括讨论学习的计算复杂性,分析了凸度和稳定性的概念,书中介绍的重要的算法范例包括随机梯度下降,神经网络和结构输出学习,同时还介绍了诸如PAC-Bayes方法和基于压缩的边界等新兴理论概念。
4. 《统计学习基础:数据挖掘、统计与预测》The Elements of Statistical Learning
作者:Trevor Hastie, Robert Tibshirani and Jerome Friedman
这本书在普遍概念框架中描述了数据学领域的重要思想。虽然这种方法属于统计学范畴,但本书的重点在于概念而不是数学。
书中列举了许多例子,并大胆的采用色彩丰富的图片。对所有数据科学或行业数据挖掘感兴趣的人来说,这本书都是不可不读的宝贵的资源。
这本书的内容涵盖范围广泛,从监督式学习(预测)到无监督式学习。讨论的话题包括神经网络,支持向量机,分类树,其对boosting算法的讨论更是首创。
5. 《统计学习导论:基于R应用》An Introduction to Statistical Learningwith Applications in R
作者:Gareth James, Daniela Witten, Trevor Hastie and Robert Tibshirani
本书为数据学习方法的导论,面向非数学专业的高年级本科生、硕士和博士研究生。本书还涵盖了大量的R实验,详细解释了在实际生活中如何践行不同的方法,因此对于实践派数据科学家来说是有用的资源。
6. 《数据学基础》Foundations of Data Science
作者:Avrim Blum, John Hopcroft, and Ravindran Kannan
虽然计算机科学的传统领域仍然非常重要,但越来越多的研究人员将使用计算机来了解和提取应用程序中出现的大量数据的可用信息,而不仅仅是利用计算机解决特定的问题。
考虑到这一点,本书在写作中涵盖未来40年中可能会有所应用的理论,正如过去40年里,自动控制原理,算法和相关主题发挥的巨大作用一样。
7. 《写给程序员的数据挖掘实践指南》A Programmer’s Guide to Data Mining: TheAncient Art of the Numerati
作者:Ron Zacharski
本指南遵循循序渐进、逐步学习的原则引导读者阅读。在阅读本书时,作者建议读者通过提供的Python代码来练习和实验。
希望读者能积极参与数据挖掘技术的试用和编程。这本书可以说是给读者提供了手把手辅导,阅读完此书会给读者日后更深入了解数据挖掘技术打下坚实基础。
8. 《大数据:互联网大规模数据挖掘与分布式处理》Mining of Massive Datasets
作者:Jure Leskovec, Anand Rajaraman and Jeff Ullman
本书的编写基于斯坦福大学计算机科学课程“CS246: Mining Massive Datasets”。
这本书和斯坦福的课程一样,是为没有计算机基础的本科学生设计的。为了支持读者进行更深入的探索,大部分章节最后都补充了深度阅读参考资料。
9. 《深度学习》Deep Learning
作者:Ian Goodfellow, Yoshua Bengio and Aaron Courville
《深度学习》这本书旨在帮助学生和从业人员了解机器学习领域,特别是深度学习。
10. 《向往的机器学习》Machine Learning Yearning
作者:吴恩达
人工智能,机器学习和深度学习掀起了众多行业的改革浪潮。但建立机器学习系统之前,你必须做出以下几个具有实际意义的决定:
你还要收集更多的训练数据吗?
你应该采用端对端的深度学习吗?
你打算如何应对训练数据与测试数据机组不匹配的情况?
等等……
以前,要想知道怎么回答这些问题、怎么做出明智决策,你只能回学校去读研究生课程,或者进公司给前辈当学徒。为了改变这种情况,作者写作了此书,帮助读者更好的构建人工智能系统。
注:推荐图书的全部清单,请在灯塔大数据公众号里回复“四月计划 ”即可下载!
本文为专栏文章,来自:融智未来,内容观点不代表本站立场,如若转载请联系专栏作者,本文链接:https://www.afenxi.com/43977.html 。