转载自程序员书库机器学习算是一个交叉领域,他涉及统计、概率、计算机科学和算法等方面,近几年机器学习发展快速,有人就想要入门学习数据科学领域,使用机器学习(ML)技术创造产品,但是想要很好的掌握其内部的工作原理和算法,有个坚固的数学基础是很有必要的。
为什么说数学很重要?
机器学习的数学之所以很重要,原因有很多,主要包括以下方面:
机器学习需要选择正确的算法,包括训练时间、模型复杂度、参数个数等
选择参数的设置和验证策略
通过理解偏差-方差权衡,识别欠拟合和过拟合
估计正确的置信区间和不确定性。
你需要什么数学水平?
当试图理解像机器学习这样的跨学科领域时,主要的问题是理解这些技术所需的数学知识量和自身的数学水平。
宾夕法尼亚大学计算机和信息科学系教授 Jean Gallier 的开源了一本书籍《Algebra, Topology, Differential Calculus, and Optimization Theory For Computer Science and Engineering》,用了1900页的内容,为读者讲解计算机科学所需的线性代数、微分和最优化理论等问题,这些内容对你深入学习机器学习帮助非常大。
这本书和其他的PDF资料不同,他们更像是作者的个人笔记,目的是帮助读者巩固相关知识,如果你读完这本书,就等同于将大学本科三年的数学课程学完了,而是是适用于CS的数学知识
内容涵盖微积分、线性代数、最优化理论、拓扑等知识,不过,令人纳闷的是,这本书竟然没有概率论这一部分的知识,主要分为10大模块:
1. 线性代数
2. 仿射几何和射影几何
3. 双线性形式的几何
4. 几何:PID、UFD、诺特环、张量、PID 上的模块、规范形
5. 拓扑和微分
6. 最优化理论基础
7. 线性优化
8. 非线性优化
9. 在机器学习中的应用
10. 附录
Jean Gallier教授会在每个知识点前面做一个概括性的总结,让读者对接下来的内容有个心理准备,比如,前面四个章节主要回顾基本的代数结构(群、环、域、向量空间),线性代数的基本概念,如向量空间、子空间、线性组合、线性无关等。讨论了对偶空间、超平面、线性映射等问题。
以下是本书的目录截图:
关于作者
Jean Gallier是宾夕法尼亚大学的教授,拥有法国和美国双国籍,1978年取得博士后学位就从事于计算机领域工作,发表过许多研究论文和书籍,其中《Computational geometry》、《Low-dimensional topology》、《Discrete mathematics》、《Discrete mathematics》等书籍的作者就是Jean Gallier
Jean Gallier有一个个人主页,在上面可以找到他曾经发表过的研究论文和书籍,大部分都可以免费下载。
书籍地址:
www.cis.upenn.edu/~jean/math-basics.pdf
转载自程序员书库