写在前面:数据挖掘与统计计算笔记合集主要用于作者大学专业课复习自用,内容系本人自理,拒绝未经本人许可用作他用的行为。
参考教材:
课程目录:
第一章:统计学习的基本概念1、统计学习是什么
2、为什么要估计函数f
3、参数和非参数方法
4、预测精确性和模型解释性的trade-off
5、有监督和无监督学习
6、分类和回归
7、如何衡量模型的精确程度(分类模型和回归模型)
8、偏差和方差的trade-off
9、贝叶斯分类器和KNN算法
第二章:线性回归模型1、线性模型的估计、检验、预测问题
2、特殊情形下的调整,非线性数据、残差相关、非常数残差、异常值、高杠杆点、共线性
第三章:分类模型1、逻辑回归的模型假定、参数估计和决策准则
2、LDA和QDA的模型假定、参数估计和决策准则
第四章:重抽样方法1、验证集、留一交叉验证、K折交叉验证的实施过程
2、Bootstrap的用途和具体的实施过程
第五章:线性模型选择和规则化方法1、为什么要模型选择(预测精确性和模型解释性)
2、子集选择、逐步回归的计算步骤
3、岭回归和LASSO回归的计算函数和算法以及差异
4、主成份回归和偏最小二乘的计算过程
第六章:非线性模型1、多项式回归、阶段函数的含义
2、分段多项式函数和回归样条的承接
3、局部回归在线性模型中的应用
第七章:树形方法1、分类回归树对应的最优化问题和计算步骤
2、bagging和random forest方法的实施步骤和差异
3、out-of-bag误差估计和变量重要性的计算方法
第八章:支持向量机1、超平面的含义
2、最大边缘分类器的基本思想和优化问题
3、支持向量分类器的出发点和对应的优化问题
4、核函数的作用
5、为什么高维投射可以解决线性不可分的问题
第九章:无监督方法1、PCA方法的原理
2、层次聚类的计算过程
3、K均值聚类的优化问题和计算方法
4、DBSCAN的主要思想
,Copyright © 2008-2022 秒下下载站
m.down10s.com .All Rights Reserved