《机器学习》（蒋三新老师）课程笔记

持续更新……

更新2018.5.8周二晚 “决策树”

参考文章：

【机器学习】决策树（上）——从原理到算法实现

【机器学习】决策树（下）——CART算法及剪枝处理

数据挖掘十大算法之CART详解

开发者自述：我是如何理解决策树的

基本概念

描述概念空间（描述分类过程的一种数据结构），ID3算法……

发展历史：

84年：CART（分类回归树？）

分类树：预测输入的类型；

衰退树：预测输入的实数值（如房价，住宿天数）

86年：ID3改进——ID4

88：ID4——ID5

93：C4.5

本质——无论何种决策树算法，都为构造一棵熵值（信息熵，条件熵，信息熵相关的分类问题，信息增益）下降的…

产生：

周二晚——“信息融合技术”课程笔记。

隐含的（数学）原理在数量上的显式表现:

统计学方法概述：

传统：渐进理论

三阶段：1.搜集数据，采样与实验设计；2.分析数据，；3.进行推理，预测&分类

概率论 ——统计方法：回归分析，判别分析，聚类分析，探索性分析

svm：

基于统计学习理论的机器学习方法，具有完备的数学基础在COLT-92上首次提出，

比较：1.机器学习——主要依靠模型、数据训练，如何在数学上证明其的收敛性（有效性）？2.神经网络——“凭经验调参数？”

研究重点：核函数

分类问题：线性可分，近似线性可分，线性不可分，

统计学习理论：小样本，预测学习

eg.函数估计模型

基本概念：产生器generate，训练器supervisor（train set），学习机learning machine（范数在其中的应用），期望风险；经验风险；

V/C维（vapnik-chervonenkis，dimension）:

过学习（过拟合，overfitting（underfitting,goof tit））：一般的学习方法（神经网络）基于期望风险（）最小

最大间隔法的直观导出：

学习理论的四个部分：一致性理论，

线性分类器；分类超平面；最大间隔原则

分类问题的数学表示：

分类学习方法：分类学习机——最优分类——约束优化

课间问题：

1.机器学习与深度学习的关系？

2.硬件与人工智能的关系？

3.课程框架？

4.……

2018.2.24.周二晚

近似线性可分问题：惩罚参数→目标函数

（广义）线性支持向量计算法（简单易学的机器学习算法——线性支持向量机）：四个步骤1.训练集；2.选择适当的惩罚参数c，构造并求解二次规划问题；3.

非线性分类：最优化问题的求解

机器学习

（自己整理的关于机器学习的很好的资料）

什么是机器学习（知乎问题）

机器学习入门好文，强烈推荐（）

学习路线（机器学习、深度学习、python）

机器学习十大算法

三张图读懂机器学习：基本概念、五大流派与九种常见算法

吴恩达：机器学习在线课程（斯坦福公开课）

机器学习精简入门教程（GitHub贴出的，非常棒的笔记！）

机器学习的数学基础（黄海广，公益性的关于机器学习的网站）

吴恩达老师的机器学习课程个人笔记（黄海广）

deeplearning.ai（吴恩达老师的深度学习课程笔记及资源）（黄海广）

机器学习笔记（作者：子实）

机器学习笔记（作者，李金）

机器学习相关教程 Python tutorial（周沫凡, 莫烦Python）