《机器学习》(蒋三新老师)课程笔记

持续更新……




更新2018.5.8周二晚   “决策树”

参考文章:

【机器学习】决策树(上)——从原理到算法实现

【机器学习】决策树(下)——CART算法及剪枝处理

数据挖掘十大算法之CART详解

开发者自述:我是如何理解决策树的



基本概念

描述概念空间(描述分类过程的一种数据结构),ID3算法……

发展历史:

84年:CART(分类回归树?)

    分类树:预测输入的类型;

    衰退树:预测输入的实数值(如房价,住宿天数)

86年:ID3改进——ID4

88:ID4——ID5

93:C4.5

本质——无论何种决策树算法,都为构造一棵熵值(信息熵条件熵信息熵相关的分类问题信息增益)下降的…

产生:


    



周二晚——“信息融合技术”课程笔记。

隐含的(数学)原理在数量上的显式表现:

统计学方法概述:

    传统:渐进理论

三阶段:1.搜集数据,采样与实验设计;2.分析数据,;3.进行推理,预测&分类

概率论 ——统计方法:回归分析,判别分析,聚类分析,探索性分析


svm:

    基于统计学习理论的机器学习方法,具有完备的数学基础在COLT-92上首次提出,

比较:1.机器学习——主要依靠模型、数据训练,如何在数学上证明其的收敛性(有效性)?2.神经网络——“凭经验调参数?”

研究重点:核函数

    分类问题:线性可分,近似线性可分,线性不可分,


统计学习理论:小样本,预测学习

eg.函数估计模型

   

  基本概念: 产生器generate,训练器supervisor(train set),学习机learning machine(范数在其中的应用),  期望风险;经验风险;

V/C维(vapnik-chervonenkis,dimension):

过学习(过拟合,overfitting(underfitting,goof tit)):一般的学习方法(神经网络)基于期望风险()最小

最大间隔法的直观导出:

学习理论的四个部分:一致性理论,


线性分类器;分类超平面;最大间隔原则

分类问题的数学表示:

分类学习方法:分类学习机——最优分类——约束优化


课间问题:

1.机器学习与深度学习的关系?

2.硬件与人工智能的关系?

3.课程框架?

4.……


2018.2.24.周二晚


近似线性可分问题:惩罚参数→目标函数

(广义)线性支持向量计算法(简单易学的机器学习算法——线性支持向量机):四个步骤1.训练集;2.选择适当的惩罚参数c,构造并求解二次规划问题;3.

非线性分类:最优化问题的求解


   
   
   


机器学习

(自己整理的关于机器学习的很好的资料)

什么是机器学习(知乎问题)

机器学习入门好文,强烈推荐()

学习路线(机器学习、深度学习、python)

机器学习十大算法

三张图读懂机器学习:基本概念、五大流派与九种常见算法


吴恩达:机器学习在线课程(斯坦福公开课)

机器学习精简入门教程(GitHub贴出的,非常棒的笔记!)

机器学习的数学基础(黄海广,公益性的关于机器学习的网站)


吴恩达老师的机器学习课程个人笔记(黄海广)

deeplearning.ai(吴恩达老师的深度学习课程笔记及资源)(黄海广)

机器学习笔记作者:子实

机器学习笔记(作者,李金)

机器学习相关教程 Python tutorial 周沫凡, 莫烦Python


Machine Learning in Action(机器学习实战)ApacheCN 简介: 专注于优秀项目维护的开源组织










猜你喜欢

转载自blog.csdn.net/weixin_41852866/article/details/79978800