人工智能学习笔记-什么是机器学习

什么是机器学习

1.1 机器学习的本质

1.2机器学习VS 专家规则

1.3. 机器学习基本原理

1.4. 机器学习的类别

1.1. 本质

   根据历史看到的样本,总结规律。

1.2. 机器学习 VS 专家规则

机器学VS 专家规则

 

机器学习

专家规则

说明

样本

全量样本

抽样样本

(优点:最少数据获得最多信息 
    缺点:很难做到绝对随机,随机采样的误差不好控制)

 

规律

海量规则 
微观级的事物描述(10e9-10e12)

(特征更多,规律更精细)

几百条规则 
特征数量有限(10e2-10e3)

规则: 
根据特征(属性)对样本分类

特征的多少决定了分类的个数

总结

机器总结

(能够看海量样本,总结海量规则的核心原因)

专家总结

 
 

收纳尽可能多的数据,挖掘长尾价值

选取最有效的数据,发挥头部价值

 

1.3. 机器学习基本原理

定义一个损失函数(错误率),尝试所有的划分方法,取损失函数最小的划分方法。

 

举例说明:Linear Regression(单变量线性回归)

步骤

函数

含义

公式

说明

1

假设函数
Hypothesis Function

模型

 

x是特征

2

损失函数
Loss Function

衡量预测值和真实值的差距

 

求解θ0θ1
使得对于训练样例(x,y)
hθ(x)hθ(x)接近”y

3

梯度下降法

 

找到损失函数的局部极小值点

 

 

 

实际问题

问题

解决方法

穷举划分方法,导致计算量太大

Mini batch 
剪枝

过拟合

正则惩罚

1.4. 机器学习的类别

图片来自于:https://morvanzhou.github.io/tutorials/machine-learning/sklearn/

如上图所示,机器学习的类别,可以划分为几部分。

   

特点

类别

机器学习

监督学习

有标签(Label)

分类(Classification)

预测明天会不会下雨

 

回归(Regression)

通过房屋面积预测房价

无监督学习

无标签(Label)

聚类(Clustering)

已知学生出勤率和作业质量,为学生聚类

得到结果,把学生分类几类

 

降维(Dimensionality Reduction)

 

强化学习

计算机在环境给予的奖励或惩罚的刺激下,逐步形成对刺激的预期,产生能获得最大利益的行为。

简单监督神经网络: 快棋手

复杂监督神经网络: 慢棋手

强化学习神经网络:左右互博,最大化最后的奖励

 

猜你喜欢

转载自blog.csdn.net/hualusiyu/article/details/85012288