监督式学习、无监督式学习、无监督式学习 --概念区分

机器学习可以分为:
监督式学习:有标签。给出定义好的标签,程序「学习」标签和数据之间的映射关系
无监督式学习:无标签
半监督式学习:少量有标签+大量无标签

1、监督式学习(Supervised learning)

理解1:监督式学习是拥有一个输入变量(自变量)和一个输出变量(因变量),使用某种算法去学习从输入到输出之间的映射函数。目标是得到足够好的近似映射函数,当输入新的变量时可以以此预测输出变量。
(算法从数据集学习的过程可被看作一名教师在监督学习,so称:监督式学习。监督式学习 分为 分类(输出类别标签)和回归(输出连续值)问题。)

理解2:根据输入-输出样本对L={(x1,y1),···,(xl,yl)}学习输入到输出的映射f:X->Y,来预测测试样例的输出值。SL包括分类(Classification)和回归(Regression)两类任务,分类中的样例xi∈Rm(输入空间),类标签yi∈{c1,c2,···,cc},cj∈N;回归中的输入xi∈Rm,输出yi∈R(输出空间)。

理解3: 监督学习针对的是带标签的训练集,根据标签的离散/连续,监督学习又分为分类/回归。我们定义样本集合为X,与X中样本一一对应的标签组成的集合记为Y,令image.png表示样本和标签服从的联合分布(未知),监督学习的任务就是训练一个方程image.png,使得f(x)可以预测出x的真实标签。

2、无监督式学习(Unsupervised learning)

理解1:无监督式学习指的是只有输入变量没有相关的输出变量
目标是对数据中潜在的结构和分布建模,以便对数据做进一步的学习。相比于监督式学习,无监督式没有确切的答案和学习过程也没有监督,算法独自运行发现和表达数据中的结构。无监督式学习 分为 聚类问题(在数据中发现内在的分组)和 关联问题(数据的各部分之间的关联和规则)。

理解2: 利用无类标签的样例U={x1,···,xn}所包含的信息学习其对应的类标签Yu=[y1···yn]T,由学习到的类标签信息把样例划分到不同的簇(Clustering)或找到高维输入数据的低维结构。UL包括聚类(Clistering)和降维(Dimensionality Reduction)两类任务。

理解3:无监督学习的特点是训练样本无标签,它通常可以分为以下几个任务:

聚类,即将样本分到不同的组,使一个组中的样本尽量相似,不同组间的样本尽量不相似;
异常检测,即检测出少量偏离主体的样本(离群点);
维度归约:在高维样本中很多维度对学习的作用不大而且会减弱关键维度的作用,而且,在高维空间中,相似和不相似的样本之间的距离不好区分,所以降维十分关键;

3、半监督式学习(Semi-Supervised Learning,SSL)

半监督式学习是一种监督式学习与非监督式学习相结合的一种学习方法。拥有大部分的无标签数据(自变量)和少部分的有标签数据(因变量)。半监督分类的任务就是训练一个分类器 f,这个分类器的表现比只用有标签数据训练得到的分类器好
换种通俗说法:先用有标签的数据 训练模型,再用此模型给无标签的数据打上标签。

参考资料:
https://www.cnblogs.com/PJQOOO/p/11724809.html
https://blog.csdn.net/jiusake/article/details/80016171

猜你喜欢

转载自blog.csdn.net/xiaoyue_/article/details/105104915
今日推荐