目录
本博客基本概念:训练集、测试集、特征值、监督学习、非监督学习、半监督学习、分类、回归
概念学习:
概念学习是指从有关某个布尔函数的输入输出训练中推断出布尔函数。
概念学习举例子1(教小孩子认识小鸟):
比如你作为父母,教小孩子认识小鸟。
首先看到鸟后,你教他,这是一只小鸟
后来他看到一辆车,你告诉他那不是鸟,他默认鸟应该是在天上飞的
后来他看到一个飞机,他说这是不是鸟,你告诉他那是飞机,他觉得鸟应该是活的
...这一步一步小孩子就认识了鸟是什么,电脑学习过程也是这个过程。
概念学习举例子2(判断小明是否“享受运动”)
概念定义在实例(instance)集合,这个集合表示为X。(X:所有可能,天气、温度、湿度、锋利、水温、预报6个属性)
待学习的概念或目标函数成为目标概念,记作c。c(x)=1,享受运行,c(x)=0,不享受运动,也可以叫做y
x是每一个实例,就是一行所有,包含最后一列信息
X是所有实例的集合
学习目标:f: X-->>Y
概念学习举例子3(美国硅谷房价的学习)
一些基本知识点:
训练集training set(data) /训练样例 training example
训练集testing set(data) /测试样例 testing exemple
特征向量:属性的集合,附属一个实例(比如第一行除了最后的“是”,“晴、暖、普通、强、暖、一样”这就是一个向量)
标记:c(x) ,实例类别的标记
正例和反例
概念有两大分类:
分类:目标标记为类别型数据(样例2,观察最后一列)
回归:目标标记为连续性数值(样例3,观察最后一列)
监督学习的例子:
研究肿瘤是否良性,特征值是:肿瘤尺寸+颜色;标记:良性/恶性
- 有监督学习:训练集有类别标记
- 无监督学习:无类别标记(比如我们并不知道良性还是恶性,只是有特征值数据集)
- 半监督学习:有类别标记的巡礼集+无标记训练集