机器学习的定义
(1) 阿瑟·塞缪尔(1959):
这些研究领域赋予了计算机学习的能力,而无需明确编程。
Fields of study that gives computers the ability to learn without being explicitly programmed.
(2) Tom Mitshell(1998):
计算机程序从经验E中学习,解决某一任务T进行某一性能度量P,通过P测定在T上的表现因经验E而提高。
A computer program is said to learn from experience E with respect to some task T and some performance measure P, if its performance on T, as measured by P, improves with experience E.
机器学习的四大类
(1)监督学习-Supervised learning
如:支持向量机,神经网络
给出数据集合标签,也就是计算机知道每一个数据的结果根据这条数据的正确结果反向传播,从而优化模型。
(2)无监督学习-Unsupervised learning
如:聚类,EM算法
对于每个数据,不给出标签,也就不告诉计算机这条数据的最终的正确结果是什么,让计算机自由学习。
(3) 半监督学习-Semi-Supervised Learning
对一部分数据给出其正确结果的标签,另一部分不给出正确结果的标签,也就是让计算机即做监督学习,有做无监督学习。
(4)强化学习-Reinforcement learning
智能体不断与环境进行交互,通过试错的方式来获得最佳策略。其目的是寻求全局最优解,而不是局部最优解。也就是在每一个数据样本中,我们不告诉计算机学习的结果是不是正确的,但是对于这一个大的应用场景,我们设定了一个评价函数,RL的目的是引导计算机训练模型,以使评价函数最优。
监督学习
监督学习也就是从标记的训练数据推断函数的机器学习任务。监督学习可以进一步分为分类和回归。分类是预测一个标签 (是离散的),回归是预测一个数量 (是连续的)。
Supervised learning can be further divided into classification and regression.