1训练数据,标签
图片分类 人脸识别,
小朋友学习数学,给奖励或者xx
分类(根据结果有多少项):二元分类,多类别分类
回归:
2只有数据,无标签
异常监测
3过程中,与周围环境做互动,得到相应,最终获得奖励
Alphago,自动驾驶
监督学习
公司:客户来电话原因,减少电话转接次数,提高效率,找IT支持 或者退货,或者会计财务相关
回归:而是映射到一个连续值:
回归算法,预测公司股价
无监督学习
只有数据,没有标签,没有监督员
通过算法来创建标签。
聚类典型场景:异常检测
超出边界的
实际上可能出现驾驶员超速
强化学习
汽车需要学习驾驶
代理是虚拟汽车,环境是赛道
-