学习笔记一:机器学习的基本概念

算法选择原则:

机器学习需要预测目标变量值,选择监督学习算法;否则,选择无监督学习算法。监督学习算法中,目标变量值为离散值,选用分类算法;目标变量值为连续的数值,选用回归。无监督学习算法中,若只需将数据划分为离散的租,则采用聚类算法;若还需估计数据与各个分组的相似程度,需要使用密度估计算法。

算法选择的关键是:反复试错的迭代过程。

学习数据:

要了解数据:特征值是离散变量还是连续变量;特征值中是否存在缺失;何种原因导致缺失;数据是否存在异常;某个特征发生的频率如何。

机器学习的基本步骤:

(1)收集数据;(2)分析数据;(3)训练算法;(4)测试算法;(5)使用算法。



猜你喜欢

转载自blog.csdn.net/horserunningnostop/article/details/80016076