《机器学习》自学笔记,大概每天看10页,博客将按章节分类,当成是对自己的监督 :D
Chapter 1 绪论
1.机器学习研究内容:
研究如何通过计算的方式,利用经验改善系统自身的性能;也即研究在计算机上从数据中产生模型(model)的“学习算法”。
2.数据相关的一些概念:
(1)数据集(data set): 一组记录的集合,如{色泽 = 青绿;根蒂 = 蜷缩; 响声 = 清脆} {色泽 = 青黄;根蒂 = 微蜷;响声 = 浊 响}..........
(2) 样本(sample)/示例(instance): 上面的一条记录即为对一个事件或对象的描述,也可称坐一个特征向量(feature vector )
(3) 属性(attribute)/特征(feature): 事件或对象在某方面的表现或性质,如上述“色泽”
(4) 属性空间/样本空间/输入空间:属性张成的空间
3.学习任务分类:
(1) 分类(classification):想要预测的是离散值,如“好瓜” “坏瓜”
(2) 回归(regression):想要预测的是连续值,如西瓜的含糖率