这里写自定义目录标题
写在前面
一直都想入门机器学习,但找不到好的视频学习,自己看书一知半解,难以坚持下去,国庆期间刷B站,无意间点开了这个视频,发现老师讲的很好,通俗易懂,适合入门机器学习,决定跟着林老师入门机器学习,加油!!!!
视频地址:https://www.bilibili.com/video/av12463015?from=search&seid=1316649029654829142
整个基石课程分成四个部分:
- When Can Machine Learn?
- Why Can Machine Learn?
- How Can Machine Learn?
- How Can Machine Learn Better?
每个部分由四节课组成,总共有16节课。那么,从这篇开始,我将连续对这门课做课程笔记,共16篇,在巩固自己学习的同时,分享一下学习经历。
下面开始第一节课的笔记:The Learning Problem。
一、What is Machine Learning
什么是“学习”?学习就是人类通过观察、积累经验,掌握某项技能或能力。就好像我们从小学习说话、走路,就是学习的过程。而机器学习(Machine Learning),顾名思义,就是让机器(计算机)也能向人类一样,通过观察大量的数据和训练,发现事物规律,获得某种分析问题、解决问题的能力。
机器学习还可以定义为:Improving some performance measure with experence computed from data 即:从资料出发,经过电脑的计算之后,最终得到某一种表现的增进。
什么情况下会使用机器学习来解决问题呢?其实,目前机器学习的应用非常广泛,基本上任何场合都能够看到它的身影。其应用场合大致可归纳为三个条件:
- 事物本身存在某种潜在规律
- 某些问题难以使用普通编程解决
- 有大量的数据样本可供使用
二、Applications of Machine Learning
在我们的衣、食、住、行、教育、娱乐等各个方面都有着机器学习的身影,可以说机器学习无处不在。比如,打开淘宝时,在首页就会给我们自动推荐我们可能会喜欢的商品;电影频道会根据用户的浏览记录和观影记录,向不同用户推荐他们可能喜欢的电影等等,到处都有机器学习的影子。
三、Components of Machine Learning
有关机器学习问题应该注意的一些基本的术语:
- 输入x
- 输出y
- 目标函数f,即最接近实际样本分布的规律
- 训练样本data
- 假设hypothesis,一个机器学习模型对应了很多不同的hypothesis,通过演算法A,选择一个最佳的hypothesis对应的函数称为矩g,g能最好地表示事物的内在规律,也是我们最终想要得到的模型表达式。
机器学习的流程:
对于未知的目标函数f,存在一些训练样本D,假设是监督式学习,其中有输入x,也有输出y。机器学习的过程,就是根据先验知识选择模型,该模型对应的hypothesis set(用H表示),H中包含了许多不同的hypothesis,通过学习算法A,在训练样本D上进行训练,选择出一个最好的hypothes,对应的函数表达式g就是我们最终要求的。一般情况下,g能最接近目标函数f,这样,机器学习的整个流程就完成了。
机器学习更具体的定义:
四、Machine Learning and Other Fields
机器学习的相关领域:
- 数据挖掘(Data Mining)
- 人工智能(Artificial Intelligence)
- 统计
五、总结
思维导图:
这里附上本节课的课件:https://www.csie.ntu.edu.tw/~htlin/course/mlfound17fall/doc/01_handout.pdf
注意:
本文的所有截图均来自台湾大学林轩田《机器学习基石》课程。