一、基础概述

1、机器学习开发流程 2、机器学习模型是什么 3、机器学习算法分类

二、需明确问题

（1）算法是核心，数据和计算是基础（2）找准定位

大部分复杂模型的算法设计都是算法工程师在做，而我们要做的是：
1.分析很多的数据
2.分析具体的业务
3.应用常见的算法
4.特征工程、调参数、优化

三、具体要怎样做

学会分析问题，使用机器学习算法的目的，想要算法完成何种任务
掌握算法基本思想，学会对问题用相应的算法解决
学会利用库或者框架解决问题

四、机器学习开发流程

flowchat st=>start: 原始数据 e=>end: 模型应用 op=>operation: 数据特征工程（训练数据和测试数据） op2=>operation: 算法进行学习 op3=>operation: 模型 op4=>operation: 模型评估（测试数据） cond=>condition: 模型选择：判断模型是否合格？ st->op->op2->op3->op4->cond cond(yes)->e cond(no)->op2

graph LR
A(原始数据) -->>B(数据特征工程 即训练数据和测试数据)
B-->>C
C-->>D
D-->>E
E-->>F
F-->>G

4.1机器学习[模型]是什么？

【定义】：通过一种映射关系将输入值到输出值

graph LR A[1.学习特征值及目标值] -- 输入 --> B{0.模型} C[2.被预测特征值] --输入--> B B --预测--> D(3.输出值)

例如：

输入猫、狗、图片，判断它是啥
输入文章，判断它是科技类、还是体育类
输入月票房数据，预测下月票房数据

五、机器学习算法分类

5.1监督学习

【分类】k-近邻算法、贝叶斯分类、决策树与随机森林、逻辑回归、神经网络
【回归】线性回归、岭回归
【标注】隐马尔可夫模型 (不做要求)

【监督学习】（Supervised learning），可以由输入数据中学到或建立一个模型，并依此模式推测新的结果。输入数据是由输入特征值和目标值所组成。函数的输出可以是一个连续的值【称为回归】。或是输出是有限个离散值【称作分类】。

【监督学习特点】： 【监督学习】---(分类、回归)→ 【输入数据有特征有标签，即有标准答案】

5.1.1分类问题

概念：【分类】是监督学习的一个核心问题，在监督学习中，当输出变量取有限个离散值时，预测问题变成为分类问题。最基础的便是二分类问题，即判断是非，从两个类别中选择一个作为预测结果；分类问题：在这里插入图片描述

5.1.2分类学习应用：

分类在于根据其特性将数据“分门别类”，所以在许多领域都有广泛的应用：

在银行业务中，构建一个客户分类模型，按客户按照贷款风险的大小进行分类
图像处理中，分类可以用来检测图像中是否有人脸出现，动物类别等
手写识别中，分类可以用于识别手写的数字
文本分类，这里的文本可以是新闻报道、网页、电子邮件、学术论文 …

5.1.3 回归问题

在这里插入图片描述概念：【回归】是监督学习的另一个重要问题。回归用于预测输入变量和输出变量之间的关系，输出是连续型的值。

5.1.4回归应用

回归在多领域也有广泛的应用：

房价预测，根据某地历史房价数据，进行一个预测
金融信息，每日股票走向 …

5.2无监督学习

【聚类】k-means

【无监督学习】（Supervised learning），可以由输入数据中学到或建立一个模型，并依此模式推测新的结果。输入数据是由输入特征值所组成。

【无监督学习特点】： 【无监督学习】---(聚类)→ 【输入数据有特征无标签，即无标准答案】

5.3习题

说一下它们具体问题类别： 1、预测明天的气温是多少度？ ——回归 2、预测明天是阴、晴还是雨？——分类 3、人脸年龄预测？——回归（多重多元回归） 4、人脸识别？——分类

《机学零》机器学习基础知识