《机学零》机器学习基础知识

一、基础概述

1、机器学习开发流程 2、机器学习模型是什么 3、机器学习算法分类

二、需明确问题

(1)算法是核心,数据和计算是基础 (2)找准定位

大部分复杂模型的算法设计都是算法工程师在做,而我们要做的是:
1.分析很多的数据
2.分析具体的业务
3.应用常见的算法
4.特征工程、调参数、优化

三、具体要怎样做

  1. 学会分析问题,使用机器学习算法的目的,想要算法完成何种任务
  2. 掌握算法基本思想,学会对问题用相应的算法解决
  3. 学会利用库或者框架解决问题

四、机器学习开发流程

flowchat st=>start: 原始数据 e=>end: 模型应用 op=>operation: 数据特征工程(训练数据和测试数据) op2=>operation: 算法进行学习 op3=>operation: 模型 op4=>operation: 模型评估(测试数据) cond=>condition: 模型选择:判断模型是否合格? st->op->op2->op3->op4->cond cond(yes)->e cond(no)->op2
graph LR
A(原始数据) -->>B(数据特征工程 即训练数据和测试数据)
B-->>C
C-->>D
D-->>E
E-->>F
F-->>G

4.1机器学习[模型]是什么?

【定义】:通过一种映射关系将输入值到输出值

graph LR A[1.学习特征值 及 目标值] -- 输入 --> B{0.模型} C[2.被预测特征值] --输入--> B B --预测--> D(3.输出值)

例如:

  1. 输入猫、狗、图片,判断它是啥
  2. 输入 文章,判断它是科技类、还是体育类
  3. 输入月票房数据,预测下月票房数据

五、机器学习算法分类

5.1监督学习

  • 【分类】k-近邻算法、贝叶斯分类、决策树与随机森林、逻辑回归、神经网络
  • 【回归】 线性回归、岭回归
  • 【标注】 隐马尔可夫模型 (不做要求)

【监督学习】(Supervised learning),可以由输入数据中学到或建立一个模型,并依此模式推测新的结果。输入数据是由输入特征值和目标值所组成。 函数的输出可以是一个连续的值【称为回归】。 或是输出是有限个离散值【称作分类】。

【监督学习特点】: 【监督学习】---(分类、回归)→ 【输入数据有特征有标签,即有标准答案】

5.1.1分类问题

概念:【分类】是监督学习的一个核心问题,在监督学习中,当输出变量取有限个离散值时,预测问题变成为分类问题。最基础的便是二分类问题,即判断是非,从两个类别中选择一个作为预测结果; 分类问题: 在这里插入图片描述

5.1.2分类学习应用:

分类在于根据其特性将数据“分门别类”,所以在许多领域都有广泛的应用:

  • 在银行业务中,构建一个客户分类模型,按客户按照贷款风险的大小进行分类
  • 图像处理中,分类可以用来检测图像中是否有人脸出现,动物类别等
  • 手写识别中,分类可以用于识别手写的数字
  • 文本分类,这里的文本可以是新闻报道、网页、电子邮件、学术论文 …

5.1.3 回归问题

在这里插入图片描述 概念:【回归】是监督学习的另一个重要问题。回归用于预测输入变量和输出变量之间的关系,输出是连续型的值。

5.1.4回归应用

回归在多领域也有广泛的应用:

  • 房价预测,根据某地历史房价数据,进行一个预测
  • 金融信息,每日股票走向 …

5.2无监督学习

  • 【聚类】k-means

【无监督学习】(Supervised learning),可以由输入数据中学到或建立一个模型,并依此模式推测新的结果。输入数据是由输入特征值所组成。

【无监督学习特点】: 【无监督学习】---(聚类)→ 【输入数据有特征无标签,即无标准答案】

5.3习题

说一下它们具体问题类别: 1、预测明天的气温是多少度? ——回归 2、预测明天是阴、晴还是雨?——分类 3、人脸年龄预测?——回归(多重多元回归) 4、人脸识别?——分类

猜你喜欢

转载自www.cnblogs.com/chenxi188/p/11926322.html