吴恩达机器学习入门笔记1-术语 - 代码天地

吴恩达机器学习入门笔记1-术语

其他 2019-09-19 12:14:30 阅读次数: 0

1 术语

1.1 泛化

学习得到的模型适用于新样本的能力称为泛化能力

1.2 过拟合-关键障碍

学习器能拟合样本所有数据，即把训练样本自身的一些特点当作所有潜在样本的一般性质，导致泛化能力下降的现象。

即假设函数中特征变量过多
只可缓解，无法消除
常见导致因素：学习能力过好

在这里插入图片描述

在这里插入图片描述

1.2.1 解决方法

人为或者利用算法舍去影响程度不高的特征变量
正则化：保留所有特征变量但降低参数大小

1.3 错误率

分类错误样本数占样本总数的比率，==设定样本数少的类别作为正类别==

1.3.1 查准率P(Precision)

机器预测的正结果中用户真正需要的结果所占的比例 eg：判断得癌症人中，真正得癌症的人的比率

1.3.2 查全率/召回率R(Recall)

用户真正需要的结果中机器成功预测结果所占的比例 eg：所有得癌症的人中，能判断出得癌症人的比率

与P互斥

$[外链图片转存失败(img-oaKzvm5x-1568601688891)(E:\Artificial Intelligence Markdown\Machine Learning\pictures\1.3 查准率与召回率.png)]$

1.3.3 权衡查准率与查全率

通过改变判断阈值，高阈值，P高R低；低阈值P低R高

$[外链图片转存失败(img-aXm2LzGs-1568601688892)(E:\Artificial Intelligence Markdown\Machine Learning\pictures\1.3.3 权衡查准率与召回率.png)]$

1.3.4 BEP

查准率与查全率相等时的值

1.3.5 利用调和平均判断基于查准率与查全率算法的好坏

各统计变量倒数算术平均数的倒数。给较低的值更高的权重
\[ \frac{1}{F1}=\frac{1}{2}(\frac{1}{P}+\frac{1}{R})\tag{1.1} \]

\[ F_1=2\frac{PR}{P+R}\tag{1.2} \]

结果恒小于算术平均
\(F_1\in[0,1]\)，越高越好

1.4 卡方分布

标准正态分布的平方

1.5 布尔数据

即逻辑数据类型，取值为0或1

猜你喜欢

转载自www.cnblogs.com/jestland/p/11548440.html

吴恩达机器学习入门笔记1-术语

吴恩达机器学习笔记1-基础

吴恩达机器学习笔记1

机器学习吴恩达笔记（1）

【机器学习】吴恩达机器学习系列笔记（1）

【机器学习】吴恩达学习笔记（1）

机器学习入门---吴恩达视频的简要总结（1）

吴恩达机器学习入门笔记0-复习

吴恩达机器学习入门视频笔记（一）

吴恩达(Andrew Ng)——机器学习笔记1

机器学习吴恩达-线性回归笔记（1）

吴恩达网课笔记1——机器学习策略

吴恩达机器学习笔记1——线性回归

吴恩达机器学习课程笔记1

吴恩达机器学习笔记Day1

吴恩达机器学习 linear_regression笔记(1)

吴恩达机器学习课程笔记1

吴恩达机器学习：编程作业1-单变量线性回归（Python实现）

吴恩达——机器学习1

吴恩达机器学习笔记（一）

吴恩达机器学习笔记（八）

吴恩达机器学习笔记（七）

吴恩达机器学习笔记（六）

吴恩达机器学习笔记（五）

吴恩达机器学习笔记（四）

吴恩达机器学习笔记（三）

吴恩达机器学习笔记（二）

吴恩达机器学习笔记（九）

吴恩达机器学习笔记（十二）

吴恩达机器学习笔记（十一）

今日推荐

周排行

Access的四舍五入取整

8.23 前端学习过程

入门学习过程方向与漏洞复现总结：

操作分布式文件之八：如何批量并行读写远程文件和事务补偿处理

应邀出个教程（搭建tensorflow跑网络环境）

Kubernetes之Pod控制器应用进阶

14-[mysql内置功能]--

HDU6212 区间dp 好题

VS2015生成代码图

验证手机号的工具类

每日归档

更多

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)

2024-10-12(0)