花书读书笔记（三）-数值计算

其他 2021-01-23 06:40:49 阅读次数: 0

全部笔记的汇总贴：《深度学习》花书-读书笔记汇总贴

《深度学习》PDF免费下载：《深度学习》

一、上溢和下溢

一种极具毁灭性的舍入误差是下溢（underﬂow），当接近零的数被四舍五入为零时发生下溢。另一个极具破坏力的数值错误形式是上溢（overﬂow），当大量级的数被近似为 $\infty$ 或 $-\infty$ 时发生上溢。

必须对上溢和下溢进行数值稳定的一个例子是 softmax 函数（softmax function），softmax 函数经常用于预测与 Multinoulli 分布相关联的概率，定义为 $softmax(x_i)=\frac{\exp(x_i)}{\sum_{j=i}^n\exp(x_j)}$

二、病态条件

条件数表征函数相对于输入的微小变化而变化的快慢程度。输入被轻微扰动而迅速改变的函数对于科学计算来说可能是有问题的，因为输入中的舍入误差可能导致输出的巨大变化。

三、基于梯度的优化方法

我们在负梯度方向上移动可以减小 $f$ 。这被称为最速下降法(method of steepest descent) 或梯度下降（gradient descent）。

Hessian矩阵等价于梯度的 Jacobian 矩阵，对应得点就是对应的特征方向的二阶偏导值。

例如，牛顿法求解（到时候会在学《统计学习方法》的附录时单独讲解）。

四、约束优化

简单来说就是希望在找 $f (x)$ 的最大值或最小值的时候，给 $x$ 添加一些约束。

Karush–Kuhn–Tucker（KKT）方法是针对约束优化非常通用的解决方案。

KKT条件（确定最优点的必要非充分条件）：

广义Lagrangian的梯度为零；

所有关于 $x$ 和KKT乘子的约束都满足；

不等式约束显示的“互补松弛性”： $\alpha\odot h(x)=0$

五、实例：线性最小二乘

直接看课本P85的描述。

下一章传送门：花书读书笔记（四）-机器学习基础

猜你喜欢

转载自blog.csdn.net/qq_41485273/article/details/112755968

花书读书笔记（三）-数值计算

花书读书笔记（十一）-应用

深度学习（花书）读书笔记——第三章-概率与信息论

花书读书笔记（八）-卷积网络

花书读书笔记（七）-深度模型中的优化

花书读书笔记（五）-深度前馈网络

花书读书笔记（四）-机器学习基础

花书读书笔记（二）-概率与信息论

花书读书笔记（十二）-线性因子模型

花书读书笔记（十）-实践方法论

深度学习（花书）读书笔记——第二章-线性代数

深度学习（花书）读书笔记——第五章-机器学习基础

《深度学习》花书-读书笔记汇总贴（汇总8/19）

花书读书笔记（六）-深度学习中的正则化

花书读书笔记（一）-线性代数（奇异值分解、伪逆、PCA）

花书读书笔记（九）-序列建模：循环和递归网络

进化计算读书笔记（三）

松鼠书读书笔记（三）——HTTP连接管理

西瓜书读书笔记（三）-线性模型

读书笔记三

CoreJava读书笔记--大数值

松鼠书读书笔记（七）——HTTPS

松鼠书读书笔记（六）——认证

松鼠书读书笔记（五）——cookie

机器学习（西瓜书）-- 读书笔记

读书笔记：如何选书

JavaScript小红书读书笔记

《机器学习》西瓜书读书笔记

西瓜书读书笔记（一）-绪论

【读书笔记】计算广告

今日推荐

周排行

8种防盗链的方法

php的序列化和反序列化

Java 8：CompletableFuture

Android版本差异适配方案(5.0-9.0)

makedownpad使用

Spring Boot 使用AOP切面实现后台日志管理模块

实战SSM_O2O商铺_44【DES加密】关键配置信息进行DES加密

ACM排行榜说明

【转】SQL重复记录查询

板球和秃子威力那个大

每日归档

更多

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)

2024-09-09(0)

2024-09-08(0)

2024-09-07(0)

2024-09-06(0)