机器学习十大算法（四）逻辑回归（本质，极大似然估计） - 代码天地

机器学习十大算法（四）逻辑回归（本质，极大似然估计）

其他 2018-08-31 20:44:28 阅读次数: 0

概念

假设有一个二分类问题，输出为y∈{0,1}，而线性回归模型产生的预测值为z=wTx+b是实数值，我们想有一个理想的阶跃函数来帮我们实现z值到0,1的转化。

然而该函数不连续，我们希望有一个单调可微的函数来供我们使用，于是遍找到了sigmoid来替代。

两者的图像如下图所示：

有了Sigmoid之后，由于其取值在[0,1]，我们就可以将其视为类1的后验概率p(y=1|x)。说白了，就是如果有了一个测试点x，那么就可以用Sigmoid算出来的结果来当做该点x属于类别1的概率大小。于是，非常自然地，我们把sigmoid计算得到的值大于等于0.5的归为类别1，小于0.5的归为类0.

逻辑回归与自适应线性网络

逻辑回归与自适应线性网络非常相似，两者的区别在于逻辑回归的激活函数为sigmoid，而自适应线性网络的激活函数为y=x，两者的网络结构如下：

1.逻辑回归：

2.自适应线性网路

逻辑回归的代价函数

1.首先模仿线性回归的做法，利用误差平方和来当代价函数。

其中i表示第i个样本点。

我们会发现这是一个非凸函数，这就意味着代价函数有着许多局部最小值，这不利于我们求解。（？？？）

（下图为凸函数与非凸函数）

2. 换一个思路，前面我们提到了ϕ(z)可以视为类1的后验估计，所以我们有

其中，p(y=1|x;w)表示给定w，那么x点y=1的概率大小。

上面两式可以写成一般式：

接下来我们就要用极大似然估计来根据给定的训练集估计出参数w：

为了简化运算，我们对上面这个等式的两边都取一个对数：

我们现在要求的是使得l(w)最大的w。在l(w)加个负号就变成最小的了。

为了理解这个代价函数，我们不妨拿一个例子的来看看：

也就是说：

如下图所示：

从图中不难看出，如果样本的值是1的话，估计值ϕ(z)越接近1付出的代价就越小，反之越大；

同理，如果样本的值是0的话，估计值ϕ(z)越接近0付出的代价就越小，反之越大。

利用梯度下降法求参数

在开始梯度下降之前，sigmoid有一个很好的性质，就是：

ϕ′(z)=ϕ(z)(1−ϕ(z))

还有我们需明确，梯度的负方向就是代价函数下降最快的方向。借助于泰勒展开，我们有：

f(x+δ)−f(x)≈f′(x)⋅δ

其中，f′(x)和δ为向量，那么这两者的内积就等于：

f′(x)⋅δ=||f′(x)||⋅||δ||⋅cosθ

当θ=π时，也就是δ在f′(x)的负方向上时，取得最小值，也就是下降的最快的方向。

下降过程：

其中，wj为第j个特征的权重；η为学习率，用来控制步长。

所以，在使用梯度下降法更新权重时，只要根据下式即可：

当然，在样本量极大的时候，每次更新权重会非常耗费时间，这是可以采用随机梯度下降法，这时每次迭代时需要将样本重新打乱，然后用下式不断更新权重。

也就是去掉了求和，而是针对每个样本点都进行更新。

猜你喜欢

转载自blog.csdn.net/zonglinzonglin/article/details/82025808

机器学习十大算法（四）逻辑回归（本质，极大似然估计）

逻辑回归(logistic regression)的本质——极大似然估计

机器学习笔记——极大似然估计

机器学习--极大似然估计详解

从极大似然估计到EM算法

极大似然估计+EM算法

极大似然估计（MLE）学习总结

学习笔记16：极大似然估计

极大似然估计学习【转载】

机器学习——极大似然估计与贝叶斯估计

机器学习之线性回归极大似然估计法

线性回归逻辑回归and极大似然估计

机器学习算法（1）——极大似然估计与EM算法

极大似然估计--详细解读-逻辑回归的根本

机器学习数学原理——极大似然估计法

机器学习笔记06---极大似然估计

从极大似然估计推导线性回归

MLE极大似然估计和EM最大期望算法

概率模型（一）：极大似然估计与EM算法

机器学习总结：极大似然估计，极大后验概率估计，朴素贝叶斯

机器学习：详解极大似然估计(MLE)与极大后验估计(MAP)

【数理统计】学习笔记03：参数的点估计（矩估计和极大似然估计）

[学习笔记] [机器学习] 11. EM算法（极大似然估计、EM算法实例、极大似然估计取对数的原因）

【机器学习----实验报告】实验二参数估计（极大似然估计）

机器学习--极大似然估计与最大后验概率估计

[转载] 机器学习笔记（VII）线性模型(III)对数几率回归和极大似然估计

机器学习中数学(10)——先验概率,后验概率,似然函数和极大似然估计

贝叶斯参数估计与极大似然估计和EM算法关系

逻辑回归和线性回归,代价函数,交叉熵函数,极大似然估计

机器学习总结(四)：极大似然估计与最小二乘法

今日推荐

周排行

Leetcode简单题61~80

解决zookeeper磁盘IO高的问题

多线程相关方法详解

Maven-setting.xml文件详解

Maven 项目的 classpath 理解

渊亭科技大数据笔试题

配置JVM内存分配

计算机网络个人学习笔记（三）网络层：第三部分连载

js中两个等号(==)和三个等号(===)的区别

用C程序自动打开电脑上的程序

每日归档

更多

2024-09-18(0)

2024-09-17(0)

2024-09-16(0)

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)

2024-09-09(0)