吴恩达机器学习（四）逻辑回归（二分类与多分类）

其他 2018-09-27 09:16:58 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/zhq9695/article/details/82814197

目录

1. 假设函数（Hypothesis）

2. 决策边界（Decision Boundary）

3. 代价函数（Cost Funciton）

4. 梯度下降（Gradient Descent）

5. 逻辑回归实现多分类

6. 其他求解参数的方法

学习完吴恩达老师机器学习课程的逻辑回归，简单的做个笔记。文中部分描述属于个人消化后的理解，仅供参考。

0. 前言

逻辑回归（Logistic Regression），是一种用于二分类（binary classification）的算法。我们可假设：

$y=1$ --- 代表二分类中的正类
$y=0$ --- 代表二分类中的反类

1. 假设函数（Hypothesis）

首先给出一个函数，Sigmoid 函数， $g(z)=\frac{1}{1+e^{-z}}$ ，它的函数图像如下所示：

我们知道，在线性回归算法中，假设函数被定义为 $h_{\theta}(x)=\theta^{T}x$ ，此时假设函数的取值范围可以为 $(-\infty ,\infty)$ 。在二分类中，输出 $y$ 的取值只能为 $0$ 或者 $1$ ，在 $\theta^{T}x$ 之外包裹一层 Sigmoid 函数，使之取值范围属于 $(0,1)$ ，所以给出如下定义：

$\large h_{\theta}(x)=g(\theta^{T}x)=\frac{1}{1+e^{-\theta^{T}x}}=P(y=1 | x;\ \theta)$

例如 $h_{\theta}(x)=0.7$ ，表示有 $70\%$ 的概率 $y=1$ ，表示输入为 $x$ 时， $y=1$ 的概率。

2. 决策边界（Decision Boundary）

根据以上假设函数表示概率，我们可以推得：

$if\ h_{\theta}(x)\geqslant 0.5\ \Rightarrow \ y=1$
$if\ h_{\theta}(x)< 0.5\ \Rightarrow \ y=0$

令 $h_{\theta}(x)=0.5\ \Rightarrow \ \theta^{T}x =0$ ，则 $\theta^{T}x =0$ 为决策边界。如果用图像表示，如下例子：

3. 代价函数（Cost Funciton）

在线性回归中，我们给出定义 $J(\theta)=\frac{1}{2m}\sum_{i=1}^{m}(h_{\theta}(x^{(i)})-y^{(i)})^2$ ，由于它是一个凸函数，所以可用梯度下降直接求解，局部最小值即全局最小值。

但在逻辑回归中， $h_{\theta}(x)$ 是一个复杂的非线性函数，属于非凸函数，直接使用梯度下降会陷入局部最小值中。

根据极大似然估计（Maximum likelihood Estimate），可对代价函数作如下修改：

$\large J(\theta)=\frac{1}{m}\sum_{i=1}^{m}Cost(h_{\theta}(x^{(i)}),y^{(i)})$

$\large Cost(h_{\theta}(x),y)=\left\{\begin{matrix} -log(h_{\theta}(x))\ if\ y=1\\ -log(1-h_{\theta}(x))\ if\ y=0 \end{matrix}\right.$

当 $y=1$ 时，我们对 $Cost(h_{\theta}(x),y)$ 作图如下。易知当 $h_{\theta}(x)\rightarrow 0$ （可判定 $y=0$ ）时，代价是接近无穷大的（因为此时判错），反之亦然。

我们亦可将代价函数写成如下形式：

$\large J(\theta)=-\frac{1}{m}\sum_{i=1}^{m}[y^{(i)}log(h_{\theta}(x^{(i)}))+(1-y^{(i)})log(1-h_{\theta}(x^{(i)}))]$

此时的代价函数是凸函数，可用梯度下降法求全局最优解。

4. 梯度下降（Gradient Descent）

与线性回归一致，梯度下降仍然采用如下公式：

$\large \theta_{j}:=\theta_{j}-\alpha \frac{\partial }{\partial \theta_{j} }J(\theta)$

5. 逻辑回归实现多分类

多分类（multi-classification）是指分类的结果不只两类，而是有多个类别。

逻辑回归本质上是一种二分类的算法，但是可以通过搭建多个二分类器的思想，实现多分类。

针对类别 $A$ ，设 $A$ 为正类，非 $A$ 为反类，搭建二分类器 $h_{\theta}^{(1)}(x)$
针对类别 $B$ ，设 $B$ 为正类，非 $B$ 为反类，搭建二分类器 $h_{\theta}^{(2)}(x)$
针对类别 $C$ ，设 $C$ 为正类，非 $C$ 为反类，搭建二分类器 $h_{\theta}^{(3)}(x)$
........

由于 $h_{\theta}^{(i)}(x)=P(y=i | x;\ \theta)$ ，即求 $max(h_{\theta}^{(i)}(x))$ 时的 $i$ 。

6. 其他求解参数的方法

除了梯度下降外，还有以下求解方法：

共轭梯度法（Conjugate Gradient）
BFGS
L-BFGS

在这些方法中，相比梯度下降，有以下优点和缺点：

不需要主观的选择学习率 $\alpha$ ，算法中的内循环会自动调节
速度更快
算法更复杂

猜你喜欢

转载自blog.csdn.net/zhq9695/article/details/82814197

吴恩达机器学习（四）逻辑回归（二分类与多分类）

吴恩达机器学习（三）逻辑回归 1/2 —— 二分类与多分类

吴恩达《机器学习》学习笔记七——逻辑回归（二分类）代码

吴恩达-机器学习(3)-分类、逻辑回归、多分类、过拟合

吴恩达《机器学习》学习笔记八——逻辑回归（多分类）代码

【吴恩达-深度学习】二分类和logistic回归-学习笔记

吴恩达机器学习 - 逻辑回归——多元分类

吴恩达机器学习 - 逻辑回归——多元分类吴恩达机器学习 - 逻辑回归——多元分类

【吴恩达】机器学习作业 ex3data1 -- 多分类逻辑回归（Python）

【机器学习】吴恩达作业3.0，python实现逻辑回归手写多分类问题

机器学习(7) 逻辑回归：二分类

吴恩达学习笔记（5）--二分类问题

TensorFlow2.0实现逻辑回归二分类，多分类

R语言 | 二分类和多分类的逻辑回归实现

机器学习入门（十）：回归与聚类算法——逻辑回归与二分类

GBDT 回归树二分类多分类

吴恩达机器学习笔记--第三周-1.分类与逻辑回归

吴恩达|机器学习作业3.0.逻辑回归解决多元分类

吴恩达笔记——神经网络基础：二分分类

吴恩达机器学习笔记（四）逻辑回归

吴恩达深度学习笔记(105)-人脸识别之面部验证与二分类

吴恩达-深度学习课程笔记1-2.1 二分类Binary Classification

【吴恩达深度学习专栏】神经网络的编程基础(Basics of Neural Network programming)——二分类

机器学习之逻辑回归实现二分类器

机器学习：用逻辑回归做二分类进行癌症预测

机器学习入门（python实现逻辑回归二分类）

机器学习第七周--二分类算法逻辑回归

吴恩达机器学习个人笔记(二)-逻辑回归

吴恩达机器学习 - 逻辑回归

吴恩达机器学习--逻辑回归

今日推荐

周排行

四大线程池详解

如何高效使用Vim

Mogodb的常用操作总结

Spyder默认页面布局调整

SAR日志分析

OAuth是一个关于授权（authorization）的开放网络标准，在全世界得到广泛应用，目前的版本是2.0版。本文对OAuth 2.0的设计思路和运行流程，做一个简明通俗的解释，主要参考材料为R

WebService中注解开发，CXF，Spring整合，Rest风格

2019考研英语一 Text1分析

windows下安装docker详细步骤

CentOS 7/6系统升级内核版本到5.2.2

每日归档

更多

2024-08-05(0)

2024-08-04(0)

2024-08-03(0)

2024-08-02(0)

2024-08-01(0)

2024-07-31(0)

2024-07-30(0)

2024-07-29(0)

2024-07-28(0)

2024-07-27(0)