损失函数之交叉熵(一般用于分类问题) - 代码天地

损失函数之交叉熵(一般用于分类问题)

其他 2018-11-18 02:38:40 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/u014453898/article/details/81559462

一，交叉熵的原理：

交叉熵是用来衡量两个概率分布的距离(也可以叫差别)。[概率分布：即[0.1，0.5，0.2，0.1，0.1]，每个类别的概率都在0~1，且加起来为1]。

若有两个概率分布p(x)和q(x)，通过q来表示p的交叉熵为：(注意，p和q呼唤位置后，交叉熵是不同的)

$H(p,q)=-\sum p(x)log q(x)$

只要把p作为正确结果(如[0，0，0，1，0，0])，把q作为预测结果(如[0.1，0.1，0.4，0.1，0.2，0.1])，就可以得到两个概率分布的交叉熵了，交叉熵值越低，表示两个概率分布越靠近。

交叉熵计算实例：

假设有一个三分类问题，某个样例的正确答案是(1，0，0)，某个模型经过softmax回归之后的预测答案是(0.5，0.4，0.1)，那么他们的交叉熵为：

$H((1,0,0),(0.5,0.4,0.1))=-(1\times log0.5+0\times log0.4+0\times log0.1)\approx 0.3$

如果另一个模型的预测概率分布为(0.8，0.1，0.1)，则这个预测与真实的交叉熵为：

$H((1,0,0),(0.8,0.1,0.1))=-(1\times log0.8+0\times log0.1+0\times log0.1)\approx 0.1$

由于0.1小于0.3，所以第二个预测结果要由于第一个。

二，使用交叉熵的背景：

通过神经网络解决分类问题时，一般会设置k个输出点，k代表类别的个数，如下图：

每个输出结点，都会输出该结点对应类别的得分，如[cat，dog，car，pedestrian] 为[44，10，22，5]

但是输出结点输出的是得分，而不是概率分布，那么就没有办法用交叉熵来衡量预测结果和真确结果了，那怎么办呢，解决方法是在输出结果后接一层 softmax，softmax的作用就是把输出得分换算为概率分布。

三，用tensorflow实现交叉熵：

在tensorflow中，有交叉熵的接口，由于交叉熵一般会与softmax一起使用，所以tensorflow对这两个功能进行了统一封装。

接口为：

corss_entropy = tf.nn.softmax_cross_entropy_with_logits(labels=y_，logits=y)

其中，y_为标准答案结果，y为网络输出的预测结果。

猜你喜欢

转载自blog.csdn.net/u014453898/article/details/81559462

损失函数之交叉熵(一般用于分类问题)

多分类问题的softmax函数交叉熵损失函数推导

带你一文透彻学习【PyTorch深度学习实践】分篇——多分类问题之交叉熵损失函数CrossEntropyLoss：Softmax分类器，One-hot；针对MNIST数据集 | 附：实例源代码

详解机器学习损失函数之交叉熵

损失函数之均方误差MSE(一般用于回归问题)

交叉熵损失函数（softmax分类器）

交叉熵损失函数

交叉熵--损失函数

谈一谈交叉熵损失函数

机器学习之路：tensorflow 深度学习中分类问题的损失函数交叉熵

分类问题为什么用交叉熵做损失函数

二分类问题的sigmoid交叉熵损失函数推导

pytorch 损失函数(平方损失、二分类损失、交叉熵损失等)

学习笔记8：常用损失函数之交叉熵（Cross Entropy）

tensorflow2.x学习笔记八：tensorflow(keras)损失函数之交叉熵

神经网络多分类任务的损失函数——交叉熵

【交叉熵损失函数】关于交叉熵损失函数的一些理解

损失函数-交叉熵的推导和二分类交叉熵

损失函数之交叉熵

简单的交叉熵损失函数

解剖交叉熵损失函数

交叉熵损失函数(paddle)

简单的交叉熵损失函数，

摘录：交叉熵损失函数

交叉熵损失函数 CrossEntropyLoss

平方损失函数与交叉熵损失函数

损失函数——交叉熵损失函数

损失函数 - 交叉熵损失函数

从熵到交叉熵损失函数的理解

捋一捋二分类和多分类中的交叉熵损失函数

今日推荐

周排行

LRU cache算法

windows10, 自带的OpenSSH, key权限问题, 文件权限问题

测试用例书写方法

HIVE-默认分隔符的（linux系统的特殊字符）查看，输入和修改

最贵的AMD 7nm显卡来了！这设计够狂野

java多线程简单demo

[ 转载 ]在Android系统上使用busybox——最简单的方法

QT connect学习

BFSIFT算法分析

Xcode10：library not found for -lstdc++.6.0.9 临时解决

每日归档

更多

2024-08-06(0)

2024-08-05(0)

2024-08-04(0)

2024-08-03(0)

2024-08-02(0)

2024-08-01(0)

2024-07-31(0)

2024-07-30(0)

2024-07-29(0)

2024-07-28(0)