自然语言处理 —— 困惑度 - 代码天地

自然语言处理 —— 困惑度

其他 2020-02-21 20:58:31 阅读次数: 0

我们通常用困惑度（perplexity）来评估语言模型的好坏。可以探索一下交叉熵损失函数的定义。困惑度是对交叉熵损失函数做指数运算后得到的值。特别地：

最佳情况下，模型总是把标签类别的概率预测为1，此时困惑度为1；
最坏情况下，模型总是把标签类别的概率预测为0，此时困惑度为正无穷；
基线情况下，模型总是把预测所有类别的概率都相同，此时困惑度为类别个数。

显然，任何一个有效模型的困惑度必须小于类别个数。

假定交叉熵损失函数为： $H(y^{(i)},\hat{y}^{(i)})=-\sum_{j=1}^qy_j^{(i)}log\hat{y}_j^{(i)}$ 困惑度计算公式为 $per = e^{H(y^{(i)},\hat{y}^{(i)})}$ 在最佳情况下， $H(y^{(i)},\hat{y}^{(i)})=0$ ，可以知道 $e^0=1$ ;
在最坏情况下， $H(y^{(i)},\hat{y}^{(i)})=无穷大$ ，因此困惑度为无穷大；
在基线情况下， $H(y^{(i)},\hat{y}^{(i)})=-\frac{1}{n}$ ，因此困惑度为n，也就是类别个数。

发布了256 篇原创文章 · 获赞 10 · 访问量 8264

私信关注

猜你喜欢

转载自blog.csdn.net/qq_37388085/article/details/104382988

自然语言处理 —— 困惑度

百度自然语言处理

自然语言处理——句子的相似度

百度云自然语言处理(Nlp)

自然语言处理（五文本相似度）

nlp自然语言处理中句子相似度计算

自然语言处理--计算余弦相似度

人工智能-自然语言处理(NLP)：N-gram语言模型【用来判断一句话语法上是否通顺】 --＞语言模型的评估【Perplexity（困惑度） --＞利用语言模型生成新句子】

自然语言处理之比较两个句子的相似度余弦相似度

自然语言处理中句子相似度计算的几种方法

【NLP】百度AI平台自然语言处理API调用（情感分析案例）

基于百度AI的自然语言处理文字分类

自然语言处理-BM25相关度打分

使用Python调用百度自然语言处理API

《统计自然语言处理》高清PDF 百度网盘下载分享

NLP 自然语言处理 jieba gensim 最好别分家之最简单的相似度实现

【自然语言处理】常见的文本相似度计算方法

2020百度暑期实习面试（机器学习、数据挖掘、自然语言处理岗位）

【自然语言处理】Topic Coherence You Need to Know（主题连贯度详解）

LLM(大语言模型)常用评测指标-困惑度（Perplexity）

自然语言处理

自然语言处理①

java调用百度自然语言处理API参考（仿某宝评论观点抽取）

Unity使用百度AI，进行自然语言处理过程中遇到的编码格式问题

python调用百度智能云API请求（以自然语言处理——词法分析为例）

自然语言处理实战项目4-文本相似度的搜索功能，搜索文本内容

百度2024校招机器学习、数据挖掘、自然语言处理方向面试经历

自然语言语义相似度计算方法

【自然语言处理介绍】

自然语言处理概览

今日推荐

周排行

Access的四舍五入取整

8.23 前端学习过程

入门学习过程方向与漏洞复现总结：

操作分布式文件之八：如何批量并行读写远程文件和事务补偿处理

应邀出个教程（搭建tensorflow跑网络环境）

Kubernetes之Pod控制器应用进阶

14-[mysql内置功能]--

HDU6212 区间dp 好题

VS2015生成代码图

验证手机号的工具类

每日归档

更多

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)

2024-10-12(0)