NLP 简单统计 - 代码天地

NLP 简单统计

其他 2019-01-21 16:29:32 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/qq_35774189/article/details/84557386

1、变量名必须以字母开头，可以包含数字和下划线，名称是区分大小写的，变量名不能游空格，可以用下划线 ( _ ) 把单词分开

2、利用FreqDist寻找文本中最常见的50个词：

第89行计算whale出现的次数

累积频率图

计算文本中每个词的长度：

fdist.keys() 只有20个不同的元素（说明只有20种不同的词长）

fdist.freq(3) 表示词长为3的词占比

例子	描述
fdist=FreqDist(samples)	创建包含给定样本的频率分布
fdist.inc(sample)	增加样本
fdist['monstrous']	计数给定样本出现的次数
fdist.freq('monstrous')	给定样本的频率
fdist.N()	样本总数
fdist.keys()	以频率递减顺序排序的样本链表
for sample in fdist:	以频率递减的顺序遍历样本
fdist.max()	数值最大的样本
fdist.tabulate()	绘制频率分布表
fdist.plot()	绘制频率分布图
fdist.plot(cumulative=True)	绘制累积频率分布图
fdist1 < fdist2	测试样本在fdist1中出现的频率是否小于fdist2

猜你喜欢

转载自blog.csdn.net/qq_35774189/article/details/84557386

NLP 简单统计

nlp 统计语言模型

NLP - 统计频率

NLP简单介绍

简单地了解NLP

【Elasticsearch】NLP简单应用

NLP（一）：从规则到统计

NLP-统计语言模型

csdn博客的简单nlp分析

简单理解NLP中文分词

【NLP】暑假课作业3 - 词性标注（简单词频概率统计）

NLP

【NLP】

NLP系列-中文分词（基于统计）

初探nlp 词频统计，去停顿词

006-深度学习与NLP简单应用

Pycharm nltk 实现简单的NLP功能

NLP——01机器翻译的简单框架

NLP标注工具Brat的简单使用

NLP数据预处理——词频统计（创建词典）程序

【NLP】英文数据预处理__词频统计简例

基于ansj_seg和nlp-lang的简单nlp工具类

NLP | 简单学习一下NLP中的transformer的pytorch代码

python.nlp随笔（四）简单的全文检索系统

NLP的第三方包的学习简单总结

Flair：一款简单但技术先进的NLP库！

Flair：一款简单但技术先进的NLP库

NLP中几种分词库的简单使用（Python）

NLP(6):一些简单得dp

FoolNLTK—简单好用的中文NLP工具包

今日推荐

周排行

vue + echart +map中国地图，省市地图，区县地图

spring boot2 (31)-cors跨域请求

『学习资料推荐』299元买的微信营销资料打包

个人学习卷积神经网络的疑惑解答

网络工程师-软考

模拟人生4 春夏秋冬、星梦起飞版更新下载方法以及常见问题

python关于对象的字符串显示str和repr以及

奇怪的session混乱问题

【3】分治法（divide-and-conquer）

Java项目开发成绩管理系统（九）各模块实现信息修改

每日归档

更多

2024-08-07(0)

2024-08-06(0)

2024-08-05(0)

2024-08-04(0)

2024-08-03(0)

2024-08-02(0)

2024-08-01(0)

2024-07-31(0)

2024-07-30(0)

2024-07-29(0)