FreqDist的问题 - 代码天地

FreqDist的问题

其他 2018-09-22 04:32:27 阅读次数: 0

在看Python自然语言处理的时候，书中给出的代码跑出来结果和书里的不一样

fdist1 = FreqDist(text1) �
>>> fdist1 �
<FreqDist with 260819 outcomes>
>>> vocabulary1 = fdist1.keys() �
>>> vocabulary1[:50] ④
[',', 'the', '.', 'of', 'and', 'a', 'to', ';', 'in', 'that', "'", '-','his', 'it', 'I', 's', 'is', 'he', 'with', 'was',
'as', '"', 'all', 'for','this', '!', 'at', 'by', 'but', 'not', '--', 'him', 'from', 'be', 'on','so', 'whale', 'one',
'you', 'had', 'have', 'there', 'But', 'or', 'were','now', 'which', '?', 'me', 'like']

书中输出的成果是按照单词的频率由高至低排列的

但是跑这个代码是从书里的顺序排列的

又不想自己写逻辑

然后查到了这个点击打开链接

总的来说就是fdist1.tabulate()直接就可以获得一个从高到低的排列list

大概是这样

还有就是下面的画图， fdist1.plot(n)是从高到低的前n个单词的频率，fdist1.plot(50,cumulative=True)是积分的次数

反正和书里不一样

猜你喜欢

转载自blog.csdn.net/weixin_41965702/article/details/80858579

FreqDist的问题

NLTK（FreqDist）

python 函数FreqDist

nltk中的FreqDist,ConditionalFreqDist和Bigram

nltk.probability.FreqDist 自动识别语料库中词汇的频率分布

自然语言处理学习1：nltk英文分句WordPunctTokenizer、分词word_tokenize和词频统计FreqDist

自然语言处理学习4：nltk词频统计FreqDist，ConditionalFreqDist和tabulate 结合汽车评论实例

自然语言处理学习3：中文分句re.split()，jieba分词和词频统计FreqDist

问题

AS问题

问题？？？

问题：

问题、

This问题

就=与==的问题

问题才是问题

MongoDB 时差问题问题

原始问题与对偶问题

指针问题 —— 排序问题

问题管理管住问题

背包问题的问题分析

遇到的问题 (记录问题)

引入问题，变量问题

问题 D: 家庭问题

问题：每秒的问题

P问题、NP问题

问题 C: 油田问题

问题 L: 枪声问题

问题 G: 极值问题

约瑟夫问题、圆桌问题

今日推荐

周排行

(BIND最佳实践)Linux运维最佳实践

makefile ifeq之坑: 1. syntax error near unexpected token 2. *** missing separator. Stop.

easyui datagrid操作栏内置图片按钮

SQLyog连接MySQL时出现的2058错误解决方法

linux音频开发

hashcode方法简析

SpringBoot中使用Transaction注解遇到的坑

逆战-CSS中子元素在父元素中的4种水平垂直居中方法

Expression.Blend.4 Chapter 图片和视频的使用

springMVC返回void值

每日归档

更多

2024-09-17(0)

2024-09-16(0)

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)

2024-09-09(0)

2024-09-08(0)