使用jieba分析小说人物出现次数

其他 2019-10-29 21:34:17 阅读次数: 0

分析：

1. 读取小说，以读的形式打开

with open('文件名.txt','r',encoding='utf8') as f:
    str = f.read()

2. 切割小说

ret = jieba.lcut(str)

3. 统计所有词语出现次数 --> 准备一个字典

dic = {}
for word in ret:
    if len(word) == 1:  # 去掉名字为一个字的
        continue
    dic[word] = dic.get(word, 0) + 1

　　准备一个多余称呼的列表

excluedes = ["诸葛亮","卧龙","玄德","关公","丞相",...]

　　如果文中某个人物有多个称呼时，应将多个称呼叠加到某一个称呼上，再将多余的删除

dic['关羽'] = dic['关羽'] + dic['美髯公'] + dic['关公'] + dic['关云长'] + dic['云长']

for i in excluedes:
    del dic[i]

4. 对字典进行排序，升序

lis = list(dic.items())
lis.sort(key=lambda x:x[1],reverse=True)

5. 取出出现次数前十的数据

for i in range(10):
    print(lis[i][0])

猜你喜欢

转载自www.cnblogs.com/zry-yt/p/11761633.html

使用jieba分析小说人物出现次数

利用python语言分析小说的词频、词性、词云、小说人物出场次数排序以及小说人物关系

Python-[jieba库应用]-统计水浒传中人物出现次数

金庸的武侠世界——小说人物分析

词云分析《天龙八部》人物出现次数

对三国演义人物出现次数统计分析

Redis之统计人物出现的次数

python 3.X 使用jieba.wordcloud.pandas等库分析小说后生成云图和柱状图

【matplotlib库与jieba库】使用jieba库对《三国演义》全篇进行分词处理，并使用matplotlib库绘制统计的人物出场次数最多的前五名的柱状图

【jieba库】使用jieba库对《三国演义》全篇进行分词处理，统计《三国演义》中各个人物的出场次数，打印次数排名前五的人物姓名具有排除词库和合并不同称谓功能的Python程序|CSDN创作打卡

用java实现输出英文小说飘中出现次数最多的前N个单词（附：使用文件读写）

我们分析了金庸小说中出现的1367个人物名字，发现了一些相当惊人的事情

统计中文文本中人物出现次数

python从入门到放弃篇16（jieba库，文件操作，for循环）实现三国人物的出场次数统计

jieba分词提取小说人名

AI 小说里的人物

统计 THE TRAGEDY OF ROMEO AND JULIET （罗密欧与朱丽叶）英文小说中各单词出现的次数

jieba的使用

Python---统计《三国演义》中出现次数较高的人物

jieba库小说词频统计

使用HashMap统计字符出现的次数

使用HashMap计算每个Key出现的次数

使用map统计字符出现次数

使用folderLeft函数统计字母出现的次数

Java 结合中文分词库 jieba 统计一堆文本中各个词语的出现次数【代码记录】

运用结巴库分析三国演义的人物出场次数

Python 中文词频分析——红楼梦人物出场次数

jieba源码分析（二）

jieba源码分析（一）

今日推荐

周排行

成为C++高手之宏与枚举

在CAD二次开发中使用进度条

Js插件ECharts，HighCharts学习网址整理

Celery提交任务出错(on windows.)

cephfs内核客户端性能追踪

thinkphp中PHPExcel用法

EntityFramework动态组合多排序字段

汇编语言（八）实验9 根据材料编程

安装ubuntu后必须做的事情（对我而言）

JS函数式编程

每日归档

2024-10-22(0)

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)