根据（本地）数据或文件制作词云图 - 代码天地

根据（本地）数据或文件制作词云图

编程语言 2019-01-13 09:10:51 阅读次数: 0

首先，我们需要收集和筛选自己需要的数据内容，可以使用数据爬虫爬取或者是本地文件。

前期准备：

1.python3及以上

2.使用pip安装jieba，PIL， matplotlib，numpy，wordcloud ，msyh.ttf中文字体，其中jieba主要应用于分词，numpy用于数据处理，wordcloud用于词云图制作和显示，安装过程请自行百度。

from wordcloud import WordCloud
import jieba
import PIL
import matplotlib.pyplot as plt
import numpy as np
 
def wordcloudplot(txt):
    path = r'D:/wordcloud/msyh.ttf' #中文字体
    alice_mask = np.array(PIL.Image.open('D:/wordcloud/1.jpg'))  #保存文件
    #设计词云图的显示格式
    wordcloud = WordCloud(font_path=path,
                          background_color="white",
                          margin=5, width=1800, height=800, mask=alice_mask, max_words=2000, max_font_size=60,
                          random_state=42)
    wordcloud = wordcloud.generate(txt)
    wordcloud.to_file('D:/wordcloud/1.jpg')
    plt.imshow(wordcloud)
    plt.axis("off")
    plt.show()
 
 
def main():
    a = []
    #打开并使用jieba分词，.csv是我的数据文件
    f = open(r'D:/wordcloud/haiwang_yingping.csv', 'r',encoding='utf-8').read()
    words = list(jieba.cut(f))
    for word in words:
        if len(word) > 1:
            a.append(word)
    txt = r' '.join(a)
    wordcloudplot(txt)
 
 
if __name__ == '__main__':
    main()

显示结果如下：

小白初学，如果有发现各种bug和改进方法，欢迎大佬评论留言！

猜你喜欢

转载自blog.csdn.net/weixin_42424151/article/details/86405864

根据（本地）数据或文件制作词云图

python处理数据集并制作词云图

python制作词云图

制作词云图

pyecharts制作词云图

python/wordcloud制作词云图

Python - 制作词云图 WorldCloud

使用中文制作词云图---

利用 Pyecharts 制作词云图

Python 使用wordcloud制作词云图

制作词云图的一些难点

虾米音乐歌单制作词云图

python通过tkinter制作词云图工具

网易云音乐歌单制作词云图

制作词云图过程中积累到的知识

python爬取网页版优酷视频《我不是药神》的弹幕数据并制作词云图

利用python爬取微博热搜榜制作词云图

Python爬虫新手入门教学（六）：制作词云图

python学习之 python制作词云图我的第一张python词云图 python怎么做词云图

使用wordcloud制作词云报错OSError: cannot open resource和制作出的词云图乱码问题

抓取qq音乐评论 (林俊杰-雪落下的声音) 制作词云图，是否值得一听

Python3 获取任意贴吧最新帖子制作词云图存储为markdown！

使用python或者Anaconda环境制作词云图时报错：ModuleNotFoundError: No module named ‘wordcloud‘ 解决办法

Python制作词云

Python对网页内容作词云图分析

制作VOC数据集，根据groundtruth文件生成xml文件

R语言制作词云

使用python制作词云

【js】js根据url或数据下载文件到本地

基于java实现的分词以及词频统计，准备制作词云数据

今日推荐

周排行

Access的四舍五入取整

8.23 前端学习过程

入门学习过程方向与漏洞复现总结：

操作分布式文件之八：如何批量并行读写远程文件和事务补偿处理

应邀出个教程（搭建tensorflow跑网络环境）

Kubernetes之Pod控制器应用进阶

14-[mysql内置功能]--

HDU6212 区间dp 好题

VS2015生成代码图

验证手机号的工具类

每日归档

更多

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)

2024-10-12(0)