模块wordcloud库的使用
一 wordcloud库基本介绍
1.1 wordcloud库概述
wordcloud是优秀的词云展示第三方库
-
wordcloud库的安装
1.2 wordcloud库的安装
pip install wordcloud
二 wordcloud库使用说明
2.1 wordcloud库基本使用
wordcloud库把词云当作一个WordCloud对象
-
wordcloud.WordCloud()代表一个文本对应的词云
-
可以根据文本中词语出现的频率等参数绘制词云
-
绘制词云的形状,尺寸和颜色都可以设定
2.2 wordcloud库常用方法
W = wordcloud.WordCloud()
-
以WordCloud对象为基础
-
配置参数,加载文本,输出文件
-
步骤1:配置对象参数
-
步骤2:加载词云文本
-
步骤3:输出词云文件
2.3 配置对象参数
2.4 wordcloud应用实例
中文需要先分词并组成空格分隔字符串
代码示例
# pip install wordcloud
from wordcloud import WordCloud
import matplotlib.pyplot as plt
# from scipy.misc import imread
from matplotlib.image import imread
txt = 'you can get better everday'
txt1 = '中国,是以华夏文明为源泉、中华文化为基础,并以汉族为主体民族的多民族国家,\
通用汉语、汉字,汉族与少数民族被统称为“中华民族”,又自称为炎黄子孙、龙的传人。\
中国是世界四大文明古国之一,有着悠久的历史,距今约5000年前,以中原地区为中心开始出现聚落组织进而形成国家,\
后历经多次民族交融和朝代更迭,直至形成多民族国家的大一统局面。20世纪初辛亥革命后,君主政体退出历史舞台,\
共和政体建立。1949年中华人民共和国成立后,在中国大陆建立了人民代表大会制度的政体。\
中国疆域辽阔、民族众多,先秦时期的华夏族在中原地区繁衍生息,到了汉代通过文化交融使汉族正式成型,\
奠定了中国主体民族的基础。后又通过与周边民族的交融,逐步形成统一多民族国家的局面,而人口也不断攀升,\
宋代中国人口突破一亿,清朝时期人口突破四亿,到2005年中国人口已突破十三亿.\
中国文化渊远流长、博大精深、绚烂多彩,是东亚文化圈的文化宗主国,在世界文化体系内占有重要地位,\
由于各地的地理位置、自然条件的差异,人文、经济方面也各有特点。传统文化艺术形式有诗词、戏曲、\
书法、国画等,而春节、元宵、清明、端午、中秋、重阳等则是中国重要的传统节日。 [1-7]'
color_mask = imread('demo=jpg.jpg') # 设定图片
wc = WordCloud(
font_path=r'C:\Windows\Fonts\STXINGKA.TTF', # 设置字体(本机子自带的)
background_color='red', # 修改背景颜色
width=1000, # 定义宽度
height=960, # 设置高度
min_font_size=2, # 字体间距
mask=color_mask # 引用图片
)
wc.generate(txt1)
wc.to_file('cy.png')
plt.imshow(wc)
plt.show()
显示效果
本地文档实现词云显示
import jieba
from wordcloud import WordCloud
import matplotlib.pyplot as plt
from matplotlib.image import imread
f = open('工作报告.txt', encoding='gbk')
data = f.read()
res = jieba.lcut(data)
# result = ""
# for i in res:
result = "".join(res)
# print(result)
color_mask = imread('demo=jpg.jpg')
wc = WordCloud(
font_path=r'C:\Windows\Fonts\STXINGKA.TTF',
width=1000,
height=800,
mask=color_mask,
background_color='red'
)
wc.generate(result)
wc.to_file('小康社会.png')
plt.imshow(wc)
plt.show()
得到的效果为