美文网首页
使用Python一秒看完十九大报告

使用Python一秒看完十九大报告

作者: CC先生之简书 | 来源:发表于2017-10-19 12:57 被阅读180次
19meeting.png

使用到的知识点:

  • 制作词云的基本步骤和原理
  • Python3实现词云制作
  • wordcloud扩展包的使用
  • 使用图片制作词云,分析十九大的关键词

思路:
词云的原理是对输入的文本数据进行词频统计,根据词汇出现频率的不同,按不同比例显示出词汇,生成图片。频率高的词汇显示的大,频率低的词汇显示的小。文本数据可以是本地数据,也可是是爬虫动态从网络中获取的。

需要安装包:
$ pip install numpy
$ pip install python-matplotlib
$ pip install python-pil
$ pip install wordcloud

实现代码:

from os import path
from wordcloud import WordCloud
import numpy as np
from PIL import Image
from os import path
import matplotlib.pyplot as plt
import random

d = path.dirname(__file__)
# 使用numpy中的mask
mask = np.array(Image.open(path.join(d, "stormtrooper_mask.png")))

# 读取数据来源
text = open(path.join(d, '19meeting.txt')).read()

# 生成词云图片
wordcloud = WordCloud().generate(text)

# 显示生成的图片
wc = WordCloud(max_words=2000, mask=mask, margin=10,
               random_state=1).generate(text)

plt.figure()
plt.imshow(wc)
plt.axis("off")
plt.show()

以上代码里面用到了两个文件,一个是词云的原图片(可以看得出来原图片是什么吗?哈哈),一个是十九大报告的原文。

看,是不是秒读 十九大报告。

相关文章

网友评论

      本文标题:使用Python一秒看完十九大报告

      本文链接:https://www.haomeiwen.com/subject/yikuuxtx.html