# ▣ 문법예제25. 위드 클라우드를 그리기 위해 필요한 패키지들을 임폴트 합니다.
from wordcloud import WordCloud, STOPWORDS import matplotlib.pyplot as plt # 그래프 그리는 모듈 from os import path # os 에 있는 파일을 파이썬에서 인식하기 위해서 import re # 데이터 정제를 위해서 필요한 모듈 import numpy as np from PIL import Image # 이미지 시각화를 위한 모듈
# ▣ 문법예제26. 워드 클라우드의 배경이 되는 이미지 모양을 결정합니다.
usa_korea = np.array( Image.open('/content/drive/MyDrive/data500/s_korea.png') )
# ▣ 문법예제27. 워드 클라우드를 그릴 스크립트를 가져옵니다.
script = '/content/drive/MyDrive/data500/conan.txt'
# ▣ 문법예제28. 워드 클라우드 그림이 저장될 디렉토리를 지정합니다.
d = path.dirname('/content/drive/MyDrive/data500')
# ▣ 문법예제29. 워드 클라우드를 그릴 스크립트와 os 의 위치를 서로 연결해서 # utf8 로 인코딩 해서 한글 텍스트를 text 변수로 리턴합니다.
text = open( "/content/drive/MyDrive/data500/conan.txt", mode="r", encoding="utf-8").read()
# ▣ 문법예제30. 워드 클라우드에서 의미없이 자주 나오는 단어들의 빈도가 높아서 # 글씨가 크게 나오는 것들을 제거시켜주기 위한 코드
file = open("/content/drive/MyDrive/data500/word.txt", "r", encoding="utf-8") word = file.read().split(' ') for i in word: text = re.sub( i, '', text) # text 변수에 i 에 단어가 있다면 null 로 변경해라 !
# ▣ 문법예제31. 위에서 만든 text 를 가지고 워드 클라우드를 그리시오 !
# 워드 클라우드를 그린다. wordcloud = WordCloud(font_path='NanumBarunGothic', # 글씨체 stopwords=STOPWORDS, # 마침표, 느낌표,싱글 쿼테이션 등을 정제 max_words=700, # 워드 클라우드에 그릴 최대 단어갯수 background_color='white', # 배경색깔 max_font_size = 150, # 최대 글씨 크기 min_font_size = 1, # 최소 글씨 mask = usa_korea, # 배경 모양 colormap='Paired').generate(text).to_file('/content/drive/MyDrive/data500/result_cloud.png') plt.figure(figsize=(15,15)) plt.imshow(wordcloud, interpolation='bilinear') # 글씨가 퍼지는 스타일 plt.axis("off")
|