Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
Tags
- word2vec
- 딥러닝개념
- R에서의 wordcloud
- deeplearning개념
- WordCloud R
- deeplearning용어
- R에서의 워드클라우드
- 마르코프 체인
- StringJoiner
- R dataframe
- 자언어처리모델
- self-attention
- 도날드노만
- R TF-IDF
- 상호작용디자인
- selfattention
- 통계기반자연어처리
- r word2vec
- 어탠션
- 자연어처리
- R 워드클라우드
- 체험디자인
- StringBuffer vs StringBuilder
- 딥러닝용어
- RNN Attention
- 마르코프
- 언어모델
- HashMap
- R 키워드 가중치
- wordVector
Archives
- Today
- Total
클로이의 데이터 여행기
[R] R을 이용한 텍스트마이닝_WordCloud(코드 및 설명) 본문
지난 포스팅에서 TF-IDF를 활용하여 의미 있는 키워드를 뽑아보았습니다.
이번 포스팅에서는 이 키워드들을 활용하여 wordcloud를 그려보려고 합니다.
wordcloud는 이미 많은 분들이 알고 계시듯 '비정형 텍스트에서 뽑은 키워드들을 시각화'하는 것인데요.
wordcloud 결과를 보면 한 눈에 텍스트의 맥락을 이해할 수 있다는 장점을 가지고 있습니다.
1. R에서의 wordcloud
그렇다면 R에서는 wordcloud를 어떻게 쓸 수 있는지 살펴보겠습니다.
R에서 wordcloud를 활용하는 방법은 간단합니다.
1) wordcloud 참고 코드
[ 라이브러리 ]
- 'wordcloud2' : wordcloud를 그리는 라이브러리
- 'dplyr' : 데이터 조작을 간편하게 하는 R의 대표 라이브러리의 하나
아래의 코드에서는 고빈도 top 50 키워드를 뽑을 때 '파이프(%>%)'를 활용하기 위해 설치
library(dplyr)
library(wordcloud2)
top50 = wordDf_TF %>% top_n(50) # top 50 단어추출
wordcloud2(data = top50
, color = "random-dark"
, shape = "cloud"
, size = 0.5
, fontFamily = "나눔고딕")
기존에 tf-idf를 활용하여 만들었던 dataframe을 활용하였습니다.
(지난 tf-idf 포스팅, https://data-traveler.tistory.com/33)
2) wordcloud 결과
wordcloud를 통해 텍스트에 어떤 키워드가 자주 등장했는지 간단하게 살펴볼 수 있었습니다.
이상입니다. 읽어주셔서 감사합니다.
'R' 카테고리의 다른 글
[R] R을 이용한 텍스트마이닝_TF-IDF (코드 및 설명) (0) | 2019.06.20 |
---|---|
[R] R을 이용한 텍스트마이닝_Word2vec(코드 및 설명) (3) | 2019.05.31 |
[R] R을 이용한 텍스트마이닝_'stringr' package (0) | 2019.04.19 |
[R] R을 이용한 텍스트마이닝_DataFrame (0) | 2019.04.16 |
[R] R을 이용한 텍스트마이닝_vector,list,matrix (0) | 2019.04.09 |
Comments