KoNLP 패키지를 이용해 블로그를 분석한 결과
KoNLP(Korean Natural Language Processing) 패키지
한글 자연어 분석 패키지로 한국어를 분석할 수 있는 총 27개의 함수가 들어 있다.
KoNLP 패키지를 사용하기 위해서는 rJava, memoise 패키지가 필요하다.
패키지 설치
install.packages("rJava")
install.packages("memoise")
install.packages("KoNLP")
패키지 로드
library(rJava)
library(memoise)
library(KoNLP)
library(dplyr)
library(stringr)
- rJava
설치되어 있는 jdk 를 연동하는 역할
rJava를 설치한 후 library를 로드하면 오류가 발생한다.
error : JAVA_HOME cannot be determined from the Registry
solution : 환경변수 setting
system 변수에 JAVA_HOME C:\Program Files\Java\jdk-9.0.4 추가
- memoise
- stringr
특수문자 제거를 위해 사용
텍스트 파일에 있는 한글 분석
useNIADic();
txt <- readLines('hiphop.txt')
head(txt)
install.packages('wordcloud')