한국어 처리1 Word Cloud를 위한 한국어 처리기 open-korean-text (with. Maven) 우선 Word Cloud 란? 데이터에서 얻어진 태그/워드들을 분석하여 중요도나 인기도 등을 고려하여 시각적으로 늘어 놓은 것을 말합니다. 프로젝트 순서.1. 데이터 수집 (웹 크롤링으로 얻은 웹문서나 파일문서들)2. 형태소 분리 (한글.....)3. D3.js를 이용하여 단어드를 Word Cloud로 시각화. 이때 가지고 있는 데이터의 형태소를 분석하여 명사만을 추출, word cloud를 만들고 싶었습니다. 트위터에서 만들고 2017년 이후 개발은 openkoreantext.org에서 하는 오픈소스 한국어 처리기.Java로 래퍼된 한국어를 처리하는 Java/Scala 라이브러리입니다. open-korean-text의 GitHub를 보면normalization(정규화), tokenization(토큰화).. 2018. 10. 23. 이전 1 다음 반응형