[한나눔 형태소 분석기] 한나눔 형태소 분석기 오픈소스 이클립스 설치
2016.05.03 20:48
[한나눔 형태소 분석기] 한나눔 형태소 분석기 오픈소스 이클립스 설치
이번 포스팅은 오픈소스인 한나눔 형태소를 이클립스에 Import하여 사용하는 방법을 포스팅하도록 하겠습니다.
메뉴얼에 보면 나와있는데요
몇가지 사항만 더 보시면 쉽게 하실 수 있습니다.
한나눔 형태소 분석기 이클립스 Import
1. 자신의 Workspace에 한나눔 형태소 압축파일 푸세요. 다운로드장소는 앞의 포스팅을 참조하시면됩니다.
귀찮으신 분들은
http://blog.naver.com/rjsgmlgood/220192037636
압축을 풀고 나면 아래와 같은 상태의 폴더내용을 확인하실 수 있습니다.
2. 위에 보시면 conf와 data라는 폴더를 또 압축을 푸셔야합니다.
conf와 data에는 형태소사전이 들어있기때문에 압축안푸시면 에러납니다.
3. 이클립스에서 이제 프로젝트를 생성하시면됩니다.
new Project로 들어가셔서 프로젝트이름을 폴더이름과 일치시켜주세요.
JHanNanum-0.8.4-ko으로 전 일치시켰습니다.
4. 이렇게하면 성공적으로 추가될거 같지만 안됩니다.
왜냐하면 UTF-8을 형태소분석기에서 지원하기 때문에 보통 EUC-KR로 인코딩되어있어서 사용할 수 없습니다.
따라서, Properties -> Resource에서 인코딩을 바꿔주시면됩니다.
5. 성공적으로 된것을 확인 할 수 있습니다.
잘되는지 확인하시려면, src -> kr.ac.kaist.swrc.jhannanum.demo에서 아무거나 돌려보시면 됩니다.
저는 WorkflowNounExtractor.java를 돌리도록 하겠습니다.
컴파일하시면 !
단어만 추출됩니다.
이렇게 활용하시면서 패키지 뜯어보시면 한나눔형태소 분석기를 분석할 수 있습니다.
다음 포스팅은 라이브러리 형태로 사용하는 방법은 간단한 예제를 포스팅하도록 하겠습니다.
광고 클릭에서 발생하는 수익금은 모두 웹사이트 서버의 유지 및 관리, 그리고 기술 콘텐츠 향상을 위해 쓰여집니다.