[한나눔 형태소 분석기] 카이스트 Hannanum형태소 분석기 소개

이번 포스팅은 형태소 분석기대해서 소개를 하겠습니다.

현재 외국에서는 영어를 분석하는 분석기들은 많이 나왔습니다. 심지어 워드맵같이 각 단어의 반의어, 유사어 등을 연결하여 네트워크 맵을 만들어놨습니다. 하지만 그에 반해 우리나라언어는 아직 이 정도 수준까지는 못 따라가고 있는 실정입니다.

이에 많은 대학연구소에서는 많은 연구를 현재 진행 중에 있습니다. 그 중에 한 성과가 형태소 분석기입니다.

서울대학교 꼬꼬마 분석기, 국민대학교 KLT 등 많은 대학에서 현재 연구해왔고 현재 연구 중에 있습니다.

이번 포스팅은 그 중 카이스트에서 개발한 한나눔 형태소 분석기에 대해서 소개해드릴게요.

 

한나눔 형태소 분석기는 카이스트 SWRC 연구소에서 개발한 오픈소스 형태소 분석기입니다.

보통 형태소 분석기를 사용해야할 프로젝트가 다가오면 1순위로 거론되는게 이 형태소 분석기입니다.

이유는 간단합니다. 오픈소스입니다. 모든 소스코드가 전부 공개되기 때문에 소스코드만 분석할 수 있다면,

각 프로젝트에 맞게 변경이 가능합니다. 그게 힘든일이긴 합니다만, 사용할 수 있는게 어딘가요 ㅋ

 

한나눔 형태소 분석기는 사이트에 쉽게 다운로드하여 사용할 수 있습니다.

각 단계를 모듈별로 분할하여 workflow개념으로 만들어진 모듈을 조립하는 형식으로 설계할 수 있습니다.

이러한 단계는 데모프로그램에서 GUI형태로 표현하여 더 쉽게 접근이 가능합니다.

또한, 한글에 대한 태그가 제가 조사한 형태소 분석기 중에서 제일 다양합니다.

너무 자세한 태그를 원치 않을 경우 더 간단한 태크도 지원합니다.

 

각 모듈이 플러그인 형태로 되어있습니다.

크게 3가지로 나뉩니다.

 

1. Text Preprocessing : 문장 경계 인식, 필터링, 자동 띄어쓰기 등 형태소 분석 이전에 필요한 전처리 작업을 수행합니다.

2. Morphological Analysis : 입력 문장에 대해서 어절 단위로 발생 가능한 모든 형태소 분석 결과를 생성합니다.

3. POS Tagging : 가장 유망한 형태소 분석 결과들을 선택하여 입력 문장에 대한 최종 품사 태깅 결과를 반환합니다.

 

이러한 3가지 플러그인에 하위 플러그인들이 여러개있습니다.

경축! 아무것도 안하여 에스천사게임즈가 새로운 모습으로 재오픈 하였습니다.
어린이용이며, 설치가 필요없는 브라우저 게임입니다.
https://s1004games.com

이것들을 조합하여 workflow을 조립하여 사용하면됩니다.

 

더 자세한 내용은 아래의 형태소 분석기 메뉴얼을 다운받아 참조하시면 됩니다.

 

한나눔 형태소 분석기에 대한 공식 자료를 얻는 사이트는 아래와 같습니다.

 

한나눔 형태소 분석기 소개 사이트

http://semanticweb.kaist.ac.kr/home/index.php/About_SWRC

 

한나눔 형태소 분석기 개발 커뮤니티  사이트

http://kldp.net/projects/hannanum

 

한나눔 형태소 분석기 메뉴얼 다운로드

http://kldp.net/projects/hannanum/forum/316173

 

한나눔 형태소 분석기 소스코드 다운로드

http://kldp.net/projects/hannanum/download

 

다음 포스팅에는 설치 및 데모프로그램 사용을 포스팅하겠습니다.

 

[출처] http://blog.naver.com/rjsgmlgood/220192037636

 

 

 

본 웹사이트는 광고를 포함하고 있습니다.
광고 클릭에서 발생하는 수익금은 모두 웹사이트 서버의 유지 및 관리, 그리고 기술 콘텐츠 향상을 위해 쓰여집니다.
번호 제목 글쓴이 날짜 조회 수
1195 [ 一日30分 인생승리의 학습법] VBA Web Scraping: How Can VBA Be Used To Scrape Website Data? file 졸리운_곰 2024.04.13 3
1194 [ 一日30分 인생승리의 학습법] 윈도우 실행파일 구조(PE파일) file 졸리운_곰 2024.03.31 3
1193 [ 一日30分 인생승리의 학습법] [Analysis] PE(Portable Executable) 파일 포맷 공부 file 졸리운_곰 2024.03.31 3
1192 [ 一日30分 인생승리의 학습법] 성공하는 메타버스의 3가지 조건 file 졸리운_곰 2024.03.30 7
1191 [ 一日30分 인생승리의 학습법] REST, REST API, RESTful 과 HATEOAS file 졸리운_곰 2024.03.10 9
1190 [ 一日30分 인생승리의 학습법] 렌더링 삼형제 CSR, SSR, SSG 이해하기 file 졸리운_곰 2024.03.10 2
1189 [ 一日30分 인생승리의 학습법] 엑셀 VBA에서 셀레니움 사용을 위한 Selenium Basic 설치 file 졸리운_곰 2024.02.23 11
1188 [ 一日30分 인생승리의 학습법]500 Lines or Less Blockcode: A Visual Programming Toolkit : 500줄 이하의 블록코드: 시각적 프로그래밍 툴킷 졸리운_곰 2024.02.12 4
1187 [ 一日30分 인생승리의 학습법] 구글 클라이언트(앱) 아이디를 발급받으려면 어떻게 해야 하나요? 졸리운_곰 2024.01.28 3
1186 [ 一日30分 인생승리의 학습법] 빅뱅 프로젝트를 성공적으로 오픈하기 위한 팁 졸리운_곰 2023.12.27 16
1185 [ 一日30分 인생승리의 학습법]“빅뱅 전환보다 단계적 전환 방식이 이상적 애자일팀과 협업 쉽게 체질 개선을” file 졸리운_곰 2023.12.27 12
1184 [ 一日30分 인생승리의 학습법] Big-bang / phased 접근 file 졸리운_곰 2023.12.27 3
1183 [ 一日30分 인생승리의 학습법] CodeDragon 메뉴 데이터 전환의 개념 이해 - 데이터 전환의 개념, 데이터 전환방식, 데이터 전환방식 및 장단점 비교, 데이터전환 이후 검토해야 할 사항 졸리운_곰 2023.12.27 5
1182 [ 一日30分 인생승리의 학습법] 블록체인과 IPFS를 이용한 안전한 데이터 공유 플랫폼 - 분쟁 해결 시스템 file 졸리운_곰 2023.12.27 6
1181 [ 一日30分 인생승리의 학습법] 블록체인과 IPFS를 이용한 안전한 데이터 공유 플랫폼 - 개념과 리뷰 시스템 file 졸리운_곰 2023.12.27 4
1180 [ 一日30分 인생승리의 학습법] 소켓 CLOSE_WAIT 발생 현상 및 처리 방안 file 졸리운_곰 2023.12.03 7
1179 [ 一日30分 인생승리의 학습법] robots 설정하기 졸리운_곰 2023.12.03 3
1178 [ 一日30分 인생승리의 학습법] A Tutorial and Elementary Trajectory Model for the Differential Steering System of Robot Wheel Actuators : 로봇 휠 액츄에이터의 차동 조향 시스템에 대한 튜토리얼 및 기본 궤적 모델 file 졸리운_곰 2023.11.29 6
1177 [ 一日30分 인생승리의 학습법] Streamline Your MLOps Journey with CodeProject.AI Server : CodeProject.AI 서버로 MLOps 여정을 간소화하세요 file 졸리운_곰 2023.11.25 2
1176 [ 一日30分 인생승리의 학습법] Comparing Self-Hosted AI Servers: A Guide for Developers / : 자체 호스팅 AI 서버 비교: 개발자를 위한 가이드 file 졸리운_곰 2023.11.25 10
대표 김성준 주소 : 경기 용인 분당수지 U타워 등록번호 : 142-07-27414
통신판매업 신고 : 제2012-용인수지-0185호 출판업 신고 : 수지구청 제 123호 개인정보보호최고책임자 : 김성준 sjkim70@stechstar.com
대표전화 : 010-4589-2193 [fax] 02-6280-1294 COPYRIGHT(C) stechstar.com ALL RIGHTS RESERVED