[한글 형태소 분석기] MeCab 설치 및 PHP 바인딩

 

 

한글 형태소 분석기가 필요하여 찾던중 유용한 한국어 형태소 분석기를 찾게되어 공유하고자 글을 올린다.

우리나라 형태소분석기는 외국에 비해 이렇다 할 오픈소스가 존재하지 않는다. 

그나마 루씬 한글 형태소 분석기가 유일무이 한 상태였는데 최근에 은전한닢 프로젝트를 알게 되어 상당히 반가웠다. 

은전한닢 프로젝트는 MeCab 엔진 기반으로 원래는 일본어 형태소 분석 엔진인데 일본어와 한국어의 유사점 덕택에 한글 분석도 동작하는 것을 확인후 진행하였다고 한다. 

 

그래서 한번 설치후 테스트 해보기로 하였다. 테스트 환경 (CentOS 6.4)

 

아래 url 이동후 mecab-ko 엔진과

https://bitbucket.org/bibreen/mecab-ko/downloads

bibreen-mecab-ko-a022ac77f5af.zip

mecab-ko-dic 한국어 사전을 다운받는다.

https://bitbucket.org/bibreen/mecab-ko-dic/downloads

bibreen-mecab-ko-dic-dfb911ac9b2a.zip

설치시 만약 CentOS버전이 5.9 이하라면 아래 URL을 참고하시면 됩니다.

http://eunjeon.blogspot.kr/2013/02/cent-os-59-mecab-mecab-ko-dic.html

 
설치후 
vi /usr/local/etc/mecabrc 
들어가서 
/usr/local/lob/mecab/dic/ipadic/을 ;으로 주석처리하고  
아래에 라인에 /usr/local/lob/mecab/dic/mecab-ko-dic/를 추가한다. 

 

 

a01.png

 

 

 

 

이렇게 하면 설치가 완료!

잘 설치가 됬는지 확인해보기~

경축! 아무것도 안하여 에스천사게임즈가 새로운 모습으로 재오픈 하였습니다.
어린이용이며, 설치가 필요없는 브라우저 게임입니다.
https://s1004games.com

 

a02.png

 

 

나는 서버사이드 언어로 PHP를 사용하기 때문에 MeCab를 PHP에서 호출이 가능하게 포팅해줘야 했다.

아래 url을 참고하면 MeCab를 PHP에서도 사용할수 있다.

http://dumpcookie.tistory.com/entry/php-mecab-%EB%B0%94%EC%9D%B8%EB%94%A9-%EC%82%AC%EC%9A%A9%ED%95%98%EA%B8%B0

 

MeCab PHP바인딩 시에 마무리작업으로 아래작업을 꼭해줘야 한다.

vi /etc/ld.so.conf

들어가서

/usr/lib64/php/modules/ 을 추가한다.

그리고 쉘에 ldconfig 입력한다.

 

* 참조 

1. 품사태그 정의된 문서: https://docs.google.com/a/xiilab.com/spreadsheet/ccc?key=0ApcJghR6UMXxdEdURGY2YzIwb3dSZ290RFpSaUkzZ0E#gid=0

 

2. 은전한닢 프로젝트 소개: http://www.iamday.net/apps/article/talk/2121/view.iamday

 

 

[출처] http://jokergt.tistory.com/144

 

 

본 웹사이트는 광고를 포함하고 있습니다.
광고 클릭에서 발생하는 수익금은 모두 웹사이트 서버의 유지 및 관리, 그리고 기술 콘텐츠 향상을 위해 쓰여집니다.
번호 제목 글쓴이 날짜 조회 수
1191 [ 一日30分 인생승리의 학습법] REST, REST API, RESTful 과 HATEOAS file 졸리운_곰 2024.03.10 7
1190 [ 一日30分 인생승리의 학습법] 렌더링 삼형제 CSR, SSR, SSG 이해하기 file 졸리운_곰 2024.03.10 1
1189 [ 一日30分 인생승리의 학습법] 엑셀 VBA에서 셀레니움 사용을 위한 Selenium Basic 설치 file 졸리운_곰 2024.02.23 9
1188 [ 一日30分 인생승리의 학습법]500 Lines or Less Blockcode: A Visual Programming Toolkit : 500줄 이하의 블록코드: 시각적 프로그래밍 툴킷 졸리운_곰 2024.02.12 3
1187 [ 一日30分 인생승리의 학습법] 구글 클라이언트(앱) 아이디를 발급받으려면 어떻게 해야 하나요? 졸리운_곰 2024.01.28 2
1186 [ 一日30分 인생승리의 학습법] 빅뱅 프로젝트를 성공적으로 오픈하기 위한 팁 졸리운_곰 2023.12.27 14
1185 [ 一日30分 인생승리의 학습법]“빅뱅 전환보다 단계적 전환 방식이 이상적 애자일팀과 협업 쉽게 체질 개선을” file 졸리운_곰 2023.12.27 6
1184 [ 一日30分 인생승리의 학습법] Big-bang / phased 접근 file 졸리운_곰 2023.12.27 2
1183 [ 一日30分 인생승리의 학습법] CodeDragon 메뉴 데이터 전환의 개념 이해 - 데이터 전환의 개념, 데이터 전환방식, 데이터 전환방식 및 장단점 비교, 데이터전환 이후 검토해야 할 사항 졸리운_곰 2023.12.27 4
1182 [ 一日30分 인생승리의 학습법] 블록체인과 IPFS를 이용한 안전한 데이터 공유 플랫폼 - 분쟁 해결 시스템 file 졸리운_곰 2023.12.27 5
1181 [ 一日30分 인생승리의 학습법] 블록체인과 IPFS를 이용한 안전한 데이터 공유 플랫폼 - 개념과 리뷰 시스템 file 졸리운_곰 2023.12.27 3
1180 [ 一日30分 인생승리의 학습법] 소켓 CLOSE_WAIT 발생 현상 및 처리 방안 file 졸리운_곰 2023.12.03 6
1179 [ 一日30分 인생승리의 학습법] robots 설정하기 졸리운_곰 2023.12.03 2
1178 [ 一日30分 인생승리의 학습법] A Tutorial and Elementary Trajectory Model for the Differential Steering System of Robot Wheel Actuators : 로봇 휠 액츄에이터의 차동 조향 시스템에 대한 튜토리얼 및 기본 궤적 모델 file 졸리운_곰 2023.11.29 5
1177 [ 一日30分 인생승리의 학습법] Streamline Your MLOps Journey with CodeProject.AI Server : CodeProject.AI 서버로 MLOps 여정을 간소화하세요 file 졸리운_곰 2023.11.25 1
1176 [ 一日30分 인생승리의 학습법] Comparing Self-Hosted AI Servers: A Guide for Developers / : 자체 호스팅 AI 서버 비교: 개발자를 위한 가이드 file 졸리운_곰 2023.11.25 8
1175 [ 一日30分 인생승리의 학습법] Self-Hosted Artificial Intelligence: Keeping Control of Your Data : 자체 호스팅 인공 지능: 데이터 제어 유지 file 졸리운_곰 2023.11.25 5
1174 [ 一日30分 인생승리의 학습법] AI_머신러닝 기초 정리 file 졸리운_곰 2023.11.24 14
1173 [ 一日30分 인생승리의 학습법] 머신러닝 내용 요약 및 정리 졸리운_곰 2023.11.24 9
1172 [ 一日30分 인생승리의 학습법] 당신이 알아두어야 할 10가지 머신러닝 알고리즘 file 졸리운_곰 2023.11.24 7
대표 김성준 주소 : 경기 용인 분당수지 U타워 등록번호 : 142-07-27414
통신판매업 신고 : 제2012-용인수지-0185호 출판업 신고 : 수지구청 제 123호 개인정보보호최고책임자 : 김성준 sjkim70@stechstar.com
대표전화 : 010-4589-2193 [fax] 02-6280-1294 COPYRIGHT(C) stechstar.com ALL RIGHTS RESERVED