2014년 2월 23일 일요일

mecab-ko-lucene-analyzer-0.14.0 배포합니다.

mecab-ko-lucene-analyzer-0.14.0이 나왔습니다.

mecab-ko-dic-1.5.0 사전 형식 변경으로 lucene-analyzer 새로 배포합니다.

추가된 기능

  • 상세 형태소를 볼 수 있는 partOfSpeech 속성 추가.
  • 의미부류를 볼 수 있는 semanticClass 속성 추가.
solr 에 설치하기
elasticsearch에 설치하기
시연 사이트를 통해 분석 결과를 미리 확인해 보실 수 있습니다.

꼭 사전은 mecab-ko-dic-150-20140223 이상 버전을 받아 사용하세요.

mecab-ko-dic-1.5.0-20140223 배포합니다.

mecab-ko-dic-1.5.0-20140223이 나왔습니다.

변경된 점은 다음과 같습니다.
  • NN으로 표기되던 명사를 NNG(보통 명사), NNP(고유 명사)로 세분화
  • NNB(의존 명사)를 NNB(의존 명사)와 NNBC(단위를 나타내는 명사)로 세분화
  • 사전에서 semantic_class (의미 부류) 필드가 추가
  • 인명 및 지명 사전에 다량의 데이터를 추가
  • 위키피디아 사전에서 다량의 불필요한 단어를 제거하거나 수정

여기서 받으실 수 있습니다.

주의: 사전 형식의 변경으로 인해,  mecab-ko-lucene-analyzer와 elasticsearch-analysis-mecab-ko의 버전을 0.14.0이상으로 변경하셔야 합니다.