은전한닢 프로젝트
검색에서 쓸만한 오픈소스 한국어 형태소 분석기를 만들자!
2013년 3월 1일 금요일
mecab-ko-lucene-analyzer-0.9.3 배포합니다.
mecab-ko-lucene-analyzer-0.9.3
가 나왔습니다.
StandardIndexTokenizerFactory에서
decompoundMinLength
의 역할 변경함. 복합명사 분해시 분해되는 토큰의 최소 길이 설정. 기본값은 2입니다.
decompoundMinLength = 1 : "자동차" -> "자동차", "자동", "차"
decompoundMinLength = 2 : "자동차" -> "자동차", "자동"
설정방법은
여기
를 참고하세요.
여기
서 받으실 수 있습니다.
java compile version: jdk1.6.0_41
댓글 없음:
댓글 쓰기
최근 게시물
이전 게시물
홈
피드 구독하기:
댓글 (Atom)
댓글 없음:
댓글 쓰기