2013년 7월 31일 수요일

리디북스에서 은전한닢 프로젝트를 사용합니다.



전자책 서비스인 리디북스의 책 검색에 은전한닢 프로젝트를 사용합니다. Apache Solr와 mecab-ko-lucene-analyzer를 사용하여 책과 저자 검색을 합니다.

2013년 7월 20일 토요일

mecab-ko-lucene-analyzer-0.12.0 배포합니다.

mecab-ko-lucene-analyzer-0.12.0이 나왔습니다.
  • mecab-ko-dic-1.4.0을 위한 코드 추가
여기서 받으실 수 있습니다.

mecab-ko-dic-1.4.0-20130720 배포합니다.

mecab-ko-dic-1.4.0-20130720이 나왔습니다.
  • 조사,어미,명사 파생 접미사 활용어 띄어쓰기 패널티를 주기위해 pos-id 변경 및 설정(dicrc) 변경
  • 인명사전(NN-Person.csv, NN-Person-Preanalysis.csv) 데이터 추가. (약 10만 단어 추가)
  • 안되/VV, 안된/VA+ETM, 안된다/VA+EF, 안된다는/VA+ETM 단어 출현 비용 수동으로 수정하여, 오분석 방지
  • 띄어쓰기 있는 어미 페널티 비용 500 -> 3000으로 변경
주의: mecab-ko-lucene-analyzer을 사용하시는 분들은 mecab-ko-lucene-analyzer-0.12.0으로 업데이트 하셔야합니다.

여기서 받으실 수 있습니다.

2013년 7월 7일 일요일

mecab-ko-lucene-analyzer-0.11.0 배포합니다.

mecab-ko-lucene-analyzer-0.11.0이 나왔습니다.
  • Apache Lucene/Solr 4.3.1 버전에 맞춰서 코드 수정.
주의: 이번 버전은 Lucene/Solr 4.3.x 버전을 사용하셔야 합니다.

여기서 받으실 수 있습니다.