Apache Solr-5.3.0 한글 분석기 설치Search Engine2017. 7. 13. 16:56
Table of Contents
1). 네이버 카페(루씬 한글분석기 오픈소스 프로젝트) 에서 arirang-morph-1.0.0.jar , arirang.lucene-analyzer-5.0-1.0.0.jar 를 다운받고 sole 웹 서버의 라이브러리 폴더에 복사한다. (~/solr-5.3.0/server/solr-webapp/webapp/WEB-INF/lib)
2). 생성한 core 폴더 /conf/managed-schema.xml 파일에 아래의 내용을 추가한다.
<!-- arirang -->
<fieldType name="text_ko" class="solr.TextField">
<analyzer type="index">
<tokenizer class="org.apache.lucene.analysis.ko.KoreanTokenizerFactory" />
<filter class="solr.LowerCaseFilterFactory" />
<filter class="solr.ClassicFilterFactory" />
<filter class="org.apache.lucene.analysis.ko.KoreanFilterFactory" hasOrigin="true" hasCNoun="true" bigrammable="false" />
<filter class="org.apache.lucene.analysis.ko.HanjaMappingFilterFactory" />
<filter class="org.apache.lucene.analysis.ko.PunctuationDelimitFilterFactory" />
<filter class="solr.StopFilterFactory" words="stopwords.txt"
ignoreCase="true" />
</analyzer>
<analyzer type="query">
<tokenizer class="org.apache.lucene.analysis.ko.KoreanTokenizerFactory" />
<filter class="solr.LowerCaseFilterFactory" />
<filter class="solr.ClassicFilterFactory" />
<filter class="org.apache.lucene.analysis.ko.KoreanFilterFactory" hasOrigin="true" hasCNoun="true" bigrammable="false" />
<filter class="org.apache.lucene.analysis.ko.WordSegmentFilterFactory" hasOrijin="true" />
<filter class="org.apache.lucene.analysis.ko.HanjaMappingFilterFactory" />
<filter class="org.apache.lucene.analysis.ko.PunctuationDelimitFilterFactory" />
<filter class="solr.StopFilterFactory" words="stopwords.txt" ignoreCase="true" />
</analyzer>
</fieldType>
3). solr 데몬을 다시 재시작 하고 core 선택 후 analysis 기능을 이용하여 확인 가능하다.
명령어 예제
./solr restart -s /home/kogun82/workspace/kobic -p 1818
'Search Engine' 카테고리의 다른 글
elasticsearch 구동 시 max virtual memory 장애 조치 방법 (0) | 2018.10.30 |
---|---|
Apache Solr Collection 생성 (0) | 2018.08.10 |
Apache Solr-5.3.0과 MySQL 연동 및 인덱스 생성 (0) | 2017.07.13 |
Apache Solr-5.3.0 설치 및 실행 (0) | 2017.07.13 |
Apache Solr-4.4.0 인덱스 및 검색 방법 (0) | 2017.07.12 |
@kogun82 :: Ctrl+C&V 로 하는 프로그래밍
Korean BioInformation Center(KOBIC) Korea Research Institute of Bioscience & Biotechnology Address: #52 Eoeun-dong, Yuseong-gu, Deajeon, 305-806, KOREA +82-10-9936-2261 e-mail: kogun82@kribb.re.kr Blog: kogun82.tistory.com Homepage: www.kobic.re.kr
포스팅이 좋았다면 "좋아요❤️" 또는 "구독👍🏻" 해주세요!