Search Engine
Apache Solr-5.3.0 한글 분석기 설치
kogun82
2017. 7. 13. 16:56
1). 네이버 카페(루씬 한글분석기 오픈소스 프로젝트) 에서 arirang-morph-1.0.0.jar , arirang.lucene-analyzer-5.0-1.0.0.jar 를 다운받고 sole 웹 서버의 라이브러리 폴더에 복사한다. (~/solr-5.3.0/server/solr-webapp/webapp/WEB-INF/lib)
2). 생성한 core 폴더 /conf/managed-schema.xml 파일에 아래의 내용을 추가한다.
<!-- arirang -->
<fieldType name="text_ko" class="solr.TextField">
<analyzer type="index">
<tokenizer class="org.apache.lucene.analysis.ko.KoreanTokenizerFactory" />
<filter class="solr.LowerCaseFilterFactory" />
<filter class="solr.ClassicFilterFactory" />
<filter class="org.apache.lucene.analysis.ko.KoreanFilterFactory" hasOrigin="true" hasCNoun="true" bigrammable="false" />
<filter class="org.apache.lucene.analysis.ko.HanjaMappingFilterFactory" />
<filter class="org.apache.lucene.analysis.ko.PunctuationDelimitFilterFactory" />
<filter class="solr.StopFilterFactory" words="stopwords.txt"
ignoreCase="true" />
</analyzer>
<analyzer type="query">
<tokenizer class="org.apache.lucene.analysis.ko.KoreanTokenizerFactory" />
<filter class="solr.LowerCaseFilterFactory" />
<filter class="solr.ClassicFilterFactory" />
<filter class="org.apache.lucene.analysis.ko.KoreanFilterFactory" hasOrigin="true" hasCNoun="true" bigrammable="false" />
<filter class="org.apache.lucene.analysis.ko.WordSegmentFilterFactory" hasOrijin="true" />
<filter class="org.apache.lucene.analysis.ko.HanjaMappingFilterFactory" />
<filter class="org.apache.lucene.analysis.ko.PunctuationDelimitFilterFactory" />
<filter class="solr.StopFilterFactory" words="stopwords.txt" ignoreCase="true" />
</analyzer>
</fieldType>
3). solr 데몬을 다시 재시작 하고 core 선택 후 analysis 기능을 이용하여 확인 가능하다.
명령어 예제
./solr restart -s /home/kogun82/workspace/kobic -p 1818
반응형