首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 教程频道 > 其他教程 > 开源软件 >

Solr4:加入汉语分词IKAnalyzer2012 FF

2013-10-16 
Solr4:加入中文分词IKAnalyzer2012 FFfieldType nametext_ik classsolr.TextFieldanalyzer type

Solr4:加入中文分词IKAnalyzer2012 FF

<fieldType name="text_ik" class="solr.TextField">     <analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/>     <analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>   </fieldType>          

查询采用IK自己的最大分词法,索引则采用它的细粒度分词法,各自配置了isMaxWordLength属性。
修改$SOLR_HOME/collection1/conf/schema.xml文件,在<fields></fields>中修改如下内容:

 <fieldType name="text_zh-cn" class="solr.TextField" positionIncrementGap="100">   <analyzer>    <tokenizer class="solr.SmartChineseSentenceTokenizerFactory"/>    <filter class="solr.SmartChineseWordTokenFilterFactory"/>    <filter class="solr.LowerCaseFilterFactory"/>    <filter class="solr.PositionFilterFactory" />    <filter class="solr.StopFilterFactory" ignoreCase="false" words="lang/stopwords_zh-cn.txt" enablePositionIncrements="true"/>   </analyzer>  </fieldType>

4.其它省略
???
也可以比较IKAnalyzer与Lucene自带的SmartChineseSentenceTokenizerFactory的差别,可以通过http://localhost:8080/solr/#/collection1/analysis中选择不同的分词器来查看。

转载自:http://www.cnblogs.com/nayitian/archive/2013/01/18/2866733.html

热点排行