首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 教程频道 > 其他教程 > 开源软件 >

Solr平添IKAnalysis中文分词

2013-12-02 
Solr添加IKAnalysis中文分词fieldType nametextik analyzer isMaxWordLengthfalse/filterignor

Solr添加IKAnalysis中文分词
<fieldType name="textik" > <analyzer isMaxWordLength="false"/> <filter ignoreCase="true" words="stopwords.txt"/> <filter generateWordParts="1" generateNumberParts="1" catenateWords="1" catenateNumbers="1" catenateAll="0" splitOnCaseChange="1"/> <filter protected="protwords.txt"/> <filter isMaxWordLength="false"/> <filter ignoreCase="true" words="stopwords.txt"/> <filter generateWordParts="1" generateNumberParts="1" catenateWords="1" catenateNumbers="1" catenateAll="0" splitOnCaseChange="1"/> <filter protected="protwords.txt"/> <filter name="code"> <fields> <field name="title" type="textik" indexed="true" stored="true" required="true" /> </fields>

?

?

3. 将下载的IKAnalyzer目录下的IKAnalyzer3.2.8.jar放入 TOMCAT/webapps/该solr工程/WEB-INFO/lib 目录下

?

4. 将下载的IKAnalyzer目录下的IKAnalyzer.cfg.xml和ext_stopword.dic文件放入 TOMCAT/webapps/该solr工程/classes 目录下,你也可以自己定义停用词字典,然后在IKAnalyzer.cfg.xml中进行配置,多个停用词字典之间用逗号隔开

?

5. 重启tomcat,输入http://域名:端口号/该solr工程/admin/analysis.jsp,效果如下:


Solr平添IKAnalysis中文分词
?

?

?

热点排行