solr中文分词(mmseg4j)
1、从http://code.google.com/p/mmseg4j/??? 下载mmseg4j
?
2、在$SOLR_HOME下建立lib和dic两个目录,讲mmseg4j-all-1.8.4.jar拷贝到lib目录,将data里的.dic文件拷贝到dic目录
?
3、修改Schema.xml
添加fieldType
???
重启tomcat
进入 http://yourhost:8080/solr-example/admin/analysis.jsp
?
哦也,我们的中文分词大功告成了
?
我们试着提交些中文到solr里,然后进行查询
?
?
接下来我们试着查询一下:
?
查询结果
?可能会遇到的问题:1、在Query String:输入中文时候会乱码导致查询不到结果
解决办法:修改tomcat的server.xml
<Server ...> <Service ...> <Connector ... URIEncoding="UTF-8"/> ... </Connector> </Service></Server>??