首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 教程频道 > 其他教程 > 开源软件 >

solr汉语言分词(mmseg4j)

2012-06-27 
solr中文分词(mmseg4j)1、从http://code.google.com/p/mmseg4j/??? 下载mmseg4j?2、在$SOLR_HOME下建立lib和

solr中文分词(mmseg4j)

1、从http://code.google.com/p/mmseg4j/??? 下载mmseg4j

solr汉语言分词(mmseg4j)

?

2、在$SOLR_HOME下建立lib和dic两个目录,讲mmseg4j-all-1.8.4.jar拷贝到lib目录,将data里的.dic文件拷贝到dic目录

?

3、修改Schema.xml

添加fieldType

?
?

?

重启tomcat


进入 http://yourhost:8080/solr-example/admin/analysis.jsp

solr汉语言分词(mmseg4j)

?

哦也,我们的中文分词大功告成了

?

我们试着提交些中文到solr里,然后进行查询

solr汉语言分词(mmseg4j)

?

?

接下来我们试着查询一下:

solr汉语言分词(mmseg4j)

?

查询结果

?可能会遇到的问题:

1、在Query String:输入中文时候会乱码导致查询不到结果

解决办法:修改tomcat的server.xml

<Server ...> <Service ...>   <Connector ... URIEncoding="UTF-8"/>     ...   </Connector> </Service></Server>
?

?

热点排行