lucene2.4.0 demo 中文支持搭建
由于自己的毕业设计要对html文件建索引,所以参考了 lucene2.4.0的demo,由于现在网上对这个demo的搭建都是较早版本,所以有很多的问题,现在把我的步骤阐述一下:
step1:首先需要准备好lucene-core-2.4.0.jar和IKAnalyzer2.0.2OBF.jar(不要使用IKAnalyzer1.4版本,它不怎么支持lucene-core-2.4.0.jar).
step2:在elipse里面建立一个java工程,把demo的原代码拷贝过来.
step3:把这个demo代码中的全部StandardAnalyzer修改为IK_CIKAnalyzer,此时你去调试demo会出现类似一下错误:
step4:解决上面的问题需要:
第一:先下载一个javacc
第二:修改HtmlParser.jj文件的
options { IGNORE_CASE = true; STATIC = false;} 为:
options { IGNORE_CASE = true; STATIC = false;UNICODE_INPUT=true;}
第三:运行javacc HtmlParser.jj
第四:把产生出来的7个java文件覆盖原先的java源文件
此时去建立索引试没有问题了,
但是如果要使用luceneweb来搜索还要修改jsp编码问题
step5:把luceneweb下面的5个jsp文件都加上
step6:还需要修改results.jsp
把62行的
OK了
1 楼 kafei819000 2009-02-16 就不知道你在说些什么 lucene2.4在2.3的基础上有了很大的改变,许多方法已经不建议使用,并且在建立索引时的算法也已经彻底换掉,你的帖子是要说明lucene2.4的功能呢?还是要说明和以前的区别?搭建这个demo说明什么意义?而你说的demo是lucene自带的,如果你想要深入研究lucene,那么在javaeye上有好多关于这方面的帖子可以参考的。 2 楼 renavatior 2009-02-18 这个demo,是支持中文的,原先只能支持英文,这样对有些人上手方便点而已了