首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 教程频道 > 网络技术 > 网络基础 >

Lucene 前缀搜寻 不好用

2013-01-07 
Lucene 前缀搜索 不好用本帖最后由 qin_olina 于 2010-04-16 21:30:06 编辑最近在学习Lucene,做《Lucene+nu

Lucene 前缀搜索 不好用
本帖最后由 qin_olina 于 2010-04-16 21:30:06 编辑 最近在学习Lucene,做《Lucene+nutch搜索引擎开发》搜索部分的 前缀搜索时,达不到预期效果。
完全是按书上的代码写的呀,为什么呢?
难道PrefixQuery不能实现前缀搜索吗? 

public static void PrefixQueryTest(){
try{
IndexSearcher searcher = new IndexSearcher(Dest_Index_Path);
Term term = new Term("content","记录");
PrefixQuery query = new PrefixQuery(term);
System.out.println(query.toString());
Hits hits = searcher.search(query);
System.out.println("Search Results:");
for(int i = 0;i < hits.length();i ++){
System.out.println(hits.doc(i));
}
}catch(IOException e){
e.printStackTrace();
}
System.out.println("Search Success");
}
运行结果:
content:记录*
class org.apache.lucene.search.PrefixQuery
Search Results:
Document<stored/uncompressed,indexed<id:001> stored/uncompressed,indexed,tokenized<content:记录 一>>
Document<stored/uncompressed,indexed<id:002> stored/uncompressed,indexed,tokenized<content:记录 二>>
Document<stored/uncompressed,indexed<id:003> stored/uncompressed,indexed,tokenized<content:记录 三>>
Document<stored/uncompressed,indexed<id:004> stored/uncompressed,indexed,tokenized<content:一 2345 记录>>
Document<stored/uncompressed,indexed<id:005> stored/uncompressed,indexed,tokenized<content:记录 新 一>>
Search Success

意料之外的结果是...
Document<stored/uncompressed,indexed<id:004> stored/uncompressed,indexed,tokenized<content:一 2345 记录>>
Document<stored/uncompressed,indexed<id:005> stored/uncompressed,indexed,tokenized<content:记录 新 一>>
(初次提问,不妥之处请多担待)
[解决办法]
这里应该很少有人玩这个东西,友情帮顶。。。
[解决办法]
正好需要。。。。
[解决办法]
前缀搜索比较少用
[解决办法]
因为你对content字段进行了分词,“记录一”会被分成“记录”和“一”两个词,“一2345记录”会被分成"一","2345","记录"三个词,使用前缀搜索时,搜索"记录",当然"记录"这个词也算是包含了前缀,而你的5条记录都包含"记录"这个词,当然都能搜索到了。你应该在增加索引时,将content字段设置成NOT_ANALYZED,不对content进行分词,这样就能达到你的预期效果了。

热点排行