首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 教程频道 > 开发语言 > 编程 >

3、索引建立步骤

2012-12-23 
三、索引建立步骤索引建立步骤1、创建DirectoryDirectory directory FSDirectory.open(new File(D:/test/

三、索引建立步骤

索引建立步骤


1、创建Directory

Directory directory = FSDirectory.open(new File("D:/test/index01"));

?

2、创建Writer

IndexWriter writer = new IndexWriter(directory, new IndexWriterConfig(Version.LUCENE_35,new StandardAnalyzer(Version.LUCENE_35)));

?

3、创建文档并且添加索引


??????????? 文档和域的概念很重要
??????????? 文档相当于表中的每一条记录,域相当于表中每一个字段


??? ??? ??? Document document = null;
??? ????
??? ??? ??? Collection<File> files = FileUtils.listFiles(new File("D:/test/lucene"),FileFileFilter.FILE, null);
??? ??? ??? for (File file : files) {
??? ??? ??? ??? document = new Document();
??? ??? ??? ??? document.add(new Field("content", new FileReader(file)));
??? ??? ??? ??? document.add(new Field("filename", file.getName(), Field.Store.YES, Field.Index.NOT_ANALYZED));
??? ??? ??? ??? document.add(new Field("path", file.getAbsolutePath(), Field.Store.YES,Field.Index.NOT_ANALYZED));//是否存储路径,是否进行分词
??? ??? ??? ???
??? ??? ??? ??? writer.addDocument(document);
??? ??? ??? }

4、查询索引的基本信息


??? ??? ??? IndexReader reader = IndexReader.open(directory);
??? ??? ??? //通过reader可以有效的获取到文档的数量
??? ??? ??? System.out.println("numDocs:" + reader.numDocs());//可以使用的文档数量
??? ??? ??? System.out.println("maxDocs:" + reader.maxDoc());//所有的文档数量,包括被删除的文档
??? ??? ??? System.out.println("deleteDocs:" + reader.numDeletedDocs());//被删除的文档数量
??? ??? ??? reader.close();
??? ??

5、删除索引

//参数是一个选项,可以是一个Query,也可以是一个term,term是一个精确查找的值
//此时删除的文档并不会被完全删除,而是存储在一个回收站中的,可以恢复
writer.deleteDocuments(new Term("id", "1"));
writer.commit();


6、恢复删除

??? ? try {
??? ??? ??? IndexReader reader = IndexReader.open(directory, false);
??? ??? ??? //恢复时,必须把IndexReader的只读(readOnly)设置为false
??? ??? ??? reader.undeleteAll();
??? ??? ??? reader.close();


7、强制删除,相当于删除回收站里面的,彻底删除了

writer = new IndexWriter(directory, new IndexWriterConfig(Version.LUCENE_35, new StandardAnalyzer(Version.LUCENE_35)));
writer.forceMergeDeletes();


8、优化和合并索引

writer = new IndexWriter(directory, new IndexWriterConfig(Version.LUCENE_35, new StandardAnalyzer(Version.LUCENE_35)));
//会将索引合并为2段,这两段中的被删除的数据会被清空
//特别注意:此处Lucene在3.5之后不建议使用,因为会消耗大量的开销,

//Lucene会根据情况自动处理的
writer.forceMerge(2);


9、更新索引

??? ??? ??? writer = new IndexWriter(directory, new IndexWriterConfig(Version.LUCENE_35,
??? ??? ??? ??? new StandardAnalyzer(Version.LUCENE_35)));
??? ??? ??? /*
??? ??? ??? ?* Lucene并没有提供更新,这里的更新操作其实是如下两个操作的合集
??? ??? ??? ?* 先删除之后再添加
??? ??? ??? ?*/
??? ??? ??? Document doc = new Document();
??? ??? ??? doc.add(new Field("id", "11", Field.Store.YES, Field.Index.NOT_ANALYZED_NO_NORMS));
??? ??? ??? doc.add(new Field("email", emails[0], Field.Store.YES, Field.Index.NOT_ANALYZED));
??? ??? ??? doc.add(new Field("content", contents[0], Field.Store.NO, Field.Index.ANALYZED));
??? ??? ??? doc .add(new Field("name", names[0], Field.Store.YES, Field.Index.NOT_ANALYZED_NO_NORMS));
??? ??? ??? writer.updateDocument(new Term("id", "1"), doc);

??????????? //会把原来id=1的那个文档删掉,新增id=11的那个文档

热点排行