首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 教程频道 > 开发语言 > 编程 >

lucene Field一部分参数设置含义

2012-12-21 
lucene Field部分参数设置含义/*** Field.Store.COMPRESS:压缩保存,用于长文本或二进制数据* Field.Store.

lucene Field部分参数设置含义

         /**         * Field.Store.COMPRESS:压缩保存,用于长文本或二进制数据         * Field.Store.YES:保存         * Field.Store.NO:不保存         *         * Field.Index.NO:不建立索引         * Field.Index.TOKENIZED:分词,建索引         * Field.Index.UN_TOKENIZED:不分词,建索引         * Field.Index.NO_NORMS:不分词,建索引.但是Field的值不像通常那样被保存,而是只取一个byte,这样节约存储空间         *         * Field.TermVector.NO:不保存term vectors         * Field.TermVector.YES:保存term vectors         * Field.TermVector.WITH_POSITIONS:保存term vectors.(保存值和token位置信息)         * Field.TermVector.WITH_OFFSETS:保存term vectors.(保存值和Token的offset)         * Field.TermVector.WITH_POSITIONS_OFFSETS:保存term vectors.(保存值和token位置信息和Token的offset)         */ 
? 1 楼 csdn_zuoqiang 2011-12-26   Field.Store.YES:存储字段值(未分词前的字段值)
Field.Store.NO:不存储,存储与索引没有关系
Field.Store.COMPRESS:压缩存储,用于长文本或二进制,但性能受损

Field.Index.ANALYZED:分词建索引
Field.Index.ANALYZED_NO_NORMS:分词建索引,但是Field的值不像通常那样被保存,而是只取一个byte,这样节约存储空间
Field.Index.NOT_ANALYZED:不分词且索引
Field.Index.NOT_ANALYZED_NO_NORMS:不分词建索引,Field的值去一个byte保存

TermVector表示文档的条目(由一个Document和Field定位)和它们在当前文档中所出现的次数
Field.TermVector.YES:为每个文档(Document)存储该字段的TermVector
Field.TermVector.NO:不存储TermVector
Field.TermVector.WITH_POSITIONS:存储位置
Field.TermVector.WITH_OFFSETS:存储偏移量
Field.TermVector.WITH_POSITIONS_OFFSETS:存储位置和偏移量

热点排行