paoding分词 如何按照自己的想法定义词典
我在自己的javaweb项目中加入了paoding分词搜索引擎
弄了很久 可以出来所有结果了
问题是
1、我想输入 '穿越小说' 让它搜索包括'穿越' 和'小说' 的内容,结果是搜索不到
2、我输入'穿越 小说'加了空格 就可以搜索到我想要的结果
我想问一下我给怎么定义词典可以实现 1 的要求?
请各位不吝赐教,谢谢!
还有我在任意一个词典文件中加入两行
穿越
小说
后,重新启动服务,按照步骤2做,又没有搜索到任何结果,为何?
[解决办法]
paoding分词器 它是一个按语义进行分词的
像"穿越小说" 它可能就分成"穿越" 和"小说" 两个关键字,而当你输入“穿越小说”作为关键字进行搜索的话,肯定是搜索不到含有'穿越' 和'小说' 的内容文件,因为索引文件中没有“穿越小说”这个关键字,只有当你输入'穿越' 或'小说' 作为关键字才能搜到相应的内容。
还有就是字母或数字,它会把它们作为整体作为一个关键字
如: 文件的内容是"111111 aabc",经过paoding分词器后,你只有输入"111111"或 "aabc"作为关键字,才能搜索到这个文件,而输入"1"作为关键字,是搜索不到该文件的。。
[解决办法]
在paoding的t-base词典里加入穿越小说 四个字 然后clear一下项目就加载进去了 我至今没找到更好的办法 我就这样做的
[解决办法]
可以设置分词粒度的把?
[解决办法]
用IK的拉到,paoding并不是最好的一个