数据库搜索引擎
请问各位大牛,关于海量数据的查询除了数据库建索引之外,是否还关系到算法问题?
如果我想做一个数据库方面的搜索引擎该从何着手?
还有,百度搜索引擎它是怎么从数据库中快速检索到你所输入的关键字的?
希望得到各位高手的指导,谢谢!
[解决办法]
搜索引擎一般不用数据库,因为性能太低,文件系统的效率要高,一般使用索引文件来处理
具体的就是分级索引。通过这个就可以找到关键词,然后通过查询倒排表,来找到相应的页面索引。
[解决办法]
所谓倒排技术就是说,它把“文档里面有哪些词?”转化成了“哪些文档里面出现了某个词?”这样的问题
也就是说,对于文档里出现的某个词,索引的时候将哪些文档里面含有这个词给找出来,这样在搜索的时候就直接可以搜到了
关于数据库搜索,现在我使用compass来做,这个引擎还是不错的
既适合与Hibernate、Spring这种框架结合,也适合直接用Jdbc来建立与数据库的连接
具体的可以看这里
http://www.compass-project.org/