搜索网站的原理
我在sql server中模拟了5000万条数据进行查询。大概要50秒左右。
衍生一个问题.搜索网站拥有的数据量是我的N倍,他是如何高效的查询。
[解决办法]
搜索网站根本不是用的关系数据库直接查询的。
比如java的开源搜索引擎,lucene。
先生成索引文件,再基于索引文件用lucene的api来查,还可以中文分词。
比如你搜:中国人,那么国人也会被搜出来,你用like就不能分词和同义词吧。
[解决办法]
用lucene吧,开源工具。
[解决办法]
lucene是搜索引擎必备
[解决办法]
索引啊~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~在.NET 下面也有lucene 可以自行研究下
[解决办法]
lucene,分布式搜索