首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 教程频道 > 网站开发 > 高性能WEB开发 >

需要遍历一个页面的所有标题和数据库中的记录进行匹配,请问怎么设计

2013-06-26 
需要遍历一个页面的所有标题和数据库中的记录进行匹配,请教如何设计最近有一个需求,做一个类似网页抓取的

需要遍历一个页面的所有标题和数据库中的记录进行匹配,请教如何设计
最近有一个需求,做一个类似网页抓取的东西,需要遍历里某个网页的所有文章标题,然后根据数据库里的关键字和文章匹配,打标记,想请教各位大神如何设计,每次都去数据库里拿太耗了吧。关键字记录大概有上千条,需要逐个去和标题匹配。项目用的原生的jdbc,请教大神们如何设计啊...
[解决办法]
业务层与数据持久层(jdbc)之间加一块缓存,可以直接采用开源的memcache,开始时,先对缓存预热,
key:关键字 value:"1"
通过get("入参")方法,如果返回“1”,表示数据库里面有记录
[解决办法]
头像不错,盯着看忘了想问题。
[解决办法]
我感觉关键的问题是这里,根据数据库里的关键字和文章匹配...
串匹配查库肯定是会慢的....
使用---缓存是一种解决方案...
感觉可以建立外部倒排索引....?通过索引查到库里的主建---
如果是建外部索引感觉要解决好几个问题?
索引与库的同步
与索引读---和写

热点排行