做采集系统,采集后的文章URL在历史表中做记录,以后采集文章的时候,从历史表中比较,采集过的就不要采集了。做采集系统,采集后的文章URL在历史表中做记录,以后采集文章的时候,从历史表中比较,采集过的就不要采集了。 但是历史表越拉越大,以后即使采集一篇文章都要和历史表所有记录比较一下,是不是效率太低了?有啥解决办法?[解决办法]学习