一个自动分类问题的解决方案
需求:一个文章系统,在发布文章时不需要人为分类,只需要根据其文章内是否包含有指定关键词来自动决定该文章属于什么分类。
目前的解决思路:
表一:
表名:WenZhang)
列名:WZID BiaoTi NeiRong
示例: 1 “股票大跌启示” “文章内容信息略……”
2 “今日证券交易所信息” “文章内容信息略……”
--------------------
表二:
表名:Class
列名:ClassID ClassName Keywords
示例:1 财经新闻 财经,股票,交易所
2 IT新闻 电脑,微软,Google
--------------------
表三:
表名:List
列名:ClassID WZID
示例:1 1
1 2
=============================================
简单流程:在用户提交新闻时,会自动根据其文章及标题内容检查是否包含表Class当中的Keywords列中的关键词,如果存在任何一个,则将该文章WZID和符合的类别ClassID值Insert到了表List当中。
目前发现的问题:
表Class中的Keywords列中的关键词为了做到更准确匹配分类要求是可以增减修改的。但是一旦做了增减修改,就必然影响List表中相关分类的数据。在文章量已经很大量的情况下,要是因为某个关键词删除或新增了某个关键词就必须把list表中该类别所有记录整个删除然后重新.这样操作消耗太大了。
因此想问一下,是否有合适的办法减少这种消耗。或者根据以上所描述的需求能否有更好的解决办法。
[解决办法]
那我不得不ding一下了,哈哈
[解决办法]
算了。延用旧办法吧。另希望有人回贴,以便于我散分结贴
------------------------------------------------------
哦~哇哈哈
[解决办法]
另外,建议楼主
在表一(加一个字段,作为分类标识)插入数据的时候就确定该条记录属于那一类(表二),这样你以后改表二的分类规则就不会影响已经插入的数据了,而且显示的时候会少一个表连接,速度会好一些
------------------------------------------------
表一:
表名:WenZhang)
列名:WZID BiaoTi NeiRong
示例: 1 “股票大跌启示” “文章内容信息略……”
2 “今日证券交易所信息” “文章内容信息略……”