首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 教程频道 > 企业软件 > 企业开发 >

稿子的内容识别

2012-12-31 
文章的内容识别假设现在有体育,娱乐,汽车等类别,那如何根据一篇文章的内容识别其类别呢?(1)如果采用关键词

文章的内容识别
假设现在有体育,娱乐,汽车等类别,那如何根据一篇文章的内容识别其类别呢?
(1)如果采用关键词方法,数据库如何设计?
(2)如何让程序具有人工智能?
(3)中文或者日文的话,怎样对文章进行分词啊?
[解决办法]
建议你看一下Data mining: practical machine learning tools and techniques 和Data Mining: Concepts and Techniques这两本书,讲到了人工智能及数据挖掘的东西.关于多语言的问题,无论是关键词还是文章内容建议统一用unicode方式存取,这样比较的时候就不存在编码转化的问题了。

热点排行