小弟求点VSM(向量空间模型)的资料,搞过的帮帮忙。
要做个基于向量空间模型的文本检索系统要用VC来做。。。看了一些论文,太概括了,看不太懂。。
这本书可以参考吗?
信息检索导论http://product.dangdang.com/product.aspx?product_id=20919956&ref=search-1-pub#catalog
头都大了,没有头绪。
[解决办法]
VSM不用看什么书吧,去搜篇英文论文来看就行了,没多长也没多复杂
[解决办法]
倒排表做没?
用倒排做索引,TF命中率做值,形成的向量,可以计算向量相似度,计算均值聚类。
原理非常简单,有大一的线性代数基础就可以看懂。