查询消歧(query disambiguation)有哪些常用的技术?
比如说输入一个查询"buy apple",怎么能知道在这里apple的含义是水果还是苹果公司呢?
本来我用wordNet来做消歧,但是wordnet的sense不够新,或者不够全面,比如关于apple没有苹果公司的这一含义……
其他的比较成熟的方法有哪些呢?谢谢~
[解决办法]
可以利用查询日志进行分析,从过去的查询词中找出当前查询词可能存在的不同语义
[解决办法]
统计日志点击日志。
如果“buy apple”,点击的主要是 手机,那么手机的概率更高。
次要的是水果,那么水果的概率更低。
[解决办法]
把查询记为q,点击的url类目为 c
其实就是统计概率P(c
[解决办法]
q)