首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 教程频道 > 数据库 > 数据库开发 >

数据挖掘:用户推荐系统技术深度揭底

2012-07-19 
数据挖掘:用户推荐系统技术深度揭秘数据科学家需要具备专业领域知识并研究相应的算法以分析对应的问题,而

数据挖掘:用户推荐系统技术深度揭秘

数据科学家需要具备专业领域知识并研究相应的算法以分析对应的问题,而数据挖掘是其必须掌握的重要技术。以帮助创建推动业务发展的相应大数据产品和大数据解决方案。EMC最近的一项调查也证实了这点。调查结果显示83%的人认为大数据浪潮所催生的新技术增加了数据科学家的需求。本文将为您展示如何基于一个简单的公式查找相关的项目。请注意,此项技术适用于所有的网站(如亚马逊),以个性化用户体验、提高转换效率。

查找相关项问题

数据挖掘:用户推荐系统技术深度揭底

要想为一个特定的项目查找相关项,就必须首先为这两个项目定义相关之处。而这些也正是你要解决的问题:

  • 在博客上,你可能想以标签的形式分享文章,或者对比查看同一个人阅读过的文章
  • 亚马逊站点被称为“购买此商品的客户还购买了”的部分
  • 一个类似于IMDB(Internet Movie Database)的服务,可以根据用户的评级,给出观影指南建议

    不论是标签、购买的商品还是观看的电影,我们都要对其进行分门别类。这里我们将采用标签的形式,因为它很简单,而且其公式也适用于更复杂的情形。

    以几何关系重定义问题

    现在以我的博客为例,来列举一些标签:

      欧式几何空间距离

      计算欧式几何空间两点之间距离的数学公式非常简单。考虑相关两点A、B之间的距离:

      数据挖掘:用户推荐系统技术深度揭底

      两点之间的距离越近,它们的相关性越大。下面是Ruby代码:

        下面是Ruby代码:

          ?代码如下:

            红线、黄线和蓝线是具有相同长度的曼哈顿距离,绿线代表欧氏几何空间距离

热点排行