协同过滤算法 R/mapreduce/spark mllib多语言实现

  • 时间:
  • 浏览:2
  • 来源:uu快3开奖_uu快3娱乐_输钱

        1)最近邻模型:基于距离的协同过滤算法

http://www.cnblogs.com/technology/p/4467895.html

参考文章:

适用场景

     对于有另另3个 多在线网站,用户的数量往往超过物品的数量,同時 物品数据相对稳定,怎么让计算物品的例如度不但     计算量小,同時 暂且频繁更新。怎么让许多清况 只适用于电子商务类型的网站,像新闻类,博客等例如网站的     系统推荐,清况 往往是相反的,物品数量是海量的,怎么让频繁更新。r语言实现基于物品的协同过滤算法      

1) Item-Based,非个性化的,每许多人看多的都一样

2) User-Based,个性化的,每许多人看多的不一样对用户的行为分析得到用户的喜好后,可不前要根据用户的喜好计算例如用户和物品,怎么让可不前要基于例如用户或物品进行推荐。这时候协同过滤中的有另另3个 多分支了,基于用户的和基于物品的协同过滤。

       3)Graph:图模型,社会网络图模型

代码下载

spark ALS实现

本文出自 “点滴积累” 博客,请务必保留此出处http://tianxingzhe.blog.51cto.com/3390077/17500048

       2)Latent Factor Mode(SVD):基于矩阵分解的模型

        按照模型,可不前要分为:

http://www.mamicode.com/info-detail-865258.html

3)基于模型(ModelCF)

https://github.com/bsspirit/maven_hadoop_template/releases/tag/recommend

Spark mllib里用的是矩阵分解的协同过滤,都有UserBase也都有ItemBase。

mareduce 实现

http://grouplens.org/datasets/movielens/

在计算用户之间的例如度时,是将有另另3个 多用户对所有物品的偏好作为有另另3个 多向量,而在计算物品之间的例如度时,是将所有用户对某个物品的偏好作为有另另3个 多向量。求出例如度后,接下来可不前要求例如邻居了。

http://blog.csdn.net/acdreamers/article/details/446725005

用户电影评分数据集下载

参考文章:

参考文章:

http://www.cnblogs.com/anny-19500/articles/3519555.html

http://blog.fens.me/rhadoop-mapreduce-rmr/