常用推荐算法介绍——基于知识的推荐算法
您目前处于:大数据  -  大数据  2017年12月22日  阅读 148

转载请并标注: “本文转载自 linkedkeeper.com (文/肖依云)”

如果觉得我的文章对您有用,请随意赞赏。您的支持将鼓励我继续创作!

赞赏支持
分享到: 更多
作者  肖依云  发布于 2017年12月22日  阅读 183
1. 基本概念基于内容的过滤算法会推荐与用户最喜欢的物品类似的那些。但是,与协同过滤算法不同,这种算法是根据内容(比如标题、年份、描述),而不是人们使用物品的方式来总结其类似程度的。例如,如果某个用户喜欢电影《魔戒》的第一部和第二部,那么推荐系统会通过标题关键字向用户推荐《魔戒》的第三部。在基于内容的过滤算法中,会假设每个物品都有足够的描述信息可作为特征向量(y)(比如标题、年代、描述),而这些特...
作者  肖依云  发布于 2017年12月22日  阅读 114
1. 基本概念协同过滤推荐方法的主要思想是,利用已有用户群过去的行为或意见预测当前用户最可能喜欢哪些东西或对哪些东西感兴趣。纯粹的协同方法的输入数据只有给定的用户-物品评分矩阵,输出数据一般有以下几种类型:(1)表示当前用户对物品喜欢或不喜欢程度的预测数值;(2)n项推荐物品的列表。用户行为的统一表示:user id产生行为的用户的唯一标识item id产生行为的对象的唯一标识behavior t...
作者  肖依云  发布于 2017年12月22日  阅读 148
作者 王雷 发布于 2017年09月18日  阅读 3087
为了满足日益增长的业务变化,京东的京麦团队在京东大数据平台的基础上,采用了Hadoop等热门的开源大数据计算引擎,打造了一款为京东运营和产品提供决策性的数据类产品-北斗平台。一、Hadoop的应用业务分析大数据是不能用传统的计算技术处理的大型数据集的集合。它不是一个单一的技术或工具,而是涉及的业务和技术的许多领域。目前主流的三大分布式计算系统分别为:Hadoop、Spark和Strom:Hadoo...
作者  曹德然  发布于 2017年08月04日  阅读 4622
引言HBase是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,适用于结构化的存储,底层依赖于Hadoop的HDFS,利用HBase技术可在廉价PCServer上搭建起大规模结构化存储集群。因此HBase被广泛使用在大数据存储的解决方案中。为何使用HBase HBase的优点:列可以动态增加,并且列为空就不存储数据,节省存储空间。Hbase自动切分数据,使得数据存储自动具有水平scalabi...