推荐系统
问题
- DeepWalk的图是如何建立的?
协同过滤
User-based CF:找到用户的相似性,根据A喜欢的东西推荐给B
Item-based CF:找到物品的相似新,如果用户买了物品1,推荐物品2.
基于领域的协同过滤(单纯利用统计信息计算相似程度)
创建user-item的矩阵,计算出用户与用户相似度,物品与物品之间的相似度。
基于模型的协同过滤算法
基于领域的缺点:稀疏矩阵
缺点:可能协同矩阵很大,很难求解分解的三个矩阵
阿里推荐算法
问题:长尾效应、新商品的冷启动
GraphEmbedding召回
问题:用户的长尾覆盖度、新商品的冷启动
GraphEmbedding解决方法:利用用户的序列化点击行为构建全网行为graph,结合深度随机游走对用户“虚拟采样”拟合多阶潜在兴趣信息。扩大了用户的长尾兴趣宝贝召回
将商品映射到低维向量,计算i2i的相似表
DeepWalk算法
首先建立了一张图?问题:这张图怎么建立的。
对图中的每个节点,建立训练数据(节点x,领域节点集合y),构建类似SkipGram的训练集。
首先从网络中采样训练数据,每一个训练数据是由局部相邻的节点组成的序列,DeepWalk将这组序列看成语言模型中的一个短句或短语,将短句中的每个词转换成隐式表达,同时最大化给定短句某个中心词时,出现上下文单词的概率。这里的词对应着商品,每个词有一个向量,每个商品也有一个向量。
DeepCross
ResNet实时网络排序