推荐系统

问题

  • DeepWalk的图是如何建立的?

协同过滤

  • User-based CF:找到用户的相似性,根据A喜欢的东西推荐给B

  • Item-based CF:找到物品的相似新,如果用户买了物品1,推荐物品2.

  • 基于领域的协同过滤(单纯利用统计信息计算相似程度)

    创建user-item的矩阵,计算出用户与用户相似度,物品与物品之间的相似度。

  • 基于模型的协同过滤算法

    基于领域的缺点:稀疏矩阵

    缺点:可能协同矩阵很大,很难求解分解的三个矩阵

阿里推荐算法

  • 问题:长尾效应、新商品的冷启动

  • GraphEmbedding召回

    问题:用户的长尾覆盖度、新商品的冷启动

    GraphEmbedding解决方法:利用用户的序列化点击行为构建全网行为graph,结合深度随机游走对用户“虚拟采样”拟合多阶潜在兴趣信息。扩大了用户的长尾兴趣宝贝召回

    将商品映射到低维向量,计算i2i的相似表

    • DeepWalk算法

      首先建立了一张图?问题:这张图怎么建立的

      对图中的每个节点,建立训练数据(节点x,领域节点集合y),构建类似SkipGram的训练集。

      首先从网络中采样训练数据,每一个训练数据是由局部相邻的节点组成的序列,DeepWalk将这组序列看成语言模型中的一个短句或短语,将短句中的每个词转换成隐式表达,同时最大化给定短句某个中心词时,出现上下文单词的概率。这里的词对应着商品,每个词有一个向量,每个商品也有一个向量。

  • DeepCross

  • ResNet实时网络排序