高考考试网
当前位置: 首页 高考资讯

推荐策略产品经理必读系列-第三讲推荐系统的召回,一,

时间:2023-07-20 作者: 小编 阅读量: 4 栏目名: 高考资讯

分别构建用户的userembedding和物料的itemembedding,所以称为双塔。核心思想还是通过Embedding分别去表达User和Item的特征,然后再计算相似度。把销量的因素换成比如观看次数等等。这里抛一个问题比如热销召回里“销量”如何定义?如何既考虑长期销量,又考虑近期爆款?

编辑导语:推荐系统的7大环节中,其中非常核心的一环是召回,推荐系统中的召回策略是怎样的呢?本文重点介绍基于规则的召回,希望对你有所启发。

上一篇为大家介绍了推荐系统的整体架构,本篇为大家详细介绍推荐系统里面非常核心的一环就是召回。一共分为三篇文章来为大家详细介绍推荐系统中的召回策略。

一、主流的召回方法

目前市场上所有的召回方法都可以归纳为3大类。如下图所示:

1.1 基于规则的召回

基于规则是最常用的召回策略,也是解释性最强的召回策略。常见的规则召回策略有:基于内容标签的召回,基于商品销量或者内容热度的召回,召回历史高点击率的物料,召回平台评价&质量分比较高的物料,召回用户经常购买的一些商品或者常看的物料; Part2将会针对这一部分详细展开介绍。

此种策略的优缺点:

  • 优点:策略逻辑清晰明了,业务意义明确,可解释性极强;
  • 缺点:个性化弱,千人一面,为每个用户推荐的商品比较类似。同时容易引起马太效应,头部的物料得到越来越多的曝光机会,尾部的物料曝光机会越来越少。

1.2 协同过滤

协同过滤的召回算法可以说是推荐系统最经典的算法了,甚至可以说有了协同过滤算法才真正代表了推荐系统的诞生。协同过滤算法最经典的是以下两个算法:

I 2 I (Item-CF):

用户A喜欢的物料a,为用户A推荐和物料a比较相似的物料b;该算法的核心问题是如何计算物料a和其他物料b,c,d,e……的相似度;该算法最早起源于电商巨头亚马逊。

U 2 U(User-CF):

用户A和用户B很相似,为用户A推荐用户B感兴趣且用户A之前没有接触过的物料a,因为二者是相似的,所以我们认为用户B感兴趣的物料用户A也会感兴趣;该算法的核心是如何计算用户与用户之间的相似度。

此种策略的优缺点:

  • 优点:算法逻辑相对比较简单容易实现,但同时又有不错的效果,具备了一定的个性化。
  • 缺点:和基于规则的召回具有同样的问题,冷启动的问题比较明显,同时同样会存在一定的马太效应,头部热门商品更容易和其他商品产生更多关联。但是整体协同过滤算法的出现已经让推荐系统进步了一大截;协同过滤算法下一篇文章将详细展开介绍。

1.3 基于向量的召回

其实无论是基于规则的召回,还是协同过滤算法。我们都是通过一定规则或者方法去计算物料与物料之间的相似度,用户与用户之间的相似度。协同过滤算法里面更多是一种基于统计维度的,而随着算法进步我们引入一种新的思想。基于向量去计算相似度。

  • FM:Factor Machine-因子分解机,是在2010年由谷歌推荐系统的大佬Steffen Rendle提出的。核心思想是通过对两两特征组合,引入交叉项特征;其次是通过引入隐向量(对参数矩阵进行矩阵分解),降低模型的高维灾难,完成对特征的参数估计;
  • DSSM:Deep Structured Semantic Models,深度语义匹配模型,微软于2016年提出,又叫“双塔模型”。分别构建用户的user embedding和物料的item embedding,所以称为双塔。核心思想还是通过Embedding分别去表达User和Item的特征,然后再计算相似度。

此种策略的优缺点:

  • 优点:特征理解更加深刻,模型效果更优。
  • 缺点:模型可解释性差。

上述模型我们会在后续专门介绍向量召回的篇章中进行详细介绍。

二、基于规则的召回

下面重点详细为大家介绍基于规则召回里常见的一些召回思路。

2.1 标签召回

标签召回:推荐算法1.0时代都是基于内容的推荐,而基于内容的推荐基本上都是通过标签相似度来进行推荐。尤其是在电影&音乐网站上。比如你看过标签为“武侠”、“爱情”的电影,系统会基于这个标签给你召回相同标签的物料。

基于标签的召回核心是怎么给内容打标签,标签体系如何构建,这里面有大量的人工工作和业务经验。

2.2 Top Sale

热销召回:热销召回在电商领域比较多,基于商品的销量召回一些大家都比较喜欢,销量高的商品。这种召回策略应对冷启用户特别好用。同时扩展到内容领域逻辑也是一样,只是这里的“热销”可以换成“热度”。把销量的因素换成比如观看次数等等。

这里抛一个问题比如热销召回里“销量”如何定义?多长时间段的比较合适?如何既考虑长期销量,又考虑近期爆款?如何去除大促订单的影响?

2.3 Top CTR

高点击率商品召回:推荐系统核心还是要不断提升场景里面的点击率,所以我们在召回时就需要有专门的路去召回那些历史物料中点击率比较高的商品。当然这一路需要和其他路进行融合,不然会造成非常强的马太效应。这里继续抛一个问题:点击率的统计周期多久的比较合适?

2.4 Top Quality

高质量分的物料:此类物料是最适合用于冷启,在电商领域当一个新的用户访问系统不知道为他推荐什么商品时,我们可以为他推荐历史评价、销量、收藏、点赞等都反响比较好的商品。我们会对商品综合考虑上述因素计算一个商品的质量分,然后为其推荐排名Top K的商品。

2.5 Rebuy

复购的物料:这一路在生鲜电商里面经常用,很多用户每天买的蔬菜肉类都比较相似,所以推荐系统会专门有一路召回为用户推荐他历史购买过的商品。但是复购这一路召回在综合性电商里基本不用,比如淘宝&京东?大家可以思考一下为什么?

以上就是为大家整体介绍了推荐系统召回的主流思想,本篇重点介绍基于规则的召回。下面两篇分别详细介绍基于协同过滤的召回和基于向量的召回,敬请期待。

本文由 @King James 原创发布于人人都是产品经理。未经许可,禁止转载。

题图来自 Unsplash,基于 CC0 协议

    推荐阅读
  • python 单片机编程(单片机上的MicroPython之交互式解释器)

    本文以ESP32平台为例,介绍如何使用MicroPython中的REPL。为了连接启动REPL的命令行界面,你需要首先准备好一款虚拟终端软件。最新版本的Firefox和Chrome浏览器均能够支持该种模式。在早期带有WebREPL功能的MicroPython版本中,WebREPL在启动时便自动使能,并且允许在第一次连上WiFi后直接设置WebREPL密码。REPL基本使用方法一旦启动连接了REPL,便可以进行各种试验了。另一种结束当前语句输入的方式为键入回退

  • 泰安异地换领补领居民身份证要多少钱?

    第二章申领第六条年满16周岁的中国公民,应当向常住户口所在地的户口登记机关履行申领居民身份证的手续。第十四条公民领取居民身份证后因犯罪被拘留或者被逮捕的,其居民身份证由执行拘留、逮捕的公安机关收缴归入本人案卷。当被判处刑罚或者被批准劳动教养时,其居民身份证由人民法院或者批准劳动教养的机关交执行刑罚或者劳动教养的机关保存。第三十九条本细则自发布之日起施行。

  • 橘皮糖怎么做 橘皮糖怎么做的视频

    3、橘皮晾干,待橘皮够多就可以一起泡水。

  • 古代城门攻破后会怎样(为何不把城门砌死而是任由对方撞门呢)

    因为城门是供日常通过使用的,与厚达数米的城墙相比,城门是整个城池最薄弱的。而云梯这些攻城器械,最终的目的也是为了分散守军,掩护友军攻破城门。从战国到宋朝,兵书都强调“围城必阙”,攻城只围三面,可以避免守军陷入绝境死战。这从侧面其实也印证了古代的城池防御通常都不会把城门砌死,否则也就不存在“围城必阙”了。

  • 最狠的励志十句话(人生最励志的十句话)

    知足者身贫而心富,贪得者身富而心贫不是常说知足常乐吗?乐什么,就是乐我们的心富,虽没有多少财产,收入也没有在职的高,但我们心无牵挂。多一分快怡,少一分忧伤;多一分真实,少一分虚伪;多一分悠闲,少一分忙乱。少气多闲,身忙心闲。真正做到这八个字不容易,关键是个“闲”字。老年人安度晚年一定要有闲心,当然干点家务事也好,如果什么事都不做也无聊,但是不要身忙心乱,要身忙心闲。惟其如此,要活得简单才快乐。

  • 打印机被挂起怎么解决 打印机被挂起要怎么解决

    1、右键单击“此电脑”,点击属性,进入属性页面后选择“控制面板”并进入;2、找到“查看设备和打印机”点击进入,查看你连接的打印机图标上是否有感叹号,如果有则表示异常;3、右键单击该台打印机,选择“删除设备”;4、删除完成后重新启动电脑即可。

  • 紫砂壶常识(紫砂壶常见问题解答)

    因其产自江苏宜兴,故称宜兴紫砂。但是这并不是绝对的,在更高的领域,方器、圆器,甚至是花器、筋纹器,都没有贵贱之分,也不能纯粹以制作的复杂程度来断定哪个贵哪个便宜。所泡茶汤最好是在两个小时之内喝完,一方面能够保持茶香的本质,另一方面也能保证茶汤中最峰值数目的有益物质被人体所吸收。壶口盖做的再封密,壶盖能提起全壶来,也不能成为判断壶好坏的唯一标准。

  • 衣鱼虫用什么消灭(消灭衣鱼虫的方法)

    家里如果看到一种虫子细长状,银白色,身长约1厘米左右,头部和尾部都有两条长须,这种虫子就是衣鱼虫。家里如果发现衣鱼虫,一般应该是从外界进入的,另外也说明家里的环境比较潮湿,因为衣鱼虫在干燥的环境很难生存。通过改变衣鱼虫生存的环境,从而可以更好地消灭它们。用药时把药撒在衣鱼虫经常出现的位置及家里一些隐蔽的角落里,虫子碰到药后慢慢死亡,一般撒药后一段时间就能彻底消灭干净。

  • 解决肥胖有什么方法 解决肥胖有什么方法减肥

    如此除了减少脂肪堆积外,还能帮助消化。因为饭后30分钟内,如果保持不动的状态,最容易形成腹部脂肪。常环抱手臂在胸前,腹肌没有出力,容易突起。

  • 鳊鱼钓法技巧(鳊鱼的钓法技巧及钓位选择)

    鳊鱼钓法技巧手竿底钓这种钓法多是用在饲养池塘垂钓鲫鱼或者鲤鱼用的,也可以用来垂钓鳊鱼,但是不同的是吃口方面,鳊鱼的吃口不像鲫鱼那般沉稳,有点飘忽不定,在垂钓的时候发现浮漂先轻微上浮随后立即黑漂,就需要及时提竿刺鱼。手竿底钓鳊鱼的时候如果使用活饵的话,最好保证活饵的鲜活性,保证钩饵入水后具备较好的动态诱鱼效果,在垂钓的时候钩饵到位的话最好时不时的抖动钓线,让钩饵保持以动态诱鱼的效果。