推荐引擎基本概念及内容 如何搭建个性化推荐引擎系统?

什么是RecEng:
推荐引擎( Recommendation Engine , 简称RecEng )是在阿里云计算环境下建立的一套推荐服务框架 , 用于实时预测用户对物品偏好 , 支持您定制推荐算法 , 支持 A/B Test 效果对比 。 阿里云推荐引擎 , 以数据驱动业务 , 通过人工智能实现1对1营销 , 为您的顾客提供量身定做的服务 , 帮助企业快速创新 。 同时能够为您的企业降低运营成本 , 提高顾客对企业的满意度和忠诚度 , 提升企业的业务目标 。
课程详细内容:(点击下方“了解更多”立即学习)
本认证系统的讲解了推荐系统的概念、应用、算法原理 , 并详细介绍了阿里的推荐引擎产品RecEng , 最后通过一个微项目让学员亲自动手搭建一个推荐系统 。
整个过程分为数据上传、数据预处理、推荐系统设置、测试上线四个部分 , 学员可参考本实验 , 结合企业自身业务和需求 , 将所学应用到实践中去 。
通过本案例 , 学员可了解推荐系统的概念、应用、算法原理以及阿里的推荐引擎产品RecEng的使用方法 。 通过动手实践 , 学员可以独立使用推荐引擎产品RecEng快速搭建企业推荐系统 。
推荐引擎基本概念:

  • 客户/租户(org/tenant)
指RecEng的使用者 , 系统中由其阿里云账号代表 。 通常客户是一个组织 , RecEng中常用org表示客户 。
  • 用户(user)
指客户的用户 , 即RecEng使用者的用户 。 推荐是一个2C的服务 , 使用推荐服务的客户必然有其自己的用户 , RecEng使用者的用户简称为“用户” , 系统中常用user表示用户 。
  • 物品(item)
指被推荐给用户的内容 , 可以是商品 , 也可以是歌曲 , 视频等其他内容 , 系统中常用item表示物品 。
  • 业务(biz)
业务针对数据集定义 , 定义了算法所能使用的数据范围 。 一个客户在RecEng上可以有多个业务 , 不同的业务必然有不同的数据集 。 RecEng要求每个业务提供四类数据(不要求全部提供):用户数据 , 物品数据 , 用户行为数据 , 推荐效果数据 。 每一组这样的数据就构成一个业务 。 系统中常用biz表示业务 。
比如某客户A有两类被推荐的物品 , 分别是视频和歌曲 , 于是客户A可以在RecEng上建立两个业务M和N , 其中M的物品数据为视频 , N的物品数据为歌曲 , 其他的数据(指用户数据 , 用户行为数据等)可以都相同 。 在这种方案下 , 业务M和N的数据是独立的 , 即业务M虽然能看到用户对于歌曲的行为 , 但是业务M中不包含歌曲的物品数据 , 所以会丢弃用户对于歌曲的行为;如果业务M中某用户只对歌曲有行为 , 对视频没有行为 , 业务M也会丢弃这类用户 。 反之对业务N亦然 。
一个业务最好只推荐一类物品 。 多类物品的推荐在后续的行业模板会有支持 , 需要引入板块(plate)的概念 , 一份业务数据可以生成多个板块的数据集 , 场景绑定某个板块进行推荐算法计算 。
  • 场景(scn)
场景指的是推荐的上下文 , 每个场景都会输出一个API , 场景由推荐时可用的参数决定 。 有两种场景最为常见 , 分别是首页推荐场景和详情页推荐场景 。 顾名思义 , 在执行首页推荐时 , 可用的参数只有用户信息;而在执行详情页推荐时 , 可用的参数除了用户信息 , 还包括当前详情页上所展示的物品信息 。 系统中常用scn表示场景 。
一个业务可以包含多个场景 , 即对于某个业务A , 它包含多个首页场景也是完全可以的 。
事实上 , 回到场景的原始定义 , 场景只是由推荐的上下文决定 , 客户完全可以根据自己的需求建立全新的场景 , 比如针对搜索关键词的推荐场景 , 这时可用的参数除了用户信息 , 还有用户所输入的关键词 。
  • 流程(flow)
算法流程指数据端到端的处理流程 , 一部分流程属于业务范畴 , 如数据导入流程 , 效果计算流程 , 数据质量分计算流程;一部分属于场景 , 比如场景算法流程 。 从数据源类型和产出来划分 , 又分为离线流程 , 近线流程 , 在线流程

推荐阅读