分析客户画像的5个步骤都有哪些 分析客户画像的5个步骤( 二 )


在制定标签体系时,可以参考业界的标签体系,尤其是同行业的标签体系 。 用业界已有的成熟方案解决目标业务问题,不仅可以扩充思路,技术可行性也会比较高 。
此外,需要明确的一点是:标签体系不是一成不变的,随着业务的发展,标签体系也会发生变化 。 例如电商行业的用户标签,最初只需要消费偏好标签,GPS标签既难以刻画也没有使用场景 。 随着智能手机的普及,GPS数据变得易于获取,而且线下营销也越来越注重场景化,因此GPS标签也有了构建的意义 。
3)画像构建
基于用户基础数据,根据构建好的标签体系,就可以进行画像构建的工作了 。 用户标签的刻画是一个长期的工作,不可能一步到位,需要不断地扩充和优化 。 一次性构建中如果数据维度过多,可能会有目标不明确、需求相互冲突、构建效率低等问题,因此在构建过程中建议将项目进行分期,每一期只构建某一类标签 。
画像构建中用到的技术有数据统计、机器学习和自然语言处理技术(NLP)等,如图10-3所示 。 具体的画像构建方法会在本文后面的部分详细介绍 。

分析客户画像的5个步骤都有哪些 分析客户画像的5个步骤

文章插图

▲图10-3 用户画像的构建技术
2. 标签体系
目前主流的标签体系都是层次化的,如图10-4所示 。 首先标签分为几个大类,每个大类再进行逐层细分 。 在构建标签时,只需要构建最下层的标签,就能够映射出上面两级标签 。
上层标签都是抽象的标签集合,一般没有实用意义,只有统计意义 。 例如我们可以统计有人口属性标签的用户比例,但用户有人口属性标签,这本身对广告投放没有任何意义 。
分析客户画像的5个步骤都有哪些 分析客户画像的5个步骤

文章插图

▲图10-4 互联网大数据领域常用标签体系
用于广告投放和精准营销的一般是底层标签,对于底层标签有两个要求:一个是每个标签只能表示一种含义,避免标签之间的重复和冲突,便于计算机处理;另一个是标签必须有一定的语义,方便相关人员理解每个标签的含义 。
此外,标签的粒度也是需要注意的,标签粒度太粗会没有区分度,粒度过细会导致标签体系太过复杂而不具有通用性 。
下文列举了各个大类常见的底层标签 。
  • 人口标签:性别、年龄、地域、教育水平、出生日期、职业、星座
  • 兴趣特征:兴趣爱好、使用App/网站、浏览/收藏内容、互动内容、品牌偏好、产品偏好
  • 社会特征:婚姻状况、家庭情况、社交/信息渠道偏好
  • 消费特征:收入状况、购买力水平、已购商品、购买渠道偏好、最后购买时间、购买频次
最后介绍一下构建各类标签的优先级 。 对此需要综合考虑业务需求、构建难易程度等,业务需求各有不同,这里介绍的优先级排序方法主要依据构建的难易程度和各类标签的依存关系,优先级如图10-5所示 。
▲图10-5 各类标签的构建优先级
1)事实标签
基于原始数据首先构建的是事实标签,事实标签可以从数据库直接获取(如注册信息),或通过简单的统计得到 。 这类标签构建难度低、实际含义明确,且部分标签可用作后续标签挖掘的基础特征(如产品购买次数可用来作为用户购物偏好的输入特征数据) 。
事实标签的构造过程,也是对数据加深理解的过程 。 对数据进行统计的同时,不仅完成了数据的处理与加工,也对数据的分布有了一定的了解,为高级标签的构造做好了准备 。
2)模型标签
模型标签是标签体系的核心,也是用户画像中工作量最大的部分,大多数用户标签的核心都是模型标签 。 模型标签的构建大多需要用到机器学习和自然语言处理技术,下文介绍的标签构建主要指的是模型标签构建,具体的构造算法会在下文中详细介绍 。
3)高级标签
最后构造的是高级标签,高级标签是基于事实标签和模型标签进行统计建模得出的,它的构造多与实际的业务指标紧密联系 。 只有完成基础标签的构建,才能够构造高级标签 。 构建高级标签使用的模型,可以是简单的数据统计模型,也可以是复杂的机器学习模型 。
03 构建用户画像我们把标签分为三类,这三类标签有较大的差异,构建时所用技术的差别也很大 。