在制定标签体系时,可以参考业界的标签体系,尤其是同行业的标签体系 。 用业界已有的成熟方案解决目标业务问题,不仅可以扩充思路,技术可行性也会比较高 。
此外,需要明确的一点是:标签体系不是一成不变的,随着业务的发展,标签体系也会发生变化 。 例如电商行业的用户标签,最初只需要消费偏好标签,GPS标签既难以刻画也没有使用场景 。 随着智能手机的普及,GPS数据变得易于获取,而且线下营销也越来越注重场景化,因此GPS标签也有了构建的意义 。
3)画像构建
基于用户基础数据,根据构建好的标签体系,就可以进行画像构建的工作了 。 用户标签的刻画是一个长期的工作,不可能一步到位,需要不断地扩充和优化 。 一次性构建中如果数据维度过多,可能会有目标不明确、需求相互冲突、构建效率低等问题,因此在构建过程中建议将项目进行分期,每一期只构建某一类标签 。
画像构建中用到的技术有数据统计、机器学习和自然语言处理技术(NLP)等,如图10-3所示 。 具体的画像构建方法会在本文后面的部分详细介绍 。
文章插图
▲图10-3 用户画像的构建技术
2. 标签体系
目前主流的标签体系都是层次化的,如图10-4所示 。 首先标签分为几个大类,每个大类再进行逐层细分 。 在构建标签时,只需要构建最下层的标签,就能够映射出上面两级标签 。
上层标签都是抽象的标签集合,一般没有实用意义,只有统计意义 。 例如我们可以统计有人口属性标签的用户比例,但用户有人口属性标签,这本身对广告投放没有任何意义 。
文章插图
▲图10-4 互联网大数据领域常用标签体系
用于广告投放和精准营销的一般是底层标签,对于底层标签有两个要求:一个是每个标签只能表示一种含义,避免标签之间的重复和冲突,便于计算机处理;另一个是标签必须有一定的语义,方便相关人员理解每个标签的含义 。
此外,标签的粒度也是需要注意的,标签粒度太粗会没有区分度,粒度过细会导致标签体系太过复杂而不具有通用性 。
下文列举了各个大类常见的底层标签 。
- 人口标签:性别、年龄、地域、教育水平、出生日期、职业、星座
- 兴趣特征:兴趣爱好、使用App/网站、浏览/收藏内容、互动内容、品牌偏好、产品偏好
- 社会特征:婚姻状况、家庭情况、社交/信息渠道偏好
- 消费特征:收入状况、购买力水平、已购商品、购买渠道偏好、最后购买时间、购买频次
▲图10-5 各类标签的构建优先级
1)事实标签
基于原始数据首先构建的是事实标签,事实标签可以从数据库直接获取(如注册信息),或通过简单的统计得到 。 这类标签构建难度低、实际含义明确,且部分标签可用作后续标签挖掘的基础特征(如产品购买次数可用来作为用户购物偏好的输入特征数据) 。
事实标签的构造过程,也是对数据加深理解的过程 。 对数据进行统计的同时,不仅完成了数据的处理与加工,也对数据的分布有了一定的了解,为高级标签的构造做好了准备 。
2)模型标签
模型标签是标签体系的核心,也是用户画像中工作量最大的部分,大多数用户标签的核心都是模型标签 。 模型标签的构建大多需要用到机器学习和自然语言处理技术,下文介绍的标签构建主要指的是模型标签构建,具体的构造算法会在下文中详细介绍 。
3)高级标签
最后构造的是高级标签,高级标签是基于事实标签和模型标签进行统计建模得出的,它的构造多与实际的业务指标紧密联系 。 只有完成基础标签的构建,才能够构造高级标签 。 构建高级标签使用的模型,可以是简单的数据统计模型,也可以是复杂的机器学习模型 。
03 构建用户画像我们把标签分为三类,这三类标签有较大的差异,构建时所用技术的差别也很大 。
- 第一类是人口属性,这一类标签比较稳定,一旦建立很长一段时间基本不用更新,标签体系也比较固定;
- 第二类是兴趣属性,这类标签随时间变化很快,标签有很强的时效性,标签体系也不固定;
推荐阅读
- 竞品分析的目的有哪些 竞品分析的目的
- 网页没有声音常见故障分析和解决方法新系统了解的东西
- 申请礼品理由写的方法 客户礼品申请怎么写
- 开车送客户需要注意什么礼物 开车送客户需要注意什么礼物
- 战魂铭人最强道具推荐-道具强度排行分析来看看
- 拜年送这些礼品给长辈 拜年送客户什么礼品合适
- 男客户送的礼物 俄罗斯客户喜欢什么礼物
- QQ音乐PC客户端v17.91.0.0
- 顾客结婚送这些好 客户结婚送什么礼物给他老婆
- [给力项目]客户裂变操盘手实战营:一台手机+一台电脑,让你的客户从500人裂变5000人