做好数据分析的4大思维 如何数据分析?( 二 )


很明显 , 指标就是用来定义、评价和衡量业务的一个标准 。 比如网站相关用户访问量、停留时长、跳出率等 。 销售相关销售量、销售额、客单价等 。 应该很好理解 。
指标的设定有两个经验:
1.“有总比没有强” 。 对于要监控的事物 , 能有指标的尽量要有指标 。
2.“一个好的指标应该是用来衡量具体且可量化的事物” 。 比如 , 用户访问量、停留时长、跳出率等 。
下面这张图 , 解释了什么是指标化 , 这就是有无数据分析思维的差异 , 也是典型的数据化运营 。
指标体系
有指标是否就够了呢?指标按照结构化思维可以形成一个体系 , 如销售分析指标体系 , 生产指标体系 , 电商行业指标体系 。
一家企业建立的数据分析体系通常细分到了具体可执行的部分 , 可以根据设定的某个指标异常变化 , 相应立即执行相应的方案 , 来保证运营的正常进行 。
附上一张电商行业的指标体系 , 各运营模块的指标体系网上一搜一大把 , 可以参考着建立 , 后面我也会在我的文章里阐述 。
建立指标体系的思路:
向上
可以按业务职能结构划分 , 映射出更多维度 , 比如渠道 , 运营 , 产品等相关模块 , 将相关指标映射到主要模块 , 通过简单快速的沟通 , 快速定位问题原因 。
向下
可以按因果结构划分 , 也就是指标分解 , 利用公式的方法 。 比如营收=日活*付费率*arpu等指标因果关系进行划分 , 通过定位指标波动 , 定位最细指标 , 辅助维度下转 , 能够清楚的问题原因 。
就像枝丫一样 , 从主干不断延伸枝丫 , 将业务用指标评价量化 , 逐渐形成一个健全的数据分析体系 。
4、维度分析思维最后 , 站在分析的角度讲一下维度思维 。
当你有了指标 , 可以着手进行分析 , 数据分析大体可以分三类 , 第一类是利用维度分析数据 , 第二类是使用统计学知识如数据分布假设检验 , 最后一类是使用机器学习 。 这里我们主要了解维度分析法 。
维度是观察数据的角度 , 例如“时间”、“地区”、“产品” 。 在具体分析中 , 我们可以把它认为是分析事物的角度 。 时间是一种角度、地区是一种角度 , 产品也是一种角度 , 所以它们都能算维度 。
当我们有了维度后 , 就能够通过不同的维度组合 , 形成数据模型 。 数据模型不是一个高深的概念 , 它就是一个多维立方体 。
这个概念最早来源于商业智能OLAP技术 。 数据按照事实表(Fact Table)和维表(Dimension Table)的形式存在 。 事实表用来记录具体事件 , 比如销量、销售额、售价、折扣等具体的数值信息 。 维度表是对事实表中事件的要素的描述信息 , 比如时间、城市、品牌、机型等 。
这是一个最简单的星形模型的实例 。
事实表里面主要包含两方面的信息:维和度量 , 维的具体描述信息记录在维表 , 事实表中的维属性只是一个关联到维表的键 , 并不记录具体信息;度量一般都会记录事件的相应数值 , 比如这里的产品的销售数量、销售额等 。 维表中的信息一般是可以分层的 , 比如时间维的年月日、地域维的省市县等 , 这类分层的信息就是为了满足事实表中的度量可以在不同的粒度上完成聚合 , 比如2016年商品的销售额 , 来自上海市的销售额等 。
下图举例一个简化的分析模型 , 分别由产品、城市、时间这三个维度组成 , 实际数据分析中 , 维度远不止三个 。
在数库中 , 可能是这样两张表:

做好数据分析的4大思维 如何数据分析?

文章插图
我们可以将品牌作为维度 , 分析手机的销量情况 , 也可以将时间作为维度 , 分析每一年手机市场的份额情况 。
多维分析操作包括:钻取(Drill-down)、上卷(Roll-up)、切片(Slice)、切块(Dice)以及旋转(Pivot) 。
钻取(Drill-down):在维的不同层次间的变化 , 从上层降到下一层 , 或者说是将汇总数据拆分到更细节的数据 , 比如通过对2018年华为的总销售数据进行钻取来查看各个手机型号的销售数据 。
上卷(Roll-up):钻取的逆操作 , 即从细粒度数据向高层的聚合 。 如将江苏省、上海市和浙江省的销售数据进行汇总来查看江浙沪地区的销售数据 。
切片(Slice):选择维中特定的值进行分析 , 比如只选择苹果手机的销售数据 , 或2017年的手机销售数据 。
切块(Dice):选择维中特定区间的数据进行分析 , 比如选择2016年2017年的销售数据 。

推荐阅读