介绍一个通用的数据分析方法论 如何运营分析?( 三 )


比如, 我们继续使用前面提到的案例——用户**依次**点击了ABCD四个位置才产生了GMV:

  1. **首次互动归因模型**:也就是用户第一次做某件事, 在数据中通常表现为时间最早、顺序号最小等等 。 那么我们给A记100%, B、C和D记0% 。
  2. **最终互动归因模型**:也就是用户最后一次做某件事, 对应的在数据中就表现为时间最近、顺序号最大等等 。 那么我们给D记100%, A、B和C记0% 。
  3. **线性归因模型**:也就是平均分 。 那么我们给ABCD分别记25% 。
  4. **加权归因模型**:也就是给多个促成因素分配一定的权重, 例如A和B各记30%, C和D各记20% 。 正因为多出来一个权重的维度, 需要一定的设计;并且计算权重也可以作为一种分析的过程 。 关于权重也有几种常见的设置办法, 比如首末两项最重要而其它向中间递减, 或者按时递减等等 。
当然, 在选择归因方式的时候, 也会结合具体业务的特征, 来考虑行为的先后顺序、停留时间长短等情况, 对于分析目标的贡献或影响 。
1.1.5 决策
最后就可以决策了 。 但经过了前面的几个步骤逐渐消除了不确定性, 决策反而是最简单的一步了——就是找出那个表现最好的版本、表现最好的位置、表现最好的拉新方法而已 。
而当我们有一些新的idea时, 同样可以作为A/B Test中的一个版本, 加入到这套评价体系中, 进行综合评价 。
1.2 应用案例这套方法论不仅针对日常工作中的专项分析, 在一些已经固化成型的方法论中, 也可以找到这套基础方法论的影子 。
我们来看几个已经成型方法论案例:
1.2.1 A/B Test实验
首先我们要看的案例就是A/B Test 。 在A/B Test的过程中, 首先我们要确定实验的目的, 也就是我们要通过实验提高和优化的是哪个指标 。 之后, 我们以实验中的不同版本作为细分维度, 以指标是否实现作为评价标准, 对实验结果进行评价 。 如果在实验的过程中确实遇到了需要归因的问题, 则还需要考虑如何进行归因 。
当然, 随着业务的复杂度不断发展, A/B Test的难点已经不在于比较和得出结论的过程, 而在于如何设计实验才能在更短的时间内、耗费更少的用户流量、进行更多的实验并得到有效的结论 。 这也是所有这方面的平台和工具的起点——Google的著名论文《Overlapping Experiment Infrastructure: More, Better, Faster Experimentation》论述的核心内容 。
1.2.2 用户分群
用户分群是一个常见的运营手段, 但如何确定分群的准确度, 以及如何在后续的使用中持续地维持准确度, 确是一个数据分析问题 。 在基于特征的用户分群过程中, 首先要确认的是, 我们希望获得具备怎样特征的用户群体 。
之后, 当我们想找到符合这个特征的用户时, 就可以使用TGI(Target Group Index, 目标群体指数)来衡量找到的用户群体是否对这个特征有倾向性 。 例如:如果我们想找到喜欢搞笑短视频的用户, 并且以点赞行为作为“喜欢”的定义, 就可以使用TGI的大小来评价我们找到的用户群体是否确实对搞笑短视频有所偏好 。
具备了这种分析机制之后, 我们就可以通过各种手段来对用户进行分群了, 之后针对不同的分群方式就可以计算出多组TGI值, 我们需要的就是那个TGI值最大的子群, 并选择那个得到这个子群的分群方式 。
反过来说, 关于用户分群还有另外一种场景:我们已经得到了一个用户群体, 并想要研究这个群体具备怎样的特征 。 这时, 同样可以使用TGI作为目标, 以TGI的大小来衡量分群对各种特征的倾向性 。
1.2.3 经典管理模型:BCG矩阵
在经典的BCG矩阵中, 隐含的一个关注目标是整体利益, 而手段是资源的优化配置——也就是要将企业中有限的资源, 投给更具潜力的业务, 以便获得企业层面的整体利益最大化 。
为了对这个目标进行深入研究, 在BCG矩阵中, 按照两个维度对这个指标进行了拆分, 形成了一个二维矩阵 。 在通常的画法中, 横向代表相对市场占有率的高低(通常是指相对于行业Top 3), 而纵向代表了市场增长率的高低 。 相对市场占有率和市场增长率, 就是创造利益的手段了, 占有率高且增长迅速, 自然能更多获利, 而利益自然是最终目标 。
因此, 由于手段带来的利益是不同的, 在拆分出的四个象限中, 不同的业务就有了自己的“宿命”——有的维持, 有的追加资源, 有的减少资源, 有的直接放弃 。
二、方法论的优化根据前面对于方法论的整体描述, 有三个点, 可以对这套方法论进行优化 。

推荐阅读