文章插图
1. 数据生成还是以支付业务为例 , 用户选择支付方式完成支付后 , 落库核心的两张业务表:订单表和交易表 。一个订单会对应多笔交易(每选择一种支付方式生成一笔交易 , 一笔订单可以使用多个支付方式尝试支付) , 其实还会产生其他表 , 比如收货地址表等 。
文章插图
2. 获取数据通常使用第三方工具如ETL将业务系统的数据经过抽取(Extract)、清洗转换(Transform)之后加载(Load)到数据仓库的过程 , 数据呈现在BI的数据源 。
文章插图
3. 数据建模所有数据进到数仓以后 , 需要根据实际想要看的业务数据进行数据建模 , 建模后的数据呈现在数据集 。数据集作为数据源和可视化展示的中间环节 , 承接数据源的输入 , 并为可视化展示输出数据表 。
文章插图
4. 构建数据模型数据建模是什么含义呢?
底层的业务数据表其实很多 , 几十张上百张都有 , 但到了业务数据分析阶段 , 当需要分析的数据存储在不同的表 , 可以通过数据关联 , 把多个表连接起来 , 形成模型进行数据分析 。
比如上述的业务底层订单表到了数据分析阶段衍生的订单表字段发生变化 , name 和 city 是从业务地址表取来的数据 。
总的来说 , 数据模型是完全面向数据分析的业务场景形成的新表 。以支付业务为例 , 我构建的数据模型有:用户表、订单表和交易表 。
文章插图
5. 设计维度和度量指标对数据字段可以进行下一步分类:
在统计学中 , 单一数据字段可以被分为离散和连续 。离散通常是维度 , 比如城市名称、用户名字 , 特征是有限数量的值;连续通常是度量 , 比如销量、利润或成功率 , 特征是不可罗列 , 可能为任一数值 。维度和度量中有许多灰 *** 域 , 比如金额 , 可以做维度 , 也可以做度量 。
在上述订单表中 , device、city 等是维度 , 对order_id 计数的总订单数、对status = success 计数的成功订单数是度量 。
度量可以再分原子度量和派生度量 。
原子度量指从维度里直接获取到 , 上表中的总订单数和成功订单数 。
派生度量并不能直接从数据表中获取 , 而需要基于已有数据进行加工处理得到 , 上表中的订单成功率是成功订单数/总订单数得到 。
6. 数据分析有了维度和度量的概念后 , 接着引入聚合概念 。对于数据分析来说 , 往往关心的并不是更底层一行一行的的明细数据 , 更注重分析数据的角度 , 关心的是数据的总体特征 。
聚合 , 简单讲就是数据源里的多行数据按照一定的标准计算成一个数据 , 不管数据集里有1行还是多行 , 视图里的数据都是聚合后的结果 , 一行数据也是要聚合的 , 当然一行数据聚合的结果是一样的 。实际上 , 维度为数据聚合提供依据 , 而度量是依据维度聚合得到的结果 。
配置了聚合计算的计算字段 , 将根据配置的维度自动进行聚合运算 。
如:
求和:SUM([字段])计数:COUNT([字段])计数去重:COUNT(DISTINCT [字段])求平均值:AVG([字段])
文章插图
表述的业务含义为时间周围为2021.3.1 ~ 2021.3.15 范围内pc端的订单成功率为0.5 。
计算过程:根据created_at=2021.3.1 ~ 2021.3.15 和device =pc , SUM([总订单数])= 2 , SUM([成功订单数])=1 , SUM([成功订单数])/SUM([总订单数])=1/2=0.5 。
Quick BI 提供电子表格和仪表盘两种可视化工具做以上分析 。
电子表格:
文章插图
仪表盘:
文章插图
通过可视化的图标去分析数据 , 找出机会点或者异常 。
7. 数据应用通过可视化的图表去分析数据 , 找出机会点或者异常 。可以说 , 前面1、2、3、4 所有的工作都在为了第5部分数据应用上 。
推荐阅读
- 汽车镀膜剂怎么使用视频 汽车镀膜剂怎么用视频
- 显示器hdr是什么意思 hdr是什么意思400?
- 山行描写了哪六种景物,显示秋景图 山行描写了哪六种景物
- 汽车地毯拆卸图解 汽车地毯怎么拆卸
- 奔驰smter汽车价格查询
- 换汽车大灯灯泡多少钱 换汽车大灯多少钱?
- 金杯汽车图片「金杯汽车图片价格」
- 买汽车的无息贷款真的无息吗,现在买车都是无息贷款吗
- 梦见汽车爆胎
- 抖音为什么不显示浏览者了 抖音为什么不显示浏览者