三问数据中台 数据中台

数据中心(三个问题的数据中心)
自从阿里提出“大中小前台”的概念后 , 数据中台的概念这几年火了起来 , 互联网巨头纷纷成立自己的数据中台 。数据中台到底有什么魅力能让企业如此重视?笔者从什么是数据中心 , 怎么做 , 为什么要做三个方面来回答这个问题 。

1.什么是数据中心?很多人会问 , 数据中心到底是什么?
一般来说 , 数据中心是在数据层面为企业业务提供帮助和决策的工具 。
过去 , 数据往往只显示 , 不存储;慢慢的 , 人们需要随时随地查找数据 , 存储数据的概念被普遍认可;慢慢的 , 人们逐渐养成了数据思维 , 发现可以通过看数据来制定运营策略 。当互联网时代已经进入爆发期 , 产生了大量的数据 。人们通过数据挖掘收集大量的外部数据作为决策的依据 。
现在的互联网已经进入了一个相对成熟的时期 , 大公司都建立了自己的数据中心 , 把海量的数据作为自己的资产 , 并且善于利用数据中心来整合和智能分析数据 , 驱动决策 。
说到数据中心 , 就会涉及到数据仓库 。很多人看 , 数据仓库?它只是一个数据库 , 一个存储数据的东西 。其实这并不是一个正确的认识 。两者有什么区别?
1.不同的业务场景 。数据仓库主要对收集的数据进行分析和处理;
数据库主要面向事务;
2.专注于以不同的方式优化数据 。数据仓库主要是集中资源优化获取资源的方式 , 因为业务人员和运营人员对数据的获取需求很大 , 往往每天都会调用、获取和处理大量的数据;
数据库主要集中资源优化添加、删除、修改、搜索等功能 。 , 防止过多的数据更新和事务影响数据库的效率和稳定性;
3.数据以不同的方式组织 。数据仓库通常按时间组织数据 。以电商订单为例 。数据仓库会分别用“1小时订单”、“1天订单”、“1个月订单”组织数据分析表 , 方便业务人员获取分析;
数据库按索引和物理内容组织数据 , 如“数码产品订单”、“生鲜食品订单”、“服装订单”等 。
4.冗余是不同的数据仓库往往是高度冗余的 , 因为数据仓库希望用更多重复类型的数据来分析整个产品的运营趋势 , 为下一步的运营决策做依据;
而数据库往往冗余度较低 , 数据库不希望存储大量重复类型的数据 , 从而影响数据库的整体性能和效率 。
说到这里 , 我们大概对数据中心有了初步的了解 , 那么我们就来看看如何搭建一个最适合我们公司的数据中心 。
二、如何建设最合适的数据中心?为什么说它是“最适合”自己的数据中心?
【三问数据中台 数据中台】数据中心在功能和逻辑上非常复杂 , 涉及很多领域和维度 , 那么如何打造最适合的数据中心呢?请这样想:
1.先分析你需要什么数据 。首先要根据自己的业务来分析需要哪些数据 。下面是一个例子:
(1)电子商务业务
电子商务离不开订单、商品、支付等数据 。就订单数量而言 , 可以拆分这些维度进行统计:分钟/小时/天/周/月订单、人均订单、男/女用户订单、服装/数码产品订单、复购订单数量、订单销售额、订单周转率、订单退货率等 。
如果是商品 , 会涉及到商品类型的交易次数 , 商品的点击率 , 商品的评价次数等 。
如果是支付 , 会涉及到支付成功率/失败率、支付次数、支付渠道、支付优惠使用率等等 。
(2)直播服务
说到直播业务 , 核心角色可以分为主播和用户 , 整个直播平台都是围绕这两个核心角色来设计的 。
简单来说 , 直播就是主播和用户进行信息交流的过程 。主播提供内容 , 用户消费内容 , 反馈信息(发弹幕 , 送礼物等 。).当然 , 用户可以什么都不做 , 但也为主播提供了人气和受众);
整个直播过程可以分析如下:主播打开直播间——用户通过接收推荐/订阅提醒/搜索/首页推荐等方式进入直播间 。-主播与用户交流信息互动-用户退出直播间/主播下载-直播过程结束 。
那么 , 从这个简单的过程中 , 我们可以挖掘出很多数据指标 , 比如:播出后每小时的观看人数、消息推送/订阅/首页推荐的点击率、搜索次数、弹幕发送次数/速率、礼物类型/数量、观看直播1/5/10…分钟的用户数、各种留存率等 。由于数据指标太多 , 以上数据暂且列出 。

推荐阅读