数据分类的维度大全 定类数据有哪些

定类数据有哪些(数据分类的维度大全) , 小编带你了解更多信息 。
数据分类概述
数据天然具备不同的属性和特征 , 也必然存在不同的管理主体 , 出于不同的管理目的、基于不同的数据属性或特征对数据采用不同的分类方法 。
不同维度下数据的分类如下:
1. 按数据的结构特征
l 结构化数据
结构化的数据是指可以使用关系型数据库表示和存储 , 表现为二维形式的数据 。
其一般特点是:数据以行为单位 , 一行数据表示一个实体的信息 , 每一行数据的属性是相同的 。
l 非结构化数据
非结构化数据是数据结构不规则或不完整 , 没有预定义的数据模型 , 不方便用数据库二维逻辑表或自描述语言来表现的数据 。
它本质上是异构和可变的 , 可同时具有多种格式 , 包括:文档、文本、图片、音频、视频等 。
l 半结构化数据
指非关系模型的 , 具有基本固定结构模式的数据 。它一般是自描述的 , 数据的结构和内容混合在一起 , 没有明显的区分 。例如html、日志文件、XML、JSON、E-mail等 。
半结构化数据是结构化数据的一种形式 , 它并不符合关系型数据库或其他数据表的形式关联起来的数据模型结构 , 但包含相关标记 , 用来分隔语义元素以及对记录和字段进行分层 。因此 , 它也被称为自描述的结构 。
2. 按数据的应用层次
l 第一层:元数据
元数据是关于数据的结构化数据 , 用于定义和描述其他数据 , 便于理解、查找、获取、使用和管理数据 。根据其属性的不同 , 元数据可分为业务元数据、技术元数据、管理元数据 。
l 第二层:参考数据
参考数据 , 是数据可能的取值范围及其解释 , 是对其他数据进行分类和规范的数据 。
l 第三层:主数据
主数据也称为基准数据 , 是用来描述企业内部核心业务对象的、具有高业务价值的、在企业内被多个业务部门和系统之间共享的、且相对静态的数据 , 被誉为企业的“黄金数据” 。
l 第四层:事务数据
事务数据 , 也称为活动数据 , 指的是记录企业经营和管理过程中产生的事务型数据 , 比如销售订单 , 采购订单 , 报销流程工单等 。
l 第五层:分析数据
分析数据 , 指的是由各类事务数据组成的数据 , 比如各种报表 , BI分析 , 审计数据等 , 是由很多事务型数据 , 进行组合搭建的 。
l 第六层:规则数据
规则数据是结构化描述业务规则变量的数据(如会员等级评级规则、数据质量校验规则等) , 是实现业务规则的核心数据 。规则数据不可实例化 , 规则数据的变更对业务活动的影响是大范围的 。
需要说明的是:规则数据 , 与参考数据、主数据、事务数据、分析数据等并不是严格的层次关系 , 而是跨越参考数据、主数据、事务数据、分析数据等四层 , 参考数据、主数据、事务数据、分析数据中 , 都会涉及到对规则数据的调用 。
【数据分类的维度大全 定类数据有哪些】3. 按数据的生产方式
l 原始数据
原始数据是指来自上游系统的 , 没有做过任何加工的数据 。
虽然会从原始数据中产生大量衍生数据 , 但还是会保留一份未作任何修改的原始数据 , 一旦衍生数据发生问题 , 可以随时从原始数据重新计算 。
l 衍生数据
衍生数据是指通过对原始数据进行加工处理后产生的数据 。衍生数据包括各种数据集市、汇总层、宽表、数据分析和挖掘结果等等 。从衍生目的上 , 可以简单分为两种情况 , 一种是为提高数据交付效率 , 数据集市、汇总层、宽表都属于这种情况 。另一种是为解决业务问题 , 数据分析和挖掘结果就属于这种 。
4. 按描述事物的角度
l 状态类数据
描述客观世界的实体 , 也即一个个对象 , 比如人、桌子、账户等等 。对于这些对象 , 各有各的特征 , 不同种类的对象拥有不同的特征 , 比如人的特征包括姓名、性别和年龄 , 桌子的特征包括颜色和材质;对于同一种对象的不同个体 , 其特征值不同 , 比如张三男20岁 , 李四女24岁 。有些特征稳定不变 , 而另一些则会不断发生变化 , 比如性别一般不变 , 但账户金额、人的位置则随时可能变化 。

推荐阅读