因此 , 可以使用一组特征数据来描述每个对象 , 这些数据可以随时间发生变化(数据的变化一方面依赖于对象的变化 , 另一方面依赖于变化反映到数据上的时间差) , 每个时点的数据反映这个时点对象所处的状态 , 因此称之为状态类数据 。
l 事件类数据
描述客观世界中对象之间的关系 , 它们是怎么互动的 , 怎么发生反应的 。我们把这一次次互动或反应记录下来 , 这类数据称之为事件类数据 。比如客户到商店买了件衣服 , 这里出现三个对象 , 分别是客户、商店、衣服 , 三个对象之间发生了一次交易关系 。
l 混合类数据
混合类数据理论上也属于事件类数据范畴 , 两者的差别在于 , 混合类数据所描述的事件发生过程持续较长 , 记录数据时该事件还没有结束 , 还将发生变化 。比如订单 , 从订单生成到结案整个过程需要持续一段时间 , 首次记录订单数据是在订单生产的时候 , 订单状态、订单金额后续还可能多次变化 。
5. 按数据的存储方式
数据按其存储方式 , 可以分为关系型数据、键值数据、列式数据、图数据、文档数据等 。
l 关系型数据
采用关系数据模型的数据库系统 , 关系数据模型实际上是表示各类实体及其之间联系的由行和列构成的二维表结构 。一个关系数据库由多个二维表组成 。表中的每一行为一个元组 , 每一列为一个属性 , 对关系型数据库进行操作通常采用结构化查询语言 。
l 键值数据
是一种非关系数据库 , 它使用简单的键值方法来存储数据 。键值数据库将数据存储为键值对集合 , 其中键作为唯一标识符 。键和值都可以是从简单对象到复杂复合对象的任何内容 。键值数据库是高度可分区的 , 并且允许以其他类型的数据库无法实现的规模进行水平扩展 。
l 列式数据
是一种非关系数据库 , 以列相关存储架构进行数据存储的数据库 , 主要适合于批量数据处理和即时查询 。相对应的是行式数据库 , 数据以行相关的存储体系架构进行空间分配 , 主要适合于小批量的数据处理 , 常用于联机事务型数据处理 。
l 图数据
是一种非关系型数据库 , 它应用图形理论存储实体之间的关系信息 。比如 , 社会网络中人与人之间的关系 。
l 文档数据
是NoSQL中非常重要的一个分支 , 它主要用来存储、索引并管理面向文档的数据或者类似的半结构化数据 。
6. 按数据的产生频率
l 批量数据
这种方式下 , 数据每隔一段时间提供一次 , 把该时段内所有变化的数据都提供过来 。批量方式时效较低 , 大部分传统系统都采用T+1方式 , 业务用户最快只能分析到前一天的数据 , 看前一天的报表 。
l 实时数据
每当数据发生变化或产生新数据 , 就会立刻提供过来 。这种方式时效快 , 能有效满足时效要求高的业务 , 比如场景营销 。但该方式对技术要求更高 , 必须保证系统足够稳定 , 一旦出现数据错误 , 容易造成较严重的业务影响 。
7. 按数据的使用频率
l 热数据
热数据是需要被计算节点频繁访问的在线类数据 。
比如可以是半年以内的数据 , 用户经常会查询它们 。热数据适合放在数据库中存储 , 比如MySql、MongoDB和Hbase等 。
l 冷数据
冷数据是指离线类不经常访问的数据 。主要用于灾难恢复的备份或者因为要遵守法律规定必须保留一段时间 , 比如企业备份数据、业务与操作日志数据、话单与统计数据等 。
冷数据通常会存储在性能较低、价格较便宜的文件系统里 , 适用于离线分析 , 比如机器学习中的模型训练或者大数据分析 。
l 温数据
温数据是非即时的状态和行为数据 , 也可以简单理解为把热数据和冷数据混在一起就成了温数据 。如果整体数据量不大 , 也可以不区分温数据和热数据 。
8. 按数据的连续属性
l 连续型数据
连续数据类型代表着数据的取值是连续不间断的 , 可以用某种尺度进行连续的测量取值 , 在可能值的有限或无限范围内都可以无限取值 。
推荐阅读
- 属猴人的贵人属相是什么 属龙属蛇属牛
- 营销)成功的五大案例 好营销案例有哪些(互联网广告
- 属猴人在虎年的运势不错 事业财富大丰收的一年
- 红砖和青砖的价格区别 青砖和红砖的价格差多少
- 2022年属蛇人四月份的事业运势 工作方面的发展顺利
- 2022年属羊的4月份事业运气如何 事业运势有所提升
- 什么样八字的人需要找干爹,八字旺盛的人需要找干爹
- 2020年10月29号九月十三出生的孩子生辰八字和性格命运解析
- 附使用范围 电子驾驶证是什么样子的?
- 双鱼座出生时间:双鱼座的出生日期