浅谈MySQL、Hadoop、BigTable、Clickhouse数据读写机制( 二 )


因为是按排序键已经排好序了,所以索引结构不需要像其他引擎设计的那么复杂;
底层是稀疏索引(默认8192为一个步长),通过【稀疏索引+标记的偏移量】就能很快找到Block的位置
1、Clickhouse通过【批处理+预排序】将数据提前排好序
2、Clickhouse能处理的最小单位是block,block就是一群行的集合 , 默认最大8192行组成一个block
相关资料
HDFS设计原理
日志系统:一条SQL更新语句是如何执行的?
SSTable存储引擎
Clickhouse的优化手段之block+lsm
Clickhouse索引结构
Clickhouse存储引擎
Clickhouse官方文档:MergeTree系列

推荐阅读