Skip to main content

ClickHouse的分片时把数据库横向扩展(Scale Out)到多个物理节点上的一种有效的方式。

复用了数据库的分区概念,相当于在原有的分区下作为第二层分区。

ClickHouse会将数据分为多个分片,且分布到不同节点上,通过Distributed表引擎把数据拼接起来一同使用。

Sharding机制使得ClickHouse可以横向线性拓展,构建大规模分布式集群,但需要避免数据倾斜问题。

总结:

数据分区:允许查询在指定了分区键的条件下,尽可能的少读取数据。

数据分片:允许多台机器/节点同时并行执行查询,实现了分布式并行计算。

本文内容转载自小滴课堂