hbase 存储机制 作者:马育民 • 2021-11-28 12:40 • 阅读:10046 # 存储机制 [![](https://www.malaoshi.top/upload/pic/hbase/20190310163115164.png)](https://www.malaoshi.top/upload/pic/hbase/20190310163115164.png) 1. Table 中的所有行都按照 Rowkey 的字典序排列。 2. Table 在行的方向上分割为多个 HRegion。 3. HRegion 按大小分割的(默认 10G),每个表一开始只有一个 HRegion,随着数据不断插入表,HRegion 不断增大,当增大到一个阀值的时候,HRegion 就会等分会两个新的 HRegion。 当表中的行不断增多,就会有越来越多的 HRegion。 4. HRegion 是 Hbase 中分布式存储和负载均衡的最小单元。最小单元就表示不同的 HRegion 可以分布在不同的 HRegionserver 上。但一个 HRegion 是不会拆分到多个 server 上的。 5. HRegion 虽然是负载均衡的最小单元,但并不是物理存储的最小单元。事实上,HRegion 由一个或者多个 Store 组成,每个 Store 保存一个 Column Family。每个 Strore 又由一个 MemStore 和 0 至多个 StoreFile 组成 https://blog.csdn.net/f1550804/article/details/88380764 https://zhuanlan.zhihu.com/p/54184168 原文出处:http://malaoshi.top/show_1IX2JHL4hXyq.html