这个需要根据具体的业务场景来做判断
1. rowkey的设计主要为了方便后期的查询(条件查询语句),如果设计的合理,查询速率可以大大提升
2. 分区的设计,主要考量的是入库HBase的速率。如果设计的不合理,会导致局部入库数据过热,严重的有可能出现入库失败的情况。
3. 当然,分区如果设计的合理,查询速率也会提升。
hbase中的预分区,是为了防止要插入的数据的rowkey设计不太合理导致
Hadoop|
Apache Pig|
Apache Kafka|
Apache Storm|
Impala|
Zookeeper|
SAS|
TensorFlow|
人工智能基础|
Apache Kylin|
Openstack|
Flink|
MapReduce|
大数据|
云计算|
用户登录
还没有账号?立即注册
用户注册
投稿取消
文章分类: |
|
还能输入300字
上传中....