HBase的安装包里面有自带zookeeper的。很多系统部署也是直接启动上面的zookeeper。本来也是没有问题的,想想吧,系统里也只有hbase在用zookeeper。先启动zookeeper,再将hbase起来就好了?但是今天遇到了一个很蛋疼的问题。和同事争论了很久。?因为我们是好多hbase集群共用一个zookeeper的,其中一个集群需要从hbase0.90.2升级到hbase0.92上,自然,包也要更新。但是其中一台regionserver上面同时也有跑zookeeper,而zookeeper还是用hbase0.90.2自带的zookeeper在跑。?现在好了,升级一个regionserver,连着zookeeper也要受到牵连,看来必须要重启,不然,jar包替换掉,可能会影响到zk正在跑的经常。但是重启zk毕竟对正在连接这个zk的client端会有短暂的影响。?真是蛋疼。本来只是升级hbase,zk却强耦合了。?虽然后来证明zookeeper只要启动了,哪怕jar包删除也不会影响到正在跑的zk进程,但是这样的不规范带来的风险,实在是没有必要。?所以作为运维,我强烈建议zk和hbase分开部署,就直接部署官方的zk好了,因为zk本身就是一个独立的服务,没有必要和hbase耦合在一起。?在分布式的系统部署上面,一个角色就用一个专门的文件夹管理,不要用同一个目录下,这样子真的容易出问题。?当然datanode和tasktracker另当别论,他们本身关系密切。
scan时可以设置是否开启raw模式,开启raw模式会返回包括已添加删除标记但是未实际删除的数据。
setraw
public void setraw(boolean raw)
enable/disable "raw" mode for this scan.
if "raw" is enabled the scan will return all
delete marker and deleted rows that have not
been collected, yet.
this is mostly useful for scan on column families
that have keep_deleted_rows enabled.
it is an error to specify any column when "raw" is set.
parameters:
raw - true/false to enable/disable "raw" mode.
Hadoop|
Apache Pig|
Apache Kafka|
Apache Storm|
Impala|
Zookeeper|
SAS|
TensorFlow|
人工智能基础|
Apache Kylin|
Openstack|
Flink|
MapReduce|
大数据|
云计算|
用户登录
还没有账号?立即注册
用户注册
投稿取消
文章分类: |
|
还能输入300字
上传中....