Hive是基于HDFS的离线数据仓库,提供了SQL的支持,将SQL翻译成MapReduce执行。 而HBase是分布式K-V数据库,非常适合实时的大规模的K-V查询和修改需求。 更多关于Hive和HBase的介绍,请搜索"lxw的大数据田地".
hive中的join可概括为map端join和reduce端join,两种join的原理不同,使用mapreduce处理的方式也不同,需要了解其中的原理之后,就可以将其自己翻译成mapreduce程序。可以搜索"lxw的大数据田地",里面有对hive中join类型和原理的详细描述。
Hadoop|
Apache Pig|
Apache Kafka|
Apache Storm|
Impala|
Zookeeper|
SAS|
TensorFlow|
人工智能基础|
Apache Kylin|
Openstack|
Flink|
MapReduce|
大数据|
云计算|
用户登录
还没有账号?立即注册
用户注册
投稿取消
文章分类: |
|
还能输入300字
上传中....