mapreduce和hive

Hive是基于HDFS的离线数据仓库，提供了SQL的支持，将SQL翻译成MapReduce执行。而HBase是分布式K-V数据库，非常适合实时的大规模的K-V查询和修改需求。更多关于Hive和HBase的介绍，请搜索"lxw的大数据田地".

　　hive中的join可概括为map端join和reduce端join，两种join的原理不同，使用mapreduce处理的方式也不同，需要了解其中的原理之后，就可以将其自己翻译成mapreduce程序。可以搜索"lxw的大数据田地"，里面有对hive中join类型和原理的详细描述。