hive和hadoop的关系

hive是Hadoop的一个组件，作为数据厂库，hive的数据是存储在Hadoop的文件系统中的，hive为Hadoop提供SQL语句，是Hadoop可以通过SQL语句操作文件系统中的数据。hive是依赖Hadoop而存在的。
hive 就是个单机版的

　　hadoop包含以下组件：hdfs,mapreduce,yarn。
hive是数据仓库：用于管理结构化数据，数据存于hdfs上。
spark是一个分布式计算框架：区别于hadoop的另一种mapreduce的计算框架。基于rdd的分布式内存计算引擎。