hive是Hadoop的一个组件,作为数据厂库,hive的数据是存储在Hadoop的文件系统中的,hive为Hadoop提供SQL语句,是Hadoop可以通过SQL语句操作文件系统中的数据。hive是依赖Hadoop而存在的。
hive 就是个单机版的
hadoop包含以下组件:hdfs,mapreduce,yarn。
hive是数据仓库:用于管理结构化数据,数据存于hdfs上。
spark是一个分布式计算框架:区别于hadoop的另一种mapreduce的计算框架。基于rdd的分布式内存计算引擎。
Hadoop|
Apache Pig|
Apache Kafka|
Apache Storm|
Impala|
Zookeeper|
SAS|
TensorFlow|
人工智能基础|
Apache Kylin|
Openstack|
Flink|
MapReduce|
大数据|
云计算|
用户登录
还没有账号?立即注册
用户注册
投稿取消
文章分类: |
|
还能输入300字
上传中....