因为可以维护海量数据,而且可以对数据进行挖掘,然后形成意见和报告等,使用该应用程序进行相关的静态数据分析,也不需要快速响应给出结果,而且数据本身不会频繁变化。
这个要看你把数据仓库用于做什么,如果有实时交互查询的需求,可以考虑greenplum,也可以考虑spark sql或impala。如果只是海量数据的批量处理,就建议用hive了。
Hadoop|
Apache Pig|
Apache Kafka|
Apache Storm|
Impala|
Zookeeper|
SAS|
TensorFlow|
人工智能基础|
Apache Kylin|
Openstack|
Flink|
MapReduce|
大数据|
云计算|
用户登录
还没有账号?立即注册
用户注册
投稿取消
文章分类: |
|
还能输入300字
上传中....