GreenPlum采取的是PostgreSql框架,是PostgreSql系的重要应用。从这个角度上可以知道GreenPlum是关系型数据库。Hadoop框架是一种分布式的平台设计理念。它本身不是数据库。其中Impala可以认为是一种非关系型的数据库, Hive相当于SQL。
GreenPlum采取的是PostgreSql框架,是PostgreSql系的重要应用。从这个角度上可以知道GreenPlum是关系型数据库。
Hadoop框架是一种分布式的平台设计理念。它本身不是数据库。其中Impala可以认为是一种非关系型的数据库, Hive相当于SQL。
分布式,是多个方面的,最主要是存储方面。GreenPlum的分布式主要体现在多个机器文件存储,授权等方面。而Hadoop的文件管理方面,也是分布式的,因为只有分布式的部署才能最大效力的发回Hadoop的功能。
因此可以认为GreenPlum和Hadoop没有直接关系。
mpp是一种海量数据实时分析架构。 mpp作为一种不共享架构,每个节点运行自己的操作系统和数据库等,节点之间信息交互只能通过网络连接实现。
mpp架构目前被并行数据库广泛采用,一般通过scan、sort和merge等操作符实时返回查询结果。目前采用mpp架构的实时查询系统有emc greenplum、hp vertica和googl e dremel,这些都是实时数据处理领域非常有特点的系统,尤其是dremel可以轻松扩展到上千台服务器,并在数秒内完成tb级数据的分析。
Hadoop|
Apache Pig|
Apache Kafka|
Apache Storm|
Impala|
Zookeeper|
SAS|
TensorFlow|
人工智能基础|
Apache Kylin|
Openstack|
Flink|
MapReduce|
大数据|
云计算|
用户登录
还没有账号?立即注册
用户注册
投稿取消
文章分类: |
|
还能输入300字
上传中....