shuffle就是combine,partition,combine的组合
第一个是map端的combine,是在map本地把同key的放在一起成列表
第二个是partition分割,把键值对按照key对应分配到reduce
第三个是reduce端的combine,把同key的再合并得到最后的reduce输入
真是个不错的选题呢 哈哈啊哈哈哈哈哈哈
Hadoop|
Apache Pig|
Apache Kafka|
Apache Storm|
Impala|
Zookeeper|
SAS|
TensorFlow|
人工智能基础|
Apache Kylin|
Openstack|
Flink|
MapReduce|
大数据|
云计算|
用户登录
还没有账号?立即注册
用户注册
投稿取消
| 文章分类: |
|
还能输入300字
上传中....
哀思沫